(23 revisões intermediárias pelo mesmo usuário não estão sendo mostradas)
Linha 1: Linha 1:
= Conceito=
= Conceito=
* Speech Recognition (Reconhecimento de fala), é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor). Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.
* Speech Recognition ("Reconhecimento de fala"), são  metodologias e tecnologias que permite o reconhecimento e a tradução da linguagem falada em texto por computadores, Smartphone,entre outros. Também é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor) ou áudio externo(musica) . Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.
**exemplo: transformar a entrada de dados (áudio) e tem como saída o áudio transformado em texto.


=2 .STT e TTS=
= STT=
* É o processo de ditar um texto usando o Reconhecimento de fala. Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja no sistema.
* É o processo de ditar um texto usando o Speech Recognition, que tem como entrada de dados o áudio e saída de dados o texto.
** Conversão de palavras faladas ao texto.
* Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja já incorporado no sistema.
** Uma pessoa que converte o discurso em um formato de texto


=4 Vantagens=
=TTS=
=5 Referências=
* O TTS é o oposto do STT, tem como entrada de dados letra, palavras e textos, e saída de dados em áudio.
* O TTS é um sistema texto-voz, converte o que foi digitado para uma voz sintetizada.Um sistema com armazenamento em fonemas podem não transmitir com clareza o que foi digitado, já um armazenamento de palavras e frases tem uma saída de dados de melhor qualidade. Para criar voz sintetizada, pode conectar frases e palavras já gravadas, em um armazenamento de banco de dados. 
* Para deficientes visuais o TTS habilita a leitura das informações de exibição do computador, para que cada informação recebida pela maquina seja transmitida uma mensagem por voz.
 
=Vantagens=
* Os sistemas que utiliza o reconhecimento de voz, o usuário consegue optar pelo setor da empresa ou do call center que melhor pode atendê-lo sem falar com uma pessoa física. 
* Os sistemas que utilizam autenticação por Biometria da Voz, tem a vantagem da segurança, já que a voz de cada pessoa tem características únicas.
* Palavras-chaves  já registradas no sistema para ter acesso mais rápido na funcionalidade desejada.
** Por exemplo, o usuário consegue fazer uma ligação, fazer uma pesquisar, buscar um endereço, entre outros, pelo comando de voz, ao invés de digitar.
* Maior acessibilidade para pessoas com deficiência visuais.
 
=Referências=
* http://www.nch.com.au/kb/10019.html
* http://www.nch.com.au/kb/10019.html
* https://www.tecmundo.com.br/curiosidade/3144-como-funciona-o-reconhecimento-de-voz-.htm
* https://www.tecmundo.com.br/curiosidade/3144-como-funciona-o-reconhecimento-de-voz-.htm
Linha 16: Linha 25:
* http://mundoestranho.abril.com.br/alimentacao/como-funciona-o-reconhecimento-de-voz-em-aparelhos-eletronicos/
* http://mundoestranho.abril.com.br/alimentacao/como-funciona-o-reconhecimento-de-voz-em-aparelhos-eletronicos/
* https://ttsbrasil.wordpress.com/
* https://ttsbrasil.wordpress.com/
* http://www.teclan.com.br/reconhecimento-de-voz-no-call-center-vantagens-e-caracteristicas/
* https://www.gta.ufrj.br/grad/10_1/impressaovocal/conclusao.html
* https://pt.wikipedia.org/wiki/S%C3%ADntese_de_fala
* http://searchmobilecomputing.techtarget.com/definition/text-to-speech

Edição atual tal como às 02h55min de 7 de junho de 2017

Conceito

  • Speech Recognition ("Reconhecimento de fala"), são metodologias e tecnologias que permite o reconhecimento e a tradução da linguagem falada em texto por computadores, Smartphone,entre outros. Também é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor) ou áudio externo(musica) . Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.

STT

  • É o processo de ditar um texto usando o Speech Recognition, que tem como entrada de dados o áudio e saída de dados o texto.
  • Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja já incorporado no sistema.

TTS

  • O TTS é o oposto do STT, tem como entrada de dados letra, palavras e textos, e saída de dados em áudio.
  • O TTS é um sistema texto-voz, converte o que foi digitado para uma voz sintetizada.Um sistema com armazenamento em fonemas podem não transmitir com clareza o que foi digitado, já um armazenamento de palavras e frases tem uma saída de dados de melhor qualidade. Para criar voz sintetizada, pode conectar frases e palavras já gravadas, em um armazenamento de banco de dados.
  • Para deficientes visuais o TTS habilita a leitura das informações de exibição do computador, para que cada informação recebida pela maquina seja transmitida uma mensagem por voz.

Vantagens

  • Os sistemas que utiliza o reconhecimento de voz, o usuário consegue optar pelo setor da empresa ou do call center que melhor pode atendê-lo sem falar com uma pessoa física.
  • Os sistemas que utilizam autenticação por Biometria da Voz, tem a vantagem da segurança, já que a voz de cada pessoa tem características únicas.
  • Palavras-chaves já registradas no sistema para ter acesso mais rápido na funcionalidade desejada.
    • Por exemplo, o usuário consegue fazer uma ligação, fazer uma pesquisar, buscar um endereço, entre outros, pelo comando de voz, ao invés de digitar.
  • Maior acessibilidade para pessoas com deficiência visuais.

Referências