| Linha 8: | Linha 8: | ||
** Uma pessoa que converte o discurso em um formato de texto. | ** Uma pessoa que converte o discurso em um formato de texto. | ||
=TTS= | =TTS= | ||
* O TTS é o oposto do STT, tem como entrada letras e palavras, recebe esses dados e converte para ter a sua saída em áudio. | |||
=Vantagens= | =Vantagens= | ||
Edição das 00h12min de 7 de junho de 2017
Conceito
- Speech Recognition ("Reconhecimento de fala"), é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor) ou áudio externo(musica). Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.
- exemplo: transformar a entrada de dados (áudio) e tem como saída o áudio transformado em texto.
STT
- É o processo de ditar um texto usando o Speech Recognition. Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja no sistema.
- Conversão de palavras faladas ao texto.
- Uma pessoa que converte o discurso em um formato de texto.
TTS
- O TTS é o oposto do STT, tem como entrada letras e palavras, recebe esses dados e converte para ter a sua saída em áudio.
Vantagens
- Os sistemas que utiliza o reconhecimento de voz, o usuário consegue optar pelo setor da empresa ou do call center que melhor pode atendê-lo sem falar com uma pessoa física.
- Os sistemas que utilizam autenticação por Biometria da Voz, tem a vantagem da segurança, já que a voz de cada pessoa tem características únicas.
- Palavras-chaves registradas no sistema para ter acesso mais rápido na funcionalidade desejada.
- O usuário por exemplo consegue fazer uma ligação, fazer uma pesquisar, buscar um endereço, entre outros.
Referências
- http://www.nch.com.au/kb/10019.html
- https://www.tecmundo.com.br/curiosidade/3144-como-funciona-o-reconhecimento-de-voz-.htm
- https://student.dei.uc.pt/~guilhoto/downloads/voz.pdf
- http://www.vision.ime.usp.br/~teo/publications/dissertacao/node9.html
- http://mundoestranho.abril.com.br/alimentacao/como-funciona-o-reconhecimento-de-voz-em-aparelhos-eletronicos/
- https://ttsbrasil.wordpress.com/
- http://www.teclan.com.br/reconhecimento-de-voz-no-call-center-vantagens-e-caracteristicas/
- https://www.gta.ufrj.br/grad/10_1/impressaovocal/conclusao.html