Conceito

  • Speech Recognition (Reconhecimento de fala), é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor). Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.
    • exemplo: transformar a entrada de dados (áudio) e tem como saída o áudio transformado em texto.

STT e TTS

  • É o processo de ditar um texto usando o Reconhecimento de fala. Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja no sistema.
    • Conversão de palavras faladas ao texto.
    • Uma pessoa que converte o discurso em um formato de texto

Vantagens

5 Referências