Speech Recognition: mudanças entre as edições

Edição das 23h37min de 7 de setembro de 2016

Erro ao criar miniatura: Arquivo não encontrado

Conceito

Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:

a transformação do que se fala em um texto simples, FALA LIVRE. Exemplo: Dictation
executar comandos ou tarefas através da voz, COMANDO DE VOZ. Exemplo: Siri (iOS)
e também a utilização da voz como fonte de segurança, AUTENTICAÇÃO DE VOZ, também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.

Tratamento: STT e TTS

Erro ao criar miniatura: Arquivo não encontrado

Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas

STT - Speech To Text: quando geramos textos através de áudios do usuário.
TTS - Text To Speech: quando transformamos textos em áudios.

@@ Linha 9: / Linha 9: @@
 === Tratamento: STT e TTS ===
-[[Arquivo:tts.jpg|200px]]
+[[Arquivo:tts.jpg|420px]]
 Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
 * STT - Speech To Text: quando geramos textos através de áudios do usuário.
 * TTS - Text To Speech: quando transformamos textos em áudios.