Speech Recognition: mudanças entre as edições

Edição das 23h32min de 7 de setembro de 2016

Erro ao criar miniatura: Arquivo não encontrado

Conceito

Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:

a transformação do que se fala em um texto simples, FALA LIVRE. Exemplo: Dictation
executar comandos ou tarefas através da voz, COMANDO DE VOZ. Exemplo: Siri (iOS)
e também a utilização da voz como fonte de segurança, AUTENTICAÇÃO DE VOZ, também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.

Tratamento: STT e TTS

Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas

TTS - Text To Speech: quando transformamos textos em áudios.
STT - Speech To Text: quando geramos textos através de áudios do usuário.

@@ Linha 3: / Linha 3: @@
 == Conceito ==
 Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:
-* a transformação do que se fala em um texto simples, '''fala livre.''' Exemplo: [https://dictation.io/ Dictation]
+* a transformação do que se fala em um texto simples, '''FALA LIVRE.''' Exemplo: [https://dictation.io/ Dictation]
+* executar comandos ou tarefas através da voz, '''COMANDO DE VOZ.''' Exemplo: Siri (iOS)
+* e também a utilização da voz como fonte de segurança, '''AUTENTICAÇÃO DE VOZ''', também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.
+=== Tratamento: STT e TTS ===
+Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
+* TTS - Text To Speech: quando transformamos textos em áudios.
+* STT - Speech To Text: quando geramos textos através de áudios do usuário.