Edição atual tal como às 02h55min de 7 de junho de 2017

Conceito

Speech Recognition ("Reconhecimento de fala"), são metodologias e tecnologias que permite o reconhecimento e a tradução da linguagem falada em texto por computadores, Smartphone,entre outros. Também é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor) ou áudio externo(musica) . Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.

STT

É o processo de ditar um texto usando o Speech Recognition, que tem como entrada de dados o áudio e saída de dados o texto.
Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja já incorporado no sistema.

TTS

O TTS é o oposto do STT, tem como entrada de dados letra, palavras e textos, e saída de dados em áudio.
O TTS é um sistema texto-voz, converte o que foi digitado para uma voz sintetizada.Um sistema com armazenamento em fonemas podem não transmitir com clareza o que foi digitado, já um armazenamento de palavras e frases tem uma saída de dados de melhor qualidade. Para criar voz sintetizada, pode conectar frases e palavras já gravadas, em um armazenamento de banco de dados.
Para deficientes visuais o TTS habilita a leitura das informações de exibição do computador, para que cada informação recebida pela maquina seja transmitida uma mensagem por voz.

Vantagens

Os sistemas que utiliza o reconhecimento de voz, o usuário consegue optar pelo setor da empresa ou do call center que melhor pode atendê-lo sem falar com uma pessoa física.
Os sistemas que utilizam autenticação por Biometria da Voz, tem a vantagem da segurança, já que a voz de cada pessoa tem características únicas.
Palavras-chaves já registradas no sistema para ter acesso mais rápido na funcionalidade desejada.
- Por exemplo, o usuário consegue fazer uma ligação, fazer uma pesquisar, buscar um endereço, entre outros, pelo comando de voz, ao invés de digitar.
Maior acessibilidade para pessoas com deficiência visuais.

@@ Linha 1: / Linha 1: @@
-[[Arquivo:speech.jpg|200px]]
+= Conceito=
+* Speech Recognition ("Reconhecimento de fala"), são  metodologias e tecnologias que permite o reconhecimento e a tradução da linguagem falada em texto por computadores, Smartphone,entre outros. Também é um reconhecimento de padrões, tem como funcionalidade em reconhecer as palavras faladas pelo usuário (interlocutor) ou áudio externo(musica) . Para que a máquina ou dispositivo reconheça a fala, é necessário um conversor analógico-digital que capta as vibrações criadas pela a voz e converte essas ondas em dados digitais. Em seguida, o programa compara os sons captados com fonemas conhecidos e presentes em seu banco de dados. Depois de converter e reconhecer a entrada de áudio, o sistema analisa o resultado e o compara com palavras e frases gravadas previamente, com isso, ele identifica o que seu usuário disse e converte para a funcionalidade desejada.
-== Conceito ==
+= STT=
-Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:
+* É o processo de ditar um texto usando o Speech Recognition, que tem como entrada de dados o áudio e saída de dados o texto.
-* a transformação do que se fala em um texto simples, '''FALA LIVRE.''' Exemplo: [https://dictation.io/ Dictation]
+* Para que o sistema reconheça a voz, é necessário que haja a integração de vozes da língua que o usuário deseja já incorporado no sistema.
-* executar comandos ou tarefas através da voz, '''COMANDO DE VOZ.''' Exemplo: Siri (iOS)
-* e também a utilização da voz como fonte de segurança, '''AUTENTICAÇÃO DE VOZ''', também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.
-== Tratamento: STT e TTS ==
+=TTS=
+* O TTS é o oposto do STT, tem como entrada de dados letra, palavras e textos, e saída de dados em áudio.
+* O TTS é um sistema texto-voz, converte o que foi digitado para uma voz sintetizada.Um sistema com armazenamento em fonemas podem não transmitir com clareza o que foi digitado, já um armazenamento de palavras e frases tem uma saída de dados de melhor qualidade. Para criar voz sintetizada, pode conectar frases e palavras já gravadas, em um armazenamento de banco de dados.
+* Para deficientes visuais o TTS habilita a leitura das informações de exibição do computador, para que cada informação recebida pela maquina seja transmitida uma mensagem por voz.
-[[Arquivo:tts.jpg|420px]]
+=Vantagens=
+* Os sistemas que utiliza o reconhecimento de voz, o usuário consegue optar pelo setor da empresa ou do call center que melhor pode atendê-lo sem falar com uma pessoa física.
+* Os sistemas que utilizam autenticação por Biometria da Voz, tem a vantagem da segurança, já que a voz de cada pessoa tem características únicas.
+* Palavras-chaves  já registradas no sistema para ter acesso mais rápido na funcionalidade desejada.
+** Por exemplo, o usuário consegue fazer uma ligação, fazer uma pesquisar, buscar um endereço, entre outros, pelo comando de voz, ao invés de digitar.
+* Maior acessibilidade para pessoas com deficiência visuais.
-Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
+=Referências=
-* STT - Speech To Text: quando geramos textos através de áudios do usuário.
+* http://www.nch.com.au/kb/10019.html
-* TTS - Text To Speech: quando transformamos textos em áudios.
+* https://www.tecmundo.com.br/curiosidade/3144-como-funciona-o-reconhecimento-de-voz-.htm
+* https://student.dei.uc.pt/~guilhoto/downloads/voz.pdf
-== Vantagens ==
+* http://www.vision.ime.usp.br/~teo/publications/dissertacao/node9.html
+* http://mundoestranho.abril.com.br/alimentacao/como-funciona-o-reconhecimento-de-voz-em-aparelhos-eletronicos/
-[[Arquivo:tecassistiva.jpg|200px]]
+* https://ttsbrasil.wordpress.com/
+* http://www.teclan.com.br/reconhecimento-de-voz-no-call-center-vantagens-e-caracteristicas/
-Uma das principais vantagens no uso do reconhecimento de voz para realizar comandos, redigir texto, é a possibilidade de realizarmos duas funções ao mesmo tempo. Geralmente temos grande dificuldade em realizarmos duas ou mais tarefas ao mesmo tempo, pela atenção que ela necessita, mas a fala é algo tão instintivo para nós que sempre mantemos nossa comunicação na maioria de nossas atividades.
+* https://www.gta.ufrj.br/grad/10_1/impressaovocal/conclusao.html
+* https://pt.wikipedia.org/wiki/S%C3%ADntese_de_fala
-Também exerce papel de fundamental importância na tecnologia assistiva, permitindo a acessibilidade a informação e a conteúdos a deficiente visuais.
+* http://searchmobilecomputing.techtarget.com/definition/text-to-speech
-Possui papel já consolidado nas empresas de telecomunicação e nos SACs (serviço de atendimento ao cliente).
-== Referências ==
-http://www.dds.com.br/blog/index.php/biometria-de-voz-para-autenticacao-call-center/
-https://jorgeclucero.wordpress.com/sintese-computacional-de-vozes-desordenadas/
-http://www.diotek.com/eng/business/speech-recognition-synthesis-software/
-https://student.dei.uc.pt/~guilhoto/downloads/voz.pdf
-http://www.tecmundo.com.br/curiosidade/3144-como-funciona-o-reconhecimento-de-voz-.htm

Speech Recognition: mudanças entre as edições

Edição atual tal como às 02h55min de 7 de junho de 2017

Índice

Conceito

STT

TTS

Vantagens

Referências