Conceito

  • Tecnologias de reconhecimento da fala permitem que computadores equipados com microfones interpretem a fala humana, por exemplo, para transcrição ou como método de comando por voz.
  • Frequentemente a expressão "reconhecimento de voz" é utilizada com vários sentidos, que, na verdade, referem-se a tecnologias distintas. O processamento de voz pode ser aplicado em 4 principais áreas:
  1. Comando de voz: O reconhecimento de fala no comando de voz, é caracteriza-se por processar apenas um pequeno trecho de fala, de modo a identificar que tipo de ação o sistema deve tomar. Um exemplo prático são as centrais de telefone, onde o usuário pode usar a voz ao invés de apertar os botões.
  2. Fala natural: O reconhecimento de fala natural envolve uma ou mais frases, isto é, várias palavras que tenham o mesmo sentido semântico. A fala reconhecida é então convertida em texto. A aplicação mais comum para esta tecnologia é a ditado de documento usado até em e-mails.
  3. Síntese de voz: A síntese de voz é o processo contrário ao de reconhecimento de fala. O sintetizador recebe o texto em forma digital e o transforma em ondas sonoras. Ou seja, ele "lê" o texto digitado. Uma aplicação bem útil e que envolve a segurança que o reconhecimento de voz nos trás, é quando o usuário não pode desviar sua atenção para o texto e a síntese de voz faz a leitura do mesmo para o usuário.
  4. Autenticação de voz: Nada mais é que o reconhecimento de voz sendo utilizado para reconhecer a pessoa que está falando. Ele pode ser utilizado como forma de acesso de uma pessoa específica para uma função.


Por que usar o reconhecimento de voz?

  • O reconhecimento de voz permite que os usuários ditem ao seu computador para que ele converta suas palavras em texto quando estiverem usando um processador de textos ou escrevendo um e-mail. Também permite acessar comandos de função, como abrir arquivos e acessar menus com instruções de voz. E há programas projetados para áreas específicas, como transcrição médica ou legal.
  • Pessoas com deficiências que os impedem de digitar também já adotaram sistemas de reconhecimento de voz. Se um usuário não pode usar suas mãos, ou para deficientes visuais nos casos em que não é possível ou conveniente usar um teclado Braille, esses sistemas permitem que eles se expressem ditando textos e que tenham controle sobre várias das funções do computador. Alguns programas salvam os dados da fala do usuário após cada sessão, o que permite que pessoas com deterioração progressiva da fala continuem a ditar aos seus computadores.

Acessibilidade por trás do sistema de reconhecimento de voz

  • Com a globalização, as pessoas que não tem acesso às informações não estão, de certa forma, inclusas na sociedade. Pessoas com deficiência precisam de adaptações específicas para terem acesso a estas informações. Tal adaptação é trazida, de forma simples e eficaz, pelo reconhecimento de voz. Ou seja, com este tipo de tecnologia todos conseguem acessar e colaborar com as informações globais.

Aplicações

  • Atualmente, quando ligamos para a maior parte das grandes empresas, não é uma pessoa que costuma atender o telefone. É uma gravação automática que atende e o instrui a pressionar botões para passar pelos diferentes menus. No entanto, muitas empresas já passaram desse estágio de ter de apertar botões, pedindo que você fale certas palavras (novamente, como foi instruído por uma gravação) para conseguir o que quer. O sistema que torna isso possível é um tipo de programa de reconhecimento de voz, um sistema de telefone automatizado.
  • Também vale ressaltar a segurança que o reconhecimento de voz nos traz, como por exemplo a sua aplicação em GPS modernos. Um excelente exemplo desta aplicação é o programa WAZE, no qual podemos escolher nossas rotas e destinos através do reconhecimento de voz. Aumentando assim a segurança no trânsito simplesmente pelo fato do condutor não se distrair ao programar sua rota/destino.

https://itunes.apple.com/br/app/waze-gps-social-e-transito/id323229106

Referências