Betoecd (discussão | contribs)
Sem resumo de edição
Betoecd (discussão | contribs)
Sem resumo de edição
Linha 9: Linha 9:
=== Tratamento: STT e TTS ===
=== Tratamento: STT e TTS ===


[[Arquivo:tts.jpg|200px]]
[[Arquivo:tts.jpg|420px]]


Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
* STT - Speech To Text: quando geramos textos através de áudios do usuário.
* STT - Speech To Text: quando geramos textos através de áudios do usuário.
* TTS - Text To Speech: quando transformamos textos em áudios.
* TTS - Text To Speech: quando transformamos textos em áudios.

Edição das 23h37min de 7 de setembro de 2016

Erro ao criar miniatura: Arquivo não encontrado

Conceito

Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:

  • a transformação do que se fala em um texto simples, FALA LIVRE. Exemplo: Dictation
  • executar comandos ou tarefas através da voz, COMANDO DE VOZ. Exemplo: Siri (iOS)
  • e também a utilização da voz como fonte de segurança, AUTENTICAÇÃO DE VOZ, também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.

Tratamento: STT e TTS

Erro ao criar miniatura: Arquivo não encontrado

Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas

  • STT - Speech To Text: quando geramos textos através de áudios do usuário.
  • TTS - Text To Speech: quando transformamos textos em áudios.