Betoecd (discussão | contribs)
Betoecd (discussão | contribs)
Sem resumo de edição
Etiqueta: visualeditor
Linha 3: Linha 3:
== Conceito ==
== Conceito ==
Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:
Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:
* a transformação do que se fala em um texto simples, '''fala livre.''' Exemplo: [https://dictation.io/ Dictation]
* a transformação do que se fala em um texto simples, '''FALA LIVRE.''' Exemplo: [https://dictation.io/ Dictation]
* executar comandos ou tarefas através da voz, '''COMANDO DE VOZ.''' Exemplo: Siri (iOS)
* e também a utilização da voz como fonte de segurança, '''AUTENTICAÇÃO DE VOZ''', também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.
 
=== Tratamento: STT e TTS ===
Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas
* TTS - Text To Speech: quando transformamos textos em áudios.
* STT - Speech To Text: quando geramos textos através de áudios do usuário.

Edição das 23h32min de 7 de setembro de 2016

Erro ao criar miniatura: Arquivo não encontrado

Conceito

Speech Recognition ou simplesmente reconhecimento de voz, é o processo pelo qual um software transforma as ondas mecânicas emitidas por um usuário em linguagem digital, para realizar alguns conjuntos de atividades que podem ser subdivididas em:

  • a transformação do que se fala em um texto simples, FALA LIVRE. Exemplo: Dictation
  • executar comandos ou tarefas através da voz, COMANDO DE VOZ. Exemplo: Siri (iOS)
  • e também a utilização da voz como fonte de segurança, AUTENTICAÇÃO DE VOZ, também reconhecido como biometria focal, sua aplicação ainda ocorre em níveis de segurança mais baixos até o aperfeiçoamento da tecnologia.

Tratamento: STT e TTS

Além de realizar o reconhecimento de informações por voz é muito importante devolver essas informações para o usuário também em forma de áudio. Tendo isso em mente dividimos o tratamento de voz em duas áreas

  • TTS - Text To Speech: quando transformamos textos em áudios.
  • STT - Speech To Text: quando geramos textos através de áudios do usuário.