Sem resumo de edição
Linha 48: Linha 48:


== Vocoders ==
== Vocoders ==
Vocoders são uma classe de sistema de codificação de voz que analisam o sinal de voz e transmitem as características da voz de forma que seja possível o receptor sintetizar uma voz com as mesmas características da voz analisada pelo transmissor. Dessa forma, em um sistema que utiliza vocoders, a voz que a pessoa no receptor escuta não é a mesma voz da pessoa no transmissor, e sim recriada pelo receptor que tenta imitar a voz do transmissor.
Vocoders são em geral muito mais complexos do que os codificadores de forma de onda. Isso permite que eles alcancem tenham uma maior economia na taxa de transmissão.  Entretanto eles são muito menos robustos pois o seu desempenho tende a depender de quem está falando.
O mais popular entre os sistemas vocoder é o Codificador Preditivo Linear (LPC -- Linear Predictive Coder). Outros esquemas vocoder incluem o vocoder de canal, vocoder de formante, vocoder cepstrum e o vocoder exitado por voz.
=== Análise da voz ===
Os vocoders analisam a voz para codificar, separando-a em dois tipos: Sonoros e Surdos.
O som Sonoro (pronúncias de "m", "n", "v" e semelhantes) é resultado das vibrações quase periódicas da corda vocal. Já os sons Surdos (pronúncias de "f", "s" "x" e semelhantes) são fricativos produzidos por fluxo turbulento de ar por contração.
Além dos tipos de sons também tem a intonação que dependem da frequência da modulação da voz e as amplitudes dessas frequência.
Para a maioria das pessoas a frequência de intonação está abaixo de 300 Hz e essa informação é muito difícil de extrair do sinal. As intonação da voz correspondem às frequências de resonancia do trato vocal e são denominadas de ''Formantes'' do sinal de voz.
Ajustando meticulosamente os parâmetros do modelo de geração de voz, uma voz de boa qualidade pode ser sintetizada.
=== Vocoders de Canal ===
O vocoder de canal foi o primeiro entre os sistemas de síntese/análise da voz demonstrados na prática. os vocodes de canal são vocoders de domínio de frequência que determinam o envelope do sinal de voz para diversas faixas de frequências e depois amostram, codificam e multiplexam essa amostras com as saídas codificadas dos outros filtros. A amostragem é feita de forma síncrona e a cada 10 ms e 30 ms. com a informação da energia sobre cada banda, a decisão de sonoro/surdo e a frequência de entornação para a voz sonora também são transmitidas.
=== Vocoders de formantes ===
O vocoder de formante é semelhante em conceito ao vocoder de canal. Teoricamente, o vocoder de formante utiliza menos sinais de controle. Em vez de enviar amostras do envelope de espectro de potência, o vocoder de formante tenta transmitir as posições dos picos (formantes) do envelope espectral. Normalmente, um vocoder de formante deve ser capaz de identificar pelo menos três formantes para representar os sons da voz, e também deve controlar as intensidades dos formante.
Vocoders de formantes podem reproduzir a voz em taxas de bits inferiores a 1,2 kbps. Porém, devido às dificuldades no cálculo exato do local dos formantes e transições de formantes a partir da voz humana, eles não têm sido muito bem sucedidos.
=== Vocoders cepstrum ===


= Referências =
= Referências =

Edição das 03h00min de 13 de abril de 2012

  • Explique o que é CELP e seus procedimentos de codificação
  • Quais os padrões da série G e suas taxas?
  • Quais os codecs mais utilizados?
  • Explique sobre os padrões Rate: Full, Half, Enhanced ...
  • Faça um comparativo entre eles.
  • Quais as referências utilizadas neste trabalho?


Na comunicação móvel a largura de banda é um bem limitado e os servidores de comunicação móvel desejam acomodar o maior número de clientes dentro da largura de banda disponibilizadas para os seus serviços. Na tentativa de diminuir a banda necessária para transmitir a voz foram desenvolvidos diversos codificadores de voz visando diminuir a taxa de dados para a transmissão dela e, dessa forma, diminuir a banda necessária por cliente.

Codificadores

O papel dos codificadores de voz é diminuir a quantidade de informação (quantidade de bits por segundo) necessária que o transmissor deve enviar ao receptor de forma que o receptor possa reproduzir a fala da pessoa no transmissor com qualidade o suficiente para que a pessoa no receptor possa compreender. Para tentar comprimir a voz foram desenvolvidas diversas técnicas que podem ser divididas em duas categorias de codificadores: Os Codificadores de forma de onda, que tentam reproduzir a forma de onda do sinal de voz o mais próximo o possível da realidade sendo possível utilizá-los para qual quer sinal, e os Vocoders (Voice encoder), que utilizam mecanismos para conhecer a priore o sinal que deve ser codificado e por isso são específicos para cada sinal.

Codificadores de forma de onda

Os Codificadores de forma de onda são projetados para codificar sinais independente da origem e isso permite que eles possam codificar igualmente bem uma grande variedade de sinais. Eles têm a vantagem de serem robustos para uma grande variedade de características de voz e para ambientes com ruído. Essas vantagens são preservadas com o mínimo de complexidade, dessa forma essa categoria de codificadores consegue somente uma economia moderada na taxa de transmissão. Alguns exemplos de Codificador de forma de onda são:

  • Modulação por Código de Pulso (PCM -- Pulse Code Modulation);
  • Modulação por Código de Pulso Diferencial (DPCM -- Differential Pulse Code Modulation);
  • Modulação por Código de Pulso Diferencial Adaptativa (ADPCM -- Adaptative Differential Pulse Code Modulation);
  • Modulação Delta (DM -- Delta Modulation);
  • Modulação Delta com Variação Contínua de Inclinação (CVSDM -- Contunuously Variable Slope Delta Modulation);
  • Codificação Preditiva Adaptativa (APC -- Adaptative Predictive Coding).


Modulação por Código de Pulso (PCM)

Na essência, a modulação por código de pulso é simplesmente a representação dos bits de uma conversão analógico-digital de um sinal que e esses bitssão enviado pelo transmissor ao receptor de forma serial.

Modulação por Código de Pulso Diferencial Adaptativa (ADPCM)

Os sistemas que utilizam o PCM não tentam remover as redundâncias contidas no sinal de voz. Na tentativa de tirar proveito dessas redundâncias foi criado a Modulação por Código de Pulso Diferencia Adaptativo. O ADPCM permite que a voz seja codificada e transmitida à uma taxa de 32 kbps e mantendo a mesma qualidade de voz que um sistema PCM, cuja a taxa de transmissão é de 64 kbits. Algorítimos eficientes para o ADPCM foram desenvolvidos e padronizados, sendo o algorítimo ADPCM para codificação de voz a 40, 32, 24 ou 16 kbps recomendado pela ITU-T é o G.726.

Modulação Delta (DM)

Os moduladores Delta tentam transmitir a variação do nível dos sinais, ou seja, quando o nível do sinal é superior a do sinal anterior o emissor envia o bit 1 (um), já se o nível do sinal for inferior ao do sinal anterior é enviado o bit 0 (zero).

Modulação Delta com Variação Contínua de Inclinação (CVSDM)

Caso o sinal enviado ao MD tenha uma varição rápida este não conseguirá acompanhar a variação do sinal, pois cada bit enviado representa um passo fixo e pequeno o suficiente para provocar perdas no sinal por não permitir que a saída do MD acompanhe o sinal. Entretanto, se o passo representado pelos bits seja grande para poder acompanhar a variação rápida do sinal de entrada o MD irá inserir ruido quando a variação do sinal for mais suave. Para minimizar esses problemas, a Modulação Delta com Variação Contínua de Inclinação propõe um passo variável que depende da quantidade de simbolo repetido, como mostrado na figura abaixo. Algorítimo de controle do passo em um sistema CVSDM

De forma didática aqui é apresentado um exemplo de um Modulador Delta com Variação Contínua de Inclinação (CVSDM) feito no Proteus®.


Vocoders

Vocoders são uma classe de sistema de codificação de voz que analisam o sinal de voz e transmitem as características da voz de forma que seja possível o receptor sintetizar uma voz com as mesmas características da voz analisada pelo transmissor. Dessa forma, em um sistema que utiliza vocoders, a voz que a pessoa no receptor escuta não é a mesma voz da pessoa no transmissor, e sim recriada pelo receptor que tenta imitar a voz do transmissor. Vocoders são em geral muito mais complexos do que os codificadores de forma de onda. Isso permite que eles alcancem tenham uma maior economia na taxa de transmissão. Entretanto eles são muito menos robustos pois o seu desempenho tende a depender de quem está falando. O mais popular entre os sistemas vocoder é o Codificador Preditivo Linear (LPC -- Linear Predictive Coder). Outros esquemas vocoder incluem o vocoder de canal, vocoder de formante, vocoder cepstrum e o vocoder exitado por voz.

Análise da voz

Os vocoders analisam a voz para codificar, separando-a em dois tipos: Sonoros e Surdos. O som Sonoro (pronúncias de "m", "n", "v" e semelhantes) é resultado das vibrações quase periódicas da corda vocal. Já os sons Surdos (pronúncias de "f", "s" "x" e semelhantes) são fricativos produzidos por fluxo turbulento de ar por contração. Além dos tipos de sons também tem a intonação que dependem da frequência da modulação da voz e as amplitudes dessas frequência. Para a maioria das pessoas a frequência de intonação está abaixo de 300 Hz e essa informação é muito difícil de extrair do sinal. As intonação da voz correspondem às frequências de resonancia do trato vocal e são denominadas de Formantes do sinal de voz. Ajustando meticulosamente os parâmetros do modelo de geração de voz, uma voz de boa qualidade pode ser sintetizada.

Vocoders de Canal

O vocoder de canal foi o primeiro entre os sistemas de síntese/análise da voz demonstrados na prática. os vocodes de canal são vocoders de domínio de frequência que determinam o envelope do sinal de voz para diversas faixas de frequências e depois amostram, codificam e multiplexam essa amostras com as saídas codificadas dos outros filtros. A amostragem é feita de forma síncrona e a cada 10 ms e 30 ms. com a informação da energia sobre cada banda, a decisão de sonoro/surdo e a frequência de entornação para a voz sonora também são transmitidas.

Vocoders de formantes

O vocoder de formante é semelhante em conceito ao vocoder de canal. Teoricamente, o vocoder de formante utiliza menos sinais de controle. Em vez de enviar amostras do envelope de espectro de potência, o vocoder de formante tenta transmitir as posições dos picos (formantes) do envelope espectral. Normalmente, um vocoder de formante deve ser capaz de identificar pelo menos três formantes para representar os sons da voz, e também deve controlar as intensidades dos formante. Vocoders de formantes podem reproduzir a voz em taxas de bits inferiores a 1,2 kbps. Porém, devido às dificuldades no cálculo exato do local dos formantes e transições de formantes a partir da voz humana, eles não têm sido muito bem sucedidos.

Vocoders cepstrum

Referências

RAPPAPORT, Theodore S. Comunicações sem fio: Princípios e práticas. 2. ed. São Paulo: Prentice Hall, 2009. 412 p. ISBN 978-85-7605-198-5.

COUCH, Leon W. Digital and analog communication systems. 5. ed. New Jersey: Prentice Hall, 1997. 742 p. ISBN 0-13-599028-9.