1. INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DA
PARAÍBA – CAMPUS JOÃO PESSOA
CURSO : MESTRADO EM ENGENHARIA ELÉTRICA
DISCIPLINA: PROCESSAMENTO DE SINAIS
PROFª. DRª. SUZETE ELIDA NÓBREGA CORREIA
PCM, DPCM & ADPCM
MANOELLA MARIA SARAIVA CAVALCANTE
Matrícula: 20151630040
JOÃO PESSOA– PB
2015
2. INSTITUTO FEDERAL DE EDUCAÇÃO CIÊNCIA E TECNOLOGIA DA PARAÍBA
MESTRADO EM ENGENHARIA ELÉTRICA
DISCIPLINA: PROCESSAMENTO DE SINAIS
PROFESSORA: DRª. SUZETE ELIDA NÓBREGA CORREIA
ALUNOS: MANOELLA MARIA SARAIVA CAVALCANTE
PCM, DPCM & ADPCM
JOÃO PESSOA– PB
2015
Pesquisa apresentada à professora
Suzete Elida Nóbrega Correia,
sobre PCM, DPCM e ADPCM, da
disciplina Processamento de
Sinais, do curso de Mestrado em
Engenharia Elétrica do IFPB.
4. 4
1. INTRODUÇÃO
Hoje em dia é mais que comum trabalhar com sistemas digitais, desde a telefonia
digital, o compact disk (CD), o hard disk (HD), entre outros.
Qualquer tipo de informação que necessite ser armazenada em um sistema
computacional ou transmitida em um canal de transmissão necessita passar por um
tratamento de sinal, ou seja, um processo chamado de codificação de fonte. A grande
vantagem da utilização de um sistema assim é a redução de entropia do sinal.
Quando se precisa transmitir informações analógicas por um sistema de transmissão
digital, o sinal analógico precisa ser processado de tal forma que possa ser convertido
em digital através de amostragens e quantização.
Este sinal, depois da quantização, deve ser transformado em bits.Existem dois
principais formatos de codificação que podem efetuar essa transformação: a codificação
paramétrica e a codificação de onda. Na codificação paramétrica utilizam-se taxas de
transmissão pequenas como 2,4 a 4,8 kbps, mas a sua qualidade de sinal é baixa após a
compressão. Na codificação por onda, a qualidade do sinal é alta, porém precisa de altas
taxas de transmissão entre 16 a 64 kbps.
A codificação digital de voz utiliza a amostragem e a quantização do sinal para
conseguir a menor taxa de codificação possível e a melhor qualidade do sinal
sintetizado.
O nosso objetivo passa por analisar a codificação por onda. No mundo da
engenharia existem 3 principais métodos para essa codificação: o PCM ou Modulação
por Código de Pulso, o DPCM ou Modulação por Código de Pulso Diferencial, e o
ADPCM ou Modulação por Código de Pulso Diferencial Adaptativa.
A codificação por formato de onda é menos complexa já que não precisamos saber
como o sinal foi gerado. A taxa de transmissão deste formato fica geralmente acima dos
16 kbps.
A PCM é a mais útil e mais largamente empregada das modulações em pulsos
mencionadas. Como ilustrado na Fig.6.13, A PCM é basicamente uma ferramenta para
converter um sinal analógico em um sinal digital (conversão A/D). Um sinal analógico é
caracterizado por uma amplitude que pode assumir qualquer valor em um intervalo
5. 5
contínuo. Isso significa que pode assumir um número infinito de valores. Um sinal
digital, por sua vez, tem uma amplitude que pode que pode assumir apenas um número
finito de valores. Um sinal analógico pode ser convertido em um sinal de digital através
de amostragem e quantização, ou seja, aproximação de seu valor ao mais próximo dos
números permitidos (ou níveis de quantização. As amplitudes do sinal analógico m(t)
ocorrem no intervalo (-mp, mp ), que é dividido em L subintervalos, cada um com
largura Δv=2mp/L.
De um ponto de vista prático, um sinal digital binário (sinal que pode assumir
apenas dois valores) é muito desejável, devido à sua simplicidade, economia, e
facilidade de implementação. Podemos converter um sinal L-ário em um sinal binário
através de codificação, formada pela representação binária dos 16 dígitos decimais de
0a 15, é conhecida como código binário natural (CBN). Outras maneiras de obtenção de
códigos binários serão discutidas posteriormente. A cada um dos 16 níveis a serem
transmitidos é alocado código binário de quatro dígitos. O sinal analógico m(t) fica,
então, convertido em um sinal digital (binário). Um dígito binário é denominado bit (de
binary digit), por conveniência. Essa contração de “binary digit” em “bit” se tornou uma
abreviação padrão na indústria.
Cada amostra no exemplo é, portanto, codificada por quatro bits. Para a transmissão
destes dados binários, precisamos alocar uma forma diferente de pulso a cada um ou
dois bits. Uma possibilidade é alocar um pulso negativo ao binário 0 e um pulso 1, de
modo que cada amostra seja transmitida por um grupo de quatro pulsos binários
(codificação por pulsos). O sinal resultante é um sinal binário.
A largura de banda de um sinal de áudio é de cerca de 15kHz. Contudo, para voz
testes subjetivos mostraram que a articulação (inteligibilidade) do sinal não é afetada se
todas as componentes acima de 3400 Hz forem suprimidas. Como, em telefonia, o
objetivo é a inteligibilidade e não alta fidelidade, as componentes acima de 3400Hz são
eliminadas por um filtro passa-baixas. O sinal resultante é, então, amostrado a uma taxa
de 8000 amostras por segundo (8 kHz). Esta taxa é intencionalmente maior que a taxa
de amostragem Nyquist de 6,8 kHz para que filtros realizáveis possam ser aplicados na
reconstrução do sinal. Cada amostra é, por fim, quantizada em 256 níveis (L = 256), o
que requer um grupo de oito pulsos binários para codificar cada amostra (28 = 256).
Assim, um sinal de telefonia requer8 x 8.000= 64.000 pulsos binários por segundo.
6. 6
Uma aplicação mais recente de PCM é o compact disc (CD). Esse é um caso de alta
fidelidade e requer uma largura de banda de 20 kHz para o sinal de áudio. Embora a
taxa de amostragem de Nyquist seja apenas 40 kHz, a taxa de amostragem usada é de
44,1 kHz, pelas razões mencionadas anteriormente. O sinal é quantizado em um número
muito maior (L = 65.536) de níveis de quantização, e cada um é representado por 16
bits para reduzir o erro de quantização. Amostras codificadas em binário (1,4 milhão de
bits/s) são, então, gravadas no CD.
Em seguida, vamos dar uma breve abordagem ao processo de amostragem e
quantização e após isto, abordar os três principais métodos de codificação por onda,
com ênfase para o PCM.
2. VANTAGENS DE COMUNICAÇÃO DIGITAL
A seguir, são listadas algumas vantagens da comunicação digital em relação à
comunicação analógica:
I. A comunicação digital é capaz de suportar muito mais ruído de canal e
distorção, desde que o ruído e a distorção estejam dentro de certos limites, e é
mais robusta do que a comunicação analógica. No caso de mensagens
analógicas, qualquer distorção ou ruído, não importa quão pequenos sejam,
alterarão sinal recebido.
II. A maior vantagem da comunicação digital em relação à analógica, no entanto, é
viabilizar o uso de repetidores regeneradores. Em um sistema de comunicação
analógica, um sinal de mensagem se torna progressivamente mais fraco à
medida que viaja pelo canal, enquanto o ruído cumulativo de canal e a distorção
se tornam progressivamente mais fortes. Por fim, o sinal é superado por ruído e
distorção. A amplificação é de pouca utilidade, pois o sinal e o ruído são
amplificados na mesma proporção. Em consequência, a distância ao longo da
qual uma mensagem analógica pode ser transmitida é limitada pela potência de
transmissão inicial. No caso de comunicação digital, uma longa distância de
transmissão também pode acarretar ruído e interferência excessivos. O truque,
no entanto, consiste em montar estações repetidoras ao longo da rota de
transmissão em distâncias curtas o bastante para que pulsos de sinal possam ser
detectados antes que o acúmulo de ruídos e distorção destrua o sinal. Em cada
7. 7
estação repetidora, os pulsos são detectados e pulsos novos e limpos são
transmitidos à próxima estação repetidora, que, por sua vez, duplica esse
procedimento. Se o ruído e a distorção forem mantidos abaixo de certos limites (
O que é possível, tendo em vista o pequeno espaçamento entre repetidores ), os
pulsos podem ser detectados corretamente. * Assim, mensagens digitais podem
ser transmitidas por distâncias maiores e com mais confiabilidade do que
mensagens analógicas. Na PCM, o erro mais significativo advém da
quantização. Esse erro pode ser reduzido tanto quanto desejado, com o aumento
do número de níveis de quantização; o preço dessa solução é pago com aumento
da largura debanda do meio de transmissão ( canal).
III. A implementação em hardware digital é flexível e permite o uso de
microprocessadores, comutadores digitais e circuitos integrados de larga escala.
IV. Sinais digitais podem ser codificados para produzir taxas de erro extremamente
pequenas e alta fidelidade, assim como privacidade.
V. A multiplexação de sinais digitais é mais fácil e eficiente que a de sinais
analógicos.
VI. A comunicação digital é inerentemente mais eficiente que a analógica no que
diz respeito à troca de SNR por largura de banda.
VII. O armazenamento de sinais digitais é relativamente simples e barato e permite a
busca e seleção de informação em bases de dados eletrônicas distantes.
VIII. A reprodução com mensagens digitais pode ser extremamente confiável e sem
deterioração. Mensagens analógicas, como fotocópias e filmes, por exemplo,
perdem qualidade a cada estágio sucessivo de reprodução e devem ser
transportadas fisicamente de um local distante a outro, o que, em geral, tem
custo relativamente alto.
IX. O custo de hardware digital continua tendo redução de 50% a cada dois ou três
anos, enquanto o desempenho ou capacidade dobra no mesmo período. E não há
um fim à vista para o empolgante e exponencial progresso da tecnologia digital.
Em consequência, hoje as tecnologias digitais dominam todas as áreas de
comunicação e armazenamento de informação.
8. 8
3. AMOSTRAGEM
As amostragens são feitas no tempo, e para que não se perca informação, segundo o
Teorema de Nyquist, a frequência de amostragem fm deve ser pelo menos duas vezes
maior do que a maior frequência contida no espectro do sinal. Normalmente aplica-se
um filtro passa-baixas para limitar o espectro de frequências na área de interesse. No
caso de sinais de voz, é comum usar um filtro com frequência de corte de 3,4KHz e uma
taxa de amostragem de 8KHz. Para o caso de um cd player, a frequência de corte é
geralmente de 44,1 KHz já que os sinais de música possuem componentes de alta
frequência.
4. QUANTIZAÇÃO
Após a amostragem torna-se necessário quantizar. Esse processo introduz erros.
Porém, quanto mais bits usarmos no processo de quantização, menor será o erro.
Define-se como erro de quantização a diferença entre a entrada não quantizada e a saída
quantizada, e ele deve ser minimizado.
Existem algumas técnicas de quantização, que quando usadas nos tipos de sinais
adequados, podem produzir um erro de quantização baixo. Algumas delas são:
quantização uniforme, não uniforme, logarítmica e vetorial.
Quantizadores uniformes são aqueles em que os níveis de quantização são
equidistantes e são os mais simples em termos de implementação. Porém, a sua
desvantagem é que se tivermos um sinal de amplitude baixa, por exemplo, e os níveis de
quantização não tiverem intervalos suficientemente pequenos, haverá um erro grande no
processo.
Para os quantizadores não uniformes devemos levar em conta que, dependendo
do sinal a ser quantizado, podemos utilizar compressores de modo a diminuir o erro de
quantização de baixa amplitude. A razão disto vem bem expressa abaixo, na
quantização logarítmica. Assim, se pudermos obter a função densidade de probabilidade
do tipo de sinal a ser quantizado, podemos obter um quantizador que minimize o erro de
quantização para aquele sinal conhecido.
9. 9
A quantização logarítmica é usada quando há grandes variações de sinal, como
por exemplo os sinais de fala. Existe uma certa desvantagem nessa técnica, pois se a
ordem de variação de amplitude fôr grande, precisariamos usar um grande número de
bits ou estariamos sujeitos a um intervalo grande e consequentemente um erro de
quantização igualmente grande. No caso de sinais de fala, a probabilidade de sinais de
baixa amplitude é maior e por isso usamos intervalos de quantização não uniformes que
aumentam a medida que a amplitude do sinal cresce. Um método simples de obter este
processo é aplicar um compressor de características logarítmicas ao sinal antes de
quantizar. Existem dois tipos de compressão bastante utilizados: a lei e a lei A. Eles
são bastante similares, e as suas características de transferência são mostradas pelas
equações abaixo:
Figura 1 - Equações da lei e a lei A
A quantização vetorial baseia-se no fato de usar um bloco do sinal
original em vez quantizar cada amostra independentemente das demais. Esta técnica é
eficiente quando as amostras são dependentes umas das outras. Este tipo de quantização,
apesar de reduzir a taxa de transmissão, envolve algoritmos complexos, e é mais
sensível a erros de transmissão pois o recebimento de um vetor errado representa o erro
de um bloco de sinal.
Como mencionado anteriormente, sinais digitais têm uma variedade de fontes.
Algumas, como computadores, são inerentemente digitais. Outras são analógicas,
convertidas à forma digital por meio de diferentes técnicas, como PCM ou modulação
delta (DM), que analisaremos em seguida. O resto desta seção apresenta uma discussão
quantitativa da PCM e de seus vários aspectos, como quantização, codificação,
sincronização e as necessárias larguras de banda e SNR de transmissão.
Para quantização, limitamos a amplitude do sinal de mensagem m (t) ao intervalo (-
mp, mp) que é dividido em L intervalos uniformemente espaçados, cada um com
largura ν=2p/L. No receptor, alguns pulsos podem ser detectados erroneamente. Em
10. 10
consequência, há duas fontes de erro neste esquema: erro de quantização e erro de
detecção de pulsos. Em quase todos os esquemas práticos, o erro de detecção de pulsos
é muito pequeno em comparação com o erro no sinal recebido é causado
exclusivamente pela quantização.
Se m (kTs) for a K-ésima amostra do sinal m(t) e ṁ(kTs) for a correspondente
amostra quantizada, da fórmula de interpolação na equação abaixo, temos
Em que ṁ(t) é o sinal reconstruído das amostras quantizadas. A componente de
distorção q(t) no sinal reconstruído é q(t)=ṁ(t)-m(t). Logo,
Em que q(kT s) é o erro de quantização na k-ésima amostra. O sinal q(t) é o sinal
indesejado e, portanto, atua como um ruído, conhecido como ruído de quantização. Para
calculara potência ou valor quadrático médio de q(t), temos
Podemos mostrar que os sinais sinc (2πBt-mπ) e sinc (2πBt-nπ) são ortogonais, ou
seja,
11. 11
Por conta desse resultado, a integral dos termos cruzados no lado direito da se anula,
e obtemos:
5. CODIFICADOR PCM
A saída multiplexada PAM é aplicada à entrada do codificador, que quantiza e
codifica cada amostra em um grupo de n dígitos binário. Embora exista uma
variedade de codificadores que faz n comparações sequenciais para gerar uma
palavra de código de n bits. A amostra é comparada com uma tensão obtida por uma
combinação de tensões de referência proporcionais a 27
, 26
, 25
, ...,20
R.
A codificação exige respostas a sucessivas perguntas, das quais a primeira é se a
amostra está na metade superior ou inferior do intervalo permitido. O primeiro
dígito de código 1 ou 0 é gerado, dependendo se a amostra estiver na metade
superior ou inferior do intervalo. No segundo passo, outro dígito 1 ou 0 é gerado,
dependendo se a amostra estiver na metade superior ou inferior do subintervalo em
está localizada. O processo continua até que o último dígito binário no código tenha
sido gerado.
A decodificação é o inverso da codificação. Neste caso, cada um dos n dígitos é
aplicado a um resistor de valor diferente. O k-èsimo dígito é aplicado a um resistor
2k
R. As correntes em todos os resistores são somadas. A soma é proporcional ao
valor da amostra quantizada. Por exemplo, uma palavra de código binário 10010110
produzirá uma corrente proporcional a 27
+0+0+24
+0+22
+21
+0=150. Isso completa a
conversão D/A.
12. 12
6. PCM
O PCM é um tipo de codificador de forma de onda, que procura reproduzir o
sinal amostra por amostra.
Figura 2 – Exemplo de amostragem com intervalos de Δ e exemplo de quantização com 15 níveis de intervalo.
A modulação PCM de um sinal analógico acontece de forma simples: o sinal é
amostrado em intervalos de tempo iguais, o sinal é quantizado em alguns níveis finitos
de amplitude, finalmente o sinal é codificado. O método de codificação da forma de
onda PCM está definido nas especificações internacionais CCITT G.711, e AT&T
43801.
A amostragem deve respeitar a frequência de Nyquist, fa = 2*fM.
Primeiramente, adota-se um intervalo fixo de tempo entre uma amostra e outra.
Tanto o modulador quanto o demodulador tem os passos de amostragem já definidos
pelo sistema, no caso do PCM de telefonia o equipamento “enxerga” uma banda de
4000Hz que corresponde aproximadamente a banda que o sinal de voz ocupa. A
frequência de amostragem é de 8000Hz (8000 amostras por segundo ou ainda uma
amostra a cada 125us), respeitando a frequência de Nyquist.
No sistema telefônico o intervalo entre uma amostra e outra de um canal é utilizado
para agregar outras amostras de outros canais diferentes.
O processo de quantização pode ser visto como o mapeamento do sinal, a partir do
domínio contínuo para um número finito de níveis de saída. Como o sinal analógico
pode ter uma amplitude teoricamente infinita, mas na realidade com um valor máximo
13. 13
de amplitude, divide-se este intervalo de valores possíveis em alguns níveis de
amplitude de saída.
No PCM temos 256 níveis de quantização, como o PCM utiliza a codificação
binária, cada palavra-código contém 8 bits (28 = 256). Temos 8 bits para representar
cada amostra.
Por causa da limitação da representação do sinal existirá sempre a presença de um
ruído de quantização, no sinal quantizado. O quantizador uniforme tem um passo de
quantização constante o intervalo entre os níveis de quantização.
A relação sinal-ruído (incluindo o ruído de quantização) é um fator que afeta a
qualidade de voz na codificação uniforme. A quantização uniforme utiliza níveis iguais
de quantização em todo o “range” de entrada do sinal analógico. Sinais de pequena
amplitude têm baixo nível de relação sinal-ruído e sinais com alta amplitude têm uma
relação sinal ruído alta. Como a maioria dos sinais de voz têm pequenas amplitudes,
este processo é ineficiente e o quantizador não uniforme entra em cena.
No quantizador não uniforme, o passo de quantização não é constante, mas é
função da amplitude do sinal, na verdade os níveis têm um espaçamento
logarítmico entre si.
A “compansão” é um processo onde primeiro se comprime o sinal analógico
na fonte e depois expandir o sinal no seu lugar de destino. O termo compansão é a
junção dos termos compressão e expansão. No processo de compansão as amostras do
sinal digital são comprimidas em segmentos logarítmicos. Cada segmento é então
quantizado e codificado usando a codificação uniforme. O processo de compressão é
logarítmico. A compressão aumenta a medida em que as amostras do sinal aumentam.
Quanto maior um a amostra é em amplitude mais esta será comprimida do que uma
amostra em menor amplitude. Isto causa um ruído de quantização que cresce a medida
em que a amostra do sinal também cresce. Um aumento logarítmico na quantização.
Duas leis de compressão do sinal são definidas nas especificações
internacionais ITU-T são chamadas lei u e lei A. A compressão (realizada no
transmissor) é necessária para elevar os níveis mais fracos do sinal em comparação com
os níveis mais elevados e tornar o codificador mais robusto, a expansão é realizada no
receptor como função inversa da compressão.
14. 14
A lei u limita os valores de amostras para treze bits de magnitude e a lei A limita as
amostras para 12 bits.
A fórmula matemática para a lei u se encontra abaixo na equação (1) e a fórmula
matemática para a lei A se encontra na equação (2).
(1)
(2)
Figura 3- Compressão de sinal digital, entrada com 12 bits e 7 bits de saída.
A compansão do sinal é o processo de compressão e expansão realizado em um
processador digital de sinais, (digital signal processor - DSP), ou em um computador.
Por isso a curva de compressão ou expansão é aproximada por segmentos lineares e
programada no DSP.
Basicamente os parâmetros u e A definem as curvas de compressão; se eles forem
muito altos, a não-linearidade aumenta muito e o sinal fica distorcido. Os valores de
referência utilizados para um bom desempenho do sistema são u = 255 e A = 87,6.
A taxa de bits/s do PCM é definida internacionalmente como 64kbits/s
(8000amostras/s * 8bits por amostra).
15. 15
Atualmente o PCM é utilizado em diversas aplicações do nosso cotidiano: do
sistema telefônico, ao vídeo digital passando por diversos formatos de áudio digital
usado em computadores. No sistema de DVD, por exemplo, utiliza algumas variantes
compactadas do PCM, pois o PCM em tem uma elevada taxa de bits.
O princípio básico da codificação PCM é extremamente simples, consistindo
apenas em amostrar e quantizar amostras do sinal original. Nas análises do sinal de fala,
é comum limitar os sinais de fala em uma faixa de frequências para depois fazer a
amostragem. Essa faixa bem como a taxa de amostragem dependem da aplicação,
embora a faixa de 4kHz seja bastante usada tal como a frequência de amostragem de
8kHz.
A quantização mais usada neste tipo de codificação é a logarítmica, sobretudo no
âmbito comercial. A razão do uso da quantização logarítmica em sistemas PCM é a sua
constante relação sinal-ruído (SNR) em uma faixa extensa de entrada. Assim, é possível
encontrar este tipo de quantização nos sistemas de telefonia digital que obtém sinais de
fala de ótima qualidade a uma taxa de 64 kbps.
Essa excelente qualidade e simplicidade de operação se tornam as maiores
qualidades da codificação PCM, embora as altas taxas de transmissão restrijam as suas
aplicações.
7. DPCM
A codificação DPCM surgiu com o objetivo de diminuir a dependência por altas
taxas de transmissão da codificação PCM. Essa codificação se beneficia da alta
correlação entre as sucessivas amostras dos sinais de fala para obter uma taxa menor.
Assim, esse tipo de codificação usa um preditor linear que estima o valor da amostra
atual com base nas passadas. Após obter-se a estimativa da amostra atual, compara-se a
mesma com a amostra original e transmite-se apenas o erro entre ambas. A taxa de
transmissão menor provém do fato de que o sinal de erro possui amplitudes mais baixas
que a amostra original, o que resulta em um número de bits menor para a sua
representação.
16. 16
Figura4-CodificadoreDecodificadorDPCM
Para entendermos a técnica de modulação ADPCM, primeiro analisaremos o
DPCM ou Differential Pulse Code Modulation.
Como as amostras consecutivas PCM são muito parecidas, as diferenças entre os
sinais de entrada são mínimas. A técnica DPCM tira toda a redundância do sinal
PCM. Nesta técnica temos uma amostragem da diferença entre amostras consecutivas, e
como as diferenças são pequenas comparada com um sinal completo temos uma taxa de
bits menor que um sinal PCM.
A primeira parte de um sistema DPCM trabalha igual ao amostrador e quantizador
PCM, entretanto todas as amostras passam por uma memória chamada preditor, depois a
amostra é enviada a um diferenciador.
O diferenciador analisa a amostra atual e a anterior do preditor e envia esta diferença
para o quantizador e codificador PCM, podendo passar por uma quantização uniforme.
Depois de quantizado e codificado a diferença é transmitida para o destino final e todo o
processo é revertido.
Primeiro a diferença é desquantizada, depois a diferença é adicionada em um sinal
amostrado armazenado no preditor e depois passa por um filtro passa baixa que
reconstrói o sinal de entrada original.
17. 17
O DPCM é uma ótima técnica de se reduzir taxa de bits para a transmissão de voz,
entretanto existe o problema que ele insere erros que diminuem a qualidade da voz.
Ele quantiza a diferença entre as amostra usando a quantização uniforme.
Como visto a quantização uniforme gera uma relação sinal-ruído pequena para sinais
amostrados de pequena amplitude e grande para sinais. Como a voz gerada pelo ser
humano tem sinais de amplitude pequena existe uma ineficiência neste processo que
acarretou na criação do ADPCM.
O DPCM, usando esta técnica, pode reduzir a taxa de 64 Kbps do PCM para uma
taxa de 48 Kbps. Porém, como ele trabalha com a inserção de erros, surge a
desvantagem de diminuir a qualidade de transmissão de voz. Outra desvantagem
importante é que ele faz uso da quantização uniforme, que como vimos, introduz erros
grandes para amplitudes baixas. Como o sinal de voz tem na maior parte do tempo
amplitudes baixas, foi necessário arranjar uma codificação que transmitisse maior
confiança ao processo, e foi assim que surgiu o ADPCM.
8. ADPCM
O ADPCM tem por objetivo melhorar o desempenho dos sistemas de codificação
PCM e DPCM. Este tipo de codificação faz uso de quantização e predição adaptativa.
Na quantização adaptativa, o intervalo de quantização varia com a amplitude das
amostras passadas, ao passo que na predição adaptativa existe um ajuste do preditor
linear de acordo com variações do sinal de voz e fazendo uso do cálculo dos
coeficientes para que o erro seja mínimo.
Assim, esta codificação passou a ser conhecida como adaptativa por possuir
parâmetros que podem ser alterados com base no sinal a ser codificado.
Na década de 80, o Comitê Consultivo de Telefonia e Telegrafia Internacional –
CCITT, determinou o padrão G721 que corresponde à codificação ADPCM a uma taxa
de 32 Kbps que oferece qualidade semelhante ao PCM com 64 Kbps.
Porém, existem muitos padrões de codificadores de voz definidos pela ITU que
fazem uso da técnica ADPCM. O padrão mais conhecido é o G.726. Ele recebe o sinal
vindo em PCM a 64 Kbps , e converte-o para taxas que podem ser de 16, 24, 32, ou 40
18. 18
Kbps. Para baixas taxas como 16 Kbps, a qualidade de som se degrada. Já para taxas
entre 24 e 40 Kbps, a sua eficiência é grande.
O quantizador adaptativo utilizado na codificação G.726 tem por objetivo
quantizar a diferença entre o sinal de entrada e o sinal estimado pelo preditor adaptativo.
Na figura abaixo é possível visualizar um diagrama do codificador ADPCM:
Figura5-CodificadorG.726ADPCM
Já na recepção, o quantizador adaptativo inverso do decodificador tem por
objetivo recuperar o sinal diferença. Após isto, o sinal amostrado é reconstruído a partir
da soma do sinal diferença com o sinal estimado pelo preditor adaptativo.
Assim, após reduzirmos a taxa de transmissão com o uso do ADPCM, o sinal é
novamente transformado em PCM na taxa de 64 Kbps que está no padrão G.721.
A figura abaixo mostra o diagrama do decodificador em questão:
20. 20
9. CONCLUSÃO
As técnicas de codificação aqui apresentadas baseiam-se em um processo simples e
por isso são usadas em muitas aplicações e é objeto de estudo em muitas disciplinas de
nível superior.
Podemos analisar o funcionamento das técnicas PCM, DPCM e ADPCM. Vimos
que o algoritmo desta técnica é muito fácil de ser implementada e por isto ela é
amplamente utilizada e difundida nas mais diversas tecnologias.
Apesar de estar bem definida, muitos estudos têm sido feitos para aprimorar
algoritmos de criação de codificadores e decodificadores PCM. Existem muitos
trabalhos sendo feitos e muitos a serem a serem realizados com o PCM.
Como se mostrou no trabalho, a técnica PCM apesar das suas vantagens, possui
um entrave quanto as altas taxas de transmissão. Por isso, desenvolveram-se outras
técnicas de codificação que servem basicamente para melhorar o desempenho da
codificação em PCM. Assim, surgiu mais tarde a codificação DPCM e posteriormente a
codificação ADPCM.
A codificação ADPCM foi a que mais aprimorou a técnica inicial de Modulação
por Código de Pulso. Com ela é possível transmitir sinais PCM com taxas menores,
respeitando um certo nível de qualidade. Assim, é possível ver estas codificações e suas
variantes trabalharem em conjunto nas mais diversas aplicações de mídia digital e
outros. O PCM e suas variantes são utilizados em aplicações de mídia digital: CDs e
DVDs, aplicações em telefonia e aplicações em áudio digita e Internet.
21. 21
REFERÊNCIAS CONSULTADAS
ALENCAR, Marcelo Sampaio. Telefonia Digital. Ed Érica, São Paulo,1998.
ANÁLISE DA CODIFICAÇÃO LPC PARA SINAIS DE FALA – por André Kutwak –
Departamento de Eletrônica – Universidade Federal do Rio de Janeiro – Acesso Abril de 2015.
CATTERMOLE, Kenneth W. Principles of pulse code modulation. American Elsevier Pub,
EUA, 1989.
CISCO SYSTEMS, Waveform Coding Techniques (Pulse Code Modulation, Differential
Pulse Code Modulation and Adaptive DPCM). 2007, www.cisco.com, <acessado em 23 de
abril de 2015>
CODIFICAÇÃO e COMPRESSÃO – Departamento de Engenharia de Eletrônica e
Telecomunicações e de Computadores – Instituto Superior de Engenharia de Lisboa – Acesso
Novembro de 2008
DIGITALIZAÇÃO DE SINAIS – Departamento Acadêmico de Eletrônica – EL54F
Disciplina de Telefonia Digital – Universidade Tecnológica Federal do Paraná – Acesso Abril
de 2015.
Disponível em http://www.deetc.isel.ipl.pt/redesdecomunic/disciplinas/RSCM/varios.pdf, acesso
em 22 de abril de 2015.
Disponível em http://www.fbissoli.hostmach.com.br/hipermidia/2007_1semestre/pcm_adpcm.pdf,
acesso em 22 de abril de 2015.
Disponível em http://www.lps.ufrj.br/profs/sergioln/theses/bsc03andrekutwak.pdf, acesso em 21
de abril de 2015.
POHLMANN, Ken C. Advanced Digital Audio. 1ª ed. SAMS, Carmel, EUA. 1991.