Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz

Detalhes bibliográficos
Ano de defesa: 2011
Autor(a) principal: Wisnevski, Flávio Luis lattes
Orientador(a): Fagundes, Rubem Dutra Ribeiro lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia Elétrica
Departamento: Faculdade de Engenharia
País: BR
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/3038
Resumo: Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.