[en] CONTRIBUITIONS TO IMPROVING CELP CODING AT LOW BIT RATS
Ano de defesa: | 2006 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
MAXWELL
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=8363&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=8363&idi=2 http://doi.org/10.17771/PUCRio.acad.8363 |
Resumo: | [pt] Esta tese propõe novas melhorias para a codificação CELP a baixas taxas de bits. Primeiro, é proposto um algoritmo CELP em que a complexidade do procedimento de busca no dicionário adaptativo é grandemente reduzida, graças a uma modificação introduzida no modelo de síntese CELP. Resultados de simulação mostram que a qualidade da voz codificada com o algoritmo CELP proposto tem qualidade comparável àquela obtida com o algoritmo CELP convencional. As demais contribuições têm o propósito de melhorar a qualidade da voz codificada com o algoritmo CELP a baixas taxas de bits. Uma delas propicia uma codificação mais eficiente da envoltória espectral LPC da voz: é, especificamente, um esquema que combina quantização vetorial e interpolação interbloco dos parâmetros LSF. Com este esquema a envoltória espectral LPC codificada tem boa qualidade a uma taxa de bits tão baixa quanto 1 kb/s. A voz codificada com os algoritmos CELP apresenta freqüentemente distorções em sua envoltória espectral que são causadas por deficiências do sinal de excitação. Esta tese propõe um novo pós-filtro que reduz estas distorções e, com isso, melhora significativamente a qualidade subjetiva da voz codificada. A baixas taxas de bits a estrutura CELP convencional é incapaz de reproduzir com boa qualidade os ataques dos sons sonoros, que são cruciais para uma boa percepção da voz. Nesta tese é descrito um algoritmo CELP que dá prioridade a estes segmentos críticos. Cada bloco da voz é classificado em um dentre dezesseis padrões de sonoridade e cada padrão tem uma configuração de codificação e alocação de bits distintas. Resultados de simulação mostram que a qualidade da voz codificada a 4 kb/s com o algoritmo CELP proposto é significativamente melhor do que aquela conseguida com um codificador CELP convencional, também operando a 4 kb/s. |