Projeto e avaliação de dicionários para quantização vetorial de voz e imagem.

Detalhes bibliográficos
Ano de defesa: 2001
Autor(a) principal: BERNARDINO JÚNIOR, Francisco Madeiro.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11257
Resumo: Neste trabalho são apresentadas técnicas para projeto de dicionários aplicados a quantização vetorial (QV) de sinais de voz e imagens. A primeira. denominada SOA (self organizing algorithm), e inspirada no algoritmo de Kohonen. Utiliza, no entanto, um paradigma de vizinhança diferente do proposto por Kohonen para atualização dos vetores-código. A segunda, denominada SSC (synaptic space competitive), corresponde a nm algoritmo que utiliza aprendizagem competitiva simples. A terceira, denominada FS-SSC (frequency sensitive SSC), e resultante da introdução do principio de consciência de Grossberg no algoritmo SSC. A quarta técnica, denotada por PCA (como alusão a principal component analysis), utiliza os autovalores e os autovetores (componentes principais) da matriz de covariância de um sinal de voz para calcular os vetores-código do dicionário. São apresentados resultados concernentes a codificação de sinais de voz e imagem baseada em QV simples (convencional) como também em QV no dominio wavelet, alem de resultados referentes ao reconhecimento de locutores baseado em QV paramétrica. Os resultados mostram que os algoritmos SOA, SSC, FS-SSC e PCA apresentam~se como altemativas ao tradicional algoritmo LBG (Linde-Buzo-Gray). E investigada a complexidade computacional dos algoritmos SSC e LBG. São obtidas expressões analíticas (em função do tamanho do dicionario, da dimensão dos seus vetores-código, do numero de vetores do conjunto de treino e do numero de iterações desses algoritmos) que estabelecem as condições que devem ser obedecidas para que o algoritmo SSC seja mais eficiente que o algoritmo LBG quanto ao número de operações (divisões, multiplicações, comparações, adições e subtrações) realizadas durante o projeto do dicionario. 0 presente trabalho também apresenta um método para redução da complexidade computacional da etapa de codificação da QV. 0 método proposto utiliza a organização estruturada dos dicionários PCA para reduzir significativamente o numero de operações realizadas na etapa de determinação do vizinho mais próximo de cada vetor a ser codificado bem como para minimizar os requisitos de memória exigida para armazenar o dicionário.