Redes neurais artificiais com retardos temporais aplicadas ao reconhecimento automático do locutor.

Detalhes bibliográficos
Ano de defesa: 1997
Autor(a) principal: Casagrande, Rogério
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06112024-143045/
Resumo: A rede neural do tipo TDNN (Time-Delay Neural Network), vem sendo aplicada na tarefa de identificação de locutores devido a sua capacidade de lidar com eventos temporais. Neste trabalho foram utilizadas, além do algoritmo de treinamento originalproposto por Waibel, o Backpropagation, algumas estratégias de treinamento das redes TDNN a partir de modificações neste algoritmo. São apresentadas os resultados de diferentes formas de propagação do erro através das ponderações das sinapses, eainda, a influência dos atrasos na tarefa de identificação. Para efeito de comparação, aplicou-se à mesma tarefa a rede MLP (Multi Layer Perceptron). Os resultados mostraram que o desempenho da rede TDNN na aplicação à identificação de locutores é superior. Outro estudo foi realizado utilizando-se duas técnicas para o pré-processamento dos dados de entrada dos sistemas neurais: o banco de filtros (filter banks) e a transformada Wavelet. Os testes mostram grande potencial da transformada Wavelet em termos de rapidez de cálculo e boa compactação dos dados. Entretanto, verificou-se melhor desempenho das redes com pré-processamento de banco de filtros.