Detalhes bibliográficos
Ano de defesa: |
1997 |
Autor(a) principal: |
Casagrande, Rogério |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06112024-143045/
|
Resumo: |
A rede neural do tipo TDNN (Time-Delay Neural Network), vem sendo aplicada na tarefa de identificação de locutores devido a sua capacidade de lidar com eventos temporais. Neste trabalho foram utilizadas, além do algoritmo de treinamento originalproposto por Waibel, o Backpropagation, algumas estratégias de treinamento das redes TDNN a partir de modificações neste algoritmo. São apresentadas os resultados de diferentes formas de propagação do erro através das ponderações das sinapses, eainda, a influência dos atrasos na tarefa de identificação. Para efeito de comparação, aplicou-se à mesma tarefa a rede MLP (Multi Layer Perceptron). Os resultados mostraram que o desempenho da rede TDNN na aplicação à identificação de locutores é superior. Outro estudo foi realizado utilizando-se duas técnicas para o pré-processamento dos dados de entrada dos sistemas neurais: o banco de filtros (filter banks) e a transformada Wavelet. Os testes mostram grande potencial da transformada Wavelet em termos de rapidez de cálculo e boa compactação dos dados. Entretanto, verificou-se melhor desempenho das redes com pré-processamento de banco de filtros. |