Análise do desempenho de redes neurais artificiais no reconhecimento automático do locutor em baixas relações sinal ruído.

Detalhes bibliográficos
Ano de defesa: 2002
Autor(a) principal: Morgado, Rodrigo Dias
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/
Resumo: O presente trabalho apresenta um modelo para um sistema de Reconhecimento Automático do Locutor (RAL) utilizando Redes Neurais Artificiais (RNA) com o objetivo de diferenciar a voz de um determinado locutor da voz de todos os demais locutores da base. Os resultados incluem subconjuntos de locutores cujas vozes foram treinadas e cujas vozes não foram treinadas pelas redes. O sistema desenvolvido conta com um módulo de classificação composto por múltiplas redes neurais que permitem a fragmentação do conjunto de treinamento, o que garante a rápida introdução de novos locutores para serem treinados sem necessidade de descartar o treinamento já feito. Além disto o módulo de decisão pode ser ajustado de acordo com o nível de segurança requerido para a aplicação do sistema de reconhecimento. A robustez do reconhecedor é aferida através de testes realizados com as amostras submetidas a diversos tipos de ruído com diferentes densidades espectrais de potência. Finalmente estudou-se a possibilidade de introdução de um módulo de melhoramento com objetivo de aumentar a relação sinal ruído antes da entrada do módulo de classificação.