Detalhes bibliográficos
Ano de defesa: |
2002 |
Autor(a) principal: |
Morgado, Rodrigo Dias |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-24092024-095946/
|
Resumo: |
O presente trabalho apresenta um modelo para um sistema de Reconhecimento Automático do Locutor (RAL) utilizando Redes Neurais Artificiais (RNA) com o objetivo de diferenciar a voz de um determinado locutor da voz de todos os demais locutores da base. Os resultados incluem subconjuntos de locutores cujas vozes foram treinadas e cujas vozes não foram treinadas pelas redes. O sistema desenvolvido conta com um módulo de classificação composto por múltiplas redes neurais que permitem a fragmentação do conjunto de treinamento, o que garante a rápida introdução de novos locutores para serem treinados sem necessidade de descartar o treinamento já feito. Além disto o módulo de decisão pode ser ajustado de acordo com o nível de segurança requerido para a aplicação do sistema de reconhecimento. A robustez do reconhecedor é aferida através de testes realizados com as amostras submetidas a diversos tipos de ruído com diferentes densidades espectrais de potência. Finalmente estudou-se a possibilidade de introdução de um módulo de melhoramento com objetivo de aumentar a relação sinal ruído antes da entrada do módulo de classificação. |