[pt] IDENTIFICAÇÃO DE LOCUTOR ROBUSTA E INDEPENDENTE DO TEXTO USANDO MÚLTIPLOS CLASSIFICADORES EM SUB-BANDAS
Ano de defesa: | 2011 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
MAXWELL
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=17227&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=17227&idi=2 http://doi.org/10.17771/PUCRio.acad.17227 |
Resumo: | [pt] Esta tese destina-se ao desenvolvimento de novas técnicas de combinação de classificadores aplicados em sub-bandas visando melhorar a identificação de locutor robusta e independente do texto. As vantagens observadas nas pesquisas utilizando múltiplos classificadores em sub-bandas para o reconhecimento de locutor robusto motivaram o desenvolvimento de técnicas de combinação desses algoritmos. Nessa tese foram propostas novas abordagens para a combinação das respostas dos classificadores nas sub-bandas. O principal objetivo é melhorar a taxa de acerto em situações onde nada se sabe sobre o tipo de ruído que pode estar corrompendo os sinais de voz usados no teste do sistema. As diferentes propostas consistem no emprego de pesos não-uniformes, espaço nulo, treinamento em múltiplas condições, atributos dinâmicos e coeficientes de autocorrelação – MFCC. A aplicação das novas propostas contribui significativamente para a melhoria da taxa de acerto do sistema de reconhecimento. Obteve-se, por exemplo, um aumento na taxa de reconhecimento, em relação à técnica de combinação Soma apresentada na literatura, de aproximadamente 47% em testes com ruído branco, e de 32% em testes com ruído não-branco em 15 segundos de fala e 10 dB de RSR (Relação Sinal Ruído), apenas utilizando uma nova estratégia que emprega o espaço nulo na combinação de classificadores em sub-bandas. Resultados mais significativos foram obtidos empregando-se as demais propostas apresentadas no presente trabalho. |