Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

LIMA, Ísis de Andrade.

Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Detalhes bibliográficos
Ano de defesa:	2014
Autor(a) principal:	LIMA, Ísis de Andrade.
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Processamento Digital de Sinais Redução de Ruído Reconhecimento de Voz Avaliação Comparativa dos Filtros Impulso de Wiener Ótimo e Sub-Ótimo Sistema de Reconhecimento Automático de Voz (RAV) Cadeias de Markov - Modelo Acústico Modelo Linguístico N-Grama Ruído Aditivo Gaussiano Branco Hidden Markov Models (HMMs) Digital Signal Processing Noise Reduction Voice Recognition Comparative Evaluation of Filters Wiener Impulse Great and Sub-Great Automatic Voice Recognition System (RAV) Markov Chains - Acoustic Model Language Model N-Gram White Gaussian Additive Noise Engenharia Elétrica.
Link de acesso:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156
Resumo:	Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.

Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Registros relacionados