Redução de ruído sonoro aplicada ao reconhecimento automático de voz.

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: LIMA, Ísis de Andrade.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8156
Resumo: Um dos principais problemas no desenvolvimento de filtros para sinais de voz é a avaliação do seu desempenho. Não é possível determinar o desempenho de uma técnica de tratamento de ruído sonoro apenas pela análise da SNR obtida, pois a qualidade do sinal filtrado está ligada à sua inteligibilidade. As avaliações subjetivas também não são conclusivas. Esta dissertação apresenta uma avaliação comparativa dos filtros com resposta finita ao impulso de Wiener ótimo e sub-ótimo, que permite a ponderação entre redução de ruído obtida e distorção inserida a partir do ajuste de um parâmetro , por meio da observação da taxa de acertos de um sistema de reconhecimento automático de voz (RAV). Os filtros implementados possuem ordem 20 e janela de análise de 20 ms (intervalo no qual o sinal de voz pode ser considerado estacionário). Para o filtro sub-ótimo foram usados = 0; 5, = 0; 7 e = 0; 8. Para o reconhecedor foi utilizado o decodificador de amplo vocabulário Julius, modelo acústico baseado em cadeias de Markov (Hidden Markov Models – HMMs) e modelo linguístico N-grama para o português brasileiro. Os testes foram realizados com 20 frases de locutores distintos, totalizando 146 palavras. Foram obtidos os percentuais de palavras reconhecidas corretamente para os sinais sem adição de ruído, e para ruído aditivo gaussiano branco com SNR de 20 dB, 15 dB, 10 dB, 5 dB, 3 dB e 0 dB. Para avaliar o efeito de distorção nos filtros implementados, os sinais obtidos pela filtragem dos arquivos de voz sem ruído são processados pelo reconhecedor, observando que a percentagem de acerto aumenta com a diminuição do parâmetro (o filtro de Wiener corresponde a = 1). A partir da análise dos resultados de reconhecimento para os diferentes valores de SNR se conclui que a aplicação do filtro sub-ótimo com = 0; 7 resulta na melhor taxa de acertos para o reconhecedor utilizado dentre os quatro filtros desenvolvidos quando o ruído é aditivo gaussiano branco. A melhoria observada foi de 10% para a menor SNR avaliada e de 14% para a maior SNR avaliada.