Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas.

Detalhes bibliográficos
Ano de defesa: 1994
Autor(a) principal: COSTA, Washington César de Almeida.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500
Resumo: Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina.