Reconhecimento de fala utilizando modelos de Markov escondidos (HMM's) de densidades contínuas.
Ano de defesa: | 1994 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2500 |
Resumo: | Nesta dissertação é realizado um estudo teórico e a implementação em software de um sistema de reconhecimento de fala baseado em Modelos de Markov Escondidos (Hidden Markov Models - HMM's). HMM é uma ferramenta matemática que possibilita um modelamento dos sons da fala em termos de uma estrutura probabilística. Para tanto, utiliza-se, neste trabalho, HMM's do tipo left-right de cinco estados e fdp's contínuas, para representar a probabilidade dos vetores de observações em cada estado da cadeia de Markov. Os vetores de observações, de dimensão nove, são formados por oito coeficientes cepstrais e o logaritmo da energia segmentai como o nono parâmetro. O sistema H MM é composto de duas etapas: treinamento e classificação. Na fase de treinamento, o algoritmo de Baum-Welch é utilizado para reestimar os valores finais dos modelos. Por outro lado, na fase de classificação, utiliza-se o algoritmo de Viterbi para fornecer o valor da máxima verossimilhança entre a sentença de teste e os HMM's de referência. A avaliação do sistema proposto é realizada considerando-se dois diferentes modos de reconhecimento: o reconhecimento independente do locutor e o reconhecimento dependente do locutor. Em ambos os casos, especialmente para o modo de reconhecimento dependente do locutor, as avaliações realizadas levam a resultados bastante satisfatórios, considerando-se as condições gerais de experimentação. Além disso, várias conclusões importantes são obtidas para uma posterior otimização do sistema proposto. Finalmente, espera-se que este trabalho contribua de forma positiva para a motivação de novos estudos no campo da comunicação vocal homem-máquina. |