Detalhes bibliográficos
Ano de defesa: |
1996 |
Autor(a) principal: |
Perfeito, Joao Paulo Juliano |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-06062025-151233/
|
Resumo: |
O presente trabalho tem como objetivo demonstrar que é possível efetuar o reconhecimento de voz através da separação prévia dos sinais em unidades menores denominadas de sílabas fonéticas. Estas unidades menores segmentadas a partir do sinal original serão reconhecidas por um método baseado em modelos ocultos de Markov discretos, (DHMM). Aplicamos este modelamento a dois vocabulários: um reduzido para testes qualitativos e outro mais significativo dentro da estrutura da língua portuguesa, de maneira a testar o comportamento do algorítmo em condições mais próximas das reais. Os experimentos para ambos os vocabulários foram feitos com o uso extensivo de processamento digital de sinais, utilizando-se para a implementação do sistema programas em C em conjunto com o software de processamento matemático Matlab 4.0. No processo de elaboração do reconhecedor foram utilizadas variações de alguns algorítmos bem conhecidos, tais como: o algorítmo sugerido por Linde, Buzo & Gray, (IBG), para a geração dos codebooks; o algorítmo proposto por Paul Merlmenstein para a segmentação fonética, o algorítmo de Baum-Welch para a estimativa dos modelos de Markov e o algorítmo de Viterbi para o reconhecimento das sequências obtidas. |