Detalhes bibliográficos
Ano de defesa: |
1998 |
Autor(a) principal: |
Minami, Mario |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-29112024-093222/
|
Resumo: |
Implementamos um sistema reconhecedor de palavras isoladas, independente do falante, para ambientes adversos, com Modelos Ocultos de Markov (HMM\'s) multiparamétricos, com distribuições discretas, múltiplos livros de códigos, e expoentes de ponderação nos parâmetros, que será detalhado ao longo do texto. Com base nesse sistema, propomos um modelamento via Maximização da Informação Mútua (MM) sub-ótima que possibilita a melhoria do desempenho do sistema. O modelamento, fundamentado em elementos da Teoria da Informação, permitiu que os ajustes propostos acompanhassem o fluxo do sinal, iniciando pela etapa de codificação (quantização) e chegando aos modelos HMM, sempre pelo critério de otimização por MMI. Para o ajuste dos modelos HMM formulamos expressões de reestimação, e propomos o uso da seqüência de estados fornecida pelo decodificador por Viterbi para um procedimento de MMI sub-ótimo. Os testes no sistema e a avaliação dos ajustes propostos foram realizadoscom dados de centenas de falantes, coletados da linha telefônica fixa comercial, num vocabulário de dígitos da Língua Portuguesa. Os resultados mostraram que o modelamento proposto melhora significativamente o desempenho do sistema, sem aumentar consideravelmente a carga computacional. O modelamento proposto pode ser aplicado a qualquer HMM discreto. |