Detalhes bibliográficos
Ano de defesa: |
1993 |
Autor(a) principal: |
Gouvêa, Evandro Bacci |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-11122024-155608/
|
Resumo: |
Este trabalho realizou a implementação de um sistema de síntese de voz a partir de fonemas. A ideia básica consiste em formar uma biblioteca de unidades básicas, que poderiam ser fonemas, difones, trifones, etc., E concatenar essas unidades básicas para se formar a cadeia falada. A representação dos fonemas na biblioteca foi feita com base no modelo de predição linear. Representou-se o filtro que modela o trato vocálico através de pares de linhas espectrais (LSP). A excitação foi representada usando a técnica de predição linear excitada por código (CELP), que é uma técnica de análise por síntese. Montada a biblioteca de fonemas, foram estudados algoritmos que permitissem uma suavização das transições entre parâmetros relativos a difones justapostos, buscando obter uma melhora na qualidade do sinal de voz sintetizado. |