Síntese de voz com qualidade.

Detalhes bibliográficos
Ano de defesa: 1993
Autor(a) principal: Gouvêa, Evandro Bacci
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-11122024-155608/
Resumo: Este trabalho realizou a implementação de um sistema de síntese de voz a partir de fonemas. A ideia básica consiste em formar uma biblioteca de unidades básicas, que poderiam ser fonemas, difones, trifones, etc., E concatenar essas unidades básicas para se formar a cadeia falada. A representação dos fonemas na biblioteca foi feita com base no modelo de predição linear. Representou-se o filtro que modela o trato vocálico através de pares de linhas espectrais (LSP). A excitação foi representada usando a técnica de predição linear excitada por código (CELP), que é uma técnica de análise por síntese. Montada a biblioteca de fonemas, foram estudados algoritmos que permitissem uma suavização das transições entre parâmetros relativos a difones justapostos, buscando obter uma melhora na qualidade do sinal de voz sintetizado.