Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.

ROCHA, Raíssa Bezerra.

Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.

Detalhes bibliográficos
Ano de defesa:	2012
Autor(a) principal:	ROCHA, Raíssa Bezerra.
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Codificação de Voz Codificação Fonética Taxa de Transmissão Reconhecimento de Fonemas Taxa de Bits Qualidade de Sinal Reconstruído Complexidade Retardo de Comunicação Sensibilidade aos Erros de Canal Voice Encoding Phonetic Coding Transmission Rate Phoneme Recognition Bit Rate Rebuilt Signal Quality Complexity Communication Delay Sensitivity to Channel Error Engenharia Elétrica
Link de acesso:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/8165
Resumo:	Esta dissertação apresenta o desenvolvimento de um codificador de voz que tem como principal característica a transmissão do sinal de voz com baixas taxas de bits. Desenvolvido principalmente para ser utilizado em sistemas móveis celulares, o codificador proposto é do tipo fonético, que entre as técnicas de codificação de sinais de fala é a que permite obter menor taxa de transmissão. Sua implementação está dividida no desenvolvimento do emissor e receptor. No emissor, os sinais de fala são segmentados por meio de um reconhecedor de fonemas que utiliza Modelos de Markov Escondidos (HMMs) para modelar o sinal de voz. A cada fonema é atribuído um índice préestabelecido e sua duração e energia são estimados. A informação transmitida ao receptor consiste no índice, energia e duração de cada fonema. Deste modo, o codificador consegue uma redução na taxa de transmissão do sinal de voz. O receptor é constituído em duas etapas. Na primeira, cada usuário do codificador tem que construir um banco de unidades acústicas por meio da pronúncia de frases pré-estabelecidas. Na segunda etapa, é realizada a síntese por concatenação de segmentos como sílabas, fonemas e encontros vocálicos. Para avaliar o desempenho do codificador foi realizado um teste subjetivo informal baseado no teste ACR (Absolute Category Rating). Duas avaliações foram feitas. A primeira utiliza segmentação automática no emissor e receptor e o codificador permitiu a transmissão do sinal de voz com uma taxa de, no máximo, 150 bits/s. Os resultados da qualidade dos sinais de voz indicam que os avaliadores classificam a maioria deles como de razoável a boa. Na segunda avaliação, a segmentação utilizada para formar o banco de unidades acústicas foi realizada de forma manual. Sessenta e dois ouvintes-avaliadores foram questionados a respeito da inteligibilidade e qualidade dos sinais de voz. Os sinais de voz foram codificados com 125 bits/s e a maior parte deles apresentaram bons níveis de inteligibilidade e foram considerados sinais de fala de qualidade razoável.

Desenvolvimento de um codificador de voz pessoal de baixa taxa baseada em modelos de Markov escondidos.

Registros relacionados