Sincronia de sistemas multimídia distribuídos utilizando técnicas de aprendizagem de máquina

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Pereira, Igor Gadêlha
Orientador(a): Silveira, Luiz Felipe de Queiroz
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/27937
Resumo: A troca de fluxos de dados multimídia em um cenário de sistemas distribuídos representa um desafio, devido principalmente a dois problemas geralmente presentes nesse contexto: a sincronização entre os diversos fluxos e o gerenciamento de hardwares heterogêneos presentes no sistema. A dificuldade em manter os limites temporais necessários para reprodução de um fluxo de dados multimídia aumenta com distúrbios introduzidos pelo canal de comunicação, o que está diretamente relacionado à qualidade de serviço. Na Internet, a transmissão de fluxo multimídia de tempo real requer estratégias eficientes de sincronização e armazenamento em memória, que podem adicionar uma quantidade significativa de latência interferindo diretamente na qualidade de experiência (QoE) vivenciada pelo usuário final. Dentre as aplicações que necessitam latência baixa para garantir um QoE aceitável, a composição e a execução de músicas através da internet representam o maior desafio. Nessa direção, propomos novos métodos para sincronização de fluxos multimídia codificados e fluxos de áudio não codificados, de alta precisão e baixa latência com o intuito de serem utilizados em sistemas multimídia de alcance global, como a Internet. Através dos experimentos realizados, identificamos boas taxas de acerto na sincronização desses fluxos de áudio e vídeo. Destacamos os valores de 72% na sincronização de fluxos de vídeo e até 93% para sequencias de áudio não codificados. Para isso utilizamos análise estatística de ordem superior e redes neurais convolucionais e sequenciais para computar uma relação temporal entre dois sinais multimídia.