Codificação de vídeo baseada em DCT-3D

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Melo, Mateus Santos de
Orientador(a): Zatt, Bruno
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/6891
Resumo: Nos padrões de codificação de vídeos digitais híbridos, o vídeo a ser codificado, um sinal tridimensional, é dividido em quadros, sinais bidimensionais e, posteriormente, em blocos que são utilizados como unidade processamento. Entretanto Transformadas Tridimensionais, como a DCT-3D, podem ser utilizadas na exploração de correlação de informações de acordo com a composição natural do vídeo, um sinal tridimensional. Com o uso da DCT-3D é possível explorar a correlação de informações espaciais e temporais em uma única etapa de processamento. Desse modo, a DCT-3D pode ser utilizada como alternativa à Estimação de Movimento, etapa de maior esforço computacional dos codificadores atuais. Neste cenário, a DCT-3D pode contornar a ineficiência da estimação de movimento em cenários de movimentos não-translacionais, além de ser uma alternativa de menor esforço computacional. Para avaliar o uso de transformada tridimensional no processo de codificação de vídeos digitais, foi desenvolvido um codificador de vídeo, em C/C++, que utiliza como unidade base de processamento volumes de tamanho 8x8x8, compostos de blocos de tamanho 8x8 ao longo de oito quadros consecutivos. O codificador desenvolvido apresenta suporte às principais ferramentas de codificação suportadas pelos codificadores de vídeos baseados em sinais bidimensionais, entretanto, adaptadas para o suporte ao processamento de sinais tridimensionais. O codificador proposto apresenta seis configurações de codificação, são elas: Espacial, Diferencial, FS, FS+, RD-All e RD-Fast. Resultados experimentais foram comparados com o software de referência do padrão H.264, o JM, utilizando ferramentas similares às utilizadas no codificador proposto. Vídeos com maiores taxas de quadros por segundo apresentaram os resultados mais eficientes. As configurações Espacial, Diferencial e RD-Fast, destacam-se por apresentar baixo esforço computacional com redução de mais de 95% no tempo de codificação. Por sua vez, as configurações com Predição Interquadros FS e FS+ apresentam tempo de codificação similares ao JM utilizado. A configuração RD-Fast alcança bom compromisso entre tempo e eficiência de codificação demonstrando redução de mais de 95% no tempo de codificação ao custo de 67% de aumento no BD-Rate. Observa-se que a aplicação de transformadas tridimensionais é um alternativa promissora para codificação de baixa complexidade mas melhorias em outras etapas do codificador são necessárias para que a abordagem seja competitiva com codificadores atuais.