Aceleração do particionamento de quadros intra no codificador Versatile Video Coding (VVC) utilizando redes neurais profundas

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Bubolz, Thiago Luiz Alves
Orientador(a): Corrêa, Guilherme Ribeiro
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/8073
Resumo: A predição intra-quadro desempenha um papel muito importante nas tecnologias atuais de codificação de vídeo. Assim como no atual padrão estado-da-arte em codificação de vídeo, o High Efficiency Video Coding (HEVC), o novo padrão Versatile Video Coding (VVC) adicionou novos modos de predição aliados a novos tipos de particionamento para a predição intra-quadro. A Multi Type Tree (MTT) possibilita uma melhoria no VVC sobre a estrutura de particionamentos em quadtree do padrão HEVC, gerando tamanhos de bloco mais flexíveis. Essas novas técnicas alcançam alta eficiência de codificação, mas também resultam em um custo computacional muito alto, por vezes até impedindo a adoção deste novo padrão na indústria. Para mitigar este problema, esta dissertação apresenta um algoritmo rápido para decisão de particionamento das Coding Tree Units (CTU) durante a codificação intra-quadro, possibilitando uma redução de custo computacional do processo. Uma das contribuições do trabalho consiste em formar um dataset com dados em quantidade e pluralidade significativa, com intuito de alimentar uma arquitetura de rede neural profunda capaz de classificar particionamentos de CTU. Os resultados experimentais mostraram que a solução proposta atingiu redução no tempo de codificação de até 21,41%, com perda na eficiência de codificação de 0,432%.