Redução de complexidade do processo de decisão de modo da predição intra-quadro do codificador de vídeo VVC utilizando aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Duarte, Adson Ileon Ripinski
Orientador(a): Palomino, Daniel Munari Vilchez
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/8113
Resumo: Este trabalho apresenta uma solução para redução de complexidade do processo de decisão de modo da predição intra do codificador Versatile Video Coding (VVC). Para atingir esta redução em complexidade, a ordem em que os modos são avaliados no processo Rate-Distortion Optimization (RDO) foi alterada de forma a dar prioridade a modos de predição intra que possuam mais chances de serem escolhidos como o melhor ao final do processo de decisão. Ao fazer isto, foi possível inserir modelos de aprendizado de máquina supervisionado baseados em árvores de decisão binárias capazes de detectar quando é possível desconsiderar a avaliação de alguns tipos de modos de predição intra-quadro baseado nos custos taxa-distorção dos modos que já foram avaliados até o momento. Um total de três modelos baseados em árvores de decisão foram desenvolvidos. O primeiro e o segundo modelo foram desenvolvidos com o objetivo de buscar predizer quando os modos de predição intra Angulares ou Matrix-based Intra Prediction (MIPs) podem ser desconsiderados da avaliação do RDO sem que sejam inseridas perdas significativas em eficiência de codificação. O terceiro modelo foi desenvolvido para agir nos casos onde o primeiro e o segundo modelo não foram capazes de trazer uma redução de complexidade, buscando explorar a possibilidade de desconsiderar a avaliação dos modos intra MIPs sem que perdas significativas em eficiência de codificação sejam inseridas. Para o primeiro, segundo e terceiro modelos foram obtidas F1-scores de 85,27%, 78,69% e 84,80%. Como resultados, obteve-se médias de 10,87% de redução de complexidade e 0,39% de BDBR. Ao comparar o trabalho desenvolvido com trabalhos relacionados, pode-se notar que ainda que o método desenvolvido possua reduções de complexidade inferiores em alguns casos, o mesmo obtém perdas em eficiência de codificação inferiores em todos os casos, mesmo considerando todos os modos intra disponíveis no VVC.