Exploração das distorções da projeção ERP para redução de complexidade da codificação de vídeos omnidirecionais

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Storch, Iago Coelho
Orientador(a): Palomino, Daniel Munari Vilchez
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/6086
Resumo: A projeção equirretangular (ERP) é uma etapa de pré-processamento que permite que vídeos omnidirecionais sejam codificados através de padrões de codificação de vídeo convencionais. Embora ela possibilite a codificação destes vídeos, a projeção ERP gera distorções no vídeo que se manifestam através de esticamentos horizontais nas texturas de algumas regiões do quadro, e estes esticamentos causam comportamentos característicos nas ferramentas de codificação que não são observados durante a codificação de vídeos convencionais. Sendo assim, este trabalho explora as distorções causadas pela projeção ERP para propor um conjunto de técnicas de redução de complexidade para a codificação de vídeos omnidirecionais, tanto durante a predição interquadros quanto intraquadro. As técnicas aplicadas à predição interquadros são denominadas Early Skip, Reduced SR e Reduced FME. A técnica Early Skip consiste em fazer uma decisão prematura pelo modo de codificação skip de acordo com a homogeneidade do bloco, a técnica Reduced SR consiste em limitar horizontalmente a área de busca da estimação de movimento, e a técnica Reduced FME reduz a precisão horizontal da estimação de movimento fracionária. Quando as três são utilizadas simultaneamente, é possível reduzir a complexidade do codificador em 22,84%, em média, com um pequeno impacto na eficiência de codificação. Já as técnicas aplicadas à predição intraquadro são denominadas Reduced Intra Sizes e Reduced Intra Modes. A técnica Reduced Intra Sizes consiste em descartar a avaliação de alguns tamanhos de bloco e a técnica Reduced Intra Modes foi incorporada de outro trabalho, e baseia-se em priorizar os modos de predição intraquadro horizontais. Quando estas duas técnicas são utilizadas simultaneamente, é possível atingir uma redução de complexidade média de 23,09% sem interferir de forma significativa na eficiência de codificação. Todas as técnicas apresentadas – tanto interquadros quanto intraquadro – avaliam a distorção do vídeo para tomar suas decisões. As técnicas desenvolvidas são competitivas com trabalhos da literatura e demonstram que explorar as distorções causadas pela projeção ERP é uma boa alternativa para reduzir a complexidade na codificação de vídeos omnidirecionais sem penalizar a eficiência de codificação significativamente.