Exploring curve-based prediction models for intra-frame prediction

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Fernandes, Ramon Costi lattes
Orientador(a): Marcon, César Augusto Missio lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Escola Politécnica
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/9589
Resumo: Esta Tese apresenta dois novos modelos de predição intra-quadros: LSAS (superfícies de aproximação baseadas em mínimos quadrados, em inglês Least-Squares Approximation Surfaces) e modelos de predição baseados em curvas. Ambas as abordagens aprimoram a predição intra-quadros, oferecendo uma melhor aproximação do conteúdo de bloco codificado. Embora o LSAS não seja prático devido aos requisitos proibitivos de taxa de bits, os modelos de predição baseados em curvas mostram resultados promissores. As avaliações dos novos modelos de predição intra-quadros adotam o padrão HEVC (codificação de vídeo de alta eficiência, em inglês High Efficiency Video Coding), que culmina anos de avanços em tecnologias de codificação de vídeo. Em comparação com seu antecessor H.264, o HEVC alcança até 50% de melhorias na eficiência de codificação. Isso se traduz em metade do tamanho de um vídeo codificado, mantendo a mesma qualidade visual. Entre as muitas melhorias do HEVC, o seu preditor intra-quadros vem com mais modos de predição, capazes de modelar mais texturas em blocos de predição do que seus antecessores. Melhorar a predição intra-quadros é um aspecto importante do fluxo de codificação, pois uma melhor predição se traduz em redução da energia residual, consequentemente melhorando a eficiência da codificação. Todos os trinta e três modos angulares do HEVC receberam um cálculo de deslocamento de curva para cada amostra predita para que a predição de blocos modele regiões de imagem com texturas curvas. A proposta inclui um pequeno custo adicional nos elementos de sintaxe do vídeo codificado, para incorporar o valor de deslocamento da curva, e um aumento no tempo de codificação. No entanto, a predição aprimorada compensa esse custo com uma maior eficiência de codificação. Utilizando os modelos baseados em curvas Centerline e Radial, para aplicar o cálculo de deslocamento, os resultados experimentais demonstram maior precisão da predição com menor energia residual, alcançando uma redução média na taxa de bits Bjøntegaard-Delta (BD-Rate) de 2% e 3% para as sequências de teste HEVC na configuração All-Intra-8, para os modelos Centerline e Radial, respectivamente, porém com um aumento no tempo de codificação. Uma maior eficiência de codificação é alcançável com a combinação de ambos os modelos de curvas, chegando a uma redução média de 4% BDRate na configuração All-Intra-8.