Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC

Bibliographic Details
Main Author: Gonçalves, Paulo Henrik Ribeiro
Publication Date: 2021
Format: Master thesis
Language: por
Source: Repositório Institucional da UFPel - Guaiaca
Download full: http://guaiaca.ufpel.edu.br/handle/prefix/7787
Summary: The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC.
id UFPL_6383c302e91c20ddf4ed647e4f8b7b11
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/7787
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVCA Learning-based Affine Prediction for VVC Video CodingComputaçãoCodificação de vídeoAprendizado de máquinaRedução de esforço computacionalPredição affineVideo codingMachine learningComplexity reductionAffine predictionCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESNovas tendências no cenário de vídeos digitais têm ganhado muita popularidade recentemente, como vídeos de resoluções 4K-8K, vídeos omnidirecionais e conteúdo de tela. Para suportar tais tecnologias, novos codificadores de vídeo têm sido propostos nos últimos anos. Dentre eles, o Versatile Video Coding (VVC) é a nova aposta do Joint Video Experts Team. Lançado em Julho de 2020, o novo padrão obtém uma eficiência de codificação de 33%, quando comparado ao seu antecessor, isto devido às novas ferramentas implementadas, como estruturas de particionamento flexíveis, novas ferramentas de predição intra blocos, conjunto de novas transformadas, entre outras. Entretanto, tal avanço vem ao custo de um aumento expressivo no tempo do codificação. Outra nova ferramenta implementada é a predição affine, que permite a detecção de movimentos não-translacionais durante o processo de predição inter quadros, e portanto, oferece uma eficiência de codificação superior aos padrões anteriores. Entretanto, a predição affine acrescenta um aumento no tempo de processamento da predição interquadros de até 47%, dependendo da configuração utilizada, tornando-se um grande desafio para aplicações que necessitam de uma codificação rápida. Sendo assim, este trabalho propõe um esquema para redução do esforço computacional do codificador de vídeo VVC, através do controle de execução da etapa de predição affine. Chamado de LEAP (do inglês, Learning-based Affine Prediction), o esquema proposto é baseado em aprendizado de máquina, e é capaz de reduzir o tempo total de codificação em 8,49%, e o tempo de codificação do módulo de predição affine em 46,94%, em média, com baixas penalidades na eficiência de codificação. Além disso, por se tratar de um controle de uma das etapas de codificação, o esquema proposto pode ser aliado a outras técnicas de redução de esforço computacional para obter uma redução final ainda mais eficiente.Universidade Federal de PelotasCentro de Desenvolvimento TecnológicoPrograma de Pós-Graduação em ComputaçãoUFPelBrasilhttp://lattes.cnpq.br/1391402769662738http://lattes.cnpq.br/5741927083446578Corrêa, Guilherme Ribeirohttp://lattes.cnpq.br/1389878856201800Agostini, Luciano Volcanhttp://lattes.cnpq.br/9604735363839730Porto, Marcelo SchiavonGonçalves, Paulo Henrik Ribeiro2021-06-24T22:56:10Z2021-06-24T22:56:10Z2021-04-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.http://guaiaca.ufpel.edu.br/handle/prefix/7787porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPEL2023-07-13T07:07:29Zoai:guaiaca.ufpel.edu.br:prefix/7787Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T07:07:29Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.none.fl_str_mv Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
A Learning-based Affine Prediction for VVC Video Coding
title Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
spellingShingle Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
Gonçalves, Paulo Henrik Ribeiro
Computação
Codificação de vídeo
Aprendizado de máquina
Redução de esforço computacional
Predição affine
Video coding
Machine learning
Complexity reduction
Affine prediction
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
title_full Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
title_fullStr Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
title_full_unstemmed Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
title_sort Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
author Gonçalves, Paulo Henrik Ribeiro
author_facet Gonçalves, Paulo Henrik Ribeiro
author_role author
dc.contributor.none.fl_str_mv http://lattes.cnpq.br/1391402769662738
http://lattes.cnpq.br/5741927083446578
Corrêa, Guilherme Ribeiro
http://lattes.cnpq.br/1389878856201800
Agostini, Luciano Volcan
http://lattes.cnpq.br/9604735363839730
Porto, Marcelo Schiavon
dc.contributor.author.fl_str_mv Gonçalves, Paulo Henrik Ribeiro
dc.subject.por.fl_str_mv Computação
Codificação de vídeo
Aprendizado de máquina
Redução de esforço computacional
Predição affine
Video coding
Machine learning
Complexity reduction
Affine prediction
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Computação
Codificação de vídeo
Aprendizado de máquina
Redução de esforço computacional
Predição affine
Video coding
Machine learning
Complexity reduction
Affine prediction
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC.
publishDate 2021
dc.date.none.fl_str_mv 2021-06-24T22:56:10Z
2021-06-24T22:56:10Z
2021-04-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.
http://guaiaca.ufpel.edu.br/handle/prefix/7787
identifier_str_mv GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.
url http://guaiaca.ufpel.edu.br/handle/prefix/7787
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
Centro de Desenvolvimento Tecnológico
Programa de Pós-Graduação em Computação
UFPel
Brasil
publisher.none.fl_str_mv Universidade Federal de Pelotas
Centro de Desenvolvimento Tecnológico
Programa de Pós-Graduação em Computação
UFPel
Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1845919960710250496