Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC
| Main Author: | |
|---|---|
| Publication Date: | 2021 |
| Format: | Master thesis |
| Language: | por |
| Source: | Repositório Institucional da UFPel - Guaiaca |
| Download full: | http://guaiaca.ufpel.edu.br/handle/prefix/7787 |
Summary: | The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC. |
| id |
UFPL_6383c302e91c20ddf4ed647e4f8b7b11 |
|---|---|
| oai_identifier_str |
oai:guaiaca.ufpel.edu.br:prefix/7787 |
| network_acronym_str |
UFPL |
| network_name_str |
Repositório Institucional da UFPel - Guaiaca |
| repository_id_str |
|
| spelling |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVCA Learning-based Affine Prediction for VVC Video CodingComputaçãoCodificação de vídeoAprendizado de máquinaRedução de esforço computacionalPredição affineVideo codingMachine learningComplexity reductionAffine predictionCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESNovas tendências no cenário de vídeos digitais têm ganhado muita popularidade recentemente, como vídeos de resoluções 4K-8K, vídeos omnidirecionais e conteúdo de tela. Para suportar tais tecnologias, novos codificadores de vídeo têm sido propostos nos últimos anos. Dentre eles, o Versatile Video Coding (VVC) é a nova aposta do Joint Video Experts Team. Lançado em Julho de 2020, o novo padrão obtém uma eficiência de codificação de 33%, quando comparado ao seu antecessor, isto devido às novas ferramentas implementadas, como estruturas de particionamento flexíveis, novas ferramentas de predição intra blocos, conjunto de novas transformadas, entre outras. Entretanto, tal avanço vem ao custo de um aumento expressivo no tempo do codificação. Outra nova ferramenta implementada é a predição affine, que permite a detecção de movimentos não-translacionais durante o processo de predição inter quadros, e portanto, oferece uma eficiência de codificação superior aos padrões anteriores. Entretanto, a predição affine acrescenta um aumento no tempo de processamento da predição interquadros de até 47%, dependendo da configuração utilizada, tornando-se um grande desafio para aplicações que necessitam de uma codificação rápida. Sendo assim, este trabalho propõe um esquema para redução do esforço computacional do codificador de vídeo VVC, através do controle de execução da etapa de predição affine. Chamado de LEAP (do inglês, Learning-based Affine Prediction), o esquema proposto é baseado em aprendizado de máquina, e é capaz de reduzir o tempo total de codificação em 8,49%, e o tempo de codificação do módulo de predição affine em 46,94%, em média, com baixas penalidades na eficiência de codificação. Além disso, por se tratar de um controle de uma das etapas de codificação, o esquema proposto pode ser aliado a outras técnicas de redução de esforço computacional para obter uma redução final ainda mais eficiente.Universidade Federal de PelotasCentro de Desenvolvimento TecnológicoPrograma de Pós-Graduação em ComputaçãoUFPelBrasilhttp://lattes.cnpq.br/1391402769662738http://lattes.cnpq.br/5741927083446578Corrêa, Guilherme Ribeirohttp://lattes.cnpq.br/1389878856201800Agostini, Luciano Volcanhttp://lattes.cnpq.br/9604735363839730Porto, Marcelo SchiavonGonçalves, Paulo Henrik Ribeiro2021-06-24T22:56:10Z2021-06-24T22:56:10Z2021-04-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021.http://guaiaca.ufpel.edu.br/handle/prefix/7787porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPEL2023-07-13T07:07:29Zoai:guaiaca.ufpel.edu.br:prefix/7787Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2023-07-13T07:07:29Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false |
| dc.title.none.fl_str_mv |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC A Learning-based Affine Prediction for VVC Video Coding |
| title |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| spellingShingle |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC Gonçalves, Paulo Henrik Ribeiro Computação Codificação de vídeo Aprendizado de máquina Redução de esforço computacional Predição affine Video coding Machine learning Complexity reduction Affine prediction CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| title_full |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| title_fullStr |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| title_full_unstemmed |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| title_sort |
Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC |
| author |
Gonçalves, Paulo Henrik Ribeiro |
| author_facet |
Gonçalves, Paulo Henrik Ribeiro |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
http://lattes.cnpq.br/1391402769662738 http://lattes.cnpq.br/5741927083446578 Corrêa, Guilherme Ribeiro http://lattes.cnpq.br/1389878856201800 Agostini, Luciano Volcan http://lattes.cnpq.br/9604735363839730 Porto, Marcelo Schiavon |
| dc.contributor.author.fl_str_mv |
Gonçalves, Paulo Henrik Ribeiro |
| dc.subject.por.fl_str_mv |
Computação Codificação de vídeo Aprendizado de máquina Redução de esforço computacional Predição affine Video coding Machine learning Complexity reduction Affine prediction CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
Computação Codificação de vídeo Aprendizado de máquina Redução de esforço computacional Predição affine Video coding Machine learning Complexity reduction Affine prediction CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
The new trends in digital video technologies, such as 4K-8K resolution, omnidirectional, and screen content, have become popular in video coding scenarios. To support these technologies, new video encoders have been proposed in recent years. The Versatile Video Coding (VVC) is the most recent video coding standard proposed by the Joint Video Experts Team. Released in July of 2020, the new standard achieves a coding efficiency of 33% higher when compared to its predecessor, the HEVC. This efficiency is achieved by implementing new coding tools, such as flexible partitioning tools, new prediction modes for intra-blocks, and new transform modes. However, the implementation of new tools comes at the cost of a significant encoding time increase. Also, to improve the coding efficiency, VVC implements the affine motion estimation, which allows the detection of non-translational transformations during the interframe prediction. However, the affine motion estimation increases the complexity of VVC interframe prediction up to 47% and becomes an obstacle for real-time applications. In this sense, this work proposes a scheme to reduce the complexity of the VVC encoder by the flow control of the steps of affine motion estimation. Named as LEAP (Learning-based Affine Prediction), the proposed scheme is based on machine learning, and, when implemented in the VVC reference software, it is capable of reducing the total encoding time by 8.49%, and the encoding time of the affine motion estimation by 46.94%, on average, with minor penalties in coding efficiency. Besides, LEAP can be combined with other techniques to improve the complexity reduction of VVC. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-06-24T22:56:10Z 2021-06-24T22:56:10Z 2021-04-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021. http://guaiaca.ufpel.edu.br/handle/prefix/7787 |
| identifier_str_mv |
GONÇALVES, Paulo Henrik Ribeiro. Um esquema rápido baseado em aprendizado de máquina para a predição interquadros do codificador de vídeo VVC. Orientador: Marcelo Schiavon Porto. 2021. 90 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2021. |
| url |
http://guaiaca.ufpel.edu.br/handle/prefix/7787 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pelotas Centro de Desenvolvimento Tecnológico Programa de Pós-Graduação em Computação UFPel Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pelotas Centro de Desenvolvimento Tecnológico Programa de Pós-Graduação em Computação UFPel Brasil |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPel - Guaiaca instname:Universidade Federal de Pelotas (UFPEL) instacron:UFPEL |
| instname_str |
Universidade Federal de Pelotas (UFPEL) |
| instacron_str |
UFPEL |
| institution |
UFPEL |
| reponame_str |
Repositório Institucional da UFPel - Guaiaca |
| collection |
Repositório Institucional da UFPel - Guaiaca |
| repository.name.fl_str_mv |
Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL) |
| repository.mail.fl_str_mv |
rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br |
| _version_ |
1845919960710250496 |