Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)

Detalhes bibliográficos
Autor(a) principal: Loose, Marta Breunig
Data de Publicação: 2025
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da UFPel - Guaiaca
Texto Completo: http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211
Resumo: There is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos online. During the COVID-19 pandemic, this context intensified, demonstrating the importance of network infrastructure and strategies for video compression. In this sense, the Versatile Video Coding (VVC) standard provides new tools that enable higher compression ratios than previous standards and greater adaptability to different types of videos. The VVC standard and other modern encoders are based on the hybrid model of prediction residual coding. Its main steps include intra-frame and inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along with these characteristics, VVC is highly complex, resulting in a very high video encoding time. Therefore, many challenges are still open to reduce this problem. In light of this, this thesis aims to present solutions for reducing the encoding time in inter-frame prediction of the VVC standard. In addition to providing context on the VVC standard and inter-frame prediction itself, concepts of machine learning are also presented, along with results from a dense experimental analysis and a systematic literature review. Finally, four optimization solutions focused on inter-frame prediction are presented: one heuristic based on statistical analysis and three other solutions employing machine learning. The heuristic focuses on unidirectional, bidirectional, and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on bidirectional achieved an average reduction of 92% in time per step and 2% in total encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding Decision Tree models focused on Affine to the previous solution, achieved a total time reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused on Affine optimization, using Decision Tree models, obtained an average reduction of 42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency. Therefore, these results demonstrate that the use of machine learning techniques are the most promising ways to achieve a reduction in interframe coordination time with minimal impacts on update efficiency.
id UFPL_a45d027ce90dee39a0975cf2ac9c8feb
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/16211
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)Encoding Time Reduction in Versatile Video Coding (VVC) Inter-frame PredictionVVCInterquadrosTempo de codificaçãoAprendizado de máquinaInter-frameEncoding timeMachine learningCIENCIAS EXATAS E DA TERRACIENCIA DA COMPUTACAOThere is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos online. During the COVID-19 pandemic, this context intensified, demonstrating the importance of network infrastructure and strategies for video compression. In this sense, the Versatile Video Coding (VVC) standard provides new tools that enable higher compression ratios than previous standards and greater adaptability to different types of videos. The VVC standard and other modern encoders are based on the hybrid model of prediction residual coding. Its main steps include intra-frame and inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along with these characteristics, VVC is highly complex, resulting in a very high video encoding time. Therefore, many challenges are still open to reduce this problem. In light of this, this thesis aims to present solutions for reducing the encoding time in inter-frame prediction of the VVC standard. In addition to providing context on the VVC standard and inter-frame prediction itself, concepts of machine learning are also presented, along with results from a dense experimental analysis and a systematic literature review. Finally, four optimization solutions focused on inter-frame prediction are presented: one heuristic based on statistical analysis and three other solutions employing machine learning. The heuristic focuses on unidirectional, bidirectional, and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on bidirectional achieved an average reduction of 92% in time per step and 2% in total encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding Decision Tree models focused on Affine to the previous solution, achieved a total time reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused on Affine optimization, using Decision Tree models, obtained an average reduction of 42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency. Therefore, these results demonstrate that the use of machine learning techniques are the most promising ways to achieve a reduction in interframe coordination time with minimal impacts on update efficiency.Sem bolsaAtualmente há uma crescente demanda por vídeos digitais de altas resoluções, principalmente através da Internet. Diferentes plataformas permitem a transmissão, o compartilhamento e o consumo de vídeos online. Durante a pandemia pela COVID-19, esse contexto se intensificou, demonstrando a importância da infraes trutura de rede e de estratégias para a compressão de vídeos. Nesse sentido, o padrão Versatile Video Coding (VVC) fornece novas ferramentas que possibilitam maiores taxas de compressão, comparado aos padrões anteriores, além de maior adaptabilidade aos diferentes tipos de vídeos. O padrão VVC, assim como os demais codificadores atuais, é baseado no modelo híbrido de codificação de resíduos de predições. Suas principais etapas consistem na predição intraquadro e interquadros, Transformada, Quantização e Codificação de Entropia. Entretanto, juntamente com essas características, o VVC detém um alto grau de complexidade, acarretando em um tempo de codificação de vídeo muito alto. Sendo assim, são muitos os desafios que ainda estão em aberto, a fim de diminuir esse problema. Diante disso, esta tese visa apresentar soluções para a redução do tempo de codificação na predição interquadros do padrão VVC. Além da contextualização sobre o padrão VVC e da interquadros em si, também são apresentados conceitos de aprendizado de máquina, além de resultados de uma densa análise experimental e de uma revisão sistemática da literatura. Por fim, são apresentadas quatro soluções de otimização focadas na predição interquadros, sendo uma heurística, com base em análise estatística e outras três soluções que utilizam aprendizado de máquina. A heurística é focada nas predições Unidirecional, Bidirecional e Affine, sendo configurável para três pontos de operação. Essa solução obteve resultados de redução no tempo de codificação de até 26,5%, para as etapas Unidirecional e Bidirecional, e de até 22,71% para a etapa Affine, com perda de eficiência de codificação de 0,9% e 0,44%, respectivamente. A solução usando Random Forest focada na Bidirecional, alcançou 92% em média de redução de tempo na etapa e 2% no tempo total de codificação, com perda de eficiência de codificação de 0,75%. Já a solução ampliada, adicionando modelos Decision Tree focados na Affine à solução anterior, alcançou redução de tempo total de 3,9%, com perda de eficiência de codificação de 0,72%. Por fim, a solução focada na otimização da Affine, utilizando modelos Decision Tree, obteve redução média de 42,1% no tempo da etapa, 3,4% no tempo total de codificação, com impacto de 0,25% na eficiência de codificação. Esses resultados demonstram que a utilização de técnicas de aprendizado de máquina são caminhos muito promissores para alcançar redução no tempo de codificação da predição interquadros com impactos mínimos na eficiência de compressão.Universidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilhttp://lattes.cnpq.br/3452656759670690https://orcid.org/0000-0002-3421-5830http://lattes.cnpq.br/9604735363839730Corrêa, Guilherme Ribeirohttp://lattes.cnpq.br/1389878856201800Sanchez, Gustavo FreitasNão localizado.Agostini, Luciano VolcanLoose, Marta Breunig2025-06-17T22:03:58Z2025-06-17T22:03:58Z2025-03-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211porCC BY-NC-SAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPEL2025-06-18T06:00:40Zoai:guaiaca.ufpel.edu.br:prefix/16211Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2025-06-18T06:00:40Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.none.fl_str_mv Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
Encoding Time Reduction in Versatile Video Coding (VVC) Inter-frame Prediction
title Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
spellingShingle Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
Loose, Marta Breunig
VVC
Interquadros
Tempo de codificação
Aprendizado de máquina
Inter-frame
Encoding time
Machine learning
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
title_short Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
title_full Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
title_fullStr Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
title_full_unstemmed Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
title_sort Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
author Loose, Marta Breunig
author_facet Loose, Marta Breunig
author_role author
dc.contributor.none.fl_str_mv http://lattes.cnpq.br/3452656759670690
https://orcid.org/0000-0002-3421-5830
http://lattes.cnpq.br/9604735363839730
Corrêa, Guilherme Ribeiro
http://lattes.cnpq.br/1389878856201800
Sanchez, Gustavo Freitas
Não localizado.
Agostini, Luciano Volcan
dc.contributor.author.fl_str_mv Loose, Marta Breunig
dc.subject.por.fl_str_mv VVC
Interquadros
Tempo de codificação
Aprendizado de máquina
Inter-frame
Encoding time
Machine learning
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
topic VVC
Interquadros
Tempo de codificação
Aprendizado de máquina
Inter-frame
Encoding time
Machine learning
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
description There is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos online. During the COVID-19 pandemic, this context intensified, demonstrating the importance of network infrastructure and strategies for video compression. In this sense, the Versatile Video Coding (VVC) standard provides new tools that enable higher compression ratios than previous standards and greater adaptability to different types of videos. The VVC standard and other modern encoders are based on the hybrid model of prediction residual coding. Its main steps include intra-frame and inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along with these characteristics, VVC is highly complex, resulting in a very high video encoding time. Therefore, many challenges are still open to reduce this problem. In light of this, this thesis aims to present solutions for reducing the encoding time in inter-frame prediction of the VVC standard. In addition to providing context on the VVC standard and inter-frame prediction itself, concepts of machine learning are also presented, along with results from a dense experimental analysis and a systematic literature review. Finally, four optimization solutions focused on inter-frame prediction are presented: one heuristic based on statistical analysis and three other solutions employing machine learning. The heuristic focuses on unidirectional, bidirectional, and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on bidirectional achieved an average reduction of 92% in time per step and 2% in total encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding Decision Tree models focused on Affine to the previous solution, achieved a total time reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused on Affine optimization, using Decision Tree models, obtained an average reduction of 42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency. Therefore, these results demonstrate that the use of machine learning techniques are the most promising ways to achieve a reduction in interframe coordination time with minimal impacts on update efficiency.
publishDate 2025
dc.date.none.fl_str_mv 2025-06-17T22:03:58Z
2025-06-17T22:03:58Z
2025-03-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211
identifier_str_mv LOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
url http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC BY-NC-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
Programa de Pós-Graduação em Computação
UFPel
Brasil
publisher.none.fl_str_mv Universidade Federal de Pelotas
Programa de Pós-Graduação em Computação
UFPel
Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1845919931838758912