Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC

Detalhes bibliográficos
Autor(a) principal: Viana, Ramiro Gomes da Silva
Data de Publicação: 2025
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFPel - Guaiaca
Texto Completo: http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988
Resumo: As the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions.
id UFPL_cb4e35070e22d8e7b3940a2740f8b6a0
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/15988
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVCMachine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC EncoderPredição inter-quadrosVersatile Video CodingAprendizado de máquinaÁrvores de decisãoInter frame predictionMachine learningDecision treesCIENCIAS EXATAS E DA TERRACIENCIA DA COMPUTACAOAs the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESÀ medida que a demanda por transmissão de vídeo aumenta com trabalho re moto, educação e serviços de streaming, a necessidade de avanços contínuos nas tecnologias de codificação de vídeo torna-se cada vez mais evidente. Adaptar-se às exigências crescentes de entrega e consumo eficiente de vídeos requer o desen volvimento e aprimoramento constante nos padrões de codificação de vídeo, com o Versatile Video Coding (VVC) emergindo como um exemplo notável. Este trabalho apresenta uma visão geral dos principais algoritmos na Predição Inter-Quadros do VVC, com foco principalmente no Test Zone Search (TZS) e na Estimação de Movi mento Affine (AME), duas das ferramentas mais intensivas em termos de computação dentro do VVC. Além disso, este trabalho introduz uma abordagem para acelerar o TZS e a AME usando Aprendizado de Máquina, especificamente utilizando Árvores de Decisão. Primeiro, foi realizada uma aceleração no software de referência VVC Test Model (VTM) focada no TZS, pulando seletivamente as suas três últimas etapas, utilizando um conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pelo TZS no VVC. Em seguida, foi realizada a aceleração da AME do VTM, considerando a implementação acelerada do TZS. Neste caso, todo o processo da AME é pulado seletivamente, utilizando um novo conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pela AME no VVC. Esta abordagem proposta alcançou uma redução média de 20,99% no tempo total de codificação do VVC, uma redução média de 62,15% no tempo de execução do TZS e uma redução média de 63,58% no tempo de execução da AME, ocasionando em uma pequena perda média de eficiência de BD-BR de somente 0,90%. Estes resultados são competitivos quando comparados com os trabalhos da literatura e demonstram que a estratégia de uso de aprendizado de máquina para reduzir o custo computacional do VVC tem potencial de seguir gerando resultados expressivos em soluções futuras.Universidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilhttps://orcid.org/0000-0001-7590-2883http://lattes.cnpq.br/5361131703414450https://orcid.org/0000-0002-3421-5830http://lattes.cnpq.br/9604735363839730Porto, Marcelo Schiavonhttp://lattes.cnpq.br/5741927083446578Corrêa, Guilherme Ribeirohttp://lattes.cnpq.br/1389878856201800Agostini, Luciano VolcanViana, Ramiro Gomes da Silva2025-05-28T12:28:33Z2025-05-28T12:28:33Z2025-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfVIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988porCC BY-NC-SAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPEL2025-05-29T06:04:22Zoai:guaiaca.ufpel.edu.br:prefix/15988Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2025-05-29T06:04:22Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.none.fl_str_mv Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
Machine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC Encoder
title Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
spellingShingle Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
Viana, Ramiro Gomes da Silva
Predição inter-quadros
Versatile Video Coding
Aprendizado de máquina
Árvores de decisão
Inter frame prediction
Machine learning
Decision trees
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
title_short Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
title_full Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
title_fullStr Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
title_full_unstemmed Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
title_sort Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
author Viana, Ramiro Gomes da Silva
author_facet Viana, Ramiro Gomes da Silva
author_role author
dc.contributor.none.fl_str_mv https://orcid.org/0000-0001-7590-2883
http://lattes.cnpq.br/5361131703414450
https://orcid.org/0000-0002-3421-5830
http://lattes.cnpq.br/9604735363839730
Porto, Marcelo Schiavon
http://lattes.cnpq.br/5741927083446578
Corrêa, Guilherme Ribeiro
http://lattes.cnpq.br/1389878856201800
Agostini, Luciano Volcan
dc.contributor.author.fl_str_mv Viana, Ramiro Gomes da Silva
dc.subject.por.fl_str_mv Predição inter-quadros
Versatile Video Coding
Aprendizado de máquina
Árvores de decisão
Inter frame prediction
Machine learning
Decision trees
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
topic Predição inter-quadros
Versatile Video Coding
Aprendizado de máquina
Árvores de decisão
Inter frame prediction
Machine learning
Decision trees
CIENCIAS EXATAS E DA TERRA
CIENCIA DA COMPUTACAO
description As the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions.
publishDate 2025
dc.date.none.fl_str_mv 2025-05-28T12:28:33Z
2025-05-28T12:28:33Z
2025-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988
identifier_str_mv VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.
url http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC BY-NC-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
Programa de Pós-Graduação em Computação
UFPel
Brasil
publisher.none.fl_str_mv Universidade Federal de Pelotas
Programa de Pós-Graduação em Computação
UFPel
Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1845920003001417728