Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2025 |
| Tipo de documento: | Dissertação |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UFPel - Guaiaca |
| Texto Completo: | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988 |
Resumo: | As the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions. |
| id |
UFPL_cb4e35070e22d8e7b3940a2740f8b6a0 |
|---|---|
| oai_identifier_str |
oai:guaiaca.ufpel.edu.br:prefix/15988 |
| network_acronym_str |
UFPL |
| network_name_str |
Repositório Institucional da UFPel - Guaiaca |
| repository_id_str |
|
| spelling |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVCMachine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC EncoderPredição inter-quadrosVersatile Video CodingAprendizado de máquinaÁrvores de decisãoInter frame predictionMachine learningDecision treesCIENCIAS EXATAS E DA TERRACIENCIA DA COMPUTACAOAs the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESÀ medida que a demanda por transmissão de vídeo aumenta com trabalho re moto, educação e serviços de streaming, a necessidade de avanços contínuos nas tecnologias de codificação de vídeo torna-se cada vez mais evidente. Adaptar-se às exigências crescentes de entrega e consumo eficiente de vídeos requer o desen volvimento e aprimoramento constante nos padrões de codificação de vídeo, com o Versatile Video Coding (VVC) emergindo como um exemplo notável. Este trabalho apresenta uma visão geral dos principais algoritmos na Predição Inter-Quadros do VVC, com foco principalmente no Test Zone Search (TZS) e na Estimação de Movi mento Affine (AME), duas das ferramentas mais intensivas em termos de computação dentro do VVC. Além disso, este trabalho introduz uma abordagem para acelerar o TZS e a AME usando Aprendizado de Máquina, especificamente utilizando Árvores de Decisão. Primeiro, foi realizada uma aceleração no software de referência VVC Test Model (VTM) focada no TZS, pulando seletivamente as suas três últimas etapas, utilizando um conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pelo TZS no VVC. Em seguida, foi realizada a aceleração da AME do VTM, considerando a implementação acelerada do TZS. Neste caso, todo o processo da AME é pulado seletivamente, utilizando um novo conjunto de 12 Árvores de Decisão, uma para cada tamanho de bloco suportado pela AME no VVC. Esta abordagem proposta alcançou uma redução média de 20,99% no tempo total de codificação do VVC, uma redução média de 62,15% no tempo de execução do TZS e uma redução média de 63,58% no tempo de execução da AME, ocasionando em uma pequena perda média de eficiência de BD-BR de somente 0,90%. Estes resultados são competitivos quando comparados com os trabalhos da literatura e demonstram que a estratégia de uso de aprendizado de máquina para reduzir o custo computacional do VVC tem potencial de seguir gerando resultados expressivos em soluções futuras.Universidade Federal de PelotasPrograma de Pós-Graduação em ComputaçãoUFPelBrasilhttps://orcid.org/0000-0001-7590-2883http://lattes.cnpq.br/5361131703414450https://orcid.org/0000-0002-3421-5830http://lattes.cnpq.br/9604735363839730Porto, Marcelo Schiavonhttp://lattes.cnpq.br/5741927083446578Corrêa, Guilherme Ribeirohttp://lattes.cnpq.br/1389878856201800Agostini, Luciano VolcanViana, Ramiro Gomes da Silva2025-05-28T12:28:33Z2025-05-28T12:28:33Z2025-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfVIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988porCC BY-NC-SAinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPEL2025-05-29T06:04:22Zoai:guaiaca.ufpel.edu.br:prefix/15988Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2025-05-29T06:04:22Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false |
| dc.title.none.fl_str_mv |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC Machine Learning Applied to Reducing the Computational Cost of Test Zone Search and Affine Motion Estimation in the VVC Encoder |
| title |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| spellingShingle |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC Viana, Ramiro Gomes da Silva Predição inter-quadros Versatile Video Coding Aprendizado de máquina Árvores de decisão Inter frame prediction Machine learning Decision trees CIENCIAS EXATAS E DA TERRA CIENCIA DA COMPUTACAO |
| title_short |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| title_full |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| title_fullStr |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| title_full_unstemmed |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| title_sort |
Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC |
| author |
Viana, Ramiro Gomes da Silva |
| author_facet |
Viana, Ramiro Gomes da Silva |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
https://orcid.org/0000-0001-7590-2883 http://lattes.cnpq.br/5361131703414450 https://orcid.org/0000-0002-3421-5830 http://lattes.cnpq.br/9604735363839730 Porto, Marcelo Schiavon http://lattes.cnpq.br/5741927083446578 Corrêa, Guilherme Ribeiro http://lattes.cnpq.br/1389878856201800 Agostini, Luciano Volcan |
| dc.contributor.author.fl_str_mv |
Viana, Ramiro Gomes da Silva |
| dc.subject.por.fl_str_mv |
Predição inter-quadros Versatile Video Coding Aprendizado de máquina Árvores de decisão Inter frame prediction Machine learning Decision trees CIENCIAS EXATAS E DA TERRA CIENCIA DA COMPUTACAO |
| topic |
Predição inter-quadros Versatile Video Coding Aprendizado de máquina Árvores de decisão Inter frame prediction Machine learning Decision trees CIENCIAS EXATAS E DA TERRA CIENCIA DA COMPUTACAO |
| description |
As the demand for video transmission surges on remote work, education, and streaming services, the need for continuous advancements in video encoding tech nologies becomes increasingly evident. Adapting to the evolving requirements of efficient video delivery and consumption necessitates ongoing development and en hancement in video encoding standards, with Versatile Video Coding (VVC) emerging as a notable example. This work provides an overview of the main algorithms in VVC Inter-Frame Prediction, focusing primarily on Test Zone Search (TZS) and Affine Motion Estimation (AME), two of the most computationally intensive tools within VVC. Furthermore, this work introduces an approach to accelerate TZS and AME using Machine Learning, specifically employing Decision Trees. First, an acceleration of the VVC Test Model (VTM) reference software was performed, focusing on TZS, by selectively skipping its last three steps using a set of 12 Decision Trees, one for each block size supported by TZS in VVC. Next, the acceleration of the VTM’s AME was performed, considering the accelerated implementation of TZS. In this case, the entire AME process is selectively skipped using a new set of 12 Decision Trees, one for each block size supported by AME in VVC. The proposed approach achieved an average reduction of 20.99% in the total VVC encoding time, an average reduction of 62.15% in the TZS execution time, and an average reduction of 63.58% in the AME execution time, resulting in a small average BD-BR efficiency loss of only 0.90%. These results are competitive compared to related works in the literature and demonstrate that the strategy of using machine learning to reduce the computational cost of VVC has the potential to continue yielding significant results in future solutions. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-05-28T12:28:33Z 2025-05-28T12:28:33Z 2025-03-11 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988 |
| identifier_str_mv |
VIANA, Ramiro Gomes da Silva. Aprendizado de Máquina Aplicado à Redução do Custo Computacional do Test Zone Search e da Estimação de Movimento Affine do Codificador VVC. Orientador: Luciano Volcan Agostini. 2025. 98 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. |
| url |
http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/15988 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
CC BY-NC-SA info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
CC BY-NC-SA |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pelotas Programa de Pós-Graduação em Computação UFPel Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pelotas Programa de Pós-Graduação em Computação UFPel Brasil |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPel - Guaiaca instname:Universidade Federal de Pelotas (UFPEL) instacron:UFPEL |
| instname_str |
Universidade Federal de Pelotas (UFPEL) |
| instacron_str |
UFPEL |
| institution |
UFPEL |
| reponame_str |
Repositório Institucional da UFPel - Guaiaca |
| collection |
Repositório Institucional da UFPel - Guaiaca |
| repository.name.fl_str_mv |
Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL) |
| repository.mail.fl_str_mv |
rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br |
| _version_ |
1845920003001417728 |