Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.

Borges, Alex Machado

Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.

Detalhes bibliográficos
Ano de defesa:	2023
Autor(a) principal:	Borges, Alex Machado
Orientador(a):	Corrêa, Guilherme Ribeiro
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Pelotas
Programa de Pós-Graduação:	Programa de Pós-Graduação em Computação
Departamento:	Centro de Desenvolvimento Tecnológico
País:	Brasil
Palavras-chave em Português:	Formato AV1 Redução de complexidade Codificação de vídeo Transcodificação de vídeo Aprendizado de máquina AV1 Format Complexity reduction Video coding Video transcoding MachinelLearning
Área do conhecimento CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Link de acesso:	http://guaiaca.ufpel.edu.br/handle/prefix/9241
Resumo:	Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados à transmissão de vídeo para entretenimento, como YouTube e Netflix, seja em redes sociais, como Instagram ou TikTok, ou ainda para comunicação privada, como em chamadas de vídeo. Não à toa, mesmo com uso de codificadores de vídeo eficientes, conteúdos de vídeo representam uma parcela considerável do tráfego de dados mundial pela internet. Por este motivo, esta é uma área de relevância ímpar na comu nidade científica e a definição de novos padrões e formatos de compressão de vídeo cada vez mais eficientes tem sido uma constante. Considerando o grande número de formatos e padrões de codificação, a modificação de arquivos de vídeo para diversos fins é uma prática comum, seja para prover compatibilidade entre dispositivos ou ainda para adequar um vídeo codificado a situações adversas, como adaptação de taxa de bits e resolução. Essa modificação é chamada de transcodificação de vídeo e possui diversas aplicações. Uma das aplicações, denominada transcodificação heterogênea, tipicamente envolve a atualização de vídeos codificados em um formato mais antigo para outro mais recente e com maior eficiência de compressão. Contudo, essa tarefa exige um significativo esforço computacional, pois envolve uma decodificação e uma nova codificação em sequência. Por isso, parte da comunidade científica atuante na área de codificação de vídeo vem buscando soluções para acelerar o processo de transcodificação de vídeo. Esta tese está centrada neste objetivo. A tese apresenta inicialmente o estado da arte em transcodificação de vídeo, suas aplicações e técnicas. Nesta tese, são apresentadas sete propostas de transcodificadores rápidos para o formato AOMedia Video 1 (AV1), partindo de outros formatos largamente utilizados pela indústria de streaming de vídeo. Dentre as propostas realizadas, destacam-se aquelas que empregam modelos preditivos treinados por algoritmos de aprendizado de máquina para acelerar as decisões de particionamento do codificador. De forma a possibilitar o desenvolvimento ágil de transcodificadores rápidos, esta tese também propõe um pipeline de processamento, que permite, dentre outras coisas, a automatização do treinamento de modelos preditivos e o escalonamento de experimentos para testá-los. Como prova de conceito a essa proposta metodológica, cinco transcodificadores de vídeo rápidos foram desenvolvidos com o pipeline, todos eles empregando modelos preditivos do tipo árvore de decisão. Os resultados obtidos indicam que é possível acelerar o processo de transcodificação para o formato AV1 entre 12% e 55%, com perdas em eficiência de codificação que variam entre 1,6% e 12,8%, dependendo do formato de origem.

Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.

Registros relacionados