Aceleração do processo de edição de imagens baseadas em StyleGANs

Bibliographic Details
Main Author: Rocha, Maurício Barbosa da
Publication Date: 2024
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UFRGS
Download full: http://hdl.handle.net/10183/283281
Summary: Este trabalho explora o potencial dos modelos generativos, em particular as Generative Adversarial Networks (GANs), no contexto da edição de imagens. Ao manipular vetores de características, essas técnicas possibilitam a criação de imagens fotorrealistas e oferecem uma abordagem mais intuitiva e controlada para a edição de atributos específicos. Por meio de experimentos e análises, este estudo concentra-se em aprimorar a técnica DragGAN, uma abordagem de edição de imagens baseada na arquitetura StyleGAN2. Nosso objetivo é melhorar a eficiência na manipulação de vetores de características, especialmente na etapa de Supervisão de Movimentos da DragGAN. Desenvolvemos um método alternativo para a otimização de vetores de características, que analisa a diferença entre os vetores de características iniciais e os obtidos após as três primeiras iterações utilizando o método tradicional. Após isso, o novo método é aplicado nas iterações subsequentes até que a distância entre os pontos de manipulação e alvo deixe de apresentar reduções. Quando isso ocorre, ajustes finos são realizados utilizando o método tradicional. Adicionalmente, propomos alterações no learning rate e no raio do Rastreamento de Pontos. Comparada à abordagem tradicional, nossa solução acelera o processo de manipulação interativa de imagens através da técnica DragGAN.
id UFRGS-2_812d138297f85fe6c0c2bb33d25016bf
oai_identifier_str oai:www.lume.ufrgs.br:10183/283281
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Rocha, Maurício Barbosa daOliveira Neto, Manuel Menezes de2025-01-11T06:58:34Z2024http://hdl.handle.net/10183/283281001197974Este trabalho explora o potencial dos modelos generativos, em particular as Generative Adversarial Networks (GANs), no contexto da edição de imagens. Ao manipular vetores de características, essas técnicas possibilitam a criação de imagens fotorrealistas e oferecem uma abordagem mais intuitiva e controlada para a edição de atributos específicos. Por meio de experimentos e análises, este estudo concentra-se em aprimorar a técnica DragGAN, uma abordagem de edição de imagens baseada na arquitetura StyleGAN2. Nosso objetivo é melhorar a eficiência na manipulação de vetores de características, especialmente na etapa de Supervisão de Movimentos da DragGAN. Desenvolvemos um método alternativo para a otimização de vetores de características, que analisa a diferença entre os vetores de características iniciais e os obtidos após as três primeiras iterações utilizando o método tradicional. Após isso, o novo método é aplicado nas iterações subsequentes até que a distância entre os pontos de manipulação e alvo deixe de apresentar reduções. Quando isso ocorre, ajustes finos são realizados utilizando o método tradicional. Adicionalmente, propomos alterações no learning rate e no raio do Rastreamento de Pontos. Comparada à abordagem tradicional, nossa solução acelera o processo de manipulação interativa de imagens através da técnica DragGAN.This work explores the potential of generative models, particularly Generative Adversarial Networks (GANs), in the context of image editing. By manipulating feature vectors, these techniques enable the creation of photorealistic images and offer a more intuitive and controlled approach to editing specific attributes. Through experiments and analysis, this study focuses on enhancing the DragGAN technique, an image editing approach based on the StyleGAN2 architecture. Our goal is to improve the efficiency in manipulating latent vectors, especially in the Motion Supervision stage of DragGAN. We have developed an alternative method for optimizing latent vectors, which analyzes the difference between the initial latent vectors and those obtained after the first three iterations using the traditional method. Thereafter, the new method is applied in subsequent iterations until the distance between the manipulation points and the target ceases to show reductions. When this occurs, fine adjustments are made using the traditional method. Additionally, we propose changes to the learning rate and the radius of Point Tracking. Compared to the traditional approach, our solution accelerates the process of interactive image manipulation through the DragGAN technique.application/pdfporProcessamento de imagensVisão computacionalEdição de imagensStyleGAN2DragGANImage generationLatent spaceLatent manipulationAceleração do processo de edição de imagens baseadas em StyleGANsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPorto Alegre, BR-RS2024Ciência da Computação: Ênfase em Engenharia da Computação: Bachareladograduaçãoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001197974.pdf.txt001197974.pdf.txtExtracted Texttext/plain67716http://www.lume.ufrgs.br/bitstream/10183/283281/2/001197974.pdf.txt852591ea94af5943205d3790d032f9b0MD52ORIGINAL001197974.pdfTexto completoapplication/pdf20369199http://www.lume.ufrgs.br/bitstream/10183/283281/1/001197974.pdfd0eb519b2d6c48d1666f00f1aa95e287MD5110183/2832812025-01-12 07:39:58.303494oai:www.lume.ufrgs.br:10183/283281Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2025-01-12T09:39:58Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Aceleração do processo de edição de imagens baseadas em StyleGANs
title Aceleração do processo de edição de imagens baseadas em StyleGANs
spellingShingle Aceleração do processo de edição de imagens baseadas em StyleGANs
Rocha, Maurício Barbosa da
Processamento de imagens
Visão computacional
Edição de imagens
StyleGAN2
DragGAN
Image generation
Latent space
Latent manipulation
title_short Aceleração do processo de edição de imagens baseadas em StyleGANs
title_full Aceleração do processo de edição de imagens baseadas em StyleGANs
title_fullStr Aceleração do processo de edição de imagens baseadas em StyleGANs
title_full_unstemmed Aceleração do processo de edição de imagens baseadas em StyleGANs
title_sort Aceleração do processo de edição de imagens baseadas em StyleGANs
author Rocha, Maurício Barbosa da
author_facet Rocha, Maurício Barbosa da
author_role author
dc.contributor.author.fl_str_mv Rocha, Maurício Barbosa da
dc.contributor.advisor1.fl_str_mv Oliveira Neto, Manuel Menezes de
contributor_str_mv Oliveira Neto, Manuel Menezes de
dc.subject.por.fl_str_mv Processamento de imagens
Visão computacional
Edição de imagens
topic Processamento de imagens
Visão computacional
Edição de imagens
StyleGAN2
DragGAN
Image generation
Latent space
Latent manipulation
dc.subject.eng.fl_str_mv StyleGAN2
DragGAN
Image generation
Latent space
Latent manipulation
description Este trabalho explora o potencial dos modelos generativos, em particular as Generative Adversarial Networks (GANs), no contexto da edição de imagens. Ao manipular vetores de características, essas técnicas possibilitam a criação de imagens fotorrealistas e oferecem uma abordagem mais intuitiva e controlada para a edição de atributos específicos. Por meio de experimentos e análises, este estudo concentra-se em aprimorar a técnica DragGAN, uma abordagem de edição de imagens baseada na arquitetura StyleGAN2. Nosso objetivo é melhorar a eficiência na manipulação de vetores de características, especialmente na etapa de Supervisão de Movimentos da DragGAN. Desenvolvemos um método alternativo para a otimização de vetores de características, que analisa a diferença entre os vetores de características iniciais e os obtidos após as três primeiras iterações utilizando o método tradicional. Após isso, o novo método é aplicado nas iterações subsequentes até que a distância entre os pontos de manipulação e alvo deixe de apresentar reduções. Quando isso ocorre, ajustes finos são realizados utilizando o método tradicional. Adicionalmente, propomos alterações no learning rate e no raio do Rastreamento de Pontos. Comparada à abordagem tradicional, nossa solução acelera o processo de manipulação interativa de imagens através da técnica DragGAN.
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-01-11T06:58:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/283281
dc.identifier.nrb.pt_BR.fl_str_mv 001197974
url http://hdl.handle.net/10183/283281
identifier_str_mv 001197974
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/283281/2/001197974.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/283281/1/001197974.pdf
bitstream.checksum.fl_str_mv 852591ea94af5943205d3790d032f9b0
d0eb519b2d6c48d1666f00f1aa95e287
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1834472343586471936