Improving digital photography : revisiting core aspects through a deep-learning lens

Detalhes bibliográficos
Autor(a) principal: Henz, Bernardo
Data de Publicação: 2020
Tipo de documento: Tese
Idioma: eng
Título da fonte: Biblioteca Digital de Teses e Dissertações da UFRGS
Texto Completo: http://hdl.handle.net/10183/217574
Resumo: Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais.
id URGS_d11754a051e74d19f0da80d18042356e
oai_identifier_str oai:www.lume.ufrgs.br:10183/217574
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str 1853
spelling Henz, BernardoOliveira Neto, Manuel Menezes de2021-01-28T04:02:08Z2020http://hdl.handle.net/10183/217574001121913Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais.This dissertation revisits fundamental aspects of computational photography using state-ofthe- art deep-learning strategies to improve them. We propose two novel techniques that enhance the digital-photography pipeline. More specifically, we show how to improve image acquisition and noise handling. For image acquisition, we present a novel approach based on convolutional neural networks for jointly optimizing the design of color filter arrays and demosaicing. Our trained models provide high-quality color reconstruction and achieve higher peak signal-to-noise ratio (PSNR) values on standard datasets, surpassing previous techniques for both noise-free and noisy data. For noise handling, we propose an architecture based on generative adversarial networks (GANs) that is capable of adjusting the noise level of a given image. Through validation tests, we show that the noise generated by our models are much closer to what is found in photographs when compared to existing methods (Gaussian/Poisson noise). We evaluate the use of our generative models when training a denoiser, showing that training with images synthesized by our models indeed have superior performance on natural-images denoise benchmarks. By improving core steps of the digital-imaging pipeline, our methods have the potential to improve the overall quality of digital photographs.application/pdfengFotografia digitalAprendizado profundoProcessamento digital de imagensRedes neurais convolucionaisColor filter arrayDemosaicingDenoisingComposição de imagensImproving digital photography : revisiting core aspects through a deep-learning lensAperfeiçoando a fotografia digital: revisitando aspectos fundamentais sob uma visão de deep learning info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2020doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001121913.pdf.txt001121913.pdf.txtExtracted Texttext/plain253847http://www.lume.ufrgs.br/bitstream/10183/217574/2/001121913.pdf.txt1ddb74660a72325254cb95bdb317e951MD52ORIGINAL001121913.pdfTexto completo (inglês)application/pdf59260689http://www.lume.ufrgs.br/bitstream/10183/217574/1/001121913.pdfbc65ee7f63ff4b2c75c16d44e9a70e7fMD5110183/2175742024-05-12 06:42:19.487994oai:www.lume.ufrgs.br:10183/217574Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-05-12T09:42:19Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Improving digital photography : revisiting core aspects through a deep-learning lens
dc.title.alternative.pt.fl_str_mv Aperfeiçoando a fotografia digital: revisitando aspectos fundamentais sob uma visão de deep learning
title Improving digital photography : revisiting core aspects through a deep-learning lens
spellingShingle Improving digital photography : revisiting core aspects through a deep-learning lens
Henz, Bernardo
Fotografia digital
Aprendizado profundo
Processamento digital de imagens
Redes neurais convolucionais
Color filter array
Demosaicing
Denoising
Composição de imagens
title_short Improving digital photography : revisiting core aspects through a deep-learning lens
title_full Improving digital photography : revisiting core aspects through a deep-learning lens
title_fullStr Improving digital photography : revisiting core aspects through a deep-learning lens
title_full_unstemmed Improving digital photography : revisiting core aspects through a deep-learning lens
title_sort Improving digital photography : revisiting core aspects through a deep-learning lens
author Henz, Bernardo
author_facet Henz, Bernardo
author_role author
dc.contributor.author.fl_str_mv Henz, Bernardo
dc.contributor.advisor1.fl_str_mv Oliveira Neto, Manuel Menezes de
contributor_str_mv Oliveira Neto, Manuel Menezes de
dc.subject.por.fl_str_mv Fotografia digital
Aprendizado profundo
Processamento digital de imagens
Redes neurais convolucionais
topic Fotografia digital
Aprendizado profundo
Processamento digital de imagens
Redes neurais convolucionais
Color filter array
Demosaicing
Denoising
Composição de imagens
dc.subject.eng.fl_str_mv Color filter array
Demosaicing
Denoising
Composição de imagens
description Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais.
publishDate 2020
dc.date.issued.fl_str_mv 2020
dc.date.accessioned.fl_str_mv 2021-01-28T04:02:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/217574
dc.identifier.nrb.pt_BR.fl_str_mv 001121913
url http://hdl.handle.net/10183/217574
identifier_str_mv 001121913
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/217574/2/001121913.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/217574/1/001121913.pdf
bitstream.checksum.fl_str_mv 1ddb74660a72325254cb95bdb317e951
bc65ee7f63ff4b2c75c16d44e9a70e7f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831314623575359488