Improving digital photography : revisiting core aspects through a deep-learning lens
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2020 |
| Tipo de documento: | Tese |
| Idioma: | eng |
| Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFRGS |
| Texto Completo: | http://hdl.handle.net/10183/217574 |
Resumo: | Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais. |
| id |
URGS_d11754a051e74d19f0da80d18042356e |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/217574 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
1853 |
| spelling |
Henz, BernardoOliveira Neto, Manuel Menezes de2021-01-28T04:02:08Z2020http://hdl.handle.net/10183/217574001121913Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais.This dissertation revisits fundamental aspects of computational photography using state-ofthe- art deep-learning strategies to improve them. We propose two novel techniques that enhance the digital-photography pipeline. More specifically, we show how to improve image acquisition and noise handling. For image acquisition, we present a novel approach based on convolutional neural networks for jointly optimizing the design of color filter arrays and demosaicing. Our trained models provide high-quality color reconstruction and achieve higher peak signal-to-noise ratio (PSNR) values on standard datasets, surpassing previous techniques for both noise-free and noisy data. For noise handling, we propose an architecture based on generative adversarial networks (GANs) that is capable of adjusting the noise level of a given image. Through validation tests, we show that the noise generated by our models are much closer to what is found in photographs when compared to existing methods (Gaussian/Poisson noise). We evaluate the use of our generative models when training a denoiser, showing that training with images synthesized by our models indeed have superior performance on natural-images denoise benchmarks. By improving core steps of the digital-imaging pipeline, our methods have the potential to improve the overall quality of digital photographs.application/pdfengFotografia digitalAprendizado profundoProcessamento digital de imagensRedes neurais convolucionaisColor filter arrayDemosaicingDenoisingComposição de imagensImproving digital photography : revisiting core aspects through a deep-learning lensAperfeiçoando a fotografia digital: revisitando aspectos fundamentais sob uma visão de deep learning info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2020doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001121913.pdf.txt001121913.pdf.txtExtracted Texttext/plain253847http://www.lume.ufrgs.br/bitstream/10183/217574/2/001121913.pdf.txt1ddb74660a72325254cb95bdb317e951MD52ORIGINAL001121913.pdfTexto completo (inglês)application/pdf59260689http://www.lume.ufrgs.br/bitstream/10183/217574/1/001121913.pdfbc65ee7f63ff4b2c75c16d44e9a70e7fMD5110183/2175742024-05-12 06:42:19.487994oai:www.lume.ufrgs.br:10183/217574Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532024-05-12T09:42:19Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| dc.title.alternative.pt.fl_str_mv |
Aperfeiçoando a fotografia digital: revisitando aspectos fundamentais sob uma visão de deep learning |
| title |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| spellingShingle |
Improving digital photography : revisiting core aspects through a deep-learning lens Henz, Bernardo Fotografia digital Aprendizado profundo Processamento digital de imagens Redes neurais convolucionais Color filter array Demosaicing Denoising Composição de imagens |
| title_short |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| title_full |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| title_fullStr |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| title_full_unstemmed |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| title_sort |
Improving digital photography : revisiting core aspects through a deep-learning lens |
| author |
Henz, Bernardo |
| author_facet |
Henz, Bernardo |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Henz, Bernardo |
| dc.contributor.advisor1.fl_str_mv |
Oliveira Neto, Manuel Menezes de |
| contributor_str_mv |
Oliveira Neto, Manuel Menezes de |
| dc.subject.por.fl_str_mv |
Fotografia digital Aprendizado profundo Processamento digital de imagens Redes neurais convolucionais |
| topic |
Fotografia digital Aprendizado profundo Processamento digital de imagens Redes neurais convolucionais Color filter array Demosaicing Denoising Composição de imagens |
| dc.subject.eng.fl_str_mv |
Color filter array Demosaicing Denoising Composição de imagens |
| description |
Esta tese revisita aspectos fundamentais da fotografia computacional, enquanto os aperfeiçoa utilizando estratégias de deep-learning do estado da arte. Esta tese propõe duas técnicas que aprimoram o pipeline de fotografia digital. Especificamento, nós mostramos como melhorar o processo de aquisição de imagens e o tratamento de ruído natural. Para aquisição de imagens, nós apresentamos uma técnica inovadora baseada em Convolutional Neural Networks que otimiza conjuntamente o design de color filter arrays e o método de demosaicing. Os modelos treinados proporcionam reconstruções de alta qualidade, alcançando valores de PSNR (Peak Signal-to-Noise Ratio) maiores em diversos datasets, superando técnicas anteriores tanto para o caso de imagens sem ruído quanto para imagens ruidosas (demosaicing+denoising). Para o tratamento de ruído, nós propomos uma arquitetura baseada em GANs (Generative Adversarial Networks) que é capaz de ajustar o nível de ruído presente em uma imagem. Através de testes de validação, nós mostramos que o ruído sintetizado por nossos modelos é muito mais próximos que o encontrado em fotografias reais quando comparado com os métodos existentes (Gaussiano/Poisson). Nósavaliamos o uso de nossos modelos generativos no treinamento de denoisers, mostrando que os denoisers treinados utilizando imagens sintetizadas pela nossa ténica conseguem uma performance superior em benchmarks de remoção de ruído de images naturais. Visto que nossas técnicas melhoram aspectos importante do pipeline de imagens digitais, elas têm o potencial de melhorar a qualidade geral de fotografias digitais. |
| publishDate |
2020 |
| dc.date.issued.fl_str_mv |
2020 |
| dc.date.accessioned.fl_str_mv |
2021-01-28T04:02:08Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/217574 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001121913 |
| url |
http://hdl.handle.net/10183/217574 |
| identifier_str_mv |
001121913 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/217574/2/001121913.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/217574/1/001121913.pdf |
| bitstream.checksum.fl_str_mv |
1ddb74660a72325254cb95bdb317e951 bc65ee7f63ff4b2c75c16d44e9a70e7f |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831314623575359488 |