An efficient strategy for estimation of visually salient regions in images

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Lie, Maiko Min Ian lattes
Orientador(a): Vieira Neto, Hugo lattes
Banca de defesa: Vieira Neto, Hugo, Farias, Mylène Christine Queiroz de, Schwartz, William Robson, Nassu, Bogdan Tomoyuki
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Curitiba
Programa de Pós-Graduação: Mestrado em Engenharia Elétrica e Informática Industrial
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/3302
Resumo: A informação incidente no sistema visual humano é limitada por um mecanismo de seleção, conhecido como atenção visual. Este mecanismo é responsável por restringir a informação visual incidente a um subconjunto menor e potencialmente importante para processamento adicional, permitindo que o sistema visual responda rapidamente apesar da enorme quantidade de informação ao qual normalmente está sujeito. Sistemas de visão computacional empregam reproduções deste mecanismo para redução de espaço visual, visto que essa estratégia pode levar a substanciais ganhos em eficiência. Esta dissertação trata do problema de computação eficiente de atenção visual, em particular o caso de detecção de regiões salientes. Uma estratégia com base em sobreamostragem conjunta (joint upsampling), de estimativas de saliência em baixa resolução é apresentada com esse propósito. Isso permite explorar tanto as vantagens de estimativa em baixa-resolução (redução de custo computacional, abstração de detalhes desnecessários) quanto as de bordas em alta-resolução (alta acurácia). Com base na alta redundância de dados e importância espacialmente-variável no conteúdo de imagens de cenas reais, duas formulações de saliência visual são apresentadas para estimativa em baixa resolução na estratégia proposta. A primeira opera em nível de pixel, baseada em distâncias de cor aleatórias. A segunda opera em nível de patch, baseada em erro de reconstrução por bases obtidas através de Análise de Componentes Principais nas margens da imagem. A eficácia e eficiência da estratégia proposta são demonstradas através de avaliação nos bancos de imagens ASD, MSRA10K, ECSSD, e DUTOMRON. Uma comparação com outros sete métodos do estado-da-arte em termos de precisão, abrangência, F-measure e tempo de execução demonstra que a estratégia proposta é altamente competitiva, alcançando uma das maiores relações custo-benefício entre acurácia e tempo de execução.