An efficient strategy for estimation of visually salient regions in images
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , , , |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | eng |
Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Curitiba |
Programa de Pós-Graduação: |
Mestrado em Engenharia Elétrica e Informática Industrial
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/3302 |
Resumo: | A informação incidente no sistema visual humano é limitada por um mecanismo de seleção, conhecido como atenção visual. Este mecanismo é responsável por restringir a informação visual incidente a um subconjunto menor e potencialmente importante para processamento adicional, permitindo que o sistema visual responda rapidamente apesar da enorme quantidade de informação ao qual normalmente está sujeito. Sistemas de visão computacional empregam reproduções deste mecanismo para redução de espaço visual, visto que essa estratégia pode levar a substanciais ganhos em eficiência. Esta dissertação trata do problema de computação eficiente de atenção visual, em particular o caso de detecção de regiões salientes. Uma estratégia com base em sobreamostragem conjunta (joint upsampling), de estimativas de saliência em baixa resolução é apresentada com esse propósito. Isso permite explorar tanto as vantagens de estimativa em baixa-resolução (redução de custo computacional, abstração de detalhes desnecessários) quanto as de bordas em alta-resolução (alta acurácia). Com base na alta redundância de dados e importância espacialmente-variável no conteúdo de imagens de cenas reais, duas formulações de saliência visual são apresentadas para estimativa em baixa resolução na estratégia proposta. A primeira opera em nível de pixel, baseada em distâncias de cor aleatórias. A segunda opera em nível de patch, baseada em erro de reconstrução por bases obtidas através de Análise de Componentes Principais nas margens da imagem. A eficácia e eficiência da estratégia proposta são demonstradas através de avaliação nos bancos de imagens ASD, MSRA10K, ECSSD, e DUTOMRON. Uma comparação com outros sete métodos do estado-da-arte em termos de precisão, abrangência, F-measure e tempo de execução demonstra que a estratégia proposta é altamente competitiva, alcançando uma das maiores relações custo-benefício entre acurácia e tempo de execução. |