Detalhes bibliográficos
Ano de defesa: |
2012 |
Autor(a) principal: |
Afonso, Luis Claudio Sugi [UNESP] |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://hdl.handle.net/11449/98677
|
Resumo: |
Categorização de imagens utilizando Dicionário de Palavras Visuais tem recebido grande atenção pelas comunidades de visão computacional e processamento de imagens. Nesta abordagem, cada imagem é representada por um conjuntode pontos invariantes, os quais são mapeados no espaço de Hilbert, o qual é uma extensão do plano Euclideano e espaço 3D tendo qual quer número finito ou infinito de dimensões, representando um dicionário visual composto das características mais representativas de um conjunto de imagens. Contudo, o principal problema de tal abordagem é encontrar um dicionário que seja compacto e, ao mesmo tempo, representativo. Encontrar tal dicionário de maneira automática, sem auxílio de um usuário, é uma tarefa ainda mais difícil. Neste trabalho, é proposto um método para encontrar o dicionário de maneira automática empregando um algoritmo baseado em grafos denominado Floresta de Caminhos Ótimos, o qual não necessita da dimensão do dicionário para encontrá-lo. Os experimentos envolveram o uso de 3 bases de imagens de objetos variados e realizando-se umacomparação entre a técnica apresentada e as técnicas K-médias e Seleção Aleatória. A comparação avaliou o tempo necessário para que cada técnica compute os dicionários e a taxa de acerto proporcionada pelos dicionários. Os resultados experimentais monstraram que o algoritmo Floresta de Caminhos Ótimos é uma alternativa a ser empregada na técnica Dicionário de Palavras Visuais, uma vez que as taxas de acerto são similares as demais técnicas, possui vantagem quando dicionários de alta dimensão devem ser calculadose, principalmente, não necessita que a dimensão do dicionário visual seja definido a priori |