Representação e recuperação de imagens por meio de relações espaciais entre objetos

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Santos, D. N.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro Universitário FEI, São Bernardo do Campo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.fei.edu.br/handle/FEI/301
Resumo: Com o crescente número de imagens digitais geradas a cada dia, também aumenta a necessidade de recuperar informação contida em grandes bases de imagens de maneira rápida e precisa. As técnicas aplicadas em recuperação de imagens fazem uso, em geral, de atributos extraídos das imagens e neste espaço de atributos fazem comparações através de métricas de similaridade. Como o foco destas técnicas de recuperação de conteúdo é o uso de atributos de baixo nível, existe um problema pois o conteúdo semântico não está relacionado com estas características de baixo nível. Além disto, as relações entre objetos não são consideradas. Este trabalho aborda este problema conhecido como lacuna semântica (do inglês semantic gap) e procura aplicar relações espaciais com o intuito de reduzir o impacto da lacuna semântica na análise de cenas. Neste trabalho, as relações espaciais são expressas em termos de preposições espaciais. Assim, para definir uma preposição à partir de uma imagem é necessário segmentar os objetos que compõem a imagem e para cada par de objetos segmentados estabelecer a topologia entre eles. Para realizar a segmentação, é utilizado redes neurais convolucionais. Considerando uma imagem, a rede neural provê um valor probabilístico pada cada pixel existente na imagem, consequentemente, regiões compreendidas por valores estimados referentes à mesma classe são consideradas como o objeto segmentado. Posteriormente, estes objetos são combinados em pares para o estabelecimento de relações binárias entre eles. De posse dos objetos e seus respectivos segmentos, relações mereotopológicas são estabelecidas de acordo com o Region Connection Calculus (RCC). A definição destas relações é efetuada através de um procedimento que visa associar um par de objetos indicados na imagem com uma das oito relações definidas no RCC. Estas relações encontradas, com base neste procedimento, serão traduzidas para preposições linguísticas (existentes na língua inglesa), através de uma outra rede neural. Por fim, a informação dos objetos e suas respectivas relações é utilizada para estender uma ontologia superior. A ontologia aplicada é o Suggested Upper Merged Ontology (SUMO). O procedimento de introduzir uma representação formal permite o estabelecimento de novas relações, desconhecidas a priori. Este fato possibilita a recuperação de imagens à partir de relações derivadas através dos axiomas existentes na representação formal aplicada.