Funções de fusão inspiradas na integral de Choquet na camada de pooling de Redes de Aprendizagem Profunda

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Dias, Camila Alves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.furg.br/handle/1/8120
Resumo: A classificação das imagens é um dos problemas mais estudados na área da visão computacional. Alguns dos problemas enfrentados nesse contexto são, por exemplo, a caracterização de padrões de imagens para distinguir espécies naturais, classificação de dados coletados, que em geral envolvem informações complexas a serem identificadas, exigindo recursos como, por exemplo, ferramentas de aprendizado de máquina, como Convolutional Neural Networks (CNNs) e Deep Learning Networks (DLNs). Esta dissertação de mestrado explora o uso de funções de fusão inspiradas na integral de Choquet na camada de pooling da arquitetura da CNN, apresentando um objetivo geral de duas vias. Primeiramente, estudamos a aplicação de funções de (pré) agregação baseadas nas generalizações da integral de Choquet na redução dimensional da imagem, simulando a camada de pooling de um DLN, comparando tais funções com as usuais utilizadas na literatura (as funções aritméticas máximo e média). A avaliação quantitativa foi feita sobre um conjunto de dados de imagem usando diferentes medidas de qualidade de imagem para comparar os resultados. A segunda parte da dissertação é destinada a introduzir uma função de fusão inspirada na integral de Choquet para a camada de pooling da DLN, definida por uma função de capacidade que é aprendida pela própria rede. Utilizando o CifarNet (uma arquitetura simples para classificar objetos), analisamos a abordagem proposta na classificação das imagens. Os resultados são comparados com os obtidos quando se usa o máximo na camada de pooling.