Detalhes bibliográficos
Ano de defesa: |
2019 |
Autor(a) principal: |
Dias, Camila Alves |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://repositorio.furg.br/handle/1/8120
|
Resumo: |
A classificação das imagens é um dos problemas mais estudados na área da visão computacional. Alguns dos problemas enfrentados nesse contexto são, por exemplo, a caracterização de padrões de imagens para distinguir espécies naturais, classificação de dados coletados, que em geral envolvem informações complexas a serem identificadas, exigindo recursos como, por exemplo, ferramentas de aprendizado de máquina, como Convolutional Neural Networks (CNNs) e Deep Learning Networks (DLNs). Esta dissertação de mestrado explora o uso de funções de fusão inspiradas na integral de Choquet na camada de pooling da arquitetura da CNN, apresentando um objetivo geral de duas vias. Primeiramente, estudamos a aplicação de funções de (pré) agregação baseadas nas generalizações da integral de Choquet na redução dimensional da imagem, simulando a camada de pooling de um DLN, comparando tais funções com as usuais utilizadas na literatura (as funções aritméticas máximo e média). A avaliação quantitativa foi feita sobre um conjunto de dados de imagem usando diferentes medidas de qualidade de imagem para comparar os resultados. A segunda parte da dissertação é destinada a introduzir uma função de fusão inspirada na integral de Choquet para a camada de pooling da DLN, definida por uma função de capacidade que é aprendida pela própria rede. Utilizando o CifarNet (uma arquitetura simples para classificar objetos), analisamos a abordagem proposta na classificação das imagens. Os resultados são comparados com os obtidos quando se usa o máximo na camada de pooling. |