Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Feldman, Mariana de Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/
Resumo: Técnicas de Morfologia Matemática desempenham um papel fundamental no processamento de imagens digitais, especialmente por meio de operadores morfológicos. Entre eles, destacam-se os W-operadores, uma classe específica que realiza transformações em imagens binárias, localmente definidas em uma janela W e invariantes por translação. Algumas classes de W-operadores podem ser representadas por uma composição de n W-operadores, o que equivale a um W-operador localmente definido na janela dada pela soma de Minkowski das n janelas. Esta classe de W-operadores, denominados W-operadores multicamadas, permite a representação de filtros morfológicos e outras classes de operadores nos contextos de transformação e classificação de imagens. Além disso, W-operadores multicamadas são um caso especial das redes neurais morfológicas discretas. A classe dos W-operadores multicamadas pode ser decomposta em subclasses, cada uma associada a uma sequência específica de janelas. O espaço dessas subclasses forma um subconjunto de um reticulado Booleano que, quando considerado como um Espaço de Aprendizado, permite o aprendizado de W-operadores multicamadas por meio da minimização de uma função de erro utilizando o algoritmo do Reticulado Descendente. Esse processo de otimização no espaço de aprendizado permite o aprendizado das janelas e das funções Booleanas características de cada W-operador, de maneira eficiente, sem a necessidade de uma busca exaustiva. Neste trabalho, desenvolvemos um algoritmo capaz de aprender W-operadores multicamadas para os contextos de transformação e classificação de imagens chamado de Algoritmo do Reticulado Descendente Para o Aprendizado de W-operadores Multicamadas. Aplicamos esse algoritmo a problemas práticos, como o reconhecimento de bordas em imagens ruidosas, o aprendizado da função de transição do Conway\'s Game of Life, e a classificação de dígitos manuscritos na base MNIST. Para abordar esses problemas mais complexos, foi implementada uma otimização da busca no Espaço de Aprendizado, incluindo a exploração estocástica das cadeias e a vetorização dos dados em GPU. Evidenciamos características distintivas do método, como sua alta interpretabilidade, consistência lógica e transparência, com capacidade de aprendizado com pouquíssimas amostras de dados, que contrastam com muitos métodos modernos de aprendizado baseados em redes neurais. Embora o método apresente limitações inerentes à sua natureza combinatória, o objetivo deste trabalho foi encontrar uma solução em tempo hábil com erro aceitável e consistência lógica do operador estimado.