Detalhes bibliográficos
Ano de defesa: |
2024 |
Autor(a) principal: |
Feldman, Mariana de Sousa |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/
|
Resumo: |
Técnicas de Morfologia Matemática desempenham um papel fundamental no processamento de imagens digitais, especialmente por meio de operadores morfológicos. Entre eles, destacam-se os W-operadores, uma classe específica que realiza transformações em imagens binárias, localmente definidas em uma janela W e invariantes por translação. Algumas classes de W-operadores podem ser representadas por uma composição de n W-operadores, o que equivale a um W-operador localmente definido na janela dada pela soma de Minkowski das n janelas. Esta classe de W-operadores, denominados W-operadores multicamadas, permite a representação de filtros morfológicos e outras classes de operadores nos contextos de transformação e classificação de imagens. Além disso, W-operadores multicamadas são um caso especial das redes neurais morfológicas discretas. A classe dos W-operadores multicamadas pode ser decomposta em subclasses, cada uma associada a uma sequência específica de janelas. O espaço dessas subclasses forma um subconjunto de um reticulado Booleano que, quando considerado como um Espaço de Aprendizado, permite o aprendizado de W-operadores multicamadas por meio da minimização de uma função de erro utilizando o algoritmo do Reticulado Descendente. Esse processo de otimização no espaço de aprendizado permite o aprendizado das janelas e das funções Booleanas características de cada W-operador, de maneira eficiente, sem a necessidade de uma busca exaustiva. Neste trabalho, desenvolvemos um algoritmo capaz de aprender W-operadores multicamadas para os contextos de transformação e classificação de imagens chamado de Algoritmo do Reticulado Descendente Para o Aprendizado de W-operadores Multicamadas. Aplicamos esse algoritmo a problemas práticos, como o reconhecimento de bordas em imagens ruidosas, o aprendizado da função de transição do Conway\'s Game of Life, e a classificação de dígitos manuscritos na base MNIST. Para abordar esses problemas mais complexos, foi implementada uma otimização da busca no Espaço de Aprendizado, incluindo a exploração estocástica das cadeias e a vetorização dos dados em GPU. Evidenciamos características distintivas do método, como sua alta interpretabilidade, consistência lógica e transparência, com capacidade de aprendizado com pouquíssimas amostras de dados, que contrastam com muitos métodos modernos de aprendizado baseados em redes neurais. Embora o método apresente limitações inerentes à sua natureza combinatória, o objetivo deste trabalho foi encontrar uma solução em tempo hábil com erro aceitável e consistência lógica do operador estimado. |