Análise formal de sistemas baseados em aprendizado de máquina usando redes de petri coloridas.
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/41257 |
Resumo: | O Aprendizado de Máquina (AM) tem sido amplamente aplicado em áreas críticas como saúde, manufatura e transporte. No entanto, sua integração em sistemas críticos exige maior explicabilidade e acurácia. Modelos como árvores de decisão (Decision Tree- DT) e florestas aleatórias (Random Forest- RF) podemgerar regras redundantes, dificultando a interpretação e comprometendo a transparência. As DTs aumentam em profundidade e número de nós ao capturar padrões, o que pode dificultar a interpretação, comprometendo a transparência e a aplicabilidade em sistemas críticos, especialmente na saúde. Nesta tese, é apresentado um método baseado em redes de Petri coloridas (Coloured Petri Nets- CPN) que visa melhorar a explicabilidade de modelos DT e RF. O método, denominado RuleXtract/CPN, automatiza a extração, análise e ajuste de regras de decisão, além de permitir que essas etapas sejam realizadas por usuários sem expertise em CPN. O método desenvolvido consiste em trans formar modelos DT e RF emmodelos de CPN. Por meio de simulações, as regras de decisão são analisadas e ajustadas, eliminando redundâncias e identificando regras específicas ou incorretas que geram classificações enganosas. A implementação do método foi realizada com tecnologias web integradas ao arcabouço Access/CPN, de modo que os usuários não precisem ter experiência em CPN para gerar e simular modelos, executando-os em segundo plano. Experimentos foram conduzidos com seis conjuntos de dados relacionados à COVID 19 e cinco de Influenza. Os resultados mostram uma redução significativa no número de regras de decisão: no conjunto balanceado, as regras foram reduzidas de 882 para 688, en quanto, no conjunto desbalanceado, a redução foi de 876 para 687. A eliminação de regras redundantes reduziu a complexidade dos modelos, facilitando a validação por especialistas antes da adoção das regras em um sistema de suporte à decisão (Decision Support System- DSS). Os achados destacam a relevância do método para aumentar a confiança e a expli cabilidade de modelos de AM aplicados a sistemas críticos. A metodologia desenvolvida apresenta potencial para pesquisas futuras, incluindo sua escalabilidade e aplicação a outros algoritmos de AM. |