Detecção de anomalia através da comparação de modelos representativos

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Gelatti, Giovana Jaskulski
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-24052021-171751/
Resumo: Lacuna: Regulamentos de privacidade e acesso a dados e leis de proteção de dados tornam a comparação de departamentos e identificação de padrões, em geral, tarefas difíceis. A exploração dos dados coletados, juntamente com um modelo descritivo induzido a partir desses dados, podem ajudar a identificar modelos destoantes e promover a comparação das instituições. Objetivo: O estudo propõe a criação de modelos de redes Bayesianas capazes de extrair conhecimentos novos e significativos a partir dos dados nas variáveis utilizadas no estudo de caso. Propomos a criação de modelos de seções obstétricas por meio de variáveis utilizadas para classificação de Robson (CR), utilizada para classificar gestantes em 10 grupos, estudo de possível integração de novas variáveis à CR, a recriação de dados pelos modelos e a detecção de departamentos obstétricos com comportamentos gerais muito diferentes (anômalos) pela comparação dos modelos. Métodos: Foi desenvolvido um modelo de rede Bayesiana com as variáveis utilizadas para CR por cada hospital envolvido no estudo. Propusemos e investigamos experimentalmente novas variáveis que podem melhor caracterizar e distribuir as gestantes nos grupos de Robson. As funções do pacote R \"bnlearn\" foram usadas para manipular e recriar dados no modelo. O desempenho deste modelo foi validado quanto à capacidade de recriar dados, comparando com medidas estatísticas de dados reais, e verificando se as distribuições nos grupos CR permanecem as mesmas. No intuito de construir uma matriz de distância para identificação de dados destoantes, a distância de Hamming foi utilizada para calcular as dissimilaridades entre os modelos. As anomalias detectadas foram validadas por especialista de acordo com a escala Likert. Resultados: Os dados foram descritos e recriados através de redes Bayesianas com imputação de dados, com referência significativa aos dados reais. A comparação dos modelos sobre as seções de obstetrícia identificou padrões e anomalias. A comparação permitiu diferenciar os setores com diferentes taxas de cesárea e distribuição nos grupos de Robson, de acordo com as variáveis selecionadas, preservando o acesso aos dados reais das instituições.