Impacto da pandemia da COVID-19 e modelos de aprendizagem de máquina para predição de prematuridade no Brasil

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: SILVA, José Maurício Matapi da
Orientador(a): PAULA NETO, Fernando Maciano de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/49007
Resumo: Prematuridade é quando a criança nasce com menos de 37 semanas completas de gestação, sendo considerado um problema de saúde global, e ainda uma das principais consequências de mortes em neonatais e infantis menores de cinco anos de idade. A taxa de parto prematuro pode variar de acordo com a região geográfica e o nível de renda, mantendo uma maior frequência em países subdesenvolvidos. Nos países desenvolvidos, ele é amplamente avaliado como forma de compreender as causas e na criação de ações preventivas. Nesta pesquisa, foi proposta a utilização de algoritmos de aprendizado de máquina para predição de parto prematuro em em gestantes únicas, utilizando dados das capitais brasileiras. Foi verificado se os dois primeiros anos (2020-2021) da pandemia COVID-19 trouxeram impactos significativos para as estimativas dos modelos testados, em comparação ao que foi constatado na base de treinamento. Foram utilizados 6 classificadores de aprendizagem de máquina: Árvore de Decisão, Floresta Aleatória, Regressão Logística, Adaptive Boosting, Análise de Discriminante Linear e Rede Neural do tipo Multi-layer Perceptron, analisando as métricas de acurácia, precisão, revocação, F1-SCORE e área sobre a curva r eceiver operating characteristic. Portanto, com o processamento desses resultados, foi possível verificar a predição de parto prematuro com dados secundários no período de pandemia. A AUC dos modelos na base de validação variou de 0,7052 a 0,7729 (base sem balanceamento) e de 0,7199 a 0,7717 (base com balanceamento). Os resultados demonstraram que a COVID-19 impactou os modelos de Regressão logística, Análise discriminante linear e Multilayer perceptron (os quais são considerados estáveis), enquanto que os modelos baseados em árvore (Adaboost, Floresta aleatória e Árvore de decisão) não apresentam boa aderência à base de treino, devendo ser utilizados com cautela ou desconsiderados.