Impacto da pandemia da COVID-19 e modelos de aprendizagem de máquina para predição de prematuridade no Brasil
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Pernambuco
UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufpe.br/handle/123456789/49007 |
Resumo: | Prematuridade é quando a criança nasce com menos de 37 semanas completas de gestação, sendo considerado um problema de saúde global, e ainda uma das principais consequências de mortes em neonatais e infantis menores de cinco anos de idade. A taxa de parto prematuro pode variar de acordo com a região geográfica e o nível de renda, mantendo uma maior frequência em países subdesenvolvidos. Nos países desenvolvidos, ele é amplamente avaliado como forma de compreender as causas e na criação de ações preventivas. Nesta pesquisa, foi proposta a utilização de algoritmos de aprendizado de máquina para predição de parto prematuro em em gestantes únicas, utilizando dados das capitais brasileiras. Foi verificado se os dois primeiros anos (2020-2021) da pandemia COVID-19 trouxeram impactos significativos para as estimativas dos modelos testados, em comparação ao que foi constatado na base de treinamento. Foram utilizados 6 classificadores de aprendizagem de máquina: Árvore de Decisão, Floresta Aleatória, Regressão Logística, Adaptive Boosting, Análise de Discriminante Linear e Rede Neural do tipo Multi-layer Perceptron, analisando as métricas de acurácia, precisão, revocação, F1-SCORE e área sobre a curva r eceiver operating characteristic. Portanto, com o processamento desses resultados, foi possível verificar a predição de parto prematuro com dados secundários no período de pandemia. A AUC dos modelos na base de validação variou de 0,7052 a 0,7729 (base sem balanceamento) e de 0,7199 a 0,7717 (base com balanceamento). Os resultados demonstraram que a COVID-19 impactou os modelos de Regressão logística, Análise discriminante linear e Multilayer perceptron (os quais são considerados estáveis), enquanto que os modelos baseados em árvore (Adaboost, Floresta aleatória e Árvore de decisão) não apresentam boa aderência à base de treino, devendo ser utilizados com cautela ou desconsiderados. |