Aplicação de técnicas de aprendizado de máquina para a identificação de mães com risco de parto prematuro na cidade de São Paulo

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Aguirre Rodríguez, Elias Carlos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11449/254758
http://lattes.cnpq.br/0593292995955419
https://orcid.org/0000-0003-1120-1708
Resumo: O parto prematuro ocorre antes da 37a semana de gestação, apresentando um risco elevado de complicações físicas e neuropsicomotoras nos recém-nascidos, sendo considerado a principal causa de mortalidade neonatal. Em consonância com um dos Objetivos de Desenvolvimento Sustentável (ODS) voltados à Saúde e Bem-Estar, que visa reduzir a mortalidade neonatal até 2030, a aplicação de ferramentas tecnológicas, como o Aprendizado de Máquina, pode oferecer suporte na assistência médica e na tomada de decisões. Dessa forma, esta pesquisa tem como objetivo aplicar técnicas de aprendizado de máquina para identificar mães com risco de parto prematuro, utilizando dados do município de São Paulo no período de 2015 a 2019. Este trabalho pode ser classificado como uma pesquisa aplicada com objetivos empírico-normativos, sua abordagem é quantitativa, utilizando o método de pesquisa de modelagem e simulação. Foram utilizados dados do Departamento de Informática do Sistema Único de Saúde – DATASUS, especificamente registros da declaração de nascidos vivos. A análise baseou-se na abordagem de regressão para estimar a duração da gestação (idade gestacional), considerando informações maternas e da gestação atual ou anterior e utilizando métodos como Regressão Linear, Árvore de Decisão, Floresta Aleatória, Gradient Bossting, e Extreme Gradient Boosting. Os modelos foram validados internamente com validação cruzada de 10-Fold e foi utilizada técnica Random Search para encontrar a melhor combinação de hiperparâmetros. Como resultado, o modelo de Gradient Boosting destacou-se como o melhor, apresentando bons resultados nas diferentes métricas de desempenho, com valores de EMA = 1,186, EQM = 2,833, REQM = 1,683, e EPAM = 3,182. Concluindo, o modelo de regressão demonstrou bom desempenho, evidenciando que as técnicas de aprendizado de máquina são ferramentas eficazes na área da saúde. Elas permitem que os especialistas tomem decisões oportunas em relação à identificação de nascimentos prematuros, contribuindo para a implementação de medidas de controle e, consequentemente, para a redução das taxas de mortalidade neonatal, em conformidade com os ODS.