Desenvolvimento e análise de modelos de estatística multivariada baseados em aprendizado de máquina: predição de partos pré-termo na coorte de nascimento BRISA em Ribeirão Preto

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Bazo, Gabriel
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/17/17144/tde-07092020-102951/
Resumo: Introdução: O nascimento pré-termo (PT) é um dos principais fatores que levam a morte e causa, a longo prazo, significativa perda de capacidade, tanto física quanto psicológica entre os sobreviventes. Objetivos: Desenvolver uma ferramenta computacional baseada em Aprendizado de Máquina capaz de predizer o nascimento PT em uma coorte de nascimentos brasileira. Métodos: Estudo transversal aninhado a coorte BRISA, que coletou informações sobre todos os nascimentos em 8 hospitais de Ribeirão Preto, Brasil, 2010. Foram aplicados questionários para a mãe. Nesta análise, apenas as informações maternas anteriores ao nascimento foram utilizadas. Usou-se características sociodemográficas, estilo de vida e acompanhamento pré-natal. Uma regressão foi utilizada para determinar as variáveis independentes e a variável dependente foi criada a partir da categorização da idade gestacional (<37s PT, ≥37s termo). Seis algoritmos de predição foram testados, Random Forest (RF), Support vector machines (SVM), Naive Bayes (NB), Decision Tree (DT), Linear discriminant analysis (LDA) e K-nearest neighbors (KNN). Resultados: 7699 gestantes participaram e 7651 atenderam todos os critérios de inclusão. A idade média foi de 27 anos (±6,25), 44,22% eram primíparas. A taxa total de PT foi de 12,7%. As variáveis com maior poder de predição para o parto PT, foram: ocorrência de um parto anterior PT, ameaça de parto PT na gestação atual, quantidade de consultas do pré-natal no segundo e terceiro trimestre da gestação, realização e tipo de serviço do pré-natal, número de fetos, hospitalização durante a gestação, ocorrência de doenças durante a gestação corrente, hipertensão gestacional, anemia e quantidade de filhos vivos. RF apresentou a maior acurácia (acc=0,913), sensibilidade (s=0,81) e área sob a curva (auc=0,842). KNN apresentou a maior especifidade (e=0,972). SVM o maior valor positivo preditivo (vpp=0,649). NB o maior valor preditivo negativo (vpn=0,984). Uma simulação computacional de um pré-natal, nas normas do Ministério da Saúde, em mães nas quais o modelo de predição (SVM) indicou a ocorrência de um possível parto PT, demonstrou uma redução de 3,9% no número de nascimentos PT (0,5 na porcentagem). Em âmbito nacional, no ano de 2017 seria possível uma redução de cerca de 12,7 mil partos PT, com economia média de 119 milhões de reais, para sistemas público e privado. Conclusão: Fatores como hospitalização durante a gravidez, hipertensão, tipo de serviço e características do pré-natal foram determinantes para a predição do parto PT. O estudo demonstrou ainda que, foi possível desenvolver modelos de predição para partos PT e sugere-se que esses modelos, adotados em nível nacional por meio de políticas públicas de saúde possam reduzir o número de partos PT, impactar o custo da saúde pública no pais e melhorar a qualidade de vida da mãe e seu recém-nascido.