Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Machado, Cristiane dos Santos
Orientador(a): Passos, Ives Cavalcante
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/211237
Resumo: O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográficas, de eventos estressantes da vida e variáveis clínicas. Para alcançar esse objetivo e abordar as limitações de trabalhos anteriores, utilizamos o National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). O NESARC é uma coorte publicamente disponível, mediante solicitação, com 43.093 participantes e com um período de seguimento de três anos. Ele foi realizado em duas ondas. Entrevistas presenciais foram realizadas com 43.093 indivíduos na Onda 1, com uma taxa de 81% de resposta. A onda 2 envolveu reavaliações presenciais com todos os participantes da onda 1, refletindo 34.653 entrevistas concluídas. As variáveis preditoras foram avaliadas na Onda 1, enquanto que o desfecho (participantes que tentaram suicídio versus participantes que não tentaram suicídio entre a Onda 1 e a Onda 2) foi avaliado na Onda 2. Nós utilizamos o elastic net regularization como nossa análise primária, mas também o random forest e o artificial neural networks. O modelo construído com o elastic net regularization distinguiu indivíduos que tentaram suicídio daqueles que não tentaram com uma área sob a curva ROC (AUC) de 0,89, acurácia balanceada de 81,86%, especificidade de 89,22% e sensibilidade de 74,51% para a população geral. Para os participantes com episódios depressivos maiores ao longo da vida, a AUC foi de 0,89, a acurácia balanceada de 81,64%, a especificidade de 85,86% e a sensibilidade de 77,42%. As variáveis mais importantes com o elastic net foram transtorno de personalidade borderline, transtorno de estresse pós-traumático e descendência asiática para o modelo com todos os participantes; e tentativa prévia de suicídio, transtorno de personalidade borderline e ter ficado uma noite no hospital por causa da depressão no modelo com indivíduos com episódios depressivos maiores ao longo da vida. Random forest e artificial neural networks tiveram desempenho semelhantes em comparação ao elastic net. Dessa forma, através desse trabalho, concluímos que o risco de tentativa de suicídio pode ser estimado com alta precisão, em nível individual, em uma amostra representativa da população americana, por meio da incorporação de variáveis sociodemográficas, de fatores estressantes da vida e de variáveis clínicas. Estudos futuros que integrem dados de diferentes níveis biológicos, como dados genéticos e de saúde digital, podem ajudar a construir modelos mais precisos.