GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium

Detalhes bibliográficos
Autor(a) principal: Coelho, Alexandra Moreira
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: https://hdl.handle.net/1822/92815
Resumo: Dissertação de mestrado em Bioinformática
id RCAP_6f7371237a2aef86d7ae55c9fd87f350
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/92815
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de deliriumDeliriumGLMRegressão logística multinomialMultinomial logistic regressionEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaGlobalmente, 25% da população sofre de distúrbios mentais, sendo possível implementar metodologias que possibilitem a deteção e previsão numa fase mais precoce. Concretamente, o delirium é uma disfunção neuropsiquiátrica aguda, prevalente em doentes admitidos em contexto hospitalar de internamento e terapia intensiva. Sendo uma manifestação multifatorial é normalmente subdiagnosticada e negligenciada. O delirium pode ser categorizado, de acordo com o perfil de atividade motora, em hipoativo e hiperativo. Neste contexto, surge o tema da dissertação que visa desenvolver uma aplicação capaz de prever a ocorrência de delirium e dos seus subtipos, com base na metodologia dos GLMs. Os modelos de regressão logística multinomial são frequentemente implementados para identificar as variáveis mais contributivas, dado que permitem modelar a relação entre os preditores e uma variável dependente multicategórica. As etapas que precedem a implementação do algoritmo dizem respeito ao pré-processamento dos dados. No decorrer do processo de modelação, aplicou-se o ADASYN para gerar amostras sintéticas devido ao desbalanceamento das classes da variável dependente. Posteriormente, foi realizada a seleção de variáveis recorrendo a diversas técnicas, sendo que o método Elastic Net com um alpha de 0,1 foi o que demonstrou um melhor desempenho. Para tal, este modelo foi implementado na aplicação disponível em https://alexandra-coelho.shinyapps.io/Delirium_detection/. Para o subtipo hipoativo, permitiu a seleção de 27 variáveis, tendo obtido uma AUC-PR de 0,307 e uma AUC-ROC de 0,691. As variáveis mais contributivas incluem o período de internamento em dias, o alcoolismo, os analgésicos, os cardiotónicos, assim como, o grupo de diagnóstico referente à toxicidade e drogas. Relativamente ao subtipo hiperativo, o modelo determinou 29 variáveis relevantes, onde obteve um valor de AUC-PR de 0,074 e de 0,531 para a AUC-ROC. Das variáveis mais impactantes destacam-se a PCR, a idade, a pO2, os critérios SIRS e o local de proveniência no SU, nomeadamente, o UDC1. Especula-se que os baixos valores associados essencialmente ao subtipo hiperativo são devidos à baixa representatividade desta categoria. Apesar deste modelo preditivo ainda poder ser melhorado, assume-se como uma ferramenta útil para os profissionais de saúde aquando o diagnóstico do delirium no SU.Globally, 25% of the population suffers from mental disorders, and it is possible to implement methodologies that enable the detection and prediction at an earlier stage. Specifically, delirium is an acute neuropsychiatric dysfunction prevalent in patients admitted to inpatient and intensive care hospital settings. As a multifactorial manifestation, it is typically underdiagnosed and overlooked. Delirium can be categorized, based on motor activity profile, into hypoactive and hyperactive subtypes. In this context, the dissertation topic arises, aiming to develop an application capable of predicting the occurrence of delirium and its subtypes using the GLMs methodology. Multinomial logistic regression predictive models are often implemented to identify the most influential variables, as they allow for modelling the relationship between predictors and a multinomial dependent variable. The steps preceding the algorithm’s implementation relate to data preprocessing. During the modelling process, ADASYN was applied to generate synthetic samples due to the imbalance in the classes of the dependent variable. Subsequently, variable selection was performed using various techniques, with the Elastic Net method having an alpha value of 0,1 showing the best performance. To achieve this, this model was integrated into the application available at https://alexandra-coelho.shinyapps. io/Delirium_detection/. For the hypoactive subtype, it allowed the selection of 27 variables, resulting in an AUC-PR of 0,307 and an AUC-ROC of 0,691. The most influential variables include the length of hospitalization in days, alcoholism, analgesics, cardiotonics, as well as the diagnostic group related to toxicity and drugs. Regarding the hyperactive subtype, the model identified 29 relevant variables, with an AUC-PR of 0,074 and an AUC-ROC of 0,531. The most impactful variables include PCR, age, pO2, SIRS criteria, and the source location in the ER, specifically UDC1. It is speculated that the low values, especially for the hyperactive subtype, are due to the limited representation of this category. Despite the potential for further improvement in this predictive model, it is considered a useful tool for healthcare professionals when diagnosing delirium in the emergency room.Braga, A. C.Mariz, JoséUniversidade do MinhoCoelho, Alexandra Moreira2023-12-162023-12-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/92815por203618203info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-09-07T01:34:31Zoai:repositorium.sdum.uminho.pt:1822/92815Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T18:47:54.124256Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
title GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
spellingShingle GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
Coelho, Alexandra Moreira
Delirium
GLM
Regressão logística multinomial
Multinomial logistic regression
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
title_full GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
title_fullStr GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
title_full_unstemmed GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
title_sort GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
author Coelho, Alexandra Moreira
author_facet Coelho, Alexandra Moreira
author_role author
dc.contributor.none.fl_str_mv Braga, A. C.
Mariz, José
Universidade do Minho
dc.contributor.author.fl_str_mv Coelho, Alexandra Moreira
dc.subject.por.fl_str_mv Delirium
GLM
Regressão logística multinomial
Multinomial logistic regression
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Delirium
GLM
Regressão logística multinomial
Multinomial logistic regression
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática
publishDate 2023
dc.date.none.fl_str_mv 2023-12-16
2023-12-16T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/92815
url https://hdl.handle.net/1822/92815
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203618203
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833597670194675712