GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2023 |
| Tipo de documento: | Dissertação |
| Idioma: | por |
| Título da fonte: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Texto Completo: | https://hdl.handle.net/1822/92815 |
Resumo: | Dissertação de mestrado em Bioinformática |
| id |
RCAP_6f7371237a2aef86d7ae55c9fd87f350 |
|---|---|
| oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/92815 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de deliriumDeliriumGLMRegressão logística multinomialMultinomial logistic regressionEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaGlobalmente, 25% da população sofre de distúrbios mentais, sendo possível implementar metodologias que possibilitem a deteção e previsão numa fase mais precoce. Concretamente, o delirium é uma disfunção neuropsiquiátrica aguda, prevalente em doentes admitidos em contexto hospitalar de internamento e terapia intensiva. Sendo uma manifestação multifatorial é normalmente subdiagnosticada e negligenciada. O delirium pode ser categorizado, de acordo com o perfil de atividade motora, em hipoativo e hiperativo. Neste contexto, surge o tema da dissertação que visa desenvolver uma aplicação capaz de prever a ocorrência de delirium e dos seus subtipos, com base na metodologia dos GLMs. Os modelos de regressão logística multinomial são frequentemente implementados para identificar as variáveis mais contributivas, dado que permitem modelar a relação entre os preditores e uma variável dependente multicategórica. As etapas que precedem a implementação do algoritmo dizem respeito ao pré-processamento dos dados. No decorrer do processo de modelação, aplicou-se o ADASYN para gerar amostras sintéticas devido ao desbalanceamento das classes da variável dependente. Posteriormente, foi realizada a seleção de variáveis recorrendo a diversas técnicas, sendo que o método Elastic Net com um alpha de 0,1 foi o que demonstrou um melhor desempenho. Para tal, este modelo foi implementado na aplicação disponível em https://alexandra-coelho.shinyapps.io/Delirium_detection/. Para o subtipo hipoativo, permitiu a seleção de 27 variáveis, tendo obtido uma AUC-PR de 0,307 e uma AUC-ROC de 0,691. As variáveis mais contributivas incluem o período de internamento em dias, o alcoolismo, os analgésicos, os cardiotónicos, assim como, o grupo de diagnóstico referente à toxicidade e drogas. Relativamente ao subtipo hiperativo, o modelo determinou 29 variáveis relevantes, onde obteve um valor de AUC-PR de 0,074 e de 0,531 para a AUC-ROC. Das variáveis mais impactantes destacam-se a PCR, a idade, a pO2, os critérios SIRS e o local de proveniência no SU, nomeadamente, o UDC1. Especula-se que os baixos valores associados essencialmente ao subtipo hiperativo são devidos à baixa representatividade desta categoria. Apesar deste modelo preditivo ainda poder ser melhorado, assume-se como uma ferramenta útil para os profissionais de saúde aquando o diagnóstico do delirium no SU.Globally, 25% of the population suffers from mental disorders, and it is possible to implement methodologies that enable the detection and prediction at an earlier stage. Specifically, delirium is an acute neuropsychiatric dysfunction prevalent in patients admitted to inpatient and intensive care hospital settings. As a multifactorial manifestation, it is typically underdiagnosed and overlooked. Delirium can be categorized, based on motor activity profile, into hypoactive and hyperactive subtypes. In this context, the dissertation topic arises, aiming to develop an application capable of predicting the occurrence of delirium and its subtypes using the GLMs methodology. Multinomial logistic regression predictive models are often implemented to identify the most influential variables, as they allow for modelling the relationship between predictors and a multinomial dependent variable. The steps preceding the algorithm’s implementation relate to data preprocessing. During the modelling process, ADASYN was applied to generate synthetic samples due to the imbalance in the classes of the dependent variable. Subsequently, variable selection was performed using various techniques, with the Elastic Net method having an alpha value of 0,1 showing the best performance. To achieve this, this model was integrated into the application available at https://alexandra-coelho.shinyapps. io/Delirium_detection/. For the hypoactive subtype, it allowed the selection of 27 variables, resulting in an AUC-PR of 0,307 and an AUC-ROC of 0,691. The most influential variables include the length of hospitalization in days, alcoholism, analgesics, cardiotonics, as well as the diagnostic group related to toxicity and drugs. Regarding the hyperactive subtype, the model identified 29 relevant variables, with an AUC-PR of 0,074 and an AUC-ROC of 0,531. The most impactful variables include PCR, age, pO2, SIRS criteria, and the source location in the ER, specifically UDC1. It is speculated that the low values, especially for the hyperactive subtype, are due to the limited representation of this category. Despite the potential for further improvement in this predictive model, it is considered a useful tool for healthcare professionals when diagnosing delirium in the emergency room.Braga, A. C.Mariz, JoséUniversidade do MinhoCoelho, Alexandra Moreira2023-12-162023-12-16T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/92815por203618203info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-09-07T01:34:31Zoai:repositorium.sdum.uminho.pt:1822/92815Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T18:47:54.124256Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| title |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| spellingShingle |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium Coelho, Alexandra Moreira Delirium GLM Regressão logística multinomial Multinomial logistic regression Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
| title_short |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| title_full |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| title_fullStr |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| title_full_unstemmed |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| title_sort |
GLM’s em Data Science como ferramenta na seleção de fatores de risco: um exemplo de previsão de delirium |
| author |
Coelho, Alexandra Moreira |
| author_facet |
Coelho, Alexandra Moreira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Braga, A. C. Mariz, José Universidade do Minho |
| dc.contributor.author.fl_str_mv |
Coelho, Alexandra Moreira |
| dc.subject.por.fl_str_mv |
Delirium GLM Regressão logística multinomial Multinomial logistic regression Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
| topic |
Delirium GLM Regressão logística multinomial Multinomial logistic regression Engenharia e Tecnologia::Outras Engenharias e Tecnologias |
| description |
Dissertação de mestrado em Bioinformática |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12-16 2023-12-16T00:00:00Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/92815 |
| url |
https://hdl.handle.net/1822/92815 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
203618203 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833597670194675712 |