Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Mendes, Patricia Pedrosa Moreira |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/85/85131/tde-12072023-091827/
|
Resumo: |
Cada vez mais o aprendizado de máquina vem ganhando espaço na área da saúde devido à sua capacidade de melhorar a predição de doenças e auxiliar profissionais na condução dos tratamentos clínicos. A infecção hospitalar é o evento negativo mais comum para pacientes hospitalizados e continua a se constituir em séria ameaça à segurança dos pacientes. O objetivo deste trabalho foi encontrar uma técnica de aprendizado de máquina otimizada e eficiente que possa prever efetivamente a condição da infecção hospitalar, identificando os principais fatores responsáveis por esta condição. Neste trabalho, usamos seis técnicas de aprendizado de máquina, os algoritmos utilizados no trabalho foram Random Forest, Regressão logística, KNN, Adaboost, Bagging e XGBoost; também foram empregadas técnicas modernas de explicabilidade a estes algoritmos. Nesse processo, os dados foram divididos em dados de treino e de teste, os modelos foram treinados em um primeiro momento com os hiperparâmetros padrões, em um segundo momento os modelos foram treinados com hiperparâmetros aprimorados. Os modelos que apresentaram as melhores métricas foram o XGBoost e Random Forest, o XGBoost apresentou o melhor resultado em todas as métricas, exceto na Precisão, o Random Forest obteve o segundo melhor resultado na acurácia e na precisão, na validação cruzada o resultado foi o mesmo que o XGBoost. Para a explicabilidade do modelo foi utilizada a biblioteca SHAP, foi avaliado como o valor de cada variável influenciou no resultado alcançado pelo modelo preditivo XGBoost, SHAP apontou como mais importante as variáveis: NR_DIA_INTERNADO (quantidade de dias de internação), CD_DOENCA_PRINCIPAL_E (CID-10 Classificação internacional de doenças), DS_PROC_PRINCIPAL_E (Procedimento principal durante internação) e QT_DIAS_SONDA_VESICAL (Dias que o paciente ficou com sonda vesical). O estudo mostrou-se viável à adoção de aprendizado de máquina nas rotinas da pesquisa em saúde, no trabalho da comissão de infecção hospitalar e nas iniciativas de inovação nas instituições de saúde no Brasil. |