Análise de classificação multirrótulo em desfechos da doença falciforme.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Machado, Tiago Fernandes lattes
Orientador(a): Barreto, Marcos Ennes lattes
Banca de defesa: Gomes, Gecynalda Soares da Silva lattes, Barreto, Marcos Ennes lattes, Barbosa, Cynara Gomes lattes, Pita, Robespierre Dantas da Rocha lattes, Adorno, Elisângela Vitória lattes, Ramos, Ricardo Argenton
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação (PGCOMP) 
Departamento: Instituto de Computação - IC
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufba.br/handle/ri/41297
Resumo: A doença falciforme é uma condição genética que afeta a hemoglobina, resultando em complicações sistêmicas que influenciam a qualidade e sobrevida dos pacientes. A cromatografia líquida de alta performance (HPLC) é apontada como a melhor técnica de escolha para pesquisa de hemoglobinas variantes, já a eletroforese de hemoglobinas constitui a técnica padrão ouro para diagnóstico da doença, sendo de difícil acesso em localidades remotas do Brasil e em vários países em desenvolvimento, tais como do continente africano. A heterogeneidade clínica e a estratificação da gravidade da doença têm sido desafiadoras na prática médica, de modo que a predição de desfechos envolve análises de uma série de marcadores clínicos e laboratoriais. Vários estudos discutiram a aplicação de modelos de inteligência artificial no diagnóstico da doença falciforme e seu monitoramento, tendo os autores se concentrado na classificação tradicional, onde um único desfecho é analisado. Essa condição limita alguns problemas complexos de saúde, onde existe mais de um desfecho por paciente. A proposta deste estudo foi utilizar de algoritmos multirrótulo para observar as relações entre os desfechos da doença falciforme e avaliar a hipótese de que o uso de modelos de inteligência artificial pode permitir uma melhor estratificação de pacientes com a doença, considerando os múltiplos desfechos clínicos. Foi utilizada uma base de dados com 609 pacientes e 63 variáveis. A base foi obtida de estudos experimentais de coorte transversal gerados pelo Laboratório de Pesquisa em Anemias da Faculdade de Farmácia (UFBA) e do Laboratório de Investigação em Genética e Hematologia Translacional (LIGHT - FIOCRUZ-BA). Foram utilizados os algoritmos multirrótulo Binary Relevance (BR), Classifier Chains (CC), Label Powerset (LP) e Random k-labelsets (RAKEL), para predição dos desfechos de vaso-oclusão, crises de dor, hospitalização e infecções. Esses algoritmos são utilizados em problemas de transformação multirrótulo, que transformam o problema multirrótulo em uma série de problemas de classificação binária independentes, multiclasse e ensemble. Os resultados apontaram que quando a ordem dos desfechos é relevante, o modelo RAkELo com Random Forest se destaca, apresentando um Label Ranking Loss de 0,52. Por outro lado, quando a ordenação não é um fator clínico importante, os modelos baseados em SVM e Random Forest, em todas as abordagens (BR, CC, LP, RAkELo), mostraram uma combinação ideal de baixo Hamming Loss (0,20) e alto Micro-averaged f1-score (0,89).