Abordagens univariáveis e multivariáveis de índices autonômicos cardíacos em modelos preditivos de diabetes tipo 2 : análises com técnicas estatísticas e de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Bernardes, Alex Alves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/51979
Resumo: A Diabetes Mellitus tipo 2 é uma doença metabólica cuja manifestação ocorre com mais regularidade em indivíduos adultos, normalmente associada a fatores como alimentação não saudável e falta de atividade física. Segundo a Organização Mundial de Saúde, sua incidência está em crescimento contínuo em todo o mundo. A Diabetes Mellitus está altamente associada à Neuropatia Autonômica Diabética (NAD), condição caracterizada como inicialmente assintomática nos primeiros anos de diagnóstico de diabetes, mas que afeta significativamente a qualidade de vida e aumenta a mortalidade dos pacientes. Indicadores precoces de NA, mesmo em sujeitos assintomáticos, podem ser utilizados como preditores para o desenvolvimento ou a identificação de diabetes. O Sistema Nervoso Autônomo (SNA), parte do sistema nervoso periférico, regula as ações involuntárias do corpo, como a função cardiovascular. Este controle influencia a frequência cardíaca, causando flutuações de intervalos entre os batimentos, conhecidas como Variabilidade da Frequência Cardíaca (VFC). A VFC também é influenciada pelo ciclo respiratório e pelas variações da pressão arterial. É possível avaliar quantitativamente a ação do SNA sobre a regulação cardíaca por índices quantitativos baseados em sinais fisiológicos, medindo o impacto da disfunção do SNA em indivíduos diabéticos, que podem ou não apresentar sintomas de NAD. Utilizando esta abordagem, o objetivo deste trabalho é determinar índices quantitativos do SNA, utilizando técnicas univariáveis e multivariáveis que consigam diferenciar indivíduos portadores de diabetes tipo 2 (IPDM) e indivíduos de controle (IC). Adicionalmente, deseja-se verificar combinações de índices que consigam realizar a predição de indivíduos diabéticos. Estes índices da função autonômica cardíaca são determinados a partir do processamento e análise de sinais fisiológicos como o eletrocardiograma (ECG), o sinal de pressão arterial contínuo e o sinal respiratório. Inicialmente, o estudo investiga o uso de modelos preditivos utilizando índices de função autonômica determinados a partir de um único sinal fisiológico, como ECG ou pressão arterial contínua. Em seguida, são desenvolvidos modelos preditivos usando índices multivariados, que requerem dados obtidos de pares de sinais fisiológicos, utilizando tanto técnicas espectrais quanto de identificação de sistemas no domínio do tempo como parâmetros para a predição. Os dados para este estudo foram obtidos da base de dados pública “Cerebromicrovascular Disease in Elderly with Diabetes” (CDED). A base é composta por dados de ECG, pressão arterial contínua e fluxo respiratório de indivíduos com idades entre 55 e 75 anos, com e sem diabetes tipo 2. Os dados foram filtrados e préprocessados utilizando a toolbox CRSIDLab no MATLAB para extrair índices da função autonômica cardíaca. Esses índices foram selecionados da literatura e categorizados em três abordagens: 1) índices estatísticos no domínio do tempo, 2) índices espectrais no domínio da frequência e 3) índices de identificação de sistemas nos domínios do tempo e da frequência. As análises univariadas no domínio do tempo fornecem características estatísticas sobre um sinal, como média, desvio padrão ou contagem de eventos de interesse. No domínio espectral, a estimativa da densidade espectral de potência (DEP) dos intervalos R-R (obtidos do ECG) e a série temporal dos valores sistólicos e/ou diastólicos da pressão arterial (respectivamente o pico máximo e o nadir em cada intervalo de batimento cardíaco) fornecem índices quantitativos úteis de função autonômica, baseados na densidade de potência em diferentes regiões de frequência da DEP, e têm sido utilizados em muitos estudos para se avaliar a função autonômica cardíaca em condições de saúde e doença. No entanto, por ser baseada em um único sinal, outras variáveis que podem estar relacionadas às oscilações medidas pela DEP em diferentes regiões de frequência não podem ser consideradas. Para entender mais especificamente como a influência de diferentes sinais fisiológicos, como pressão arterial e respiração, pode causar mudanças em outro sinal, como a VFC, tornase necessária uma abordagem alternativa que descreva explicitamente esse comportamento de causa e efeito temporal. Para superar as limitações inerentes às análises univariadas, são também utilizados modelos de identificação de sistemas no domínio do tempo para caracterizar matematicamente o acoplamento dinâmico entre pares de variáveis cardiovasculares, usando um modelo de resposta ao impulso (RI) causal (no qual a saída presente depende de valores presentes e passados, mas não futuros, da entrada), a partir do qual podem ser obtidos índices adicionais da função autonômica. Todos os índices de função autonômica extraídos foram então analisados usando correlações de Pearson e Spearman, e o método estatístico One-way Anova. As análises de correlação foram aplicadas para verificar a similaridade entre os índices e o grau de influência de um índice sobre outro, enquanto a técnica One-way Anova foi usada para identificar quais índices são capazes de medir uma diferença estatisticamente significativa entre os grupos diabéticos e de controle. Subsequentemente, os índices foram usados como parâmetros em algoritmos de classificação. Os índices foram primeiro usados individualmente e depois em agrupamentos. Diferentes modelos preditivos estatísticos e de aprendizado de máquina foram usados para quantificar seu desempenho na predição de IPDM versus IC. Quatro algoritmos de aprendizado de máquina foram usados neste estudo: 1) Support Vector Machines (SVM), 2) K-Nearest Neighbor (KNN), 3) Árvore de Decisão (DT), e 4) Regressão Logística (RL). Os diferentes modelos preditivos usaram índices que foram agrupados com base em sua origem de sinal e na metodologia de extração utilizada, conforme apresentado no Apêndice B.1. Os agrupamentos de índices resultaram em oito conjuntos: A) VFC - índices estatísticos no domínio do tempo e índices espectrais no domínio da frequência relacionados exclusivamente à VFC; B) VPA - índices espectrais no domínio da frequência da Variabilidade da Pressão Arterial (VPA); C) FRF - combinação de índices de função resposta em frequência obtidos da análise espectral da VFC, VPA e identificação de sistemas por resposta ao impulso (IR); D) IR - índices de identificação de sistemas por resposta ao impulso nos domínios do tempo e da frequência; E) VFC + VPA - a combinação dos índices nos conjuntos A e B; F) VFC + IR - a combinação dos índices nos conjuntos A e D; G) Especial 1 - índices cuja hipótese nula indicou uma possível distinção entre indivíduos diabéticos e de controle com significância estatística; H) Especial 2 - índices que obtiveram alto desempenho na predição de indivíduos diabéticos e de controle, presentes em todos os algoritmos de aprendizado de máquina utilizados. A classificação do conjunto de teste com base em índices individuais mostrou excelentes resultados ao usar índices calculados a partir de modelos multivariados, como os índices de ganho dinâmico associados ao acoplamento cardiorrespiratório (ACR) ou à entrada respiratória do sistema de acoplamento com influência mútua do ACR e do acoplamento barorreflexo (ABR). Seguindo os índices de respiração, os melhores índices para a predição de grupos foram os índices estatísticos da VFC combinados com a VPA, assim como também um modelo preditivo multivariado. Os resultados com agrupamentos de índices também mostraram que o uso de índices relacionados à VFC como parâmetros do modelo pode melhorar a acurácia, sensibilidade e precisão de outros conjuntos de marcadores na classificação e predição de indivíduos diabéticos e de controle. No entanto, o agrupamento de índices relacionados exclusivamente à VFC mostrou um desempenho inferior a modelos de predição multivariados. Os grupos especiais 1 e 2 se sobressaíram como melhores agrupamentos de índices para predição dos grupos de indivíduos estudados, ambos contendo índices estatísticos no domínio do tempo e índices de ganho dinâmico associados ao par VFC e respiração. A variação de desempenho entre os grupos especiais ocorreu de acordo com os algoritmos de aprendizado de máquina utilizados, onde os grupos se alternaram entre os melhores resultados. A exceção ocorreu para o grupo G com desempenho abaixo da média geral quando treinado com o algoritmo de Árvore de Decisão, que foi liderado pelo agrupamento E. Em todos os outros algoritmos os agrupamentos G e H lideraram o desempenho na predição. Ao final, os agrupamentos dos índices especiais mostraram uma pequena melhora na predição dos grupos de indivíduos quando comparados à predição com índices individuais utilizando índices de ganho dinâmico associados à respiração. Tal evento indica uma influência robusta da respiração sobre a VFC do ponto de vista da frequência. Este resultado mostra também a importância da exploração de características dos índices a fim de evitar possíveis conflitos de informação quando utilizados como atributos para o aprendizado de máquina, como é visto nos grupos especiais.