Análise de Curvas ROC na presença de medidas repetidas irregulares

Bibliographic Details
Main Author: Ney, Victor Hugo Soares
Publication Date: 2024
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da Universidade Federal Fluminense (RIUFF)
dARK ID: ark:/87559/001300000046x
Download full: https://app.uff.br/riuff/handle/1/35542
Summary: Um dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças.
id UFF-2_189a533ec7f4b32f54bb48b88cbbf84a
oai_identifier_str oai:app.uff.br:1/35542
network_acronym_str UFF-2
network_name_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str 2120
spelling Análise de Curvas ROC na presença de medidas repetidas irregularesMedidas repetidasCurvas ROCCurvas ROCModelo estatísticoSaúde públicaUm dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças.54 f.Pinto Junior, Jony ArraisFonseca, Ana Beatriz MonteiroNey, Victor Hugo Soares2024-11-28T17:54:22Z2024-11-28T17:54:22Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfNEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023.https://app.uff.br/riuff/handle/1/35542ark:/87559/001300000046xCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2024-11-28T17:54:25Zoai:app.uff.br:1/35542Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-11-28T17:54:25Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv Análise de Curvas ROC na presença de medidas repetidas irregulares
title Análise de Curvas ROC na presença de medidas repetidas irregulares
spellingShingle Análise de Curvas ROC na presença de medidas repetidas irregulares
Ney, Victor Hugo Soares
Medidas repetidas
Curvas ROC
Curvas ROC
Modelo estatístico
Saúde pública
title_short Análise de Curvas ROC na presença de medidas repetidas irregulares
title_full Análise de Curvas ROC na presença de medidas repetidas irregulares
title_fullStr Análise de Curvas ROC na presença de medidas repetidas irregulares
title_full_unstemmed Análise de Curvas ROC na presença de medidas repetidas irregulares
title_sort Análise de Curvas ROC na presença de medidas repetidas irregulares
author Ney, Victor Hugo Soares
author_facet Ney, Victor Hugo Soares
author_role author
dc.contributor.none.fl_str_mv Pinto Junior, Jony Arrais
Fonseca, Ana Beatriz Monteiro
dc.contributor.author.fl_str_mv Ney, Victor Hugo Soares
dc.subject.por.fl_str_mv Medidas repetidas
Curvas ROC
Curvas ROC
Modelo estatístico
Saúde pública
topic Medidas repetidas
Curvas ROC
Curvas ROC
Modelo estatístico
Saúde pública
description Um dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-28T17:54:22Z
2024-11-28T17:54:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv NEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023.
https://app.uff.br/riuff/handle/1/35542
dc.identifier.dark.fl_str_mv ark:/87559/001300000046x
identifier_str_mv NEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023.
ark:/87559/001300000046x
url https://app.uff.br/riuff/handle/1/35542
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv CC-BY-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC-BY-SA
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)
instname:Universidade Federal Fluminense (UFF)
instacron:UFF
instname_str Universidade Federal Fluminense (UFF)
instacron_str UFF
institution UFF
reponame_str Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv riuff@id.uff.br
_version_ 1838993076584972288