Análise de Curvas ROC na presença de medidas repetidas irregulares
Main Author: | |
---|---|
Publication Date: | 2024 |
Format: | Bachelor thesis |
Language: | por |
Source: | Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
dARK ID: | ark:/87559/001300000046x |
Download full: | https://app.uff.br/riuff/handle/1/35542 |
Summary: | Um dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças. |
id |
UFF-2_189a533ec7f4b32f54bb48b88cbbf84a |
---|---|
oai_identifier_str |
oai:app.uff.br:1/35542 |
network_acronym_str |
UFF-2 |
network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository_id_str |
2120 |
spelling |
Análise de Curvas ROC na presença de medidas repetidas irregularesMedidas repetidasCurvas ROCCurvas ROCModelo estatísticoSaúde públicaUm dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças.54 f.Pinto Junior, Jony ArraisFonseca, Ana Beatriz MonteiroNey, Victor Hugo Soares2024-11-28T17:54:22Z2024-11-28T17:54:22Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfNEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023.https://app.uff.br/riuff/handle/1/35542ark:/87559/001300000046xCC-BY-SAinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2024-11-28T17:54:25Zoai:app.uff.br:1/35542Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202024-11-28T17:54:25Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
dc.title.none.fl_str_mv |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
title |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
spellingShingle |
Análise de Curvas ROC na presença de medidas repetidas irregulares Ney, Victor Hugo Soares Medidas repetidas Curvas ROC Curvas ROC Modelo estatístico Saúde pública |
title_short |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
title_full |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
title_fullStr |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
title_full_unstemmed |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
title_sort |
Análise de Curvas ROC na presença de medidas repetidas irregulares |
author |
Ney, Victor Hugo Soares |
author_facet |
Ney, Victor Hugo Soares |
author_role |
author |
dc.contributor.none.fl_str_mv |
Pinto Junior, Jony Arrais Fonseca, Ana Beatriz Monteiro |
dc.contributor.author.fl_str_mv |
Ney, Victor Hugo Soares |
dc.subject.por.fl_str_mv |
Medidas repetidas Curvas ROC Curvas ROC Modelo estatístico Saúde pública |
topic |
Medidas repetidas Curvas ROC Curvas ROC Modelo estatístico Saúde pública |
description |
Um dos principais pontos para o exercício da saúde pública é o diagnóstico de doenças de forma confiável, acessível e que possa ser disponibilizada à população. Nesse sentido, a análise de curvas ROC desempenha um papel crucial no desenvolvimento de testes de diagnóstico com alto desempenho. Um cenário muito comum na saúde é o acompanhamento de pacientes ao longo do tempo, em que diversas observações são coletadas sob os mesmos pacientes durante um certo período de tempo – caracterizando, assim, um estudo com a presença de medidas repetidas. Entretanto, é comum que alguns pacientes inicialmente envolvidos no estudo abandonem logo após a primeira coleta de dados e entre os que continuam, muitas vezes não conseguem comparecer em todas as datas pré-estabelecidas, constituindo, assim, uma base de dados irregular: indivíduos com diferentes quantidades de observações e diferentes tempos entre as observações. Em estudos de medidas repetidas, cada paciente observado constitui o que se chama de cluster. Devido às irregularidades anteriormente citadas, é comum a ocorrência de clusters com apenas uma observação, o qual é denominado singleton – e estes são identificados como a principal fonte de problemas nas análises. De forma a realizar a análise de curvas ROC no cenário descrito, supondo que se tenha o interesse de investigar diversos fatores mais facilmente coletados que possam estar associados com o diagnóstico – podendo constituir uma alternativa de diagnóstico ao método de referência, padrão-ouro –, é proposto na literatura um modelo misto de efeitos aleatórios, em que é incluído um intercepto para cada paciente na modelagem. Essa abordagem, no cenário descrito, pode ser um problema por diversos motivos. O principal deles é o fato de incluir um intercepto aleatório por paciente, o que causa overfitting do modelo quando há grande presença de singletons. O trabalho busca realizar um estudo de simulação em diversos cenários, avaliando como a presença de singletons afetam a análise de curvas ROC. Além disso, é proposto uma composição da verossimilhança de forma a minimizar o problema observado. Nos cenários simulados, realizar a análise de curvas ROC, com a metodologia proposta de modelos mistos com efeitos aleatórios, resultou em áreas abaixo da curva (AUC) viesadas e pontos de cortes sem interpretação. A modificação proposta trouxe uma melhor interpretação das curvas ROC e dos possíveis fatores associados com os diagnósticos das doenças. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-11-28T17:54:22Z 2024-11-28T17:54:22Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
format |
bachelorThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
NEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023. https://app.uff.br/riuff/handle/1/35542 |
dc.identifier.dark.fl_str_mv |
ark:/87559/001300000046x |
identifier_str_mv |
NEY, Victor Hugo Soares. Análise de Curvas ROC na presença de medidas repetidas irregulares. 2023. 54 f; Trabalho de Conclusão de Curso (Graduação em Estatística) - Instituto de Matemática e Estatística, Universidade Federal Fluminense, Niterói, 2023. ark:/87559/001300000046x |
url |
https://app.uff.br/riuff/handle/1/35542 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
CC-BY-SA |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
instname_str |
Universidade Federal Fluminense (UFF) |
instacron_str |
UFF |
institution |
UFF |
reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
repository.mail.fl_str_mv |
riuff@id.uff.br |
_version_ |
1838993076584972288 |