Avaliação de propostas de coeficientes de determinação do tipo R² em modelos de regressão logística com resposta nominal

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Chiode, Angelo de Souza
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-07042021-004407/
Resumo: Ao contrário de modelos de regressão linear múltipla, em que o coeficiente de determinação R² representa uma forma intituiva de avaliar a proporção de variabilidade da resposta que é devidamente explicada por meio das variáveis independentes, não existe uma forma bem estabelecida de se mensurar a variabilidade explicada em modelos de regressão logística. Diversas proposições já foram realizadas em trabalhos anteriores, especialmente para casos em que existe uma escala contínua latente associada à variável resposta. Entretanto, não há consenso sobre a melhor alternativa para respostas de natureza nominal. Este trabalho teve como objetivo revisar 12 propostas de coeficientes de determinação do tipo R² que já foram discutidas em trabalhos anteriores, a fim de avaliar a sua adequabilidade para modelos de regressão logística com resposta nominal. Foi conduzido um estudo de simulação, que apontou que os dois coeficientes apresentados por McFadden (1974) - um para a regressão simples, e outro corrigido, para a regressão múltipla - são os mais apropriados entre todas as alternativas analisadas, levando em conta a sua interpretação intuitiva; variabilidade no intervalo razoável de valores de 0 a 1; e maior conformidade com o índice de sobreposição (Bura e Gastwirth, 2001) e com medidas de acurácia preditiva, tais como o KS (Hand, 2012) e a área abaixo da curva ROC - ou, equivalentemente, o índice de Gini.