Avaliação do lasso e métodos alternativos em modelos de regressão logística

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Alcântara Junior, Gilberto Pereira de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05042021-105416/
Resumo: A regressão logística sempre foi uma importante ferramenta não só na área de estatística, mas também em diversas outras áreas como econômica, biológica e médica. Em muitas dessas áreas é comum se deparar com problemas de alta dimensionalidade, no qual o número de cováriaveis a serem testadas é maior do que o tamanho amostral. Métodos clássicos de estimação apresentam certos problemas em alta dimensionalidade. Uma das formas de solucionar esse problema é a estimação por métodos de penalização, como o lasso proposto por Tibshirani (1996). Apesar dos muitos trabalhos feitos da aplicação do lasso no modelo de regressão logística, nenhum apresenta um estudo completo de simulação do desempenho de predição do método utilizando alguma medida tradicional de avaliação de performance. Também não há na literatura trabalhos que comparam o desempenho de outras possíveis combinações feitas a partir do lasso, como por exemplo, o lasso para selecionar covariáveis e a estimação via máxima verossimilhança, ou a seleção via stepwise e a estimação via lasso. Neste trabalho é apresentado um extenso estudo de simulação sob diversos cenários criados com o objetivo de estudar e comparar o desempenho do lasso e outras 3 técnicas combinadas no modelo de regressão logística. Também foram estudados e analisados vários exemplos de aplicações em que o modelo logístico pode ser usado. Através dos resultados obtidos tanto pelas simulações quanto pelas aplicações, em relação ao poder preditivo, foi possível constatar que o lasso se sobressaía ou tinha desempenho similar aos outros métodos em todos os cenários apresentados. Em relação à comparação do modelo ajustado com o verdadeiro, nenhum dentre os métodos considerados se destaca em todos os cenários e em relação a todos os aspectos analisados.