Um critério de seleção para modelos beta baseado no trade-off predição e variabilidade

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: SILVA, Fernanda Clotilde da
Orientador(a): OSPINA, Patrícia Leone Espinheira
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Estatistica
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/44594
Resumo: Muitas vezes surge a necessidade de estudar dados cujos valores pertencem ao intervalo (0,1), nessas situações podemos optar pelo uso do modelo de regressão beta, proposto por Ferrari e Cribari-Neto (2004), que se baseia em supor que a variável resposta segue uma distribuição beta, sob uma nova parametrização. Alguns métodos de análise de diagnóstico foram desenvol- vidos para essa classe de modelos, buscando verificar a adequabilidade do ajuste, identificando possíveis afastamentos das suposições feitas. Entretanto, o uso desses métodos geralmente se- gue após a escolha de um conjunto de variáveis explicativas relevantes para o modelo, esse procedimento é conhecido como seleção de modelos, e algumas medidas usadas como critérios de seleção têm sido desenvolvidas. Dentre elas destacam-se os pseudos R2, que visam avaliar a proporção de variação da resposta explicada pelo modelo ajustado, essas medidas foram estu- dadas e implementadas por Bayer e Cribari-Neto (2017) para a classe de modelos beta. Além dessas quantidades, também dispomos do critério de seleção P2, que busca avaliar a habilidade do modelo em predizer valores consistentes da variável resposta, com base na estatística PRESS (Predictive Residual Sum of Squares), proposta por Allen (1971) para o modelo normal linear, e introduzida aos modelos beta por Espinheira et al. (2019). Uma vez que a definição des- ses critérios baseia-se no poder de explicação da variabilidade ou no poder de predição, esse trabalho tem como objetivo propor um processo de seleção para a classe de modelos beta con- siderando ambos os interesses, isto é, apresentar uma medida capaz de indicar modelos que consigam explicar bem a variabilidade da resposta, logo apresentam bons ajustes, e também consigam predizer bons valores. Esse processo consiste em determinar uma constante cha- mada “αˆ ”, obtido com base no método bootstrap paramétrico, usada para construir uma nova estatística chamada “BV” (Bias and Variability), que diz respeito ao balanceamento viés e va- riância. Além disso, αˆ muitas vezes consiste em um bom indicador do viés da estimativa para a precisão. Dessa forma, avaliamos o desempenho das nossas medidas por meio de estudos de simulações de Monte Carlo, e aplicamos alguns bancos de dados reais, comprovando na prática a eficácia dessas estatísticas. Notamos que a avaliação conjunta das estatística “BV” e “αˆ ” é o que determina o processo de seleção que estamos propondo.