Modelos Skellam Generalizados

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Gandolfi, Marina
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082024-170823/
Resumo: Na estatística aplicada, frequentemente dados de contagem são observados em diferentes áreas de estudo. Devido a grande diversidade dos problemas que resultam nestes tipos dados, torna-se necessário a proposta de novos modelos. Neste trabalho, propomos generalizações da distribuição Skellam, cujo suporte consiste do conjunto formado pelos números inteiros (positivos e negativos), visando explorar também no contexto de modelos de regressão. Para o processo de estimação e inferência dos parâmetros dos modelos foram consideradas as abordagens clássica (método de máxima verossimilhança) e bayesiana (Monte Carlo em Cadeia de Markov) para fins de comparação. Especificamente sobre a abordagem bayesiana, que foi mais eficiente nas propostas aqui apresentadas, utilizamos uma variante do algoritmo Hamiltoniano Monte Carlo, que consiste na reformulação das equações de Hamilton ao introduzir uma componente estocástica na equação do gradiente, derivando o algoritmo Gradiente Estocástico Hamiltoniano Monte Carlo. Para ilustrações dos modelos propostos, apresentamos as análises de conjuntos de dados referentes a dois problemas reais (total de 3 conjuntos de dados): no primeiro problema foi considerado um conjunto de dados correspondente às observações da variação semanal da pontuação do Ibovespa, isto é, a diferença de preço, medida em ticks (centavos) do dia atual com relação ao dia anterior, no período entre janeiro de 2000 e dezembro de 2022. Os valores estimados para o parâmetro p, caracterizaram o conjunto de dados como inflacionado de observações -2 (ticks); no segundo problema, foram considerados dois conjuntos de dados, correspondentes aos valores das diferenças entre partidas ganhas e partidas perdidas pelos times na temporada regular de 2022-2023 da National Basketball Association, em cada conferência (Leste e Oeste). Os critérios de seleção indicaram para o modelo k-MS com k = -12 como o mais bem ajustado para a conferência Leste, enquanto para a conferência Oeste, o valor indicado foi k = - 38. Diante dos bons resultados, tanto os modelos k-MS quanto os k-IS demonstraram ser boas alternativas para explicar o comportamento de dados com valores inteiros.