Family of multivariate distributions for modeling data with positive support : properties and applications

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Andrade, João Victor Monteiros de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.unb.br/handle/10482/51813
Resumo: Este trabalho tem como objetivo o desenvolvimento de uma nova família de distribuições elípticas multivariadas truncadas, ampliando as ferramentas de modelagem estatística para dados multivariados que exibem características como caudas pesadas e assimetria. As distribuições de Cauchy, t-Student e Normal servem de base para a construção dessas novas distribuições, oferecendo diferentes formas de captura de comportamentos e estruturas de dependência entre variáveis. A metodologia de construção envolve o uso de funções monotônicas crescentes, inversíveis e diferenciáveis, definidas no domínio dos números reais positivos, assegurando que as densidades resultantes tenham suporte nos reais positivos. Essa abordagem inovadora permite a preservação de propriedades fundamentais das distribuições elípticas, como a forma das caudas, ao mesmo tempo que incorpora distorções que ajustam a função densidade às características específicas dos dados analisados. A classe de distribuições proposta oferece maior flexibilidade na modelagem de comportamentos complexos de dados multivariados, sendo particularmente relevante em cenários onde as distribuições tradicionais não capturam adequadamente a dinâmica dos dados. Ao mesmo tempo, mantém a estrutura básica das distribuições elípticas, adaptando-se de maneira robusta às particularidades observadas em fenômenos empíricos. A aplicabilidade desta nova classe de distribuições é avaliada por meio de simulações de Monte Carlo e da aplicação a dados reais provenientes do Australian Institute of Sport (AIS) e de dados sobre os 50 estados dos Estados Unidos, como expectativa de vida e taxa de homicídios. Esses estudos fornecem uma avaliação prática da flexibilidade e desempenho das distribuições propostas. Na seção de revisão de literatura e conceitos fundamentais, descrevem-se os conceitos básicos necessários para o desenvolvimento do trabalho. Esses conceitos são essenciais para compreender os tópicos subsequentes, que envolvem modelagem estatística de distribuições multivariadas. A discussão desses fundamentos visa proporcionar ao leitor uma base sólida para o entendimento das propriedades estatísticas e dos métodos empregados na análise e modelagem dos dados. A seção de desenvolvimento do modelo destaca a criação de um novo modelo de distribuição assimétrica multivariada, baseado em distribuições elípticas e assimétricas. Esse modelo representa uma contribuição inédita no campo da estatística, integrando conceitos previamente explorados na literatura, mas com uma nova abordagem para lidar com a assimetria em distribuições multivariadas. A proposta amplia as possibilidades de análise e modelagem em contextos estatísticos diversos, sendo particularmente útil em aplicações onde as distribuições convencionais falham em capturar adequadamente os padrões dos dados. No estudo de simulação, conduzimos uma avaliação detalhada do desempenho dos estimadores de máxima verossimilhança (MLEs) no caso bivariado, aplicando diferentes funções de distorção, como Gi(x) = 1/α p x/β − p β/x , Gi(x) = log(x), Gi(x) = cosh−1 (x + 1), Gi(x) = log(log(x + 1)), e Gi(x) = x − 1/x. Essas funções permitem ajustar a distribuição para diferentes comportamentos dos dados, sendo analisadas com profundidade. Resultados específicos para a função logq (x) estão detalhados no Apêndice. Por fim, a aplicabilidade dos modelos propostos é avaliada em dados reais, utilizandose uma série de métricas para verificar a qualidade dos ajustes das distribuições aos dados. Para isso, são aplicados testes estatísticos bem estabelecidos, como os testes de KolmogorovSmirnov, Anderson-Darling e Cramér-von Mises, com o objetivo de identificar as distribuições que oferecem o melhor ajuste aos dados analisados. Esses resultados demonstram a robustez e a flexibilidade das novas distribuições, contribuindo para o avanço das técnicas de modelagem estatística multivariada. Este trabalho, ao propor uma nova família de distribuições elípticas multivariadas assimétricas, oferece novas perspectivas para a análise estatística de dados complexos, permitindo modelagens mais robustas e adequadas à realidade dos dados. A abordagem inovadora traz avanços significativos na modelagem de dados multivariados, com potencial para aplicações em diversas áreas da ciência e da indústria.