Detalhes bibliográficos
Ano de defesa: |
2024 |
Autor(a) principal: |
Cruz, Leonardo Santos da |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://repositorio.unb.br/handle/10482/51814
|
Resumo: |
A simetria é crucial na modelagem de dados, pois muitas técnicas estatísticas, como testes de hipóteses e intervalos de confiança, assumem a normalidade ou simetria dos dados. Distribuições simétricas simplificam a análise e a interpretação. Em contextos multivariados, a simetria é avaliada através de momentos de ordem superior, matrizes de covariância e funções de densidade de probabilidade, por exemplo. No contexto multivariado, onde a simetria está presente, algumas distribuições podem ser utilizadas para modelar os dados, como, por exemplo, distribuições esféricas e distribuições elípticas, ambas multivariadas. Porém, quando os dados apresentam algum grau de assimetria, que pode ser observado através de uma representação gráfica, por exemplo, funções classificadas de acordo com essas denominações podem não modelar de forma otimizada o conjunto de dados em estudo. Portanto, alguns erros podem ocorrer na análise decorrente do ajuste dessas distribuições. Em geral, a assimetria está frequentemente presente em contextos multivariados, mas modelar dados multivariados que apresentam assimetria não é uma tarefa trivial. Para lidar com essas características, métodos específicos foram desenvolvidos. Alguns destes métodos baseiam-se em abordagens originalmente criadas para dados simétricos, generalizando assim modelos propostos anteriormente. Esses modelos são conhecidos por incorporarem certo grau de assimetria em modelos simétricos, o que facilita a descrição e ajuste de dados que possuem essa característica. O primeiro capítulo do presente trabalho apresentará ferramentas básicas e consecutivamente mais sofisticadas relacionadas à modelagem de dados multivariados, com e sem simetria. Serão definidas distribuições mais complexas, como a distribuição elíptica, e serão apresentados exemplos e resultados importantes relacionados a essas distribuições. Por fim, são discutidas distribuições que generalizam distribuições elípticas, incorporando a propriedade de modelar dados assimétricos. Estas distribuições assimétricas serão definidas e alguns exemplos serão apresentados. No capítulo seguinte, uma nova família de distribuições assimétricas é apresentada. Inicialmente é apresentado o modelo do qual deriva esta família de distribuições. Este modelo consiste em uma relação condicional entre variáveis aleatórias, onde são incorporados parâmetros de locação, escala, assimetria e um parâmetro adicional que pode ser utilizado para refinar o ajuste do modelo ao conjunto de dados. Nessa fase do trabalho são discutidos aspectos importantes, como a definição da função densidade de probabilidade que pode ser derivada do modelo apresentado. Também são discutidas as possíveis configurações dessas funções, destacando como elas podem, dependendo dos intervalos, assumir a forma de uma função de densidade de probabilidade já conhecida, destacando o caráter generalista do modelo. Serão exploradas outras propriedades, incluindo os critérios de escolha das funções a utilizar no modelo, alguns casos especiais da função densidade de probabilidade, a sua representação gráfica, a não identificabilidade do modelo, em determinadas condições; os quantis marginais, entre outras características relevantes. Além disso, são apresentadas justificativas matemáticas para alguns fatos discutidos ao longo do texto. Por fim, é apresentada a função de máxima verossimilhança, com a caracterização explícita desta função e suas respectivas derivadas parciais, destacando a impossibilidade de descrever explicitamente os estimadores dos parâmetros em termos de expressões analíticas. Como consequência direta, as estimativas dos parâmetros precisarão ser obtidas utilizando métodos computacionais, que serão discutidos e detalhados no capítulo seguinte. Na parte final do presente trabalho, são empregados estudos de simulação, bem como a aplicação de duas famílias de distribuições apresentadas no capítulo 3 em dados reais. O estudo de simulação foi realizado com versões da função de densidade de probabilidade representando a distribuição dos dados do modelo. A estimativa de máxima verossimilhança foi utilizada em conjunto com o algoritmo de Monte Carlo. As análises utilizadas para avaliar as estimativas dos parâmetros foram o viés relativo e o erro quadrático médio. Para melhor ilustrar os resultados, são apresentados gráficos que mostram o comportamento dessas duas métricas para cada um dos parâmetros. Além disso, diversas funções foram empregadas para realizar o estudo de simulação. Uma pequena seleção representativa dessas funções é apresentada no corpo principal do texto, enquanto as demais podem ser encontradas no apêndice deste trabalho. A aplicação aos dados reais foi realizada com um conjunto de dados reais do software R. A estatística descritiva dos dados foi apresentada e comentada. Duas funções de densidade derivadas do modelo foram então ajustadas e o ajuste é avaliado usando algumas métricas, que são brevemente apresentadas e discutidas. Após a discussão dos dados, indica-se qual distribuição melhor se ajusta ao conjunto de dados com base nos critérios considerados e nas funções G escolhidas para o modelo. Por fim, são apresentadas conclusões quanto à aplicação dos dados e à estimação dos parâmetros dentro de uma perspectiva geral do trabalho desenvolvido. |