Detalhes bibliográficos
Ano de defesa: |
2021 |
Autor(a) principal: |
SOUZA, Saul de Azevêdo |
Orientador(a): |
NASCIMENTO, Abraão David Costa do |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Estatistica
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/40973
|
Resumo: |
Esta tese objetiva primeiramente estudar concentração em dados esféricos através de um novo paradigma, a saber, reduzir o problema na esfera real para o intervalo [0, 1]. Os dados esféricos endereçados são em duas frentes: fenômenos direcionais e axiais. Para alcançar o objetivo em questão, duas distribuições são propostas a partir de transformações baseadas em distâncias sobre as distribuições von Mises-Fisher (caso direcional) e Watson (caso axial) reais. As distribuições são denotadas como primeira transformação baseada em distância (TD₁()) e segunda transformação baseada em distância (TD₂()) para os casos direcional e axial, respectivamente, em que é um parâmetro que herda a relação com a concentração dos dados das distribuições esféricas. Algumas propriedades matemáticas para as distribuições TD₁ e TD₂ são discutidas: função geradora de momentos, momentos, curtose, assimetria e matriz de informação de Fisher. Além disso, discussões sobre inferência (pontual e teste de hipóteses) para os parâmetros dos novos modelos são realizadas. Uma vez propostas e estudadas as distribuições, elas são utilizadas como elementos centrais no desenvolvimento de estatísticas de testes para dados direcionais e axiais. Distribuições exatas para estas estatísticas são derivadas. Estudos numéricos, para as distribuições TD₁ e TD₂, apontam que as estimativas de máxima verossimilhança para apresentam bons desempenhos mesmo em pequenas amostras. Para o modelo ₁, verificam-se que: (i) os testes de hipóteses clássicos (escore, Wald e razão de verossimilhanças) são, em geral, conservadores quanto ao nível pré-especificado em altas concentrações; (ii) o teste escore foi o mais conservador; (iii) o teste Wald foi o mais liberal para pequenos valores de . Para o modelo ₂, observam-se que: (i) o teste da razão de verossimilhanças tende a ser mais liberal para > 1; (ii) os testes Wald e escore são mais conservadores para > 0. Duas aplicações são feitas para ilustrar as propostas em dados esféricos. Resultados mostram que o uso dos paradigmas propostos conseguem detectar de modo simples (isto é, transferindo o problema de uma esfera real para o intervalo [0, 1]) e eficiente alta concentração em amostras esféricas. É sabido que a média é uma medida de locação influenciada por valores destoantes do conjunto tanto no contexto uni quanto multivariado em espaços Euclidianos. Esse problema também se verifica para variedades estocásticas, como o espaço das pré-formas ou a hiperesfera complexa. A segunda parte desta tese se dedica a proposta de uma alternativa robusta a média extrínseca de Fréchet, que tem fórmula analítica intratável. Fórmulas matemáticas para computar a mediana extrínseca projetada e procedimentos para detecção de outliers, baseados nessa medida, são apresentados. Estudos numéricos por simulação de Monte Carlo são realizados para quantificar a robustez da nova mediana em termos da distribuição Bingham complexa para o caso de formas planares. Os resultados mostraram que a mediana proposta é mais robusta que a forma média, principalmente para pequenos tamanhos de amostras. Uma aplicação aos dados de microfósseis ilustra o uso da mediana que propomos. |