Métodos de estimação do desvio-padrão para a padronização de variáveis na análise de componentes principais

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Gomes, Juliana Vieira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.locus.ufv.br/handle/123456789/19219
Resumo: Este trabalho propôs avaliar a eficiência de diferentes matrizes de covariâncias sobre as estimativas dos componentes principais (CP), de acordo com diferentes métodos de estimação do desvio-padrão utilizado na padronização da variável. Além disso, procurou também, determinar a importância relativa de cada variável aleatória avaliada, normal ou não, que fez parte da composição do CP. A estimação do desvio-padrão foi feita de acordo com quatro métodos: desvio-padrão total, Lenth, Juan e Pena e Dong. Para isso, foram simulados 60 conjuntos de dados compostos por quatro variáveis aleatórias com 10.000 observações cada, com três diferentes graus de correlação, dois tipos de médias, dois tipos de variâncias e cinco percentuais de outliers. Os outliers foram adicionados com o intuito de quebrar a aleatoriedade das variáveis. De acordo com os resultados, o fator mais importante em afetar a qualidade da estimativa do desvio-padrão foi a proporção de outliers. Nesse sentido, o melhor método de estimação foi o de Lenth para até 2% de outliers. A matriz que forneceu os melhores resultados para a análise dos CPs, foi a que utilizou a estimativa do desvio-padrão obtida pelo método do desvio-padrão total, na ausência de outliers, com variâncias iguais e diferentes. Já para o conjunto de dados com outliers e variâncias iguais e diferentes, a matriz baseada no método de Lenth forneceu resultados mias satisfatórios para a análise de CPs.