Abordagens computacionais para calcular componentes principais ponderadas com aplicações em análise de imagens de faces humanas

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Miranda, Laura Costa Pereira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/383
Resumo: Apesar da eficiência da análise de componentes principais (Principal Components Analysis - P CA) como um método não-supervisionado, para redução de dimensionalidade, seu algoritmo não incorpora informações prévias extraídas do domínio específico correspon- dente aos dados. Uma forma de tratar essa limitação do P CA é utilizando pesos espaciais computados através dos próprios dados, gerando mapas de ponderação, os quais tam- bém denominamos mapas computacionais. Neste contexto, o principal objetivo deste trabalho é investigar a eficiência de técnicas de ponderação dos dados para o cálculo de componentes principais em experimentos de gênero e expressão facial, considerando problemas de classificação e reconstrução. Especificamente, a metodologia consiste em gerar pesos espaciais para ponderar os pixels das imagens de entrada do P CA, transla- dadas em relação à média global dos dados. Em seguida, os dados assim ponderados são utilizados como entrada para o algoritmo tradicional do P CA. O método assim obtido é denominado P CA ponderado, aproveitando a nomenclatura da literatura onde essa técnica é denominada Weighted P CA. Tal abordagem baseada em dados foi empregada na literatura via cálculo de classificadores lineares e técnicas de análise discriminante. Nesta dissertação propomos outras alternativas e comparamos os resultados obtidos nos proble- mas de interesse. Estaremos considerando as seguintes técnicas para o cálculo dos pesos espaciais: (a) Entropia de Shannon calculada pixel-a-pixel (H); (b) Inverso da Entropia de Shannon (̂H); (c) Divergência Jensen-Shannon (JS); (d) Teste t de Student (T ); (e) Hiperplanos computados usando Smooth Support Vector Machine (W ). A técnica (e) é conhecida na literatura para o método em foco, sendo escolhida como uma referência para comparação com as demais. Os mapas obtidos pelo método (d) são utilizados em análise de faces, porém, em metodologias distintas da metodologia abordada nesta dissertação. A aplicação do Teste t de Student, entropia de Shannon e seu inverso, e divergência de Jensen-Shannon para cálculo de pesos espaciais para cômputo do P CA ponderado em reconhecimento de faces consiste na principal contribuição deste trabalho. A avaliação da eficiência das diferentes componentes principais obtidas com cada técnica é feita através da visualização de componentes principais, análise dos resultados da reconstrução de imagens e classificação. Para esta última, foram utilizados os seguintes classificadores: Distância de Mahalanobis (DM ) e K-Vizinhos Mais Próximos (KN N ), com K = 1. Os pesos computados podem formar um mapa de ponderação ruidoso, o que pode acarretar artefatos na reconstrução e interferir na classificação. Com o objetivo de reduzir tais efeitos os mapas computacionais foram processados utilizando uma metodologia baseada em quadtree, gerando novos mapas Hqt,̂ Hqt, JSqt, Tqt e Wqt, para reduzir pequenas variações locais. A utilização de quadtree no processamento de mapas espaciais para computar o P CA ponderado é outra contribuição deste trabalho. Os experimentos computacionais foram realizados usando a base de imagens de faces da FEI, que consiste de 400 imagens, sendo 200 de homens e 200 de mulheres, em cada caso, com expressões faciais sorrindo e neutra, e a base de imagens FERET, consistindo em 400 imagens, com 214 imagens de homens e 186 imagens de mulheres, em cada caso, com expressões faciais sorrindo e neutra. Os resultados mostraram a eficiência das versões ponderadas do P CA especialmente quando aplicamos o classificador KN N . Neste caso, os métodos T ,̂ H, Hqt ê Hqt foram os melhores. No caso da reconstrução, existe predominância de resultados superiores para o P CA em relação aos demais, seguido dos métodos JS e W . Os experimentos foram refeitos com os mapas obtidos após processamento via quadtree, mostrando melhora dos resultado da classificação para os métodoŝ H e H e mostrando melhora dos resultados da reconstrução para o método W .