Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Marcílio Junior, Wilson Estécio |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
eng |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://hdl.handle.net/11449/242318
|
Resumo: |
Análise Exploratória de Dados (EDA) é uma ferramenta valiosa para descobrir novos insights a partir de dados de alta dimensão. Os procedimentos de EDA ajudam cientistas e profissionais a entender a relação entre instâncias de dados e estruturas usando metáforas visuais que enfatizam informações sobre o objetivo da análise. Amplamente empregadas para análise exploratória, técnicas de Redução de Dimensionalidade mapeiam o relacionamento presente em espaços de alta dimensão para espaços de dimensão menor, normalmente no R2, e permitem descobertas científicas que vão do entendimento do comportamento de redes neurais à anotação de tipos celulares. Esta tese apresenta um conjunto de abordagens para extender o poder de análise utilizando técnicas de Redução de Dimensionalidade, com o objetivo principal de ajudar no entendimento dos embeddings gerados por técnicas não-lineares, além do estabelecimento de abordagens de exploração hierárquica para análise de acordo com a demanda de informações. Tais abordagens foram resultados das seguintes atividades de pesquisa principais: (i) seleção de representativos no espaço visual com preservação do contexto e estruturas mapeadas; (ii) técnicas para análise de clustering utilizando contrastividade, permitindo o entendimento das diferenças entre instâncias de dados para a formação de clusters; (iii) explicação de forma aditiva do layout gerado por técnicas não lineares; (iv) técnica de redução hierárquica de dimensionalidade para análise granular de conjuntos de dados, que permite a preservação das estruturas entre níveis hierárquicos. |