Abordagens interativas para exploração de coleções de documentos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Andreotti, André Luis Dias
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/191677
Resumo: Os dados textuais têm desempenhado um papel cada vez mais importante em várias tarefas analíticas em pesquisas acadêmicas, inteligência de negócios, monitoramento de mídias sociais, jornalismo e outras áreas. A fim de explorar e dar sentido a esses dados, várias técnicas de visualização de textos surgiram nos últimos anos. Técnicas de visualizações, neste contexto, visam permitir que usuários possam explorar as relações entre documentos, descobrir documentos de interesse ou analisar padrões contidos nos documentos. Nessa forma de análise, um documento é comumente modelado por seu conteúdo subjacente e pelo conjunto de palavras que o compõe. Geralmente, técnicas de projeção multidimensional são empregadas para projetar esses documentos no espaço 2D, porém o usuário precisa ler cada documento para entender a geração dos agrupamentos e também existem problemas quanto a sobreposição de marcadores quando o número de documentos cresce. Neste trabalho são apresentadas duas propostas de elaboração de abordagens para exploração de coleções de documentos, em que o objetivo é reduzir o esforço cognitivo necessário para explorar o conjunto de documentos comparado com representações comuns de projeções multidimensionais. A primeira é uma abordagem híbrida, que mostra o relacionamento e o conteúdo do documento em uma única visualização, utilizando “mapas de documentos” e tag clouds. A segunda é uma abordagem hierárquica, que utiliza tag clouds para preencher as texturas de agrupamentos formados por meio do domínio de Voronoi para codificar visualmente as fronteiras dos grupos de documentos. Mostramos a eficácia das abordagens propostas na exploração de coleções de documentos, fornecendo explorações em que o usuário recebe poucas informações durante o processo exploratório e detalha o conteúdo de acordo com a demanda, superando problemas de identificação de agrupamentos e sobreposição de marcadores.