Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Barata Ribeiro, Marcelo Bianchi |
Orientador(a): |
Sá, Asla Medeiros |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Palavras-chave em Inglês: |
|
Link de acesso: |
https://hdl.handle.net/10438/29548
|
Resumo: |
Nos últimos anos, diversos avanços foram promovidos no campo de modelagem de tópicos, seja por meio do desenvolvimento de novos algoritmos, seja em processos de avaliação, assim como pelo surgimento de novas ferramentas de visualização. Esta última frente avança devido à percepção de que modelos de tópicos fornecem nova capacidade exploratória de grandes coleções de documentos, o que, aliado a soluções de visualização, pode trazer nova percepção analítica ao especialista de domínio. Este trabalho buscou introduzir uma solução interativa e de alta amplitude analítica, tendo como objeto de estudo uma coleção de documentos disponibilizada pela FGV/CPDOC. A metodologia envolveu uso de resultados provenientes de modelagem de tópicos e transformações dos dados para o processo de visualização, o que demandou o uso de distintas ferramentas de programação disponíveis. Após investigação do estado da arte, a hipótese principal é que haveria baixa disponibilidade de ferramentas de visualização de tópicos que incorporassem uma visão global do corpus acompanhada por um aumento gradual do nível de detalhamento, passando pela análise de agrupamentos de objetos viabilizada pela modelagem de tópicos, até a exploração de cada objeto. A principal contribuição está na conceituação de uma nova ferramenta que atende a conceitos de granularidade, usuário-alvo e data-ink ratio por meio de uma linguagem de programação que forneça o máximo de flexibilidade. Por fim, conclui-se que haveria muito espaço de melhoria, seja por meio de aumento de interatividade, quanto por maior dedicação a etapas de pré-processamento no caso de coleções de documentos que tenham passado por processo de OCR. |