Visualização de dados como ferramenta de classificação em sistemas de bases de dados para Data Mining

Detalhes bibliográficos
Ano de defesa: 2002
Autor(a) principal: Botelho, Elisângela
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-02062015-090709/
Resumo: A automação das atividades em diversas áreas, tais como negócios, engenharia, medicina, ciência e governo, vêm aumentando a cada dia, e com isso, cresce o volume de dados armazenados nas bases de dados. É interessante usar esses dados além dos objetivos originais das operações de pura armazenagem e busca do empreendimento inicial. Em outras palavras, é desejável extrair informações úteis, não previstas inicialmente, agregando valor ao empreendimento. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para recuperação de dados em transações padrão em grandes quantidades de dados, analisar grandes volumes de dados em formato numérico ou textual, especialmente em espaços de altas dimensões, não é fácil para o ser humano. Por outro lado, o ser humano tem uma capacidade de absorver e entender informação representada de forma gráfica muito rapidamente. Dessa forma, este trabalho visa o desenvolvimento de uma nova técnica para construção visual de classificadores de dados em atividades de Data Mining, utilizando essa reconhecidamente elevada capacidade humana de análise de dados representados em formato gráfico como fator que auxilia o treinamento do classificador. Este trabalho estende a ferramenta FastMapDB, que em sua versão original permitia apenas a visualização de dados e não possibilitava ao usuário interferir no processo de visualização, para permitir, não apenas essa visualização de dados, mas também, a seleção visual dos objetos mapeados e a delimitação de regiões de objetos na visualização. Com isso, a ferramenta passa a permitir a recuperação dos dados presentes na base de dados que o usuário considerar interessantes a partir da visualização, e provê à ferramenta recursos de classificação de novos objetos segundo regras visuais que o usuário possa definir no espaço mapeado de visualização. A proposta deste trabalho é inédita no sentido de aplicar técnicas de visualização como fator de treinamento do classificador. As ferramentas atuais apenas mostram resultados já elaborados pelo sistema, e a continuação do processo é sempre solicitada, ou decidida manualmente, pelo usuário. Nosso sistema, ao contrário, realimenta a interpretação que o usuário pode fazer a respeito dos dados, e permite que os passos de análise seguintes utilizem automaticamente esse resultado.