Investigação de regressão no processo de mineração de dados

Detalhes bibliográficos
Ano de defesa: 2003
Autor(a) principal: Dosualdo, Daniel Gomes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-12112014-101732/
Resumo: Mineração de dados refere-se ao processo responsável por identificar padrões em grandes conjuntos de dados com o objetivo de extrair um novo conhecimento. Depois de extraídos os padrões, a etapa de pós-processamento tem como objetivo avaliar alguns aspectos desses padrões, como precisão, compreensibilidade e interessabilidade. Um dos problemas da mineração de dados preditiva conhecido como regressão tenta predizer o valor de um atributo-meta contínuo baseado em um conjunto de atributos de entrada. No entanto, a regressão em mineração de dados preditivo é uma questão pouco explorada nas áreas de aprendizado de máquina e mineração de dados, uma vez que a maioria das pesquisas são voltadas para os problemas de classificação. Por outro lado, o DISCOVER é um projeto que está sendo desenvolvido no Laboratório de Inteligência Computacional. Ele tem como objetivo fornecer um ambiente integrado para apoiar as etapas do processo de descoberta de conhecimento, oferecendo funcionalidades voltadas para aprendizado de máquina e mineração de dados e textos. O DISCOVER tem motivado a realização de muitos trabalhos em diversas áreas, sendo este mais um projeto a ele integrado. Para auxiliar na preparação dos dados para a construção de um modelo de regressão simbólico e na posterior avaliação desse modelo foi proposto e implementado neste trabalho o ambiente computacional DISCOVER POSTPROCESSING ENVIRONMENT OF REGRESSION - DiPER. Esse ambiente é composto por uma biblioteca de classes, implementada de acordo com as especificações do DISCOVER, que oferece uma série de métodos para serem utilizados na etapa de pós-processamento do processo de mineração de dados.