Detalhes bibliográficos
Ano de defesa: |
2009 |
Autor(a) principal: |
CUNHA, Rodrigo Carneiro Leão Vieira da |
Orientador(a): |
ADEODATO, Paulo Jorge Leitão |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/1435
|
Resumo: |
Data Mining surgiu da necessidade de extração do conhecimento a partir de volumosas massas de dados geradas pelas empresas/instituições. Com o crescimento da área e o aumento do poder de processamento dos computadores, as organizações que prestam serviços em KDD (Knowledge Discovery in Database) têm guardado, cada vez mais, um grande número de documentos e processos referentes a projetos executados no passado. Por outro lado, hoje, o desenvolvimento de projetos de Data Mining exige do especialista o uso de diversas ferramentas, linguagens de programação e metodologias associadas à sua experiência para resolução do problema. Um dos maiores problemas práticos de KDD é como prover a interoperabilidade entre diferentes plataformas existentes, de tal forma que os processos fiquem centralizados e documentados em um único ambiente. Outro grande problema, hoje, é a falta de reuso de conhecimento devido à complexidade e forte dependência do usuário. Neste contexto, as experiências adquiridas em projetos anteriores não são devidamente documentadas, gerenciadas e controladas, gerando como conseqüência a repetição de erros dos projetos anteriores. Em outras palavras, outro grande problema prático é a falta de plataformas capazes de fazer o reuso do conhecimento adquirido em projetos realizados no passado. O principal objetivo deste trabalho é criar um framework híbrido para desenvolvimento de soluções em Mineração de Dados que integra diversas ferramentas disponíveis no mercado e disponibiliza um ambiente integrado para reuso do conhecimento na área de KDD. Este ambiente possibilita a centralização e padronização dos artefatos gerados ao longo do processo de KDD, assim como aproveita os melhores recursos de cada ferramenta de mercado disponível. Para validação do framework foram coletados os metadados de 69 projetos reais de mineração de dados, 61 lições aprendidas dos profissionais que trabalharam nestes projetos e 654 entidades de conhecimento (congressos, softwares, publicações etc) da área de KDD. Os estudos apresentados, principalmente para definição do início do projeto, mostraram ser possível, através do framework, entender as características que levaram os projetos a serem um sucesso ou fracasso. Assim, o framework é um ambiente que assegura o desenvolvimento de projetos em KDD de alta qualidade que atende às expectativas do cliente dentro do tempo e orçamento previstos |