Detalhes bibliográficos
Ano de defesa: |
2005 |
Autor(a) principal: |
Mauricio Gonçalves Júnior, Paulo |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/2765
|
Resumo: |
Nesta dissertação a linguagem DMPML é proposta como alternativa para a padronização da fase de preparação de dados em um processo de KDD. A DMPML é baseada em XML e utiliza transformações XSL para transformar dados. Devido às características da linguagem XML tais como extensibilidade, robustez e independência de plataforma, projetos de preparação de dados gerados com a utilização da DMPML podem ser compartilhados de forma eficiente através da Internet, promovendo o reuso de trabalho e a troca de experiência entre projetos semelhantes. Outros benefícios da aplicabilidade da DMPML são: (a) não necessidade de utilização de banco de dados relacionais para armazenar informações geradas pelas subfases de tratamento de dados; (b) não necessidade de implementação de código especial para transformar dados brutos em dados prontos para aplicação em um algoritmo específico de mineração de dados; (c) possibilidade de criação de regras específicas de transformação de dados para algoritmos específicos de mineração de dados sem necessariamente ser preciso redefinir o projeto de preparação de dados e (d) grande potencialidade de reutilização de projetos de preparação de dados entre massas de dados com atributos semelhantes |