Detalhes bibliográficos
Ano de defesa: |
1998 |
Autor(a) principal: |
Felix, Luis Carlos Molina |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15032018-150606/
|
Resumo: |
Nesta última década, houve um grande crescimento na capacidade de gerar e coletar dados, devido principalmente a três fatores: primeiro, ao constante aumento do poder de processamento dos computadores; segundo, ao armazenamento continuo de grande quantidade de dados a um baixo custo; e por último, à introdução de novas e melhores tecnologias relacionadas ao processamento e transmissão de dados. Embora os gerenciadores de bases de dados forneçam ferramentas básicas para otimizar o armazenamento e busca em grande quantidade de dados, o fato de como ajudar os humanos a entender e analisar estas grandes estruturas de dados é um problema de dificil solução. Nesse contexto, o Processo de Extração de Conhecimento de Bases de Dados (Knowledge Discovery in Databases KDD) emerge como uma nova tecnologia orientada à compreensão e busca de conhecimento embutido dentro destas grandes massas de dados, fazendo uso, principalmente, de várias técnicas apoiadas na estatística, bases de dados, ferramentas de visualização e Aprendizado de Máquina. De um modo geral, o processo KDD é composto de várias etapas, partindo da definição do domínio, um pré-processamento dos dados, uma etapa de Data Mining (Mineração de Dados) e, finalmente, uma análise e interpretação do conhecimento obtido. Este trabalho visa compreender e delimitar as diferentes etapas dentro do processo KDD, analisando o papel da etapa de Data Mining dentro deste processo. Dois estudos de casos (uma base de dados petroleira e uma base de dados do Programa de Melhoramento Genético da Raça Nelore) foram realizados para este fim. Este trabalho aborda importantes aspectos, principalmente quanto à relevância da discretizaç\'âo de dados contínuos na obtenção de melhores regras de classificação, além de mostrar o processo KDD em uma base de dados real, destacando a problemática encontrada e a importância da presença do especialista do domínio para o êxito deste processo. |