Detalhes bibliográficos
Ano de defesa: |
2008 |
Autor(a) principal: |
Henrique Gonçalves Salvador |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Tecnológico de Aeronáutica
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=721
|
Resumo: |
Esta pesquisa aborda o desenvolvimento de um Método para a Verificação de Dados Climatológicos -- VEDALOGIC, que se utiliza de modelos criados com algoritmos de Mineração de Dados. Este método utiliza modelos de clustering para a determinação de grupos homogêneos em um Banco de Dados Climatológicos (BDC). A partir desses grupos pode-se detectar dados suspeitos. Após a detecção de um dado suspeito, este será predito, baseado em um modelo de árvore de decisão gerado a partir de uma série histórica de dados. Em seguida, compara-se o valor predito com o valor do dado suspeito e caso haja uma diferença superior a 4%, o dado suspeito é considerado como um ruído. Uma vez detectado um ruído, uma mensagem é gerada contendo: o campo com o dado ruidoso; o intervalo de valores esperados; e uma sugestão para o ajuste com um valor pontual. A partir de alguns experimentos realizados, constatou-se que os ajustes baseados nas informações fornecidas pelo VEDALOGIC, contribuirão para o aumento da qualidade e da confiabilidade dos dados contidos no BDC. Para a construção dos modelos utilizados no VEDALOGIC, utilizou-se os algoritmos EM e K-means para gerar os modelos de clustering e os algoritmos M5P e REPTree para gerar os modelos de árvore de decisão. Para a verificação do método proposto, inseriu-se ruídos no BDC. Após aplicar o VEDALOGIC o resultado mais significativo foi a detecção de todos os ruídos inseridos e que os valores sugeridos para correção atingiram uma média de precisão acima de 97%. |