Métodos de regressão robusta e kernel para dados intervalares

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: FAGUNDES, Roberta Andrade de Araújo
Outros Autores: CYSNEIROS, Francisco José de Azevêdo
Orientador(a): SOUZA, Renata Maria Cardoso Rodrigues de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/12296
Resumo: O processo de descoberta de conhecimento tem o objetivo de extrair de informa¸c˜oes ´uteis (conhecimento) em bases de dados. As abordagens usadas na execu¸c˜ao do processo de extra¸c˜ao do conhecimento s˜ao gen´ericas e derivadas das diferentes ´areas de conhecimento, tais como da estat´ıstica, aprendizagem de m´aquina e banco de dados. A An´alise de Dados Simb´olicos (ADS) [Bock e Diday, (2000)] ´e introduzida como abordagem na ´area de descoberta autom´atica de conhecimento que visa desenvolver m´etodos para dados descritos por vari´aveis atrav´es de conjuntos de categorias, lista de valores, intervalos ou distribui¸c˜ao de probabilidade. Dentre as t´ecnicas estat´ısticas, os modelos de regress˜ao procuram prever o comportamento da vari´avel resposta (dependente) a partir de informa¸c˜oes provenientes do conjunto de vari´aveis preditoras (independentes). O objetivo deste trabalho ´e propor duas metodologias para an´alise de dados intervalares. A primeira metodologia aborda o m´etodo robusto em regress˜ao, que ´e uma alternativa para o uso do m´etodo dos m´ınimos quadrados quando os dados contˆem outliers. Enquanto a segunda aborda regress˜ao por kernel, que ´e um m´etodo que prover uma rela¸c˜ao n˜ao param´etrica entre as vari´aveis, sem utilizar um modelo com paramˆetros fixos, mas as taxas de convergˆencias dos estimadores n˜ao param´etricos s˜ao mais lentas do que a dos estimadores param´etricos. Experimentos com conjuntos de dados simulados e aplica¸c˜oes com conjuntos de dados reais intervalares indicam a funcionalidade e eficiˆencia dos m´etodos propostos.