Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados

DIAS, Lilian de Jesus Chaves

Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados

Detalhes bibliográficos
Ano de defesa:	2013
Autor(a) principal:	DIAS, Lilian de Jesus Chaves
Orientador(a):	SANTANA, Ádamo Lima de
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal do Pará
Programa de Pós-Graduação:	Programa de Pós-Graduação em Engenharia Elétrica
Departamento:	Instituto de Tecnologia
País:	Brasil
Palavras-chave em Português:	Enxame de partículas Valor ausente Imputação de dados PSO
Área do conhecimento CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAO
Link de acesso:	http://repositorio.ufpa.br/jspui/handle/2011/4617
Resumo:	Durante o processo de extração do conhecimento em bases de dados, alguns problemas podem ser encontrados como por exemplo, a ausência de determinada instância de um atributo. A ocorrência de tal problemática pode causar efeitos danosos nos resultados finais do processo, pois afeta diretamente a qualidade dos dados a ser submetido a um algoritmo de aprendizado de máquina. Na literatura, diversas propostas são apresentadas a fim de contornar tal dano, dentre eles está a de imputação de dados, a qual estima um valor plausível para substituir o ausente. Seguindo essa área de solução para o problema de valores ausentes, diversos trabalhos foram analisados e algumas observações foram realizadas como, a pouca utilização de bases sintéticas que simulem os principais mecanismos de ausência de dados e uma recente tendência a utilização de algoritmos bio-inspirados como tratamento do problema. Com base nesse cenário, esta dissertação apresenta um método de imputação de dados baseado em otimização por enxame de partículas, pouco explorado na área, e o aplica para o tratamento de bases sinteticamente geradas, as quais consideram os principais mecanismos de ausência de dados, MAR, MCAR e NMAR. Os resultados obtidos ao comprar diferentes configurações do método à outros dois conhecidos na área (KNNImpute e SVMImpute) são promissores para sua utilização na área de tratamento de valores ausentes uma vez que alcançou os melhores valores na maioria dos experimentos realizados.

Imputação de dados baseado em otimização por enxame de partículas considerando os principais mecanismos de ausência de dados

Registros relacionados