FastClass: classificação automática "Fuzzy"

Detalhes bibliográficos
Ano de defesa: 2005
Autor(a) principal: Almeida, Antonio Manoel Ribeiro de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Ceará
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=36968
Resumo: Diversas denominações foram atribuídas ao que chamamos Classificação Automática (CA) de dados. Estatísticos geralmente usam o termo análise de agrupamentos (do inglês "cluster analysis"). A classificação automática de dados está ligada ao ramo de reconhecimento de padrões, usando métodos supervisionados ou não, objetivando inicialmente, descobrir a estrutura de um determinado conjunto de dados não rotulados, X = {x1, x2, ... xn}, onde cada objeto xi, i=1, ..., n, é descrito por p variáveis (atributos ou características). As técnicas de CA podem ser aplicadas virtualmente a diversas áreas do conhecimento humano, tais como medicina, psicologia, arqueologia, inteligência artificial, economia, sociologia, biologia, ciências atmosféricas e oceanografia, com o objetivo de prover uma descrição ou síntese dos dados, ou ainda, como suporte à previsão e decisão. Na análise de agrupamentos procede-se à reunião de itens (objetos, elementos,...) com características semelhantes, sem qualquer conhecimento prévio de quais serão os grupos formados. Neste caso, busca-se construir modelos que encontrem itens com dados similares entre si, a partir de alguma métrica de "distância" ou "similaridade" entre esses itens, que serão assim colocados juntos em novos agrupamentos ("clusters") ou em agrupamentos já existentes. Para tanto, podem ser utilizados métodos geométricos, estatísticos ou mesmo redes neurais. O principal objetivo do trabalho é a elaboração de ferramenta destinada a executar técnicas de classificação automática não hierárquica difusa ("fuzzy") sobre dados de diversas origens, e apresentar os resultados obtidos na forma de gráficos, conjuntos e metadados. Podem fazer uso desta ferramenta, profissionais das mais variadas áreas: pesquisadores , estatísticos, médicos, profissional de "marketing", onde exista a necessidade de classificar um conjunto de elementos descritos por um conjunto de variáveis. Este trabalho poderá ser usado, desde a aprendizagem e compreensão das técnicas de classificação de dados, mais especificamente com o emprego da técnica difusa ("fuzzy"), até chegar à utilização da ferramenta em aplicações específicas. Complementando o trabalho, desenvolvemos as técnicas de Análise de Componentes Principais (ACP) aplicando-a ao resultado da classificação de forma a facilitar a visualização da solução. Outra abordagem utilizada foi aplicar a técnica de ACP antes da classificação para reduzir a complexidade do problema original. No trabalho utilizamos casos práticos da utilização conjunta destas técnicas. Palavras-chaves: análise de agrupamento, classificação automática, "e-learning", "data mining", clusterning, fuzzy, ACP.