Detalhes bibliográficos
Ano de defesa: |
2007 |
Autor(a) principal: |
Isabela Neves Drummond |
Orientador(a): |
Solon Venâncio de Carvalho,
Sandra Aparecida Sandri |
Banca de defesa: |
Corina da Costa Freitas,
Lamartine Nogueira Frutuoso Guimarães,
Carlos Henrique Costa Ribeiro,
Jacques Wainer |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Nacional de Pesquisas Espaciais (INPE)
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação do INPE em Computação Aplicada
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Resumo em Inglês: |
This work approaches strategies of data classification in multidimensional spaces, based on fuzzy logic and possibility theory. Classification methods that can yield possibilistic valuations as output for each element of the data set are presented, in addition to a collection of classification indexes that aid in finding the best imprecise classifier. A parameterized family of imprecise classifiers is defined from the possibilistic valuations provided by a given classification method and, based on classification indexes, accuracy measures for partial imprecision and complete imprecision are also defined for the classifier. These indexes favor the process of combination of classifiers, allowing a level of acceptable imprecision for a specific application, in agreement with the users needs. The classification model, named AGRUP, is proposed in this work as a supervised algorithm based on a clustering approach, that generates possibilistic valuations associated to all elements of the data set, by the application of similarity relations on the cluster prototypes. Finally, in the search for the precise classification, a neighborhood heuristic can be employed as a refinement process, where an imprecise classification, obtained in terms of pure and composed classes, is reduced to pure classes only. The classification process is made in the space of attributes, while the neighborhood heuristic is made in the space of the problem. The proposed approaches are tested in different applications: classification of magnetic resonance images of the brain, satellite images, besides the data set representing the origin of sags registered in eletricity distribution substations and another data set obtained from the GeoSchisto Project, related to the distribution of the Schistossomosis disease in the state of Minas Gerais, Brazil. The achieved results point to the viability of the proposed classification approaches, concerning the flexibility, applicability, accuracy, no matter whether synthetic or real, noisy or noiseless data are being classified. |
Link de acesso: |
http://urlib.net/sid.inpe.br/mtc-m17@80/2007/12.07.10.59
|
Resumo: |
Este trabalho aborda estratégias de classificação de dados em espaços multidimensionais, que tem por base a lógica difusa e a teoria de possibilidades. São apresentados métodos de classificação que retornam distribuições de possibilidade para cada elemento do conjunto de dados, além de uma coleção de índices de classificação que auxiliam na busca pelo melhor classificador impreciso. Uma família parametrizada de classificadores imprecisos é definida a partir da distribuição de possibilidade proveniente de um método de classificação, e com base nos índices de classificação definem-se os conceitos de precisão, imprecisão parcial e imprecisão completa para o classificador. Estes índices favorecem o processo de combinação de classificadores, permitindo que seja ponderado o nível de imprecisão aceitável para uma aplicação específica, de acordo com as necessidades do usuário. É proposto o modelo de classificação AGRUP, um algoritmo supervisionado, baseado em agrupamento, que gera distribuições de possibilidade associadas a todos os elementos do conjunto de dados, a partir da aplicação de relações de similaridade. Por fim, na busca pela classificação precisa, uma heurística pode ser empregada, como o refinamento pela vizinhança, onde uma classificação imprecisa obtida em termos de classes puras e compostas é reduzida a classes puras somente. A classificação propriamente dita é feita no espaço de atributos, enquanto que a vizinhança é feita no espaço do problema. As abordagens propostas são testadas em diferentes aplicações: classificação de imagens de ressonância magnética (RM) do cérebro, imagens de satélite, além do conjunto de dados que representam registro de queda na distribuição de energia em subestações elétricas e de dados do Projeto GeoSchisto, relacionados à distribuição da esquistossomose no estado de Minas Gerais. Os resultados obtidos apontam para a viabilidade das estratégias propostas, no que diz respeito à flexibilidade, aplicabilidade e acurácia, tanto em dados sintéticos, quanto em dados reais. |