Detalhes bibliográficos
Ano de defesa: |
2007 |
Autor(a) principal: |
César Donato Silva, Fábio |
Orientador(a): |
de Assis Tenório Carvalho, Francisco |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/2707
|
Resumo: |
A Análise de Dados Simbólicos (Symbolic Data Analysis) é um domínio na área de descoberta automática de conhecimento que visa desenvolver métodos para dados descritos por variáveis que podem assumir como valor conjuntos ou listas de categorias, intervalos ou distribuições de probabilidade. Essas variáveis permitem levar em conta a variabilidade e/ou a incerteza presente nos dados. Este trabalho apresenta um classificador simbólico de semântica modal para dados simbólicos de tipo intervalo. O classificador proposto apresenta duas etapas básicas, a aprendizagem e a alocação, onde ambas necessitam de uma etapa precedente de préprocessamento que transforma os dados simbólicos do tipo intervalo em dados simbólicos modal. Cada exemplo do conjunto de aprendizagem é descrito por um vetor de intervalos. Após o pré-processamento, cada exemplo passa a ser descrito por um vetor de distribuições de pesos. Após a etapa de aprendizagem, cada classe é também descrita por um vetor de distribuições de pesos que sintetiza as informações dos exemplos da classe. Cada novo exemplo a ser atribuído a uma classe (etapa de alocação), representado por um vetor de intervalos, após a fase de pré-processamento passa a ser descrito por um vetor de distribuições de pesos. A alocação de um exemplo a uma classe é realizada através de funções de dissimilaridade que comparam pares de vetores de distribuições de pesos. Algumas funções de dissimilaridade desse tipo são consideradas nesse trabalho. A avaliação do desempenho desse classificador é realizada através da aplicação do mesmo a conjuntos de dados sintéticos em uma experiência Monte Carlo e a conjuntos de dados reais usando a técnica de validação cruzada leave-one-out. O desempenho é medido pela taxa (média) de erro de classificação e pelo tempo de execução das etapas de aprendizagem e classificação. Além disso, o desempenho desse classificador foi comparado com o desempenho de um classificador de tipo k-vizinhos mais próximos também de semântica modal. Através desses exemplos, esse trabalho mostra alguns dos interesses desse classificador de semântica modal |