Detalhes bibliográficos
Ano de defesa: |
2003 |
Autor(a) principal: |
Maria Cardoso Rodrigues de Souza, Renata |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/1904
|
Resumo: |
A análise de dados simbólicos (Symbolic Data Analysis) é uma nova abordagem na área de descoberta automática de conhecimentos que visa desenvolver métodos para dados descritos por varáveis onde existem conjuntos de categorias, intervalos ou distribuições de probabilidade nas células das tabelas de dados. O objetivo deste trabalho é introduzir métodos de cluster para intervalos usando algoritmos de nuvens dinâmicas. Estes algoritmos consistem em obter, simultaneamente, uma partição em classes e identificar um conjunto de representantes das classes minimizando um critério que mede a adequação entre as classes e os protótipos. Os algoritmos de nuvens dinâmicas com distâncias adaptativas também encontram uma partição e um conjunto de representantes minimizando uma função critério, mas em cada interação existe uma distância diferente para comparar cada classe com o seu protótipo. A vantagem das distâncias adaptativas é que o algoritmo de agrupamento é capaz de reconhecer classes de formas e tamanhos diferentes. Neste trabalho, foi desenvolvido um método de nuvens dinâmicas usando a distância L1 para intervalos. Além deste método, foram também introduzidos três métodos com, respectivamente, as distâncias L1 (City-Block), L2 (Euclidiana) e L¥ (Máximo) adaptativas para intervalos. Para validar os métodos, foram realizados experimentos com um conjunto de espécies de peixes e dois conjuntos de dados artificiais de intervalos com diferentes graus de dificuldade de classificação. Os resultados fornecidos pelos métodos têm sido avaliados por um índice externo na estrutura de uma experiência Monte Carlo e testes estatísticos evidenciam que o desempenho dos métodos adaptativos é superior ao dos métodos não adaptativos |