Detalhes bibliográficos
Ano de defesa: |
2021 |
Autor(a) principal: |
Oliveira, Andressa Stéfany Silva de |
Orientador(a): |
Oliveira, Luiz Affonso Henderson Guedes de |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
|
Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufrn.br/handle/123456789/32366
|
Resumo: |
Situações que geram fluxo contínuo de dados sujeitos a mudança de comportamento ao longo do tempo, como são os casos de tráfego TCP/IP, e-commerce e monitoramento industrial, podem tornar inviável a utilização de algoritmos que possuem estratégias de aprendizagem de máquina off-line. Isto se deve à necessidade de armazenamento dos dados em função do crescimento infindável da geração dos dados e às restrições como memória limitada, impossibilitando um retreinamento do modelo. Para tratar essa classe de problemas, surgiram os algoritmos que possuem a aprendizagem total ou parcialmente on-line. Dentre eles, há os algoritmos evolutivos, os quais têm sido alvo de interesse pelo fato de possuírem a capacidade de se desenvolverem e atualizarem em ambientes desconhecidos, como também a habilidade de detecção de mudanças e desvios dos dados de entrada ao longo do tempo. Diante da vasta gama de possíveis aplicações de algoritmos evolutivos em problemas reais, nesta dissertação propomos um novo algoritmo evolutivo para agrupamento dinâmico de dados denominado de Macro SOStream. Esse algoritmo possui aprendizagem on-line e é baseado em densidade para agrupamento autoorganizável de fluxo de dados. O Macro SOStream tem como origem o algoritmo SOStream, porém aqui foi incorporado o conceito de macroclusters, os quais são formados pelos microclusters. Enquanto os microclusters possuem formas esféricas, os macroclusters têm formas arbitrárias. Ainda, utilizaram-se conjuntos de dados bem estabelecidas na literatura, a métrica de desempenho de clusterização Adjusted Rand Index (ARI) nos experimentos realizados, e é efetuada a medição do tempo médio de execução dos algoritmos com os conjuntos de dados. Os resultados indicaram que o desempenho e tempo de execução médio do algoritmo Macro SOStream é comparável aos do SOStream e do DenStream. |