Parallel implementation proposal of clustering algorithms in hardware

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Dias, Leonardo Alves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/31003
Resumo: Este trabalho apresenta um estudo sob algoritmos de clusterização de dados implementados em hardware dedicado para aplicações em geral, objetivando aumentar a velocidade de processamento. Algoritmos de clusterização têm sido amplamente adotados para encontrar a padrões entre dados, em diferentes áreas. No entanto, estes algoritmos normalmente implicam em uma alta complexidade de processamento e, além disso, a quantidade de dados armazenados atualmente é massiva. Sendo assim, a necessidade de processamento de dados com alto throughput tornou-se ainda mais importante, especialmente para aplicações em tempo real. Uma solução que foi adotada para aumentar a velocidade de processamento é o uso de técnicas paralelas implementadas em hardware dedicado, que provou ser mais eficiente em comparação com sistemas sequenciais. Logo, este trabalho propõe a implementação totalmente paralela dos algoritmos de clusterização de dados em hardware para otimizar o tempo de processamento dos sistemas em diversas áreas, possibilitando aplicações para sistemas com quantidade massiva de dados. Uma nova proposta de implementação dos algoritmos de clusterização K-means e SelfOrganising Map são apresentadas, juntamente a análises dos resultados relacionados ao throughput e o recurso de hardware para diferentes parâmetros, mostrando um aumento na velocidade de processamento de milhões de pontos de dados e neurônios atualizados por segundo. As implementações apresentadas aqui apontam para uma nova direção associada a implementação de algoritmos de clusterização e poderá ser utilizada em outros algoritmos.