Algoritmo k-means em ambiente manycore para redução do tempo de resposta da mineração de dados

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Maukoski, William Xavier lattes
Orientador(a): Senger, Luciano José lattes
Banca de defesa: Ishii, Renato Porfirio lattes, Campos Junior, Arion de lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual de Ponta Grossa
Programa de Pós-Graduação: Programa de Pós Graduação Computação Aplicada
Departamento: Departamento de Informática
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.uepg.br/jspui/handle/prefix/2991
Resumo: A mineração de dados (MD) é potencialmente onerosa, estudos para diminuir o tempo de resposta são essenciais para conseguir entregar resultados em tempos menores. Muitas soluções propostas por trabalhos correlatos utilizam computação em clusters (aglomerados) de computadores, uma alternativa a isto é utilizar a computação com GPU. A programação com GPU, necessita um conhecimento aprofundado do algoritmo a ser trabalhado e de um entendimento da arquitetura da GPU que será utilizada. Este trabalho tem por objetivo geral investigar o uso da computação paralela em ambiente manycore para reduzir o tempo de resposta de algirtmos de MD. O algoritmo K-means por ser comumente adotados em tarefas de IA e sua característica NP-Difícil foi o escolhido para ser paralelizado. Foram utilizadas ferramentas para identificar o ponto de gargalo do K-means, simultaneamente foram feitas as avaliações dos pontos positivos e negativos destas ferramentas. Após identificar o ponto de gargalo do algoritmo, ele foi reescrito para ser executado com suporte da GPU, foram feitas as coletas dos tempos de respostas e pôr fim a medição do ganho de desempenho utilizando a GPU. Ao utilizar a GPU foi primeiro constatado um SpeedUP máximo de 7,09 e uma eficiência de 0,65% considerados pequenos ao comparar com outros trabalhos da literatura. Para contornar isto foi feito um aumento na base de dados utilizada aumentado o tempo de execução, assim obteve-se resultados melhores com um SpeedUp de 26,001 e uma eficiência de 2,4% ao utilizar o máximo de cores da GPU. Concluindo-se que é possível diminuir o tempo de resposta de algoritmos de mineração de dados utilizando GPU, sem precisar alterar o hardware do equipamento.