Otimização de busca por SNPs baseada em máscaras por meio de unidade de processamento gráfico (GPU)

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Cruz, Álvaro Magri Nogueira da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
GPU
Link de acesso: http://hdl.handle.net/11449/193812
Resumo: Dentre os problemas que a bioinformática procura soluções factíveis está a busca por Polimorfismo de Nucleotídeo Simples (SNP, sigla em inglês). A detecção desse fenômeno em sequências de nucleotídeos é fundamental para possíveis inferências acerca de doenças e respostas a tratamentos, além de predições a susceptibilidade. A busca mostra-se eficiente quando trata-se de arquivos .ab1 que são provenientes de sequenciamento tipo Sanger. No entanto, no que se refere aos sequenciadores de nova geração (NGS, sigla em inglês) essa estratégia apresenta deficiências em relação ao tempo de processamento, visto que os arquivos gerados por este chegam a milhões de sequências. Algumas abordagens podem ser utilizadas a fim de amenizar esta deficiência por meio de hardwares paralelos. O paradigma multithread pode ser utilizado com o intuito de melhorar o desempenho do algoritmo, no entanto não se faz rápido o suficiente quando trata-se de um grande número de sequências. A Unidade de Processamento Gráfico (GPU, sigla em inglês) é uma alternativa, dado que esta opera com múltiplas unidades lógicas aritméticas, até milhares de unidades, bem diferente de um processador que opera com não mais do que uma dezena de unidades. A GPU torna-se mais viável, dado seu custo-benefício e características que são adequadas à resolução do problema em questão. Logo, o objetivo deste trabalho foi desenvolver um método para a busca de SNPs em arquivos NGS, com base em programação paralela com o uso de GPU. Dessa forma, foi possível observar o quão inviável torna-se a aplicação de CPU para processamento altamente paralelizável e com grande volume de dados genéticos. Em suma, foi possível obter um speedup de 5.176,86, ou seja, uma execução de 1,91 dias ora obtida por CPU, nesta proposta com GPU foi performada em 48,47 segundos.