Ferramenta baseada em cuckoo filter para remoção de redundância em dados de sequenciadores de segunda geração (NGS - next generation sequencing)

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: GAIA, Antonio Sérgio Cruz lattes
Orientador(a): VERAS, Adonney Allan de Oliveira lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Pará
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação Aplicada
Departamento: Núcleo de Desenvolvimento Amazônico em Engenharia - NDAE/Tucuruí
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufpa.br:8080/jspui/handle/2011/12798
Resumo: As plataformas de sequenciamento de segunda geração também conhecidas como NGS – Next Generation Sequencing produzem grande volume de dados, o que demanda alta complexidade e custo computacional no processamento destes dados. Essas plataformas geram leituras duplicadas que surgem na preparação da biblioteca genômica e são introduzidas na etapa de amplificação por PCR (Polymerase Chain Reaction). Essa redundância de leituras pode aumentar os requisitos computacionais e tempo de processamento de análises subsequentes (por exemplo, a montagem de novo). Para reduzir o custo computacional dessas análises é necessário realizar a remoção dessas leituras do conjunto de dados do organismo sequenciado. Neste trabalho apresentamos o NGSReadsTreatment uma ferramenta computacional para a remoção de leituras duplicadas em conjuntos de dados pareados ou fragmentos. A entrada de dados para o NGSReadsTreatment consiste em leituras oriundas de qualquer plataforma de sequenciamento com o mesmo ou diferentes comprimentos. A sua engine utiliza a estrutura probabilística Cuckoo Filter para identificar e remover as leituras redundantes, a identificação é feita comparando as leituras entre si, assim, nenhum pré-requisito é necessário além do conjunto de leituras. A validação da ferramenta foi realizada utilizando-se conjuntos de dados reais e simulados. Para aferir a eficiência da ferramenta, a mesma foi comparada com outras ferramentas de remoção de redundância. Os resultados indicam a eficiência do NGSReadsTreatment, pois obteve-se melhor resultado, tanto na quantidade de redundâncias removidas quanto no uso de memória em todos os testes realizados. Desenvolvido em JAVA, o NGSReadsTreatment é compatível com os sistemas operacionais UNIX/Linux e Windows e dispoẽ de uma versão com interface gráfica para facilitar seu uso.