LASZLO @ GALAXY - Um protótipo de serviço de montagem de genomas a partir de dados de sequenciamento de próxima geração (NGS)

Detalhes bibliográficos
Ano de defesa: 2012
Autor(a) principal: Ribeiro, Antonio Cláudio Bello
Orientador(a): Pitaluga, André Nóbrega
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto Oswaldo Cruz
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/6943
Resumo: As tecnologias NGS (Next-Generation Sequencing), desenvolvidas para reduzir o custo e o tempo do processo de sequenciamento, geram uma grande massa de dados, a um custo relativamente baixo e com grande acurácia. No entanto, as leituras curtas, por elas produzidas, dificultam sobremaneira o processo de montagem de genomas, originando novos problemas computacionais. Para tentar suplantar esses desafios, várias ferramentas de software estão disponíveis e continuam a ser desenvolvidas. Cada um desses pacotes possui vantagens e desvantagens e, na maioria das vezes, se apresenta como uma solução individual, não estando integrado a outros. Além disso, tipicamente é exigido um conhecimento mais avançado de informática para a sua correta instalação, configuração e operação; o que, nem sempre, é a realidade do usuário final. Neste contexto, o projeto nomeado LASZLO (Linkage of Assembly Scripts Zero-costed and with License Opened) @ GALAXY propõe combinar diferentes ferramentas de tratamento de dados de NGS de uso livre, na forma de um protótipo básico de serviço de montagem de genomas, buscando facilitar o trabalho do usuário através da disponibilização de uma interface Web, sugestões de parametrização e de fluxos de trabalho para esse tipo de análise. Tomando por base o framework Galaxy, foram agregados fluxos de trabalho para montagens de dados de sequenciamento reais de diferentes organismos e provenientes das tecnologias Illumina, SOLiD™ e 454. O caráter aplicado do projeto originou soluções pontuais para atender a necessidades específicas, as quais foram reunidas sob o módulo NGS: LASZLO's Sandbox, uma "caixa de ferramentas" especialmente designada às abordagens de montagem do tipo de novo e com auxílio de genoma de referência. Durante a pesquisa, o protótipo LASZLO @ GALAXY processou, por exemplo, dados de sequenciamento de Leishmania amazonensis, contribuindo para um primeiro processo de avaliação do genoma do referido organismo. Atualmente, observa-se que a produção de dados não é o mais o "gargalo" em projetos de sequenciamento, mas sim o fluxo de análise subsequente sobre o material obtido. Muitas vezes, tais dados não se traduzem imediatamente em expansão do conhecimento biológico, devido às dificuldades encontradas pelo biólogo experimental em lidar, não somente com a miríade de ferramentas disponíveis, mas também com fatores como a inerente necessidade de integração entre elas e a implementação de infra-estrutura adequada para a sua operação. Os resultados obtidos no projeto indicam que o sistema proposto, vislumbrado como um eventual serviço institucional ou mesmo de menor âmbito, pode se tornar um aliado do usuário final quanto à manipulação dos dados de NGS.