Resumo: |
A inferência de homologia entre organismos é uma atividade da genômica comparativa que possibilita compreender melhor a relação entre os mesmos e, por conseguinte, sua distância evolutiva. Especificamente, a identificação de genes ortólogos, ou seja, aqueles que têm sua origem em um ancestral comum, permite oferecer melhorias na anotação funcional de genes, uma vez que genes ortólogos tendem a ter sua função conservada. Com a crescente disponibilidade de genomas através de técnicas de NGS, a construção e atualização de bases de dados de ortólogos representam um desafio constante, pois demandam o estudo e identificação das relações entre os genes de tais organismos, em um volume de dados cada vez mais extenso e a um custo computacional cada vez mais elevado. Nesta tese propomos a solução para nuvem computacional elastic-OrthoSearch, um workflow científico de genômica comparativa inspirado no OrthoSearch, responsável pela inferência de homologia entre organismos com o uso de abordagem baseada em melhores hits recíprocos e perfis de Markov. Também propomos uma metodologia para criação de bases de ortólogos construída através do reuso do OrthoSearch. Esta metodologia mostrou-se capaz de alavancar a oferta de grupos ortólogos e assim auxiliar, por exemplo, na identificação de alvos de protozoários |
---|