GENNET : uma abordagem automatizada na análise, reconstrução e gerenciamento de redes de interações gênicas utilizando dados longitudinais de transcriptomas de hospedeiros

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Costa, Raquel Lopes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Serviço de Análise e Apoio a Formação de Recursos Humanos
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/200
Resumo: O recente desenvolvimento de ensaios moleculares para estudo do transcriptoma, associados a métodos estatísticos, matemáticos e computacionais, trouxeram grandes avanços no entendimento de sistemas biológicos, dentre os quais, a compreensão de processos infecciosos virais associados à resposta imune e escolha de alvos para o desenvolvimento de vacinas e terapias antivirais. De um lado, o processo de modelagem envolve diferentes etapas, desde a aquisição dos dados de transcriptoma, integração de informações disponíveis em bancos de dados biológicos até visualizações e análises das redes obtidas. Por outro lado, durante o processo de modelagem, são utilizados diversos sistemas de software com diferentes pressupostos de organização e forma de dados de entrada, fazendo com que todo esse processo seja, além de trabalhoso e fragmentado, passível de erros. Nesse sentido, infraestruturas de apoio a e-science como workflows científicos e banco de dados são utilizados na automação, estruturação, execução, organização e gerenciamento de experimentos científicos in silico. Nessa tese, utilizamos diferentes dados de séries temporais de expressão gênica (microarranjo de DNA) em primatas infectados pelo SIV (do inglês, Simian Imunodeficiency Virus). O SIV infecta várias espécies de primatas africanos, conhecidos como hospedeiros naturais, que não desenvolvem doença. Entretanto, quando linhagens de SIV infectam primatas não africanos, conhecidos como hospedeiros não naturais, dentre os quais o macaco asiático rhesus (Macaca mulatta), esses desenvolvem uma imunodeficiência semelhante a que ocorre em humanos pelo HIV. A proximidade evolutiva entre os vírus, SIV e HIV, e entre os hospedeiros, humanos e primatas não humanos, possibilitam estudos em modelos biológicos não humanos relevantes na compreensão dos diferentes mecanismos da imunidade inata e adaptativa nos hospedeiros. Os dados utilizados corresponderam a pontos amostrais em três diferentes fases da infecção pelo SIV: antes da infecção, fase aguda e fase crônica. O processo de análise desses dados baseou-se em abordagens de biologia de sistemas. Tais análises incluíram etapas de normalização dos dados, filtragem, anotação, agrupamento, enriquecimento, integração com base de dados biológicas e visualização dos resultados em redes de interações gênicas. Dentre os principais resultados biológicos obtidos, selecionamos: a identificação dos genes co-expressos nos perfis de expressão gênica, caracterização funcional a partir das ontologias relacionadas aos processos biológicos, interações entre os genes hopedeiro-hospedeiro e vírus-hospedeiro e diferenças nos tempos das respostas imunes na fase aguda da infecção entre os tipos de hospedeiros. Inserimos o processo analítico descrito acima em uma framework chamada GenNet consistindo de um workflow científico GenNet.W responsável pela automação do experimento científico in silico e um banco de dados GenNet.DB. O banco de dados adotou um modelo de dados em grafos, NoSQL, para armazenar as redes de interações gênicas inferidas, bem como outras informações geradas pelo workflow científico. O modelo de dados em grafo suporta nativamente a representação das redes de interações gênicas e permite a comparação entre diferentes redes inferidas e a exploração de vias de como co-expressão gênica, usando consultas que expressam em alto nível de linguagem que o sistema suporta.