Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Ribeiro, Vagner Soares
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://locus.ufv.br/handle/123456789/32506
Resumo: O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos.