Detecção e visualização de subestruturas comuns na interface proteína-ligante no nível atômico através de mineração de subgrafos frequentes
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Viçosa
Ciência da Computação |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://locus.ufv.br/handle/123456789/32506 |
Resumo: | O volume de dados disponíveis sobre sequências e estruturas de proteínas vem cres- cendo rapidamente ao longo dos últimos anos. Por exemplo, o banco de dados de sequências Uniprot possui hoje mais de 500.000 sequências revisadas manualmente e outras 107 milhões automaticamente anotadas. A quantidade de estruturas dis- poníveis é menor, mas ainda assim bem extensa, onde temos no PDB (Protein Data Bank), principal repositório de estruturas proteicas, mais de 137 mil estru- turas depositadas. Neste contexto, a Bioinformática desempenha um importante papel, no sentido de armazenar, organizar e extrair informação da grande quan- tidade de dados provenientes de organismos vivos. Neste trabalho, são propostas duas abordagens visuais para dados em larga escala que auxiliem os pesquisadores a responder diferentes questões relacionadas à proteínas. No primeiro trabalho, VERMONT (ViewER MutatiON Tool) 2.0, é apresentada uma plataforma intera- tiva que utiliza dados de sequência e estruturas de proteínas, com o objetivo de fornecer informações sobre pontos de mutação potencialmente danosos à estrutura e função proteica. Uma mutação é uma alteração na sequência de DNA, podendo afetar um único par de bases ou múltiplos genes. Elas podem ser hereditárias, quando herdadas dos pais ou somáticas, quando ocorrem durante a vida. O VER- MONT tem o objetivo de permitir o estudo do efeito de pontos de mutação em proteínas, que ocorrem quando um único nucleotídeo é alterado na sequência de DNA, podendo modificar determinados resíduos na proteína . Para isto, é utili- zada uma abordagem mista, que envolve interações intramoleculares, cálculo de acessibilidade a solvente, métricas de redes complexas e cálculo da energia livre de Gibbs. O cálculo destas informações acoplado a uma amigável interface, per- mite aos especialistas analisar e compreender o impacto de pontos de mutações. O segundo trabalho, visGReMLIN (visual Graph Mining strategy to infer protein- Ligand INteraction patterns), utiliza uma abordagem de mineração de grafos para encontrar padrões de interação recorrentes entre proteínas e ligantes. São con- siderados ligantes pequenas moléculas não proteicas que formam um complexo com a proteína. Nele, as interações entre proteína e ligante são modelados como um grafo bipartido, onde os vértices são rotulados com as características físico- químicos do átomo e as arestas com o tipo de interação estabelecido pelos átomos. Para encontrar os padrões de interação, foi realizado um agrupamento dos gra- fos, utilizando, por padrão, o método k-medoids com coeficiente de silhueta como métrica de avaliação, seguido por uma mineração de subgrafos frequentes. Esta estratégia foi capaz de identificar átomos e resíduos importantes, já determinados experimentalmente ou computacionalmente, em estudos anteriores. Em ambos os trabalhos, foram propostas ferramentas robustas e fáceis de usar que lidam com dados de proteínas em larga escala e tem o objetivo de auxiliar na compreensão de diferentes problemas biológicos. |