Detalhes bibliográficos
Ano de defesa: |
2017 |
Autor(a) principal: |
Pereira, Janaina Cruz |
Orientador(a): |
Caffarena, Ernesto Raul |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Link de acesso: |
https://www.arca.fiocruz.br/handle/icict/23812
|
Resumo: |
Funções de pontuação são um dos grandes problemas na metodologia de Docking- Based Virtual Screening - DBVS, pois elas não são capazes de classificar de forma confiável ligantes docados. Nesse trabalho propomos um novo método baseado em Deep Learning para melhoramento de DBVS. Nossa abordagem usa a saída do docking para aprender como extrair features relevantes a partir de informações básicas como tipos de átomo e tipos de resíduos provenientes do complexo proteínacomposto. Nossa abordagem introduz o conceito de embeddings para átomos e aminoácidos e implementa uma forma efetiva de criar representações de vetores distribuídos para complexos proteína-composto. Uma da maiores vantagens da abordagem proposta em detrimento aos métodos encontrados na literatura é a capacidade de aprender features com pouca ou nenhuma intervenção humana. Para verificarmos a eficácia da DeepVS, executamos experimentos de docking com o programa Autodockvina1.2 e Dock 6.6 utilizando o banco de dados DUD com cargas corrigidas. Adicionalmente, reportamos resultados usando um subconjunto do banco de dados DUD-E. O desempenho da DeepVS é avaliado com o uso da abordagem de validação cruzada (leave-one-out) e empregando-se métricas bem estabelecidas como fator de enriquecimento e AUC Usando a saída do programa Autodockvina1.2, a DeepVS registra uma AUC ROC de 0,81, que até onde sabemos é o melhor resultado de AUC já reportado para DBVS usando os 40 receptores do DUD. Para o subconjunto de 44 proteínas do DUD-E, os experimentos de validação cruzada resultaram em uma AUC média de 0,93, valor que é superior ao reportado por trabalhos recentes. Adicionalmente, aplicamos a DeepVS (treinada com o DUD) em um estudo de caso envolvendo a enzima Cruzaína. O cisteíno-protease Cruzaína é considerado como o principal cisteíno do protozoário Trypanosoma cruzi agente etiológico da doença de Chagas. Nesse estudo de caso abordamos todas as principais etapas de virtual screening baseado em estrutura envolvendo escolha da estrutura cristalográfica, estudo do sítio de ligação, estudos com controles positivos para verificação do método a ser aplicado, seleção de um conjunto de compostos a serem ranqueados em um banco de dados de ligantes, virtual screening, seleção de compostos potencialmente ativos e inspeção visual dos compostos selecionados. As estratégias utilizadas no estudo de caso tornaram possível a identificação de sete compostos candidatos a fármacos em um conjunto de dados de 90.769 compostos comercialmente adquiríveis |