Docktdeep: um programa para desenvolvimento de funções scoring para triagem virtual de compostos usando redes neurais profundas

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Silva, Matheus Müller Pereira da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/323
Resumo: Metodologias de docagem molecular e triagem virtual (VS, do inglês virtual screening) são cruciais planejamento de fármacos moderno. Como parte fundamental dessas metodologias estão as funções de pontuação (SF, do inglês scoring functions), usadas para estimar a afinidade de ligação entre uma pequena molécula (ligante) e um alvo farmacológico de interesse, usualmente uma proteína. Enquanto a determinação da geometria correta do ligante no sítio ativo de um alvo é uma tarefa realizada com acurácia relativamente satisfatória por diversos programas de docagem molecular atuais, a predição correta da afinidade de ligação proteína-ligante ainda é um desafio em aberto na área. Uma SF que seja capaz de predizer de maneira satisfatória a afinidade de ligação para diversos ligantes e alvos diferentes é essencial para uma metodologia de VS de sucesso. Nos últimos anos, o uso de técnicas de aprendizado de máquina no desenvolvimento de SFs tem ganhado destaque, superando o desempenho de abordagens mais tradicionais de modelagem a partir de princípios físicos. Neste trabalho, um programa de computador, denominado de DockTDeep, foi desenvol- vido com o objetivo de auxiliar o desenvolvimento e a aplicação de SFs baseadas em técnicas aprendizado profundo (DL, do inglês deep learning). O programa é capaz de gerar diferentes representações moleculares de complexos proteína-ligante, baseadas em grades multidimensionais de voxels (tensores 4D). Outra função crucial do programa é possibilitar o gerenciamento de grandes conjuntos de dados de complexos proteína-ligante, de maneira adequada para o treinamento com algoritmos de DL. Além disso, neste trabalho, SFs foram desenvolvidas, de maneira preliminar, utilizando o programa DockTDeep, com intuito de validar o seu uso. As SFs desenvolvidas foram treinadas usando o conjunto de dados PDBbind refined set e testadas nos conjuntos de validação core set v.2013 e v.2016. Os melhores valores de correlação de Pearson para as predições realizadas em cada conjunto foram R = 0,645 e R = 0,685, respectivamente. O programa DockTDeep se mostrou adequado para o desenvolvimento de SFs baseadas em DL que utilizam representações moleculares em grades de voxels. Diferentes modelos e representações podem ser desenvolvidos utilizando o programa, e os modelos obtidos estão aptos a serem aplicados em ensaios de VS em larga escala.