Redes neurais artificiais aplicadas no reconhecimento de regiões promotoras em bactérias Gram-negativas

Detalhes bibliográficos
Ano de defesa: 2011
Autor(a) principal: Silva, Scheila de Avila e
Orientador(a): Echeverrigaray, Sérgio, Gerhardt, Günther Johannes Lewczuk
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ucs.br/handle/11338/691
Resumo: A região promotora é uma sequência de DNA localizada anteriormente à uma região codificante e é responsável por iniciar o processo de transcrição. Deste modo, atua como um elemento regulador. O estudo da regulação da expressão gênica auxilia na compreensão da maquinária vital dos seres vivos, no conhecimento sobre a funcionalidade dos genes em diferentes espécies, na resposta celular frente às mudanças ambientais, entre outras questões. Embora os métodos computacionais para a predição de genes possuam uma boa acurácia o mesmo não é conseguido para os promotores. Esta dificuldade se deve ao tamanho reduzido do promotor e ao padrão pouco conservado, o que gera resultados com alto número de falsos positivos. Esta tese teve como objetivo a utilização de Redes Neurais Artificiais na predição, caracterização e reconhecimento de promotores de bactérias Gramnegativas. Diferente de outros trabalhos, a predição realizada não foi limitada apenas aos promotores dos genes constitutivos; foi realizada também para as demais classes de sequências promotoras. Além da abordagem clássica utilizando a composição de nucleotídeos foram empregados os valores de estabilidade da sequência. De modo a otimizar o aprendizado da Rede Neural e implementar uma ferramenta própria para a predição de promotores, foram extraídas regras de inferência (baseadas no conhecimento produzido durante o treinamento da rede) que foram ponderadas e implementadas em uma nova ferramenta, chamada BacPP. Até o presente, os resultados obtidos com o BacPP foram satisfatórios e comparáveis com a literatura. Os valores de exatidão obtidos com o BacPP para os fatores σ24, σ28, σ32, σ38, σ54 e σ70 de E. coli foram, 86,9%; 92,8%; 91,5%; 89,3%; 97,0%; 83,6%, respectivamente. Quando a ferramenta foi aplicada em promotores pertencentes a outras bactérias Gram-negativas, a exatidão geral foi de 76%. Considerando a importância da predição de promotores e a ausência de banco de dados com informações para outras bactérias, implementou-se o IntergenicDB, um banco de dados com diversas informações sobre as sequencias intergênicas e o valor de classificação destas para os diferentes fatores σ bacterianos, conforme os resultados obtidos com o BacPP.