Classificação de Proteínas usando Máquinas de Aprendizagem e Descoberta de Padrões

Detalhes bibliográficos
Ano de defesa: 2008
Autor(a) principal: do Nascimento Júnior, Francisco
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
SVM
Link de acesso: https://repositorio.ufpe.br/handle/123456789/1596
Resumo: Máquinas de aprendizagem têm sido aplicadas em diferentes problemas em Bioinformática. Similarmente, algoritmos de descoberta de padrões também têm sido usados para descobrir motifs em seqüências de proteínas, contribuindo na definição de assinaturas (tais como impressões digitais) que caracterizam classes funcionais de proteínas. Como por exemplo, a classe de receptores acoplados a proteína-G (GPCR) que representam uma das maiores famílias no Genoma Humano. Esta família é um dos grandes alvos de pesquisa para a descoberta e desenvolvimento de novas drogas, conseqüentemente, de grande interesse para a indústria farmacêutica. O modelo proposto nesta dissertação combina máquinas de aprendizagem, como SVM (Support Vector Machine) e MLP (Multilayer Perceptron), e métodos de descoberta de padrões no desenvolvimento de um procedimento para predizer a relação entre uma seqüência primária de proteínas e sua classe funcional. Como caso de estudo, este trabalho apresenta experimentos com a superfamília GPCR, usando padrões em forma de expressões regulares desta família extraídos pelo SPEXS (Sequence Pattern EXhaustive Search), um algoritmo para descoberta de padrões