Análise de classificadores de seqüências projetados por aprendizado computacional supervisionado e não supervisionado

Detalhes bibliográficos
Ano de defesa: 2004
Autor(a) principal: Carezzato, Caetano Jimenez
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-135827/
Resumo: Nos últimos anos, milhares de seqüências de DNA e proteínas vêm sendo depositadas em bancos de dados públicos de todo o mundo. Atualmente, o principal desafio da Biologia Molecular Computacional é analisar e extrair informações úteis dessa grande quantidade de dados disponível. Este trabalho tem por objetivo estudar diversos métodos computacionais para a realização de busca de homologia e clustering (reconhecimento de padrões supervisionado e não supervisionado, respectivamente) em seqüências de nucleotídeos e aminoácidos. Foi realizada uma vasta revisão bibliográfica dos principais métodos utilizados na área de reconhecimento de padrões, principalmente em Biologia Computacional. É apresentado um resumo dos principais modelos empregados na área e também resultados de experimentos realizados com genes humanos por meio de uma nova forma de extração de características em seqÜência de DNA. Tais características são baseadas em técnicas de representação Chaos Game e de análise fractal multi-escala. Ao longo desta dissertação são apresentados os elementos necessários para a compreensão das diversas técnicas e características analisadas e um resumo dos principais resultados obtidos com a utilização de tais características para a busca de genes que raramente se expressam