Uso de Meta-aprendizado para a Seleção e Ordenação de Algoritmos de Agrupamento Aplicados a Dados de Expressão Gênica

SOARES, Rodrigo Gabriel Ferreira

Uso de Meta-aprendizado para a Seleção e Ordenação de Algoritmos de Agrupamento Aplicados a Dados de Expressão Gênica

Detalhes bibliográficos
Ano de defesa:	2008
Autor(a) principal:	SOARES, Rodrigo Gabriel Ferreira
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Pernambuco
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Meta-aprendizado Aprendizado Não-supervisionado Expressão Gênica
Link de acesso:	https://repositorio.ufpe.br/handle/123456789/2107
Resumo:	O volume de dados de expressão gênica vem crescendo exponencialmente nos ultimos anos devido as novas tecnologias da Biologia Molecular, que permitem medir a expressão de milhares de genes ao mesmo tempo. A analise computacional desses dados tem grande importância na Biologia e na Medicina. Ela permite, por exemplo, a descoberta de novas classes de câncer biologicamente e clinicamente significantes e a identificação de novas funções dos genes. As tecnicas de Aprendizado de Maquina não-supervisionado fazem parte da metodologia de analise usada pelos especialistas. Existem diversos algoritmos de agrupamento de dados, cada um procurando particionar os dados de uma maneira especifica. A escolha desse algoritmo e fundamental para a qualidade do agrupamento e, portanto, para a analise adequada dos resultados. Propomos uma metodologia de meta-aprendizado para a escolha dos algoritmos de agrupamento de dados no contexto de dados de expressão gênica de celulas cancergenas. Ate o momento, o meta-aprendizado vinha sendo utilizado apenas no contexto supervisionado. Nesta Dissertação, estendemos esse conceito para problemas não-supervisionados. Usamos bases de dados de diferentes experimentos com microarrays de varios estudos sobre câncer. Extraimos caracteristicas relevantes de cada base de dados a fim de emprega-las no aprendizado de Redes Neurais, k- Vizinhos Mais Proximos e Maquinas de Vetores Suporte, utilizados como meta-aprendizes. Esses metodos foram usados como sistemas de aprendizado para predizer a ordem de desempenho dos algoritmos de agrupamento, bem como selecionar o melhor algoritmo, de acordo com essas caracteristicas. Realizamos um conjunto de experimentos para validar o uso de cada meta-aprendiz. Nesse contexto, mostramos que, em media, os rankings sugeridos pelas Maquinas de Vetores Suporte são significativamente mais correlacionados com o ranking ideal do que aqueles obtidos com o ranking default. Conseguimos realizar um estudo inovador que pode ser expandido para dados de outros contextos, servindo como ponto de partida para novas abordagens

Uso de Meta-aprendizado para a Seleção e Ordenação de Algoritmos de Agrupamento Aplicados a Dados de Expressão Gênica

Registros relacionados