Detalhes bibliográficos
Ano de defesa: |
2008 |
Autor(a) principal: |
SOARES, Rodrigo Gabriel Ferreira |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/2107
|
Resumo: |
O volume de dados de expressão gênica vem crescendo exponencialmente nos ultimos anos devido as novas tecnologias da Biologia Molecular, que permitem medir a expressão de milhares de genes ao mesmo tempo. A analise computacional desses dados tem grande importância na Biologia e na Medicina. Ela permite, por exemplo, a descoberta de novas classes de câncer biologicamente e clinicamente significantes e a identificação de novas funções dos genes. As tecnicas de Aprendizado de Maquina não-supervisionado fazem parte da metodologia de analise usada pelos especialistas. Existem diversos algoritmos de agrupamento de dados, cada um procurando particionar os dados de uma maneira especifica. A escolha desse algoritmo e fundamental para a qualidade do agrupamento e, portanto, para a analise adequada dos resultados. Propomos uma metodologia de meta-aprendizado para a escolha dos algoritmos de agrupamento de dados no contexto de dados de expressão gênica de celulas cancergenas. Ate o momento, o meta-aprendizado vinha sendo utilizado apenas no contexto supervisionado. Nesta Dissertação, estendemos esse conceito para problemas não-supervisionados. Usamos bases de dados de diferentes experimentos com microarrays de varios estudos sobre câncer. Extraimos caracteristicas relevantes de cada base de dados a fim de emprega-las no aprendizado de Redes Neurais, k- Vizinhos Mais Proximos e Maquinas de Vetores Suporte, utilizados como meta-aprendizes. Esses metodos foram usados como sistemas de aprendizado para predizer a ordem de desempenho dos algoritmos de agrupamento, bem como selecionar o melhor algoritmo, de acordo com essas caracteristicas. Realizamos um conjunto de experimentos para validar o uso de cada meta-aprendiz. Nesse contexto, mostramos que, em media, os rankings sugeridos pelas Maquinas de Vetores Suporte são significativamente mais correlacionados com o ranking ideal do que aqueles obtidos com o ranking default. Conseguimos realizar um estudo inovador que pode ser expandido para dados de outros contextos, servindo como ponto de partida para novas abordagens |