BioSom

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Otemaier, Kelly Rafaela
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1884/31637
Resumo: Resumo: Genes e proteínas são de grande importância biológica para a compreensão de processos bioquímicos e requerem nomes consistentes. Existem diversas diretrizes para nomenclatura de genes, mas elas não são rigorosamente aplicadas à atribuição de nomes aos genes recém-identificados, gerando assim, inúmeras maneiras de nomear um mesmo gene. Este trabalho tem o objetivo de detectar e minimizar a redundância e a inconsistência de dados para colaborar com a identificação correta de genes. Para isso foram utilizadas técnicas de Inteligência Artificial para identificar os sinônimos realizando um estudo dirigido a dez experimentos distintos. Para selecionar os dados dos experimentos foi construído um banco de dados relacional para armazenar as informações constantes na base NR do NCBI e as informações identificadas neste estudo. Os dados do experimento foram minerados através das técnicas de mapas auto-organizáveis de Kohonen. A Rede SOM de Kohonen foi aplicada para exprimir as relações de similaridade entre os dados. Para identificação dos agrupamentos gerados pela rede SOM foi utilizada a técnica denominada Matriz-U. As informações resultantes deste trabalho permitem inferir os sinônimos dos genes, identificar prováveis nomes para genes nomeados como hipotéticos e apontar possíveis erros de anotação.