Metodologia de desenvolvimento de data marts para apoio à decisão baseado no uso de ontologias e estudo de caso para a priorização de alvos de fármacos em tripanossomatídeos

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Teixeira, Marlon Amaro Coelho
Orientador(a): Silva Junior, Floriano Paes, Cavalcanti, Maria Cláudia Reis
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/28094
Resumo: A anotação de texto semântico permite a associação de conceitos presentes em uma ontologia a expressões textuais (termos), que são legíveis por agentes de software. No cenário científico, isso é particularmente útil, porque muitas descobertas científicas estão "escondidas" dentro de artigos acadêmicos. A área Biomédica possui mais de 300 ontologias, a maioria composta de mais de 500 conceitos. Estas ontologias podem ser usadas para anotar e/ou indexar artigos científicos. No entanto, no contexto de uma pesquisa científica, uma simples consulta baseada em palavras-chave usando a interface de uma biblioteca de textos digitais, pode retornar mais de mil hits. A análise de um conjunto tão grande de textos anotados com ontologias não é uma tarefa fácil. Neste sentido, este trabalho apresenta um método chamado TOETL, para construir uma visão analítica sobre esses textos. A ideia é fornecer uma maneira sistemática de processar um grande conjunto de artigos científicos e apoiar o pesquisador em uma melhor tomada de decisão em relação aos seus interesses de pesquisa específicos Para ilustrar a aplicação do método, um cenário científico foi escolhido com foco na pesquisa de essencialidade de gene. Este é um conceito muito importante na busca de genes com potencial para novos alvos de fármacos. Um corpus de artigos foi selecionado e semanticamente anotado com três ontologias diferentes. Este trabalho apresenta como os dados de anotação foram extraídos, organizados e agregados em um esquema dimensional de um data mart chamado TaP DM, aplicando a metodologia proposta. O estudo de caso teve como foco os seguintes protozoários: Entamoeba histolytica, Leishmania major, Plasmodium falciparum, Trypanosoma brucei e Trypanosoma cruzi. O TaP DM permite aos pesquisadores visualizarem, de forma multidimensional, os diversos conceitos envolvidos nos artigos que abordam a essencialidade de genes. Ao final, são realizadas consultas no TaP DM mostrando algumas estratégias de pesquisa sobre esses dados e discutindo como eles podem ajudar o cientista a priorizar alvos de fármacos em protozoários parasitas.