Detalhes bibliográficos
Ano de defesa: |
2018 |
Autor(a) principal: |
ALENCAR, Andreza Leite de |
Orientador(a): |
GARCIA, Vinícius Cardoso |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/32659
|
Resumo: |
Na última década, surgiu uma nova tendência de abordagens que considera modelos não apenas como artefatos de documentação, mas também como artefatos centrais no campo da engenharia de software, permitindo a criação ou execução de sistemas de software complexos a partir desses modelos. Essas abordagens foram genericamente classificadas como Model-Driven Engineering (MDE). A análise de dados biológicos moleculares envolve a geração e interpretação de dados de genoma por sistemas de software complexos para apoiar decisões clínicas em diagnósticos. Esta análise pode ser decomposta em: (1) avaliação de qualidade dos dados brutos, (2) alinhamento de leitura a um genoma de referência, (3) identificação da variante, (4) anotação das variantes e visualização de dados. Por mais que existam diversas ferramentas para dar suporte a partes específicas deste processo, ele ainda enfrenta desafios. Um destes desafios está relacionado ao fato de não existirem padrões para publicação destes dados. Cada publicador escolhe qual conjunto de dados publicar e como publicá-lo. Como resultado, os serviços existentes, os formatos e os esquemas de dados podem variar significativamente. Diante deste cenário, identificou-se a demanda por pesquisas e soluções que possibilitem uma representação destes dados, auxiliando o processo de análise, especificamente na preparação de dados da etapa de anotação de variantes de genoma. Assim, esse trabalho busca responder a seguinte pergunta de pesquisa "Quais os conceitos e características do domínio de dados biológicos moleculares que precisam ser identificados e mapeados para prover uma representação deste conjunto de dados e possibilitar a geração de ferramentas que possibilitem o gerenciamento de seus esquemas de dados?". A abordagem de MDE surge como uma alternativa promissora neste cenário pois, com uso de recursos como meta-modelos e transformações de modelos, será possível contribuir com esta demanda. Assim, esse trabalho propõe uma solução que irá representar os esquemas de dados biológicos moleculares por meio de meta-modelos, permitindo o desenvolvimento de linguagens de modelagem e outros recursos que irão compor uma arquitetura de referência para dar suporte ao processo de anotação de variantes genéticas. A principais contribuições desse trabalho foram validadas por meio de suas implementações e avaliadas por meio de estudos baseados em opinião de especialistas e observação participante, que coletaram dados qualitativos e quantitativos sobre as contribuições. Entre as principais contribuições pode-se destacar: o meta-modelo GenDB; a linguagem de modelagem GenML; os algoritmos para identificação de esquemas e geração de esquemas de bases de dados orientadas a documento; e aplicação da abordagem deMDE para o desenvolvimento de soluções no contexto de engenharia de dados. |