Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Silva, Luciana Candida da [UNESP] |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://hdl.handle.net/11449/194341
|
Resumo: |
Vivencia-se um período de mudanças nas práticas científicas, exigindo novas maneiras de gerar e comunicar a ciência. Essa nova maneira implica em disponibilizar dados de pesquisa científica gerados em laboratórios de pesquisa em tempo real, ou o mais próximo disso, em formatos abertos e estrutura adequada para permitir que sejam acessíveis, compartilháveis e reutilizáveis. Neste contexto, vislumbra-se na Web Semântica e no Linked Data conceitos e tecnologias que enfatizam a reutilização e a ligação de recursos ricamente descritos na Web. O objetivo geral desta tese é propor diretrizes semânticas para estruturação e publicação de dados abertos de cadernos de pesquisa, visando melhorias na qualidade da sua recuperação e compartilhamento em plataformas de acesso aberto. Nesse sentido, para realizar esse estudo, foram identificados os elementos conceituais e práticos presentes nas dimensões da e-Science, e apresentadas as características e as especificidades dos dados científicos anotados em cadernos de pesquisa. Na sequência, descreveu-se os conceitos e tecnologias da Web Semântica e Linked Data apropriadas para publicações desses dados em plataformas de acesso aberto. As diretrizes propostas nesta tese adotaram a etapa correspondente à formalização, estrutura, formatos e licenças de Santarem Segundo (2018). A metodologia seguiu os procedimentos tradicionais para delimitação do universo e amostragem da pesquisa, como sua classificação e coleta de dados; e, revisão sistemática de literatura para identificar trabalhos relacionados ao estado da arte dos cadernos abertos de pesquisa, no que se refere a sua estrutura e publicação para acesso e uso dos dados. Definiu-se que a pesquisa é de natureza qualitativa e finalidade aplicada; o método é bibliográfico, descritivo, exploratório, documental e de levantamento. Para a composição das diretrizes semânticas, identificou-se o ecossistema da pesquisa cientifica em torno do caderno de laboratório, realizou a modelagem dos dados a partir do modelo conceitual IFLA LRM, o mapeamento e a definição dos metadados apropriados ao contexto dos cadernos de pesquisa. Logo, os vocabulários selecionados foram descritos, bem como foram indicados os vocabulários para enriquecimento e as licenças de uso. Depois disso, analisou-se as correspondências entre os metadados e as propriedades dos vocabulários Schema.org, DC Terms, SKOS e RDA Element Sets. Em seguida foi construído o mapeamento das propriedades para relacionamentos de dados. Após o estudo das etapas, analisou-se os elementos quanto ao alcance dos Princípios FAIR e melhores práticas do W3C. Como resultado da pesquisa, estabeleceu-se um conjunto de diretrizes semânticas compostas de elementos e tecnologias que refletem a realidade de pesquisas laboratoriais e a descrição de experimentos com uma pluralidade de atributos, precisos e relevantes, os quais poderão proporcionar benefícios à comunidade cientifica com dados organizados, padronizados e disponíveis para o reuso. A aplicação devida dessas diretrizes, no que se refere à estruturação de dados, colabora para que os dados sejam encontráveis, acessíveis, interoperáveis e reutilizáveis. |