Ontologia como recurso de padronização terminológica no processo de recuperação de informação

Detalhes bibliográficos
Autor(a) principal: Janaite Neto, Jorge
Data de Publicação: 2016
Outros Autores: Ferneda, Edberto
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da Universidade Federal do Ceará (UFC)
dARK ID: ark:/83112/001300002qvv6
Texto Completo: http://www.repositorio.ufc.br/handle/riufc/24412
Resumo: Information Retrieval process involves a collection of documents that must be represented by linguistic expressions and users trying to describe linguistically their information need in order to obtain relevant documents that meet such needs. Therefore, an information retrieval system is a linguistic environment mediating the communication between a stock of information and its users. Its effectiveness depends on adequate control of language for representation of information items and requests of its users. This paper presents a method of using ontologies in information retrieval process. It uses the Vector Space Model as a formal structure for the representation of documents and queries. The documents vectors are created during the automatic indexing process, in which the ontologies provide new terms in order to enrich those representations. The search vector is created from a query expansion process in which, from inferences in ontology, new terms are entered in the search expression initially formulated by the user. The aim is standardize the representations of documents and searches, thus improving the information retrieval process.
id UFC-7_5822e87185a4da3c26d0e65ba331f7fe
oai_identifier_str oai:repositorio.ufc.br:riufc/24412
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Ontologia como recurso de padronização terminológica no processo de recuperação de informaçãoRecuperação de informaçãoIndexação automáticaExpansão de consultaOntologiaInformation Retrieval process involves a collection of documents that must be represented by linguistic expressions and users trying to describe linguistically their information need in order to obtain relevant documents that meet such needs. Therefore, an information retrieval system is a linguistic environment mediating the communication between a stock of information and its users. Its effectiveness depends on adequate control of language for representation of information items and requests of its users. This paper presents a method of using ontologies in information retrieval process. It uses the Vector Space Model as a formal structure for the representation of documents and queries. The documents vectors are created during the automatic indexing process, in which the ontologies provide new terms in order to enrich those representations. The search vector is created from a query expansion process in which, from inferences in ontology, new terms are entered in the search expression initially formulated by the user. The aim is standardize the representations of documents and searches, thus improving the information retrieval process.O processo de recuperação de informação envolve um acervo documental que deve ser representado por expressões linguísticas e usuários que tentam descrever linguisticamente as suas necessidades de informação a fim de obterem documentos relevantes para satisfazer tais necessidades. Um sistema de recuperação de informação é, portanto, um ambiente linguístico mediador na comunicação entre um estoque de informação e seus requisitantes. Sua eficiência depende de um controle adequado da linguagem de representação dos itens de informação e das requisições dos usuários. Este trabalho apresenta um método de utilização de ontologias na recuperação de informação. Utiliza-se o Modelo Espaço Vetorial como estrutura formal para a representação dos documentos e das buscas dos usuários. Os vetores dos documentos são criados durante o processo de indexação automática no qual uma ontologia fornece novos termos além daqueles extraídos do texto, enriquecendo, assim a representação do documento. O vetor de busca é criado a partir de um processo de expansão de consulta no qual, a partir de inferências em uma ontologia, novos termos são inseridos na expressão de busca inicialmente formulada pelo usuário. Pretende-se com isso uniformizar as representações dos documentos e das buscas, melhorando assim a precisão do processo de recuperação de informação.Revista Informação em Pauta2017-07-28T12:56:45Z2017-07-28T12:56:45Z2016info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleapplication/pdfJANAITE NETO, Jorge; FERNEDA, Edberto. Ontologia como recurso de padronização terminológica no processo de recuperação de informação. Revista Informação em Pauta, Fortaleza, v. 1, n. 1, p. 30-45, jan./jun. 2016.2525-3468 (online)http://www.repositorio.ufc.br/handle/riufc/24412ark:/83112/001300002qvv6Janaite Neto, JorgeFerneda, Edbertoinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFC2023-10-30T18:09:53Zoai:repositorio.ufc.br:riufc/24412Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2023-10-30T18:09:53Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.none.fl_str_mv Ontologia como recurso de padronização terminológica no processo de recuperação de informação
title Ontologia como recurso de padronização terminológica no processo de recuperação de informação
spellingShingle Ontologia como recurso de padronização terminológica no processo de recuperação de informação
Janaite Neto, Jorge
Recuperação de informação
Indexação automática
Expansão de consulta
Ontologia
title_short Ontologia como recurso de padronização terminológica no processo de recuperação de informação
title_full Ontologia como recurso de padronização terminológica no processo de recuperação de informação
title_fullStr Ontologia como recurso de padronização terminológica no processo de recuperação de informação
title_full_unstemmed Ontologia como recurso de padronização terminológica no processo de recuperação de informação
title_sort Ontologia como recurso de padronização terminológica no processo de recuperação de informação
author Janaite Neto, Jorge
author_facet Janaite Neto, Jorge
Ferneda, Edberto
author_role author
author2 Ferneda, Edberto
author2_role author
dc.contributor.author.fl_str_mv Janaite Neto, Jorge
Ferneda, Edberto
dc.subject.por.fl_str_mv Recuperação de informação
Indexação automática
Expansão de consulta
Ontologia
topic Recuperação de informação
Indexação automática
Expansão de consulta
Ontologia
description Information Retrieval process involves a collection of documents that must be represented by linguistic expressions and users trying to describe linguistically their information need in order to obtain relevant documents that meet such needs. Therefore, an information retrieval system is a linguistic environment mediating the communication between a stock of information and its users. Its effectiveness depends on adequate control of language for representation of information items and requests of its users. This paper presents a method of using ontologies in information retrieval process. It uses the Vector Space Model as a formal structure for the representation of documents and queries. The documents vectors are created during the automatic indexing process, in which the ontologies provide new terms in order to enrich those representations. The search vector is created from a query expansion process in which, from inferences in ontology, new terms are entered in the search expression initially formulated by the user. The aim is standardize the representations of documents and searches, thus improving the information retrieval process.
publishDate 2016
dc.date.none.fl_str_mv 2016
2017-07-28T12:56:45Z
2017-07-28T12:56:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv JANAITE NETO, Jorge; FERNEDA, Edberto. Ontologia como recurso de padronização terminológica no processo de recuperação de informação. Revista Informação em Pauta, Fortaleza, v. 1, n. 1, p. 30-45, jan./jun. 2016.
2525-3468 (online)
http://www.repositorio.ufc.br/handle/riufc/24412
dc.identifier.dark.fl_str_mv ark:/83112/001300002qvv6
identifier_str_mv JANAITE NETO, Jorge; FERNEDA, Edberto. Ontologia como recurso de padronização terminológica no processo de recuperação de informação. Revista Informação em Pauta, Fortaleza, v. 1, n. 1, p. 30-45, jan./jun. 2016.
2525-3468 (online)
ark:/83112/001300002qvv6
url http://www.repositorio.ufc.br/handle/riufc/24412
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Revista Informação em Pauta
publisher.none.fl_str_mv Revista Informação em Pauta
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1834207822653423616