SISMULT- Sistema de indexação semiautomática multilíngue.

Detalhes bibliográficos
Ano de defesa: 1998
Autor(a) principal: SOUSA, Ianna Maria Sodré Ferreira de.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/7087
Resumo: Com a difusão das bibliotecas digitais e da Internet, mais e mais textos em meio eletrônico, em diversos idiomas, se tornam acessíveis para um publico amplo e geograficamente disperso. Isto torna necessário o desenvolvimento de ferramentas adequadas para facilitar a indexação, o armazenamento e a recuperação adequada de documentos referentes a informação pesquisada. Este trabalho tem como objetivo apresentar um método para construção semi-automática de um thesaurus retangular multilíngue, a partir de documentos eletrônicos, que auxiliara no processo de recuperação da informação, independente do idioma. O método consiste em extrair termos semi-automaticamente do conjunto de documentos e utilizar a analise da co-ocorrência de termos para selecionar os termos relevantes, apos consultar os dicionários unilíngues para determinar os termos abstratos. Os conceitos relevantes extraídos dos documentos são então representados por uma relação binaria sobre a qual aplica-se o Método de Decomposição Retangular de uma Relação Binaria para a obtenção dos retângulos que geram o thesaurus a partir de um algoritmo incremental. Dicionários especiais e interações com o usuário são utilizados para determinar o contexto adequado para palavras ambíguas, alem de eliminar flexões e associar um conceito abstrato para cada palavra. O protótipo desenvolvido permite uma atualização continua dos thesauri existentes com novos documentos, em diversos idiomas, e a realização de consultas multilíngues, alem de permitir o acréscimo de novos idiomas.