Detalhes bibliográficos
Ano de defesa: |
2018 |
Autor(a) principal: |
Silva, Fabiano Tavares da |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual do Ceará
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=83480
|
Resumo: |
<div style="">Esta dissertação descreve um sistema de Recuperação de Informação (RI) para coleções de documentos aproximadamente uniformes em tamanho e formato. Exemplos de tais coleções são anais de conferências ou revistas científicas, prontuários médicos, sinopses de notícias, entre outros. Todas as coleções possuem em comum o mesmo domínio. A questão chave em RI é trazer a necessidade de informação do usuário em documentos relevantes. A consulta por ele projetada pode não carregar toda sua intenção do que realmente deseja. Na literatura o uso de diversas técnicas de realimentação implícita de consultas ataca diretamente esse problema. Para este trabalho analisaram-se as técnicas existentes desde o uso de tesauro até propor uma abordagem que usa a teoria de Semântica Distribucional para construir uma Análise de Contexto Local. Utilizou-se quatro coleções com distintos aspectos de domínio, sendo uma das coleções originalmente construída em português e disponibilizada para trabalhos futuros. O trabalho propõe avaliar o sistema de RI como um todo: com a expansão de consulta, a recuperação e o ranqueamento com algoritmos de baseline equivalentes aos métodos clássicos. Como forma de alcançar êxito nas tarefas que compõem o estado da arte de RI foi desenvolvido um motor de busca com interface Web que permite também o uso de técnicas de feedback de relevância. A abordagem é avaliada nas quatro bases de dados em inglês e português e comparada com técnicas semelhantes. Os resultados dos experimentos validaram a abordagem e mostram-se com uma performance competitiva e qualificada para as soluções geradas. </div><div style="">Palavras-chave: Recuperação de informação. Análise de Contexto Local. Semântica Distribucional. Indexação. Expansão de Consultas.</div> |