Detalhes bibliográficos
Ano de defesa: |
2009 |
Autor(a) principal: |
Scardua, Wendel |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-22102024-211319/
|
Resumo: |
Com o explosivo crescimento da Internet e da produção de conteudo em formato digital área de Recuperação de Informação (RI) e os sistemas de RI têm assumido papel cada vez mais importante na organização da sociedade. Se por um lado os tamanhos sempre mais gigantescos das coleções a serem indexadas colocam desafios sempre mais crescentes, é tambem verdade que o estudo dos algoritmos de busca e de estruturas de dados avancadas ja esta maduro o suficiente para que o problema de uma busca exata por termos de uma consulta possa ser realizado em tempo bastante eficiente e independente do tamanho da coleção de documentos indexada. Como o mesmo não se pode dizer de uma busca inexata, por exemplo, a ferramenta basica num sistema de RI e quase sempre o da busca exata de termos numa coleção de documentos. Se por um lado as respostas a estas buscas exatas são ja uma excelente resposta inicial, a verdade e que muito há ainda que ser melhorado, de forma que os documentos a serem devolvidos sejam aqueles relevantes à pergunta e ao contexto em que o usuario deseja. Os chamados metodos de expansão de consulta são neste contexto bastante importantes de forma a reformular a consulta original e aprimorar os resultados de forma que um documento que fale de automovel possa, por exemplo, ser devolvido quando o usuario formula uma busca por carro. Como fazer isto sem introduzir numero excessivo de documentos espurios (aumentando a cobertura sem contudo prejudicar a precisão da resposta) e sempre um desafio. A corrente dissertação faz uma pequena revisão de varias abordagens que buscam resolver este problema atacado pela expansão de consulta, bem como apresenta resultados de experimentos amplos com duas destas tecnicas, usando um corpus qualificado de 210.734 notcias dos jornais A Folha de São Paulo e O Publico que foram usados na Oficina CLEF-2006. O melhor resultado entre as duas tecnicas aqui estudadas so e inferior aos melhores resultados das duas melhores equipes que então submeteram resultados à trilha de Lngua Portuguesa. |