Métodos de Poda Estática para Índices de Máquina de Busca

Detalhes bibliográficos
Ano de defesa: 2009
Autor(a) principal: Silva, Francisca Sancha Azevedo da
Outros Autores: http://lattes.cnpq.br/9674907639244954
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:

Link de acesso: http://tede.ufam.edu.br/handle/tede/2952
Resumo: Métodos de poda de índices têm sido propostos a fim de melhorar a eficiência de máquinas de busca. Nos métodos de poda estática, as entradas do índice que têm pouca contribuição para ordenação das respostas são descartadas, reduzindo o tempo de acesso ao índice. Neste trabalho é realizado um estudo sobre métodos de poda estática e são propostos dois métodos.O primeiro método proposto leva em consideração a raridade dos termos do vocabulário para realizar a poda. Este método é apropriado para coleções que possuam grande incidência de termos raros nas consultas e um vocabulário com os tamanhos dos termos não concentrado em faixas de tamanho específicas. O segundo método proposto é apropriado para coleções onde os termos das consultas têm baixos valores de idf (inverse document frequency) e baseia-se no tamanho dos termos de logs de consultas para realizar a poda. Os resultados apresentados foram satisfatórios e podem ser aplicados a coleções com as características das estudadas neste trabalho.