Detalhes bibliográficos
Ano de defesa: |
2010 |
Autor(a) principal: |
Pereira, Alexandre Neiva |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual do Ceará
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
|
Resumo: |
O advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo. |