Usage of focused gazetteers in geoparsing

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Bruno Rabello Monteiro
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Minas Gerais
Brasil
ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO
Programa de Pós-Graduação em Ciência da Computação
UFMG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/36251
https://orcid.org/0000-0002-0376-3287
Resumo: Geoparsing é a tarefa de recuperação de informação geográfica que lida com o reconhecimento das referências a lugares contidas nos textos. Além do geoparsing, duas outras tarefas são usadas para resolver o Problema de Resolução de Escopo Geográfico (PREG), as tarefas de resolução das referências e determinação das referências. O PREG visa determinar o escopo geográfico de documentos, ou seja, os locais ou regiões relevantes, considerando o conteúdo do documento. Vários trabalhos que tratam do PREG ou de suas tarefas focam principalmente o método de solução em si. Além disso, cada trabalho testa o algoritmo usando diferentes conjuntos de dados e fontes de conhecimento externas, como os gazetteers. Esta tese propõe uma metodologia para avaliar os gazetteers ao invés dos algoritmos. A abordagem varia o tamanho e a cobertura dos gazetteers, delimitando-os geograficamente, enquanto mantém o conjunto de dados e os algoritmos fixos. Gazetteers focados podem aumentar a precisão (com baixa perda de recall) na tarefa de geoparsing em comparação com os gazetteers generalistas. Além disso, os gazetteers focados reduzem consideravelmente o número de candidatos ambíguos para cada topônimo encontrado no geoparsing.