Usage of focused gazetteers in geoparsing
Ano de defesa: | 2021 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | eng |
Instituição de defesa: |
Universidade Federal de Minas Gerais
Brasil ICX - DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO Programa de Pós-Graduação em Ciência da Computação UFMG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://hdl.handle.net/1843/36251 https://orcid.org/0000-0002-0376-3287 |
Resumo: | Geoparsing é a tarefa de recuperação de informação geográfica que lida com o reconhecimento das referências a lugares contidas nos textos. Além do geoparsing, duas outras tarefas são usadas para resolver o Problema de Resolução de Escopo Geográfico (PREG), as tarefas de resolução das referências e determinação das referências. O PREG visa determinar o escopo geográfico de documentos, ou seja, os locais ou regiões relevantes, considerando o conteúdo do documento. Vários trabalhos que tratam do PREG ou de suas tarefas focam principalmente o método de solução em si. Além disso, cada trabalho testa o algoritmo usando diferentes conjuntos de dados e fontes de conhecimento externas, como os gazetteers. Esta tese propõe uma metodologia para avaliar os gazetteers ao invés dos algoritmos. A abordagem varia o tamanho e a cobertura dos gazetteers, delimitando-os geograficamente, enquanto mantém o conjunto de dados e os algoritmos fixos. Gazetteers focados podem aumentar a precisão (com baixa perda de recall) na tarefa de geoparsing em comparação com os gazetteers generalistas. Além disso, os gazetteers focados reduzem consideravelmente o número de candidatos ambíguos para cada topônimo encontrado no geoparsing. |