Geração de embeddings de tipos de POI com base em feições geográficas.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: SILVA, Salatiel Dantas.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37311
Resumo: Pontos de Interesse (POIs) são locais específicos, como restaurantes, shoppings e parques, considerados relevantes para os usuários. Representar seus tipos por meio de mecanismos computacionais é crucial para desenvolver soluções que auxiliam em tarefas como planeja mento urbano, clusterização e recomendação de POIs. Abordagens recentes têm utilizado vetores de alta dimensão (vector embeddings) para representar os tipos de POI com base nas relações contextuais de vizinhança ou palavras associadas aos POIs. Tais representações têm deixado de lado as feições geográficas presentes nas imediações como ruas, edifícios, rios e parques. No entanto, essas feições podem contribuir significativamente para uma melhor representação dos tipos de POI. Nesse contexto, esta pesquisa propõe uma abordagem para gerar embeddings de tipos de POI utilizando as feições geográficas presentes no contexto dos POIs. Na abordagem proposta, foi desenvolvido e utilizado o algoritmo GeoContext2Vec, que considera os tipos de POI e as feições geográficas presentes em seu contexto para gerar um conjunto de treinamento, preservando os padrões espaciais de espaço e ocorrência das feições. Tal conjunto é utilizado para treinar os modelos Word2Vec e DistilBert, da área de Processamento de Linguagem Natural (PLN), capazes de gerar os embeddings dos tipos. Como principais resultados obtidos, constatou-se que os embeddings produzidos com o Geo Context2Vec refletem a similaridade dos tipos de POI conforme estruturas hierárquicas e a opinião de pessoas, com valores de matching de aproximadamente 98%, superando estraté gias do estado-da-arte. Além disso, os resultados apontam a superioridade dos embeddings em uma tarefa de classificação de zonas urbanas, alcançando um valor de F-Score de 90%. Tal resultado demonstra que as feições geográficas são informações relevantes na represen tação de tipos de POI.