Geração de embeddings de tipos de POI com base em feições geográficas.
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/37311 |
Resumo: | Pontos de Interesse (POIs) são locais específicos, como restaurantes, shoppings e parques, considerados relevantes para os usuários. Representar seus tipos por meio de mecanismos computacionais é crucial para desenvolver soluções que auxiliam em tarefas como planeja mento urbano, clusterização e recomendação de POIs. Abordagens recentes têm utilizado vetores de alta dimensão (vector embeddings) para representar os tipos de POI com base nas relações contextuais de vizinhança ou palavras associadas aos POIs. Tais representações têm deixado de lado as feições geográficas presentes nas imediações como ruas, edifícios, rios e parques. No entanto, essas feições podem contribuir significativamente para uma melhor representação dos tipos de POI. Nesse contexto, esta pesquisa propõe uma abordagem para gerar embeddings de tipos de POI utilizando as feições geográficas presentes no contexto dos POIs. Na abordagem proposta, foi desenvolvido e utilizado o algoritmo GeoContext2Vec, que considera os tipos de POI e as feições geográficas presentes em seu contexto para gerar um conjunto de treinamento, preservando os padrões espaciais de espaço e ocorrência das feições. Tal conjunto é utilizado para treinar os modelos Word2Vec e DistilBert, da área de Processamento de Linguagem Natural (PLN), capazes de gerar os embeddings dos tipos. Como principais resultados obtidos, constatou-se que os embeddings produzidos com o Geo Context2Vec refletem a similaridade dos tipos de POI conforme estruturas hierárquicas e a opinião de pessoas, com valores de matching de aproximadamente 98%, superando estraté gias do estado-da-arte. Além disso, os resultados apontam a superioridade dos embeddings em uma tarefa de classificação de zonas urbanas, alcançando um valor de F-Score de 90%. Tal resultado demonstra que as feições geográficas são informações relevantes na represen tação de tipos de POI. |