Usando relacionamentos entre atributos na descoberta da verdade do processo de fusão de dados

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: CANALLE, Gabrielle Karine
Orientador(a): SALGADO, Ana Carolina Brandão
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/51298
Resumo: A Fusão de Dados é uma tarefa primordial quando se deseja integrar dados. Durante o processo de Integração de Dados podem ocorrer conflitos entre os valores de um mesmo objeto do mundo real. Na Fusão de Dados, a etapa responsável por identificar e resolver esses conflitos, descobrindo os valores verdadeiros, é chamada de Descoberta da Verdade. Devido à facilidade de publicação e compartilhamento de dados, muitos valores falsos são disponibi- lizados na Web, e as fontes de dados possuem qualidades variadas. A etapa de Descoberta da verdade é um processo iterativo no qual se utiliza a qualidade das fontes para verificar o grau de confiança dos valores providos por ela, ao mesmo tempo que a qualidade das fontes é calculada considerando-se os valores verdadeiros que ela provê. Deste modo, principalmente em cenários de dados na Web, a descoberta da verdade se torna um desafio. Neste sentido, este trabalho propõe considerar relacionamentos entre atributos, os quais serão utilizados para inserir conhecimento adicional na etapa de descoberta da verdade no processo de Fusão de Dados. Deste modo, o processo iterativo de avaliação de confiança dos valores e de confi- abilidade das fontes será realizado com maior acurácia, não apenas com base nos dados de entrada, mas também no conhecimento adicional extraído dos relacionamentos. Experimentos foram realizados para avaliar a proposta em comparação com um algoritmo do estado da arte. Os resultados mostraram que a utilização de conhecimento adicional na descoberta da verdade melhora a precisão dos resultados.