Towards auditable and intelligent privacy-preserving Record linkage.

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: NÓBREGA, Thiago Pereira da.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29393
Resumo: A Resolução de Entidade com Garantias de Privacidade (REGP) pretende integrar dados privados/sens ́ıveis de varias fontes de dados mantidas por diferentes partes. A REGP tem por objetivo identificar registros (por exemplo, pessoas ou objetos) que representam a mesma entidade do mundo real em fontes de dados privados mantidas por diferentes custodiantes. Devido a leis e regulamentos recentes (por exemplo, Regulamento Geral de Proteção de Dados), as abordagens PPRL são cada vez mais exigidas em áreas de aplicação do mundo real, como saude, análise de crédito, avaliação de políticas publicas e segurança nacional.Em cenarios prá ticos, o processo PPRL precisa lidar com problemas de eficiência, eficacia (qualidade de ligação) e privacidade. Por exemplo, o processo de PPRL precisa ser executado sobre grandes fontes de dados (por exemplo, um banco de dados contendo informações pessoais de programas governamentais de distribuição de renda e assistência), com uma classificação precisa das entidades e, ao mesmo tempo, proteger a privacidade de a informação. Nesse contexto, este trabalho propõe melhorias no processo PPRL com o intuito de mitigar alguns dos gargalos do REGP. Particularmente, este trabalho apresenta três grandes contribuições para o processo REGP: i) um protocolo que permite a auditabilidade da computação realizada durante o REGP, ii) uma metodologia não supervisionada que aproveita o conhecimento de conjuntos de dados publicos para treinar classificador baseado em Machine Learning para o REGP, e iii) uma nova representação, ̧para os dados PPRL codificados/anonimizados que permitem o uso de novas redes neuro e classificadores de aprendizado profundo no contexto do PPRL. As presentes contribuições aprimoram várias partes do processo PPRL, visando torna-lo mais facilmente utilizado em aplicações do mundo real. Com a contribuição apresentada na tese, esperamos facilitar diversas aplicações ̃ do mundo real (por exemplo, estudos médicos, epidemiol ogicos e populacionais) e reduzir os esforços legais/burocraticos para acessar e processar os dados, tornando a execução dessas aplicações mais simples para empresas e governos.