Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Brustulin, Rafael
Orientador(a): Marson, Poliana Guerino
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Tocantins
Palmas
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciências da Saúde - PPGCS
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://hdl.handle.net/11612/911
Resumo: O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade.