Inclusão de etapa de pós-processamento determinístico para aumento de performance do relacionamento (linkage) probabilístico
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Tocantins
Palmas |
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciências da Saúde - PPGCS
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://hdl.handle.net/11612/911 |
Resumo: | O objetivo do presente estudo foi demonstrar a aplicação de uma etapa de pós-processamento determinístico, baseada em medidas de similaridade, para aumentar a performance do relacionamento probabilístico com e sem a etapa de revisão manual. As bases de dados utilizadas no estudo foram o Sistema de Informações de Agravos de Notificação e o Sistema de Informação Sobre Mortalidade no período de 2007 a 2015 do município de Palmas, Tocantins. O software probabilístico utilizado foi o OpenRecLink; foi desenvolvida e aplicada uma etapa de pós-processamento determinístico aos dados obtidos por três diferentes estratégias de pareamento probabilístico. As três estratégias foram comparadas entre si e acrescidas da etapa de pós-processamento determinístico. A sensibilidade das estratégias probabilísticas sem revisão manual variou entre 69,1% e 77,8%, enquanto que as mesmas estratégias, acrescidas da etapa de pós-processamento determinístico, tiveram uma variação entre 92,9% e 96,3%. A sensibilidade de duas estratégias probabilísticas com revisão manual foi semelhante aos obtidos pela etapa de pós-processamento determinístico, no entanto o número de pares destinados a revisão manual pelas duas estratégias probabilísticas variou entre 1.177 e 1.132 registros, contra 149 e 145 após a etapa de pós-processamento determinístico. Nossos resultados sugerem que a etapa de pós-processamento determinístico é uma opção promissora, tanto para aumentar a sensibilidade quanto para reduzir o número de pares que precisam ser revisados manualmente, ou mesmo para eliminar sua necessidade. |