Comparação de métodos para tratamento de dados faltantes em inquéritos epidemiológicos com amostragem complexa

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Pacheco, Vanessa Eufrauzino
Orientador(a): Carmo, Cleber Nascimento do
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/28714
Resumo: Inquéritos epidemiológicos com amostragem complexa são bastante utilizados devido a redução de custo propiciando o mesmo benefício que uma pesquisa censitária. Entretanto,a ocorrência de perda de dados é um dos problemas que podem afetar esses inquéritos,influenciando os resultados analíticos da pesquisa. A razão para um dado ser faltante é chamado de mecanismo de dados faltantes, definido em três categorias: perda completamente aleatória, perda não completamente aleatória e perda não aleatória. Esse trabalho descreve esses mecanismos e aponta algumas técnicas de tratamento de dados que podem ser aplicadas em uma amostragem complexa, considerando predominantemente desfechos categóricos. A partir do banco de dados Nascer no Brasil, foram simulados bancos de dados com os três tipos de mecanismos de perda e, para o tratamento dos dados, foram utilizados os métodos de análise de casos completos, método do vizinho mais próximo, imputação múltipla por média preditiva e imputação por escore de propensão. Para a comparação dos resultados foram observadas as taxas de recuperação de dados de maneira exata aos originais e diferença quadrática de estimativas de parâmetros de regressão logística e linear.Os métodos de imputação trouxeram mais de 50% dos dados recuperados de maneira exata para os mecanismos perda completamente aleatória e perda não aleatória, já para o mecanismo perda não completamente aleatória, a recuperação foi de aproximadamente 30 por cento. Para as diferenças quadráticas os métodos do vizinho mais próximo e imputação múltipla tiveram resultados equiparáveis.O presente estudo ressaltou a importância da escolha adequada de métodos de imputação para desfechos categóricos e de variáveis para predição de valores, assim como demonstrou diferenças importantes observadas de acordo com o mecanismo de perda utilizado.