Avaliação de métodos de imputação na variável Receita das empresas da Pesquisa Anual de Comércio - PAC-IBGE

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Rodrigues, João Carlos Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/45/45133/tde-15072019-104904/
Resumo: O presente trabalho utiliza as informações da Pesquisa Anual do Comércio - PAC, uma das quatro pesquisas econômicas estruturais do IBGE, para avaliar o Modelo de Imputação atual da pesquisa comparando-o com outros modelos disponíveis na literatura. Foi feito um recorte da base da PAC-IBGE dos anos de 2014 e 2015 e foram testados vinte modelos de imputação. Na PAC, tem sido observado um aumento do impacto das não-respostas nas estimativas de seus totais. Isto deriva da alta assimetria das variáveis econômicas em conjunto com o pequeno número de empresas de alguns estratos, somados ainda ao aumento populacional de algumas atividades econômicas - e, por consequência, dos pesos amostrais - e ainda do elevado número de mortes (fechamento) de empresas pequenas. Tais problemas apresentados geram a necessidade de se estudar alternativas de tratamento para essas empresas não-respondentes. Os modelos foram analisados selecionando algumas empresas aleatoriamente e assumindo que elas não tivessem respondido à pesquisa. Posteriormente, essas empresas foram submetidas aos modelos de imputação selecionados e os resultados foram avaliados utilizando Erro Quadrático Médio (EQM) e Variação Percentual (VP) dos totais estimados contra o real. Foi escolhida a variável de RECEITA para ser usada nos testes. Os modelos utilizados podem ser agrupados em quatro grupos: de médias de respondentes; através de uma regressão com uso de variáveis auxiliares de cadastro; média dos respondentes mais próximos através de uma função distância; e através de uma regressão dos respondentes mais próximos com uso de uma função distância. Ao final das análises, verificou-se que apesar de alguns modelos também terem tido bons desempenhos, não foi observado um fator relevante que indique a troca do modelo atual de imputação utilizado na PAC-IBGE.