Procedimento para geração de populações sintéticas com base em dados disponíveis no Brasil.

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Ajauskas, Rodrigo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3138/tde-04112021-120207/
Resumo: A presente pesquisa teve como objetivos principais a disponibilização de um gerador de populações sintéticas adaptado para o Brasil e a produção de uma população sintética de domicílios e indivíduos para a Região Metropolitana de São Paulo. Modelos mais modernos de previsão da demanda por transportes exigem dados de entrada desagregados sobre a população que, apesar de serem coletados por institutos nacionais de geografia e estatística, são disponibilizados apenas de forma agregada por questões de privacidade. Assim, é necessário recriar esta população com suas respectivas características, em um processo conhecido na literatura por geração de populações sintéticas. O processo se baseia principalmente em dados disponibilizados pelo Censo, nas formas de: (i) totais marginais ou de controle para cada atributo de interesse, agregados por zonas (setores censitários); e (ii) amostras da população com informações completas, porém com menor precisão espacial, no nível de região (áreas de ponderação), a serem utilizadas como matrizes semente para a geração de uma população. Considerando as diferentes abordagens teóricas e a disponibilidade de códigos livres, foi selecionado o PopulationSim como gerador de populações sintéticas para adaptação nesta dissertação. O PopulationSim pertence à categoria de métodos de reconstrução sintética e se baseia no conceito de maximização de entropia, apresentando características de flexibilidade que o tornam vantajoso em relação a outros geradores, incluindo a possibilidade de se utilizar totais de controle inconsistentes, controles em múltiplas escalas geográficas e controlar tanto atributos de domicílios como de indivíduos. Na aplicação para a Região Metropolitana de São Paulo (RMSP), foram utilizados dados do Censo 2010 do IBGE e da Pesquisa OD 2017 de São Paulo. Foram selecionados atributos no nível dos domicílios e dos indivíduos para a geração da população. Um conjunto de códigos foi desenvolvido de forma complementar para permitir a leitura das bases de dados nacionais e a preparação dos arquivos utilizados pelo PopulationSim. Foram também desenvolvidos códigos adicionais para o procedimento de validação dos resultados. Os resultados obtidos apresentam indicadores de qualidade de ajuste satisfatórios; a validação dos geradores, porém, padece da ausência de uma base real de dados desagregados da população para comparação. Os arquivos contendo a população sintética de domicílios e indivíduos para a RMSP foram disponibilizados em um repositório onde constam também um tutorial de aplicação e os códigos desenvolvidos especificamente para aplicação no Brasil.