Challenges in modeling count data: Bayesian models for correction of underreporting bias and estimation of mortality schedules

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Guilherme Lopes de Oliveira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Minas Gerais
Brasil
ICX - DEPARTAMENTO DE ESTATÍSTICA
Programa de Pós-Graduação em Estatística
UFMG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/37509
https://orcid.org/0000-0003-3220-6356
Resumo: Em diversas áreas do conhecimento como, por exemplo, Epidemiologia e Demografia, dados de contagem são coletados com o intuito de avaliar ou monitorar os riscos associados aos eventos de interesse. No entanto, muitas vezes esses dados não são completamente registrados. Em vez disso, apenas uma fração do verdadeiro total de eventos é observada, caracterizando o fenômeno conhecido por subnotificação, muito comum em estudos epidemiológicos. Se a subnotificação ocorre e não é levada em consideração, as inferências feitas a partir das contagens observadas serão viesadas e, consequentemente, os riscos relacionados aos eventos de interesse serão subestimados. Além da questão da subnotificação, dados de contagem podem apresentar alta esparcidade, como geralmente ocorre em estudos demográficos a respeito dos padrões de mortalidade em populações humanas. Nesta tese, nós abordamos estes problemas desafiadores comumente presentes na análise estatística baseada em dados de contagem. Dentre os modelos propostos, tem-se duas abordagens para a correção do viés de subnotificação, as quais foram publicadas em periódicos relevantes em Estatística, além de uma metodologia alternativa para a estimação e suavização de curvas de mortalidade por idade e sexo na presença de dados esparsos, a qual está em estágio de aprimoramento. Um introdução mais aprofundada sobre os problemas práticos abordados é fornecida no capítulo inicial, o qual também traz uma descrição detalhada das contribuições em cada modelo proposto. Os capítulos sequentes são apresentados no formato de coleção de artigos, os quais apresentam metodologias independentes com discussões individuais dos problemas abordados. Em todos os casos, o processo de inferência é feito sob o paradigma Bayesiano. Algumas abordagens disponíveis na literatura são discutidas e, em certos casos, utilizadas para comparação com os modelos propostos. Dados simulados e conjuntos de dados reais são utilizados para explorar e ilustrar as principais características dos modelos. O capítulo final traz um resumo compacto dos métodos e resultados obtidos nos estudos desenvolvidos ao longo da tese, destacando alguns pontos interessantes para estudos futuros.