Forecast dengue fever cases using time series models with exogenous covariates: climate, effective reproduction number, and twitter data

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Vieira, Julio Cesar de Azevedo
Orientador(a): Mendes, Eduardo Fonseca
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10438/24308
Resumo: Dengue é uma doença infecciosa que afeta países subtropicais. Autoridades de saúde locais utilizam informações sobre o número de notificações para monitorar e prever epidemias. Este trabalho foca na modelagem do número de casos de dengue semanal em quatro cidades do estado do Rio de Janeiro: Rio de Janeiro, São Gonçalo, Campos dos Goytacazes, e Petrópolis. Modelos de séries temporais são frequentemente utilizados para prever o número de casos de dengue nos próximos ciclos (semanas ou meses), particularmente, modelos SARIMA (Modelo Sazonal Autorregressivo Integrado de Médias Móveis) apresentam uma boa performance em situações distintas. Modelagens alternativas ainda incluem informação sobre o clima da região para melhorar a performance preditiva. Apesar disso, modelos que usam apenas dados históricos e de clima podem não possuir informações suficientes para capturar mudanças entre os regimes de não-epidemia e epidemia. Duas razões para isso são o atraso na notificação dos casos e que possivelmente não houveram epidemias nos anos anteriores. Baseando-se no sistema de monitoramento InfoDengue, esperasse que incluindo dados sobre ”numero de reprodução efetiva dos mosquitos”(RT) e ”número de tweets se referindo a dengue”(tweets) possam melhorar a qualidade das previsões no curto (1 semana) e longo (8 semanas) prazo. Foi possível mostrar que modelos de séries temporais incluindo RT e informações climáticas frequentemente performam melhor do que o modelo SARIMA em termos do erro preditivo quadrático médio (RMSE). Incluir a variável sobre o twitter não mostrou uma melhora no RMSE.