Um ensemble baseado em árvores de decisão para predizer a ocorrência de aglomerados de ônibus.
Ano de defesa: | 2020 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/17873 |
Resumo: | Atrasos nas viagens e superlotação de ônibus são algumas das insatisfações diárias dos usuários de transporte público. Esses problemas podem estar associados aos aglomerados de ônibus, eventos que ocorrem quando dois ou mais ônibus estão executando a mesma rota juntos, ou seja, chegam no mesmo horário nas paradas de ônibus. Devido à natureza estocástica do tráfego, um horário programado estático não é eficaz para evitar a ocorrência desses eventos; assim, são necessárias ações preventivas para melhorar a confiabilidade do sistema de transporte público. Os trabalhos já propostos no contexto preditivo de aglomerados de ônibus apresentam ainda limitações relacionadas à frequência ou privacidade dos dados utilizados, além da eficácia limitada à contextos específicos. Assim, este trabalho propõe um ensemble baseado em modelos de árvores de decisão para prever a formação de aglomerados de ônibus. O ensemble utiliza dados de geolocalização de ônibus, dados programados, dados de clima, da situação de tráfego e é composto pelos modelos Random Forest, XGBoost e CatBoost. Além disso, uma técnica de aprendizagem incremental é incorporada ao modelo proposto para continuamente atualizá-lo de acordo com a chegada de novos dados em tempo real. A eficácia do modelo é demonstrada com o uso de dados reais de duas cidades brasileiras e comparada com quatro modelos competidores: Regressão Linear, Regressão Logística, Support Vector Machine e Relevance Vector Machine. De acordo com os resultados, o modelo proposto é capaz de alcançar uma eficácia entre 73% − 80%, superior aos modelos competidores avaliados, e pode ser usado para prever a formação de aglomerados de ônibus em tempo real até dez paradas antes da ocorrência. |