Q-learning baseado em pedágios com pagamento circunstancial

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Santos, Timóteo Fonseca
Outros Autores: http://lattes.cnpq.br/8674721821568306
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Ciências da Comunicação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.ufam.edu.br/handle/tede/9659
Resumo: Congestionamentos são um problema recorrente nas grandes cidades, resultando em perda de produtividade, poluição e diminuição da qualidade de vida. As técnicas existentes para resolução de congestionamentos de tráfego nem sempre são eficazes ou economicamente viáveis. No entanto, a implementação de sistemas de pedágio para controlar o fluxo de tráfego em áreas movimentadas já chegou a mostrar melhorias observáveis. A análise matemática e a simulação virtual surgem como ferramentas úteis para avaliar o custo-benefício de cada abordagem. Mitigar congestionamentos envolve equilibrar o desempenho ideal do sistema e o equilíbrio do usuário, exigindo incentivos para tornar alinhados o comportamento individual do motorista com melhorias no desempenho do sistema. Há uma ampla base teórica apoiando a eficácia de abordagens baseadas em pedágio. No entanto, a premissa comum de que todos os motoristas pagam pedágio pode limitar a eficiência dos modelos no mundo real devido a evasão ou limitações econômicas. Abordando esses desafios, este trabalho explora os impactos de diferentes níveis e modos de participação em sistemas de pedágio. Adaptamos uma abordagem baseada em pedágio existente para introduzir diversos cenários de pagamento seletivo de pedágio, e investigamos a viabilidade da adoção gradual de sistemas tarifários. Tendo implementado uma variação do algoritmo TQ-learning, conseguimos controlar parâmetros como a proporção de motoristas que pagam pedágio ou a proporção de ruas mais movimentadas onde o pedágio é obrigatório. Por meio de experimentos em múltiplas proporções, apresentamos resultados que ampliam a base de conhecimento para a tomada de decisão prática na resolução de congestionamentos. Nossas descobertas demonstram que quando o sistema de pedágio é implementado gradualmente por meio do crescente número de usuários que pagam regularmente, os ganhos são constantes e sem introduzir comportamento caótico. No entanto, ao introduzir pedágios por elos ou rotas dos mais aos menos movimentados, os resultados foram, na melhor das hipóteses, inconclusivos e, na pior, provocaram uma deterioração do desempenho do sistema em comparação com a ausência de implementação.