Patrulha multi-agente com aprendizagem por reforço

Detalhes bibliográficos
Ano de defesa: 2005
Autor(a) principal: Pimentel de Santana, Hugo
Orientador(a): Lisboa Ramalho, Geber
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/2789
Resumo: A tarefa de patrulha pode ser encontrada em diferentes domínios, desde administração de redes de computadores a simulações de jogos de guerra. Esta é uma tarefa multi-agente complexa, que requer que os agentes participantes coordenem as suas tomadas de decisão de modo a obter um bom desempenho para o grupo como um todo. Neste trabalho, é mostrado de que maneira a tarefa da patrulha pode ser modelada como um problema de aprendizagem por reforço (AR), permitindo uma adaptação contínua e automática das estratégias dos agentes ao ambiente. Nós demonstramos que um comportamento cooperativo eficiente pode ser obtido utilizando técnicas padrão de AR, como Q-Learning, para treinar os agentes individualmente. É feita uma análise detalhada da optimalidade das soluções propostas e os resultados obtidos constituem um caso de estudo positivo no uso de técnicas de aprendizagem por reforço em sistemas multi-agentes. As reflexões e técnicas apresentadas são igualmente valiosas para outros problemas que compartilham propriedades similares. Além disto, a abordagem proposta é totalmente distribuída, o que a torna computacionalmente eficiente. A avaliação empírica comprova a eficácia da mesma, e torna este trabalho uma primeira abordagem de sucesso na obtenção de uma estratégia adaptativa para tal tarefa