Detalhes bibliográficos
Ano de defesa: |
2005 |
Autor(a) principal: |
Pimentel de Santana, Hugo |
Orientador(a): |
Lisboa Ramalho, Geber |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/2789
|
Resumo: |
A tarefa de patrulha pode ser encontrada em diferentes domínios, desde administração de redes de computadores a simulações de jogos de guerra. Esta é uma tarefa multi-agente complexa, que requer que os agentes participantes coordenem as suas tomadas de decisão de modo a obter um bom desempenho para o grupo como um todo. Neste trabalho, é mostrado de que maneira a tarefa da patrulha pode ser modelada como um problema de aprendizagem por reforço (AR), permitindo uma adaptação contínua e automática das estratégias dos agentes ao ambiente. Nós demonstramos que um comportamento cooperativo eficiente pode ser obtido utilizando técnicas padrão de AR, como Q-Learning, para treinar os agentes individualmente. É feita uma análise detalhada da optimalidade das soluções propostas e os resultados obtidos constituem um caso de estudo positivo no uso de técnicas de aprendizagem por reforço em sistemas multi-agentes. As reflexões e técnicas apresentadas são igualmente valiosas para outros problemas que compartilham propriedades similares. Além disto, a abordagem proposta é totalmente distribuída, o que a torna computacionalmente eficiente. A avaliação empírica comprova a eficácia da mesma, e torna este trabalho uma primeira abordagem de sucesso na obtenção de uma estratégia adaptativa para tal tarefa |