Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço

Gurzoni Junior, José Angelo

Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço

Detalhes bibliográficos
Autor(a) principal:	Gurzoni Junior, José Angelo
Data de Publicação:	2011
Tipo de documento:	Dissertação
Idioma:	por
Título da fonte:	Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
Texto Completo:	https://repositorio.fei.edu.br/handle/FEI/395
Resumo:	Agentes operando em domínios multiagentes precisam cooperar e coordenar suas ações, e em alguns casos, competir com adversários ao mesmo tempo. Muitos destes domínios são também dinâmicos, como o futebol de robôs, a exploração submarina, planetária ou os ambientes com presença humana, criando a necessidade de que os agentes sejam capazes de tomar decisões complexas e se adaptar rapidamente a novas condições. Na literatura existem resultados positivos à respeito da aplicação do Aprendizado por Reforço em problemas complexos, em parte porque os agentes que utilizam esta técnica aprendem por experiência, sem a necessidade de modelos do ambiente em que operam. Porém, os requisitos computacionais do Aprendizado por Reforço são ainda restritivos, especialmente em domínios que necessitam de resposta em tempo real. Por outro lado, muitos dos sistemas de alocação de tarefas em multi-robôs encontrados na literatura tem tempos de execução e custo computacional baixos, ideais para estas aplicações. Este trabalho apresenta uma arquitetura de alocação de tarefas em sistemas multi-robôs em que os agentes participam de leilões pelas funções de alto nível disponíveis e utilizam Aprendizado por Reforço para aprender o valor de cada uma destas funções, dada a situação em que a equipe de robôs se encontra. A arquitetura foi aplicada a uma equipe de futebol de robôs da categoria RoboCup Small Size. Foram comparados os desempenhos do mecanismo de alocação de tarefas quando agentes utilizavam valores de seus lances ajustados manualmente, quando os valores eram aprendidos por aprendizado por reforço e também por aprendizado por reforço com heurísticas. Os resultados dos experimentos mostram que,o sistema de alocação de tarefas proposto é capaz de aumentar significativamente o desempenho da equipe, quando comparado com algoritmos em que o comportamento da equipe é pré-programado.

Metadados do item

id	FEI_de19cd1cc13c65ec8f90f1efaad08f5c
oai_identifier_str	oai:repositorio.fei.edu.br:FEI/395
network_acronym_str	FEI
network_name_str	Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository_id_str
spelling	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforçoComputadores neuraisRobóticaAgentes operando em domínios multiagentes precisam cooperar e coordenar suas ações, e em alguns casos, competir com adversários ao mesmo tempo. Muitos destes domínios são também dinâmicos, como o futebol de robôs, a exploração submarina, planetária ou os ambientes com presença humana, criando a necessidade de que os agentes sejam capazes de tomar decisões complexas e se adaptar rapidamente a novas condições. Na literatura existem resultados positivos à respeito da aplicação do Aprendizado por Reforço em problemas complexos, em parte porque os agentes que utilizam esta técnica aprendem por experiência, sem a necessidade de modelos do ambiente em que operam. Porém, os requisitos computacionais do Aprendizado por Reforço são ainda restritivos, especialmente em domínios que necessitam de resposta em tempo real. Por outro lado, muitos dos sistemas de alocação de tarefas em multi-robôs encontrados na literatura tem tempos de execução e custo computacional baixos, ideais para estas aplicações. Este trabalho apresenta uma arquitetura de alocação de tarefas em sistemas multi-robôs em que os agentes participam de leilões pelas funções de alto nível disponíveis e utilizam Aprendizado por Reforço para aprender o valor de cada uma destas funções, dada a situação em que a equipe de robôs se encontra. A arquitetura foi aplicada a uma equipe de futebol de robôs da categoria RoboCup Small Size. Foram comparados os desempenhos do mecanismo de alocação de tarefas quando agentes utilizavam valores de seus lances ajustados manualmente, quando os valores eram aprendidos por aprendizado por reforço e também por aprendizado por reforço com heurísticas. Os resultados dos experimentos mostram que,o sistema de alocação de tarefas proposto é capaz de aumentar significativamente o desempenho da equipe, quando comparado com algoritmos em que o comportamento da equipe é pré-programado.Agents operating in multi-agent domains need to cooperate and coordinate their actions, while, in some instances, also competiting with adversaries. Many of these domains are also dynamic, such as robot soccer, submarine or planetary exploration, and the environments with human presence, thus creating the need to have agents able to take complex decisions and to quickly adapt to new conditions. There are positive results in the literature regarding the employment of Reinforcement Learning in complex problems, partially because agents using this technique can learn by experience, without the need to know models of the environment they operate in. However, computational costs of the Reinforcement Learning algorithms are still restrictive, especially in applications requiring real time responses. On the other hand, many of the multi-robot task allocation systems found in literature have low execution times and computational cost, making them ideal for this kind of application. This work presents a multi-robot task allocation architecture where agents participate in auctions for the available high level functions and use Reinforcement Learning techniques to learn the value of each of these functions, given the situation of the team at that point in the match. The architecture is applied to a RoboCup Small Size league robot soccer team. The performance of the task allocation mechanism is compared among the cases when the agents use manually adjusted bidding values, when these values are learned by Reinforcement Learning and also by Heuristically Accelerated Reinforcement Learning. The results show that the proposed task allocation system is capable of significantly increasing the team performance, when compared to algorithms which pre-program the team behavior.Centro Universitário da FEI, São Bernardo do CampoBianchi, Reinaldo Augusto da CostaGurzoni Junior, José Angelo2019-03-20T14:00:48Z2019-03-20T14:00:48Z2011info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGURZONI JUNIOR, José Angelo. <b> Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço. </b> 2011. il. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2011 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=170>. Acesso em: 5 maio 2011.https://repositorio.fei.edu.br/handle/FEI/395porpt_BRreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2024-03-01T22:48:32Zoai:repositorio.fei.edu.br:FEI/395Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2024-03-01T22:48:32Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
title	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
spellingShingle	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço Gurzoni Junior, José Angelo Computadores neurais Robótica
title_short	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
title_full	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
title_fullStr	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
title_full_unstemmed	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
title_sort	Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço
author	Gurzoni Junior, José Angelo
author_facet	Gurzoni Junior, José Angelo
author_role	author
dc.contributor.none.fl_str_mv	Bianchi, Reinaldo Augusto da Costa
dc.contributor.author.fl_str_mv	Gurzoni Junior, José Angelo
dc.subject.por.fl_str_mv	Computadores neurais Robótica
topic	Computadores neurais Robótica
description	Agentes operando em domínios multiagentes precisam cooperar e coordenar suas ações, e em alguns casos, competir com adversários ao mesmo tempo. Muitos destes domínios são também dinâmicos, como o futebol de robôs, a exploração submarina, planetária ou os ambientes com presença humana, criando a necessidade de que os agentes sejam capazes de tomar decisões complexas e se adaptar rapidamente a novas condições. Na literatura existem resultados positivos à respeito da aplicação do Aprendizado por Reforço em problemas complexos, em parte porque os agentes que utilizam esta técnica aprendem por experiência, sem a necessidade de modelos do ambiente em que operam. Porém, os requisitos computacionais do Aprendizado por Reforço são ainda restritivos, especialmente em domínios que necessitam de resposta em tempo real. Por outro lado, muitos dos sistemas de alocação de tarefas em multi-robôs encontrados na literatura tem tempos de execução e custo computacional baixos, ideais para estas aplicações. Este trabalho apresenta uma arquitetura de alocação de tarefas em sistemas multi-robôs em que os agentes participam de leilões pelas funções de alto nível disponíveis e utilizam Aprendizado por Reforço para aprender o valor de cada uma destas funções, dada a situação em que a equipe de robôs se encontra. A arquitetura foi aplicada a uma equipe de futebol de robôs da categoria RoboCup Small Size. Foram comparados os desempenhos do mecanismo de alocação de tarefas quando agentes utilizavam valores de seus lances ajustados manualmente, quando os valores eram aprendidos por aprendizado por reforço e também por aprendizado por reforço com heurísticas. Os resultados dos experimentos mostram que,o sistema de alocação de tarefas proposto é capaz de aumentar significativamente o desempenho da equipe, quando comparado com algoritmos em que o comportamento da equipe é pré-programado.
publishDate	2011
dc.date.none.fl_str_mv	2011 2019-03-20T14:00:48Z 2019-03-20T14:00:48Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	GURZONI JUNIOR, José Angelo. <b> Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço. </b> 2011. il. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2011 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=170>. Acesso em: 5 maio 2011. https://repositorio.fei.edu.br/handle/FEI/395
identifier_str_mv	GURZONI JUNIOR, José Angelo. <b> Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço. </b> 2011. il. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da Fei, São Bernardo do Campo, 2011 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=170>. Acesso em: 5 maio 2011.
url	https://repositorio.fei.edu.br/handle/FEI/395
dc.language.iso.fl_str_mv	por pt_BR
language	por
language_invalid_str_mv	pt_BR
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv	Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv	reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI
instname_str	Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str	FEI
institution	FEI
reponame_str	Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
collection	Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.name.fl_str_mv	Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv	cfernandes@fei.edu.br
_version_	1850044143856779264

Uma arquitetura de alocação de tarefas para sistemas multi-robôs utilizando aprendizado por reforço

Registros relacionados