Aprendizado por reforço profundo para navegação de robôs móveis
Main Author: | |
---|---|
Publication Date: | 2019 |
Language: | por |
Source: | Manancial - Repositório Digital da UFSM |
dARK ID: | ark:/26339/001300000rdkt |
Download full: | http://repositorio.ufsm.br/handle/1/26618 |
Summary: | Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019. |
id |
UFSM_f920ec78b82a210fc4d64dba202504c5 |
---|---|
oai_identifier_str |
oai:repositorio.ufsm.br:1/26618 |
network_acronym_str |
UFSM |
network_name_str |
Manancial - Repositório Digital da UFSM |
repository_id_str |
|
spelling |
Aprendizado por reforço profundo para navegação de robôs móveisDeep reinforcement learning for navigation of mobile robotsPolítica de Gradiente Determinística ProfundaAtor-Crítica SuaveAprendizado por Reforço ProfundoNavegação de RobôsDeep Deterministic Policy GradientSoft Actor-CriticDeep Reinforcement LearningRobot’s NavigationCNPQ::ENGENHARIASTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019.This work presents a study of deep reinforcement learning techniques that uses the Deep Deterministic Policy Gradient network and the Soft Actor-Critic network for application in navigation of mobile robots. In order for the robot to arrive to a target on a map, the networks have as input: 10 laser range findings, the previous linear and angular velocity, and relative position and angle of the mobile robot to the target. As output, the network has the linear and angular velocity. From the results analysis, it is possible to conclude that the deep reinforcement learning algorithms, with continuous actions, are effective for the decision-making of robotic vehicles and the Soft Actor-Critic networks present superior results, in less episodes, than the Deep Deterministic Policy Gradient. However, it is necessary to create a good reward function for the intelligent agent to accomplish its objectives. In order to show the performance of the Deep Reinforcement Learning Algorithms, they were applied in experiments with a simulated robot in three different environments and in a real robot in two environments.Este trabalho apresenta um estudo de técnicas de aprendizado profundo usando a rede de Política de Gradiente Determinística Profunda e a rede de Ator-Crítica Suave para a aplicação na navegação de robô móveis. Para que o robô consiga chegar até um determinado alvo em um mapa, as redes têm como entrada: 10 leituras do sensor laser, a velocidade linear e angular anterior do robô, e a posição relativa e ângulo do robô móvel até o alvo. Como saída, as redes têm a velocidade linear e angular. Dos resultados analisados, é possível concluir que os algoritmos de aprendizado por reforço profundo, com ações contínuas, são efetivos para a tomada de decisão de um veículo robótico, e que as redes de Ator-Crítica Suave apresentam resultados superiores, em menos episódios, que as redes de Política de Gradiente Determinística Profunda. Contudo, é necessário criar uma boa função de recompensa para que o agente inteligente consiga realizar seus objetivos. Para mostrar o desempenho dos algoritmos de Aprendizado por Reforço Profundo, foram aplicados os algoritmos nos experimentos com um robô simulado em três ambientes diferentes e um robô real em dois ambientes.Universidade Federal de Santa MariaBrasilUFSMCentro de TecnologiaGamarra, Daniel Fernando TelloJesus, Junior Costa de2022-10-21T16:44:18Z2022-10-21T16:44:18Z2019-12-112019Trabalho de Conclusão de Curso de Graduaçãoinfo:eu-repo/semantics/publishedVersionapplication/pdfJESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019.http://repositorio.ufsm.br/handle/1/26618ark:/26339/001300000rdktporAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2022-10-21T16:44:18Zoai:repositorio.ufsm.br:1/26618Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/PUBhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.bropendoar:2022-10-21T16:44:18Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false |
dc.title.none.fl_str_mv |
Aprendizado por reforço profundo para navegação de robôs móveis Deep reinforcement learning for navigation of mobile robots |
title |
Aprendizado por reforço profundo para navegação de robôs móveis |
spellingShingle |
Aprendizado por reforço profundo para navegação de robôs móveis Jesus, Junior Costa de Política de Gradiente Determinística Profunda Ator-Crítica Suave Aprendizado por Reforço Profundo Navegação de Robôs Deep Deterministic Policy Gradient Soft Actor-Critic Deep Reinforcement Learning Robot’s Navigation CNPQ::ENGENHARIAS |
title_short |
Aprendizado por reforço profundo para navegação de robôs móveis |
title_full |
Aprendizado por reforço profundo para navegação de robôs móveis |
title_fullStr |
Aprendizado por reforço profundo para navegação de robôs móveis |
title_full_unstemmed |
Aprendizado por reforço profundo para navegação de robôs móveis |
title_sort |
Aprendizado por reforço profundo para navegação de robôs móveis |
author |
Jesus, Junior Costa de |
author_facet |
Jesus, Junior Costa de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Gamarra, Daniel Fernando Tello |
dc.contributor.author.fl_str_mv |
Jesus, Junior Costa de |
dc.subject.por.fl_str_mv |
Política de Gradiente Determinística Profunda Ator-Crítica Suave Aprendizado por Reforço Profundo Navegação de Robôs Deep Deterministic Policy Gradient Soft Actor-Critic Deep Reinforcement Learning Robot’s Navigation CNPQ::ENGENHARIAS |
topic |
Política de Gradiente Determinística Profunda Ator-Crítica Suave Aprendizado por Reforço Profundo Navegação de Robôs Deep Deterministic Policy Gradient Soft Actor-Critic Deep Reinforcement Learning Robot’s Navigation CNPQ::ENGENHARIAS |
description |
Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-12-11 2019 2022-10-21T16:44:18Z 2022-10-21T16:44:18Z |
dc.type.driver.fl_str_mv |
Trabalho de Conclusão de Curso de Graduação |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
JESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019. http://repositorio.ufsm.br/handle/1/26618 |
dc.identifier.dark.fl_str_mv |
ark:/26339/001300000rdkt |
identifier_str_mv |
JESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019. ark:/26339/001300000rdkt |
url |
http://repositorio.ufsm.br/handle/1/26618 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Santa Maria Brasil UFSM Centro de Tecnologia |
publisher.none.fl_str_mv |
Universidade Federal de Santa Maria Brasil UFSM Centro de Tecnologia |
dc.source.none.fl_str_mv |
reponame:Manancial - Repositório Digital da UFSM instname:Universidade Federal de Santa Maria (UFSM) instacron:UFSM |
instname_str |
Universidade Federal de Santa Maria (UFSM) |
instacron_str |
UFSM |
institution |
UFSM |
reponame_str |
Manancial - Repositório Digital da UFSM |
collection |
Manancial - Repositório Digital da UFSM |
repository.name.fl_str_mv |
Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM) |
repository.mail.fl_str_mv |
atendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.br |
_version_ |
1838454064487071744 |