Aprendizado por reforço profundo para navegação de robôs móveis

Bibliographic Details
Main Author: Jesus, Junior Costa de
Publication Date: 2019
Language: por
Source: Manancial - Repositório Digital da UFSM
dARK ID: ark:/26339/001300000rdkt
Download full: http://repositorio.ufsm.br/handle/1/26618
Summary: Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019.
id UFSM_f920ec78b82a210fc4d64dba202504c5
oai_identifier_str oai:repositorio.ufsm.br:1/26618
network_acronym_str UFSM
network_name_str Manancial - Repositório Digital da UFSM
repository_id_str
spelling Aprendizado por reforço profundo para navegação de robôs móveisDeep reinforcement learning for navigation of mobile robotsPolítica de Gradiente Determinística ProfundaAtor-Crítica SuaveAprendizado por Reforço ProfundoNavegação de RobôsDeep Deterministic Policy GradientSoft Actor-CriticDeep Reinforcement LearningRobot’s NavigationCNPQ::ENGENHARIASTrabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019.This work presents a study of deep reinforcement learning techniques that uses the Deep Deterministic Policy Gradient network and the Soft Actor-Critic network for application in navigation of mobile robots. In order for the robot to arrive to a target on a map, the networks have as input: 10 laser range findings, the previous linear and angular velocity, and relative position and angle of the mobile robot to the target. As output, the network has the linear and angular velocity. From the results analysis, it is possible to conclude that the deep reinforcement learning algorithms, with continuous actions, are effective for the decision-making of robotic vehicles and the Soft Actor-Critic networks present superior results, in less episodes, than the Deep Deterministic Policy Gradient. However, it is necessary to create a good reward function for the intelligent agent to accomplish its objectives. In order to show the performance of the Deep Reinforcement Learning Algorithms, they were applied in experiments with a simulated robot in three different environments and in a real robot in two environments.Este trabalho apresenta um estudo de técnicas de aprendizado profundo usando a rede de Política de Gradiente Determinística Profunda e a rede de Ator-Crítica Suave para a aplicação na navegação de robô móveis. Para que o robô consiga chegar até um determinado alvo em um mapa, as redes têm como entrada: 10 leituras do sensor laser, a velocidade linear e angular anterior do robô, e a posição relativa e ângulo do robô móvel até o alvo. Como saída, as redes têm a velocidade linear e angular. Dos resultados analisados, é possível concluir que os algoritmos de aprendizado por reforço profundo, com ações contínuas, são efetivos para a tomada de decisão de um veículo robótico, e que as redes de Ator-Crítica Suave apresentam resultados superiores, em menos episódios, que as redes de Política de Gradiente Determinística Profunda. Contudo, é necessário criar uma boa função de recompensa para que o agente inteligente consiga realizar seus objetivos. Para mostrar o desempenho dos algoritmos de Aprendizado por Reforço Profundo, foram aplicados os algoritmos nos experimentos com um robô simulado em três ambientes diferentes e um robô real em dois ambientes.Universidade Federal de Santa MariaBrasilUFSMCentro de TecnologiaGamarra, Daniel Fernando TelloJesus, Junior Costa de2022-10-21T16:44:18Z2022-10-21T16:44:18Z2019-12-112019Trabalho de Conclusão de Curso de Graduaçãoinfo:eu-repo/semantics/publishedVersionapplication/pdfJESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019.http://repositorio.ufsm.br/handle/1/26618ark:/26339/001300000rdktporAttribution-NonCommercial-NoDerivatives 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessreponame:Manancial - Repositório Digital da UFSMinstname:Universidade Federal de Santa Maria (UFSM)instacron:UFSM2022-10-21T16:44:18Zoai:repositorio.ufsm.br:1/26618Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufsm.br/PUBhttps://repositorio.ufsm.br/oai/requestatendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.bropendoar:2022-10-21T16:44:18Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)false
dc.title.none.fl_str_mv Aprendizado por reforço profundo para navegação de robôs móveis
Deep reinforcement learning for navigation of mobile robots
title Aprendizado por reforço profundo para navegação de robôs móveis
spellingShingle Aprendizado por reforço profundo para navegação de robôs móveis
Jesus, Junior Costa de
Política de Gradiente Determinística Profunda
Ator-Crítica Suave
Aprendizado por Reforço Profundo
Navegação de Robôs
Deep Deterministic Policy Gradient
Soft Actor-Critic
Deep Reinforcement Learning
Robot’s Navigation
CNPQ::ENGENHARIAS
title_short Aprendizado por reforço profundo para navegação de robôs móveis
title_full Aprendizado por reforço profundo para navegação de robôs móveis
title_fullStr Aprendizado por reforço profundo para navegação de robôs móveis
title_full_unstemmed Aprendizado por reforço profundo para navegação de robôs móveis
title_sort Aprendizado por reforço profundo para navegação de robôs móveis
author Jesus, Junior Costa de
author_facet Jesus, Junior Costa de
author_role author
dc.contributor.none.fl_str_mv Gamarra, Daniel Fernando Tello
dc.contributor.author.fl_str_mv Jesus, Junior Costa de
dc.subject.por.fl_str_mv Política de Gradiente Determinística Profunda
Ator-Crítica Suave
Aprendizado por Reforço Profundo
Navegação de Robôs
Deep Deterministic Policy Gradient
Soft Actor-Critic
Deep Reinforcement Learning
Robot’s Navigation
CNPQ::ENGENHARIAS
topic Política de Gradiente Determinística Profunda
Ator-Crítica Suave
Aprendizado por Reforço Profundo
Navegação de Robôs
Deep Deterministic Policy Gradient
Soft Actor-Critic
Deep Reinforcement Learning
Robot’s Navigation
CNPQ::ENGENHARIAS
description Trabalho de conclusão de curso (graduação) - Universidade Federal de Santa Maria, Centro de Tecnologia, Curso de Engenharia de Controle e Automação, RS, 2019.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-11
2019
2022-10-21T16:44:18Z
2022-10-21T16:44:18Z
dc.type.driver.fl_str_mv Trabalho de Conclusão de Curso de Graduação
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
status_str publishedVersion
dc.identifier.uri.fl_str_mv JESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019.
http://repositorio.ufsm.br/handle/1/26618
dc.identifier.dark.fl_str_mv ark:/26339/001300000rdkt
identifier_str_mv JESUS, J. C. de. Aprendizado por reforço profundo para navegação de robôs móveis. 2019. 79 p. Trabalho de Conclusão de Curso (Graduação em Engenharia de Controle e Automação)- Universidade Federal de Santa Maria, Santa Maria, RS, 2019.
ark:/26339/001300000rdkt
url http://repositorio.ufsm.br/handle/1/26618
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Santa Maria
Brasil
UFSM
Centro de Tecnologia
publisher.none.fl_str_mv Universidade Federal de Santa Maria
Brasil
UFSM
Centro de Tecnologia
dc.source.none.fl_str_mv reponame:Manancial - Repositório Digital da UFSM
instname:Universidade Federal de Santa Maria (UFSM)
instacron:UFSM
instname_str Universidade Federal de Santa Maria (UFSM)
instacron_str UFSM
institution UFSM
reponame_str Manancial - Repositório Digital da UFSM
collection Manancial - Repositório Digital da UFSM
repository.name.fl_str_mv Manancial - Repositório Digital da UFSM - Universidade Federal de Santa Maria (UFSM)
repository.mail.fl_str_mv atendimento.sib@ufsm.br||tedebc@gmail.com||manancial@ufsm.br
_version_ 1838454064487071744