Controle inteligente de um robô móvel omnidirecional com tomada de decisão utilizando aprendizagem por reforço

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Moreira, Victor Ramon Firmo
Orientador(a): Bessa, Wallace Moreira
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/32964
Resumo: A evolução dos sistemas robóticos se tornou evidente no decorrer do tempo. Tanto pelos avanços em fabricação mecânica quanto pelos novos algoritmos utilizados, os robôs móveis têm se tornado cada vez mais independentes em suas ações. No que tange às estratégias de aprendizagem de máquina, uma atenção especial vem sendo dada aos algoritmos de aprendizagem por reforço, em virtude de suas semelhanças com o processo de aprendizado biológico. Neste trabalho propõe-se o desenvolvimento de um agente autônomo, combinando estratégias de controle inteligente com algoritmos de tomada de decisão. Para a implementação da estratégia proposta, será utilizado o robô móvel omnidirecional Robotino. Foram realizadas simulações de atuação do robô que tem por objetivo a exploração espacial de um ambiente, sendo para isso aplicado um modelo matemático específico. Para o controle do sistema, a estratégia de Linearização por Realimentação foi combinada a um compensador baseado em Redes Neurais Artificiais para lidar com as incertezas, eventuais perturbações externas e compensar a dinâmica não modelada. O algoritmo epsilon-greedy, por sua vez, foi escolhido para capacitar o robô no processo de tomada de decisão. Os resultados da implementação experimental mostram que a estratégia de controle inteligente foi eficiente e o agente inteligente proposto foi capaz de explorar o ambiente de maneira efetiva, obtendo uma alta recompensa média.