Auto-organização e aprendizagem por demonstração na determinação de marcha robótica

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: SANTANA JÚNIOR, Orivaldo Vieira de
Orientador(a): ARAÚJO, Aluizio Fausto Ribeiro
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/14928
Resumo: Esta Tese apresenta uma abordagem para o problema de locomoção de robôs com patas. Esta abordagem tem como base aprendizagem, planejamento e controle da movimentação dos membro inferiores para deslocar um robô de um local para outro. O sistema construído com a abordagem proposta produz padrões de saída semelhantes àqueles gerados por um Gerador Central de Padrões (CPG) para controlar as articulações de um robô. Os algoritmos propostos são capazes de, com um comando simples, mudar a velocidade de deslocamento do robô e de gerar sinais sincronizados e rítmicos para as articulações. O processo de aprendizagem da movimentação dos membros inferiores pode ser aplicado em diferentes robôs na aprendizagem de diversos modos de locomoção. Neste processo não é necessário determinar um conjunto de equações e seus parâmetros para cada robô. A informação necessária para a aprendizagem da movimentação das pernas de um robô é extraída dos dados observados e organizada em estados. O controle das articulações do robô é realizado com dados oriundos do conteúdo dos estados de uma trajetória através de Controle Guiado por Dados (DDC). Os dados contidos nos estados devem informar direta ou indiretamente a posição angular desejada para cada articulação. O agente aprendiz, implementado com a abordagem proposta, gera uma representação interna da movimentação dos membros através de um processo de auto-organização na qual conexões determinam a transição entre estados. Estas conexões são criadas entre estados próximos com o objetivo de gerar uma trajetória cíclica. Dois Mapas Auto-organizáveis (SOMs) de topologia variante no tempo foram implementados para o processo de aprendizagem da abordagem proposta: Gerador de Trajetória de Estados Auto-Organizável (SOM-STG) e Gerador de Trajetória de Estados Cíclica Auto-Organizável (SOM-CSTG). O mapa SOM-CSTG é uma evolução de SOM-STG e surgiu para superar algumas limitações do primeiro. O objetivo destes mapas é aprender posturas e conectá-las para construir trajetórias usadas para controlar a marcha do robô. A aquisição de dados de treinamento das redes é baseada em aprendizagem por demonstração, na qual, os estados (posturas) são aprendidos a partir de um agente demonstrador. Estes mapas são capazes de aprender com dados coletados a partir do sinal de saída de um CPG, de sensores sobre um agente demonstrador ou de observações externas ao agente demonstrador, como por imagens de vídeo. Uma trajetória cíclica de estados gerada por estes mapas, quando executada conduz o movimento dos membros do robô de maneira semelhante aos padrões de movimentação presentes nos dados de treinamento (marchas). Os testes de aprendizagem foram realizados com dados de um robô simulado de seis patas, de um animal de quatro patas e dados da locomoção humana. Os testes de planejamento e controle de movimentos foram realizados com um robô simulado de seis patas e um robô simulado de quatro patas.