Segmentação automática de demonstrações através da modelagem de séries temporais por processos beta

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Rodrigues, Gabriel Goes
Outros Autores: http://lattes.cnpq.br/4741405070315906
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.ufam.edu.br/handle/tede/9983
Resumo: Este trabalho aborda a questão da segmentação automática de demonstrações de tarefas de manipulação dentro do contexto de Learning from Demonstration. Este é um conjunto de técnicas para programação de robôs e aprendizagem de políticas, baseado na observação de demonstrações de tarefas fornecidas por um professor humano ou robô. Para que um programador de robôs aplique o Learning from Demonstration, ele deve dividir as demonstrações em atividades ou ações antes de utilizá-las para o ensino real do robô, após esta segmentação os dados organizados são alimentados em algoritmos de aprendizagem, que são o ponto principal do LfD. Neste trabalho, foca-se na parte de segmentação do problema e propõe-se uma ferramenta de segmentação de tarefas de manipulação baseada em vídeo. A abordagem baseada em dados aqui proposta não requer nenhum conhecimento prévio de programação de robôs ou segmentação manual por parte do professor humano. Usam-se ferramentas de aprendizado de máquina prontas para uso para anotação automática de imagens e modelos de Markov ocultos autorregressivos de processo beta que aproveitam uma representação infinita baseada em recursos para criar uma ferramenta contínua e fácil de usar que atinge a segmentação semântica relevante de uma forma completamente não supervisionada. Como resultado, este método atinge uma acurácia de alinhamento temporal máxima de 96% e acurácia de classificação máxima de 86,8%, sem conhecimento prévio das ações sendo segmentadas, deixando claro que esta técnica pode ser usada para segmentar tarefas de manipulação sem a necessidade de qualquer trabalho manual além da demonstração em si.