Controlador auto-sintonizável usando redes neuronais com aprendizagem supervisionada e sinais de reforço

Detalhes bibliográficos
Ano de defesa: 1991
Autor(a) principal: Cláudio Camargo Rodrigues
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto Tecnológico de Aeronáutica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=1838
Resumo: O problema principal pretendido neste trabalho é o controle de sistemas realimentados descritos por equações diferenciais ordinárias ou de diferenças. O excelente artigo de Astrom (4) contém os detalhes do problema de controle. Aqui, a aproximação solicitada será utilizar redes neuronais de forma análoga aquela utilizada por G. Bastos e C.W. Anderson [7}, para controle de processos industriais. O controlador é assumido ser de estrutura fixa, mas com parâmetros livres devem ser sintonizados para alcançar alguma Especificação de desempenho definida a priori. O supervisor consiste de uma rede neuronal produzindo as ações, avaliando o sucesso ou a falha da ação selecionada. No presente caso, uma ação é simplesmente um sonho no espaço de parâmetros que é usado para ajustar o controlador de estrutura fixa. A aprendizagem supervisionada é conseguida utilizando se um avaliador de desempenho, que altera convenientemente rede de ação seguindo a estratégia conexionista descrita em C.W.Anderson (2). A análise é baseada no Stochastic Learning Automata que seleciona uma ação de acordo com a distribuição de probabilidade que depende do sinal de reforço produzido pelo avaliador de desempenho. A realimentação é, por esta razão, suprida na forma de uma avaliação dos resultados no ambiente, obtidas como a conseqüência da ação escolhida. A densidade de probabilidade sobre o espaço de ações é armazenada internamente na rede neuronal, e as mudanças são incorporadas pelo ajustes dos pesos sinápticos na fase de treinamento.