Controlador auto-sintonizável usando redes neuronais com aprendizagem supervisionada e sinais de reforço

Cláudio Camargo Rodrigues

Controlador auto-sintonizável usando redes neuronais com aprendizagem supervisionada e sinais de reforço

Detalhes bibliográficos
Ano de defesa:	1991
Autor(a) principal:	Cláudio Camargo Rodrigues
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Instituto Tecnológico de Aeronáutica
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Controladores Redes neurais Controle automático Computação
Link de acesso:	http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=1838
Resumo:	O problema principal pretendido neste trabalho é o controle de sistemas realimentados descritos por equações diferenciais ordinárias ou de diferenças. O excelente artigo de Astrom (4) contém os detalhes do problema de controle. Aqui, a aproximação solicitada será utilizar redes neuronais de forma análoga aquela utilizada por G. Bastos e C.W. Anderson [7}, para controle de processos industriais. O controlador é assumido ser de estrutura fixa, mas com parâmetros livres devem ser sintonizados para alcançar alguma Especificação de desempenho definida a priori. O supervisor consiste de uma rede neuronal produzindo as ações, avaliando o sucesso ou a falha da ação selecionada. No presente caso, uma ação é simplesmente um sonho no espaço de parâmetros que é usado para ajustar o controlador de estrutura fixa. A aprendizagem supervisionada é conseguida utilizando se um avaliador de desempenho, que altera convenientemente rede de ação seguindo a estratégia conexionista descrita em C.W.Anderson (2). A análise é baseada no Stochastic Learning Automata que seleciona uma ação de acordo com a distribuição de probabilidade que depende do sinal de reforço produzido pelo avaliador de desempenho. A realimentação é, por esta razão, suprida na forma de uma avaliação dos resultados no ambiente, obtidas como a conseqüência da ação escolhida. A densidade de probabilidade sobre o espaço de ações é armazenada internamente na rede neuronal, e as mudanças são incorporadas pelo ajustes dos pesos sinápticos na fase de treinamento.

Controlador auto-sintonizável usando redes neuronais com aprendizagem supervisionada e sinais de reforço

Registros relacionados