Detalhes bibliográficos
Ano de defesa: |
1991 |
Autor(a) principal: |
Cláudio Camargo Rodrigues |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Tecnológico de Aeronáutica
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=1838
|
Resumo: |
O problema principal pretendido neste trabalho é o controle de sistemas realimentados descritos por equações diferenciais ordinárias ou de diferenças. O excelente artigo de Astrom (4) contém os detalhes do problema de controle. Aqui, a aproximação solicitada será utilizar redes neuronais de forma análoga aquela utilizada por G. Bastos e C.W. Anderson [7}, para controle de processos industriais. O controlador é assumido ser de estrutura fixa, mas com parâmetros livres devem ser sintonizados para alcançar alguma Especificação de desempenho definida a priori. O supervisor consiste de uma rede neuronal produzindo as ações, avaliando o sucesso ou a falha da ação selecionada. No presente caso, uma ação é simplesmente um sonho no espaço de parâmetros que é usado para ajustar o controlador de estrutura fixa. A aprendizagem supervisionada é conseguida utilizando se um avaliador de desempenho, que altera convenientemente rede de ação seguindo a estratégia conexionista descrita em C.W.Anderson (2). A análise é baseada no Stochastic Learning Automata que seleciona uma ação de acordo com a distribuição de probabilidade que depende do sinal de reforço produzido pelo avaliador de desempenho. A realimentação é, por esta razão, suprida na forma de uma avaliação dos resultados no ambiente, obtidas como a conseqüência da ação escolhida. A densidade de probabilidade sobre o espaço de ações é armazenada internamente na rede neuronal, e as mudanças são incorporadas pelo ajustes dos pesos sinápticos na fase de treinamento. |