Professional Documents
Culture Documents
Resumo. O presente trabalho descreve o projeto e anlise de um controlador robusto LQG/LTR em um manipulador
robtico usando um modelo inteligente gentico neuronal. O manipulador robtico a ser controlado atua diretamente
sobre o ambiente-alvo que deve ser controlado, de modo que as foras de impacto e as foras de estado estacionrio no
danifiquem o alvo. A dinmica do manipulador em malha fechada dada de forma desacoplada, pelas dinmicas da
planta nominal com realimentao direta dos estados e do observador estocstico de estados. Desta forma, objetiva-se
recuperar as propriedades de desempenho e estabilidade robustos que so perdidas com a insero de um estimador
estocstico. A metodologia do projeto LQG/ LTR, atravs do qual estas propriedades de robustez so recuperadas,
formulada pela definio da malha objetivo e em seguida, por meio de um procedimento assinttico que recupera as
caractersticas de resposta em freqncia dessa malha, ajustando um parmetro que iro gerar valores singulares cada
vez mais prximos, usando um algoritmo gentico, em um diagrama de Bode multivarivel. A sintonia realizada
por variaes paramtricas na equao de Riccati coordenadas por um algoritmo gentico e decomposio em valores
singulares. Os resultados oriundos do projeto LQG/LTR permitiram um melhor desempenho com relao a robustez, o
que tambm foi comprovado ao se avaliar as barreiras de desempenho e estabilidade robustas.
Palavras-chave: algoritmo gentico, rede neuronal, equao de Riccati, decomposio em valores singulares, diagrama
de Bode multivarivel.
1. INTRODUO
Este pesquisa apresenta os conceitos bsicos de controle robusto para sistemas lineares e invariantes no tempo (LIT),
em particular, um manipulador robtico. O desenvolvimento deste trabalho realizado nos domnios do tempo e da
freqncia, utilizando-se o diagrama de Bode multivarivel. Discute-se as questes de estabilidade e desempenho robustos
em malha fechada, utilizando-se a tcnica LQG/LTR. Um dos itens de maior ateno da comunidade cientfica de controle
o estudo da robustez dos sistemas de realimentao (Doyle and Stein, 1979).
A robustez uma caracterstica desejvel dos sistemas de controle por duas razes. A primeira diz respeito a preocupao permanente do projetista com que os sistemas de controle funcionem de forma satisfatria, ainda que as condies
de operao sejam distintas daquelas consideradas no modelo de projeto (nominal). E em segundo lugar, as condies
de robustez devem ser utilizadas com o objetivo de se adotar um modelo de projeto intencionalmente simplificado para
facilitar a anlise, e seu impacto sobre a complexidade do controlador resultante.
A metodologia consiste de uma tcnica de projeto de controladores utilizada em sistemas dinmicos multivariveis.
Justifica-se seu uso pela robustez do controlador garantida em face de uma ampla classe de erros de modelagem, a tcnica
empregada em sistemas MIMO, o procedimento do projeto de natureza sistemtica e que a metodologia se fundamenta
numa abordagem freqncial em sistemas MIMO (da Cruz, 1996).
As ferramentas empregadas para o desenvolvimento do projeto do controlador robusto LQG/LTR, so o projeto do
Regulador Linear Quadrtico (LQR) e o Filtro de Kalman (FK) que justifica o projeto LQG (Linear Quagrtico Gaussiano).
Estas ferramentas no sero interpretadas de forma usual em controle timo estocstico, mas utilizadas em funo de suas
propriedades. Neste trabalho, apresenta-se uma metodologia de projeto que permita a determinao de um compensador,
a ser localizado no ramo direto da malha de controle, de modo que sejam atendidos os requisitos de desempenho e
estabilidade. A seguir, descreve-se o manipulador robtico, onde ser empregada a abordagem de controle robusto.
O procedimento de recuperao das propriedades de robustez, perdidas com a estimao das variveis de estados, ,
segundo Doyle and Stein (1979), realizado pelo procedimento LTR (Recuperao da Malha de Transferncia), uma vez
que o manipulador robtico em questo possui zeros de transmisso no semiplano esquerdo (zeros de fase mnima). O
procedimento de recuperao da malha de transferncia est associado matriz de funo de transferncia de malha,
K(s)GN (s), que corresponde a abertura da malha na entrada da planta (ponto (i)), ver Figura 1. Neste procedimento,
supe-se fixada convenientemente a princpio a matriz K do compensador, enquanto que a matriz L do observador de
estado varivel.
Esta alternativa consistente com a anlise atravs dos valores singulares de K(s)GN (s) considerada para traduzir
as especificaes do sistema de controle por meio das restries do seu diagrama de Bode multivarivel. Alm disso,
admite-se que a matriz L tenha sido escolhida de modo que Real[i (A KC)] < 0, i = 1, . . . , n, em quanto o ganho do
observador de estados L varivel (da Cruz, 1996).
Como se trata de um problema de controle robusto, a avaliao do desempenho e estabilidade robustas do controlador
LQG/LTR proposto, deu-se por meio da anlise das barreiras de desempenho e estabilidade, segundo da Cruz (1996).
2. MANIPULADOR ROBTICO
Os manipuladores robticos modernos que atuam diretamente sobre o ambiente devem ser controlados de modo que
as foras de impacto, bem como as foras em regime permanente, no danifiquem os objetos. Ao mesmo tempo, o
manipulador deve fornecer uma fora suficiente para executar a tarefa. Ento, para desenvolver um sistema de controle
para regular essas foras, o manipulador robtico e o ambiente devem ser modelados. Admitindo o modelo ilustrado na
Figura 2 tem-se um sistema de quarta ordem com representao no espao de estados. O esquema a seguir consiste de
manipulador, sensor, e ambiente (Chiu and Lee, 1997).
O manipulador deve posicionar o sensor sobre a superfcie de contato de forma controlada para no causar danos a
nenhum dos componentes, ento, a sada do sistema o deslocamento do sensor, e a entrada seria um excitao u(t). O
sistema inclui ainda dois regimes, um sem contato e outro com contato do sensor superfcie de contato. Porm o sistema
um s, ento deve ser encontrada uma nica funo que descreva a dinmica do sistema como um todo. O sistema na
Figura 2 ilustra dois regimes, um sem contato com o meio ambiente e o outro com contato com o meio ambiente. Para
cada regime a dinmica do sistema diferente. Desta forma ser analisado o regime sem contato para testar a metodologia.
(1)
(2)
(3)
(4)
sendo pi os pesos das i-simas sensibilidades Si /i normalizadas com relao i-sima especificao de projeto i . Este
modelo aborda desde a representao gentica das matrizes de ponderao, passando pelas operaes cromossmicas, at
chegar s avaliaes de fitness (desempenho).
Percebe-se que a mesma constitui uma estrutura de otimizao muito complexa, uma vez que, envolve a soluo do
projeto LQR e o clculo dos autovalores de malha fechada. O desempenho de cada cromossomo do indivduo que compe
a populao QR nind. xg avaliado e cada indivduo QR z pontuado. Kz o ganho gerado por um indivduo, Az a
matriz de malha fechada para o ganho Kz , enquanto que z , Vz , Wz constituem os autovalores e autovetores direita
e esquerda, respectivamente. J Sz so as sensibilidades associadas com cada autovalor. As operaes genticas so
representadas pelos modelos de seleo, crossover e mutao, que podem ser consultados em (Neto and Abreu, 2007).
Realizada a computao da auto-estrutura de malha fechada, a estratgia de pontuao de cada indivduo realizada da
seguinte forma: para cada autovalor, dentro da margem especificada na estrutura de otimizao no linear pelo projetista,
atribui-se valor um (01) ao indivduo QR, e um centsimo (0.01) para cada autovetor associado que possua sensibilidade
normalizada, Sz < 1. O indivduo que possuir maior pontuao ser considerado o timo, e para o critrio de empate,
ser considerado melhor, aquele que possuir menor soma das sensibilidades normalizadas.
3.2.1 Desempenho da Populao Inicial
O perfil da populao inicial pode ser definido pelos valores da funo objetivo apresentados na Figura 3. Percebe-se
claramente uma diversidade gentica, sendo a mesma baixa entre o vigsimo e o trigsimo indivduo. Outros indivduos
mostram melhor diversidade. Essas concluses a respeito do processo de inicializao da populao inicial, implicam em
uma populao satisfatria no processo de busca do indivduo QR timo.
Figure 4. Evoluo do processo-funo objetivo mdia e melhor funo objetivo das geraes.
QLQR
41.436
5.494
=
4.069
5.123
5.494
4.069
5.123
44.103 9.148
3.102
, RLQR = 15.225
2.517
9.148 29.682 6.951
3.102
6.951 22.067
2.517
11.568
,
(5)
A Tabela 1 foi escolhida para realizar os testes de avaliao entre os indivduos. Como pode ser visto, todos os indivduos viveis esto prximos das restries de sensibilidade e da funo objetivo. Alm disso, a condio de positividade
das matrizes so mostradas em termos dos traos e autovalores. As matrizes de ponderao timas Q e R do melhor
indivduo factvel, so dadas por Eq. 5. Na Tabela 2, os autovalores e os traos, confirmam a positividade das matrizes
de ponderao. A positividade pode ser usada para orientar o processo de busca do AG, de modo que evite a formao
indesejvel de nicho.
O processo de busca do AG com a configurao de seus parmetros, produziu solues muito prximas uma das outras,
ou seja, o conjunto soluo matricial QR apresentada pelo AG, tem apenas pequenas discrepncias. As sensibilidades da
populao final e a mdia da funo de fitness de cada gerao apresentada na Figura 5.
4. SOLUO DA EQUAO DE RICCATI VIA REDE NEURONAL
Para resolver a EAR, usa-se problema de otimizao combinatria, tendo como restries as matrizes de ponderaes
da Eq.(5). Esta estrutura formulada para minimizar uma funo energia monotnica, no decrescente e limitada inferiormente, (g, h) (Wang, 1998). As matrizes A, B , Q e R so apresentadas, sendo que seu objetivo encontrar uma soluo
matricial simtrica e definida positiva, P. A seguir tem-se o problema de programao no-linear na forma vetorial (Eq.
n P
n
P
onde g(P ) =
n P
n
P
k=1 l=1
n
P
(6)
(aki pkj + pik akj ) qij , eij : R R uma funo matricial convexa. O prob-
k=1
lema para sntese do projeto LQR pode ser considerado como um problema de otimizao irrestrito. A rede neural
artificial recorrente um sistema dinmico no-linear contnuo. A estabilidade dos sistemas dinmicos no-lineares pode
ser analisado usando o mtodo direto de Lyapunov. As condies de estabilidade e soluo simtrica definida da equao
algbrica de Riccati esto garantidas nos teoremas I e II em Wang et al. (1998).
4.1 Modelo Neuronal para Resolver a EAR
O modelo recursivo da RNAR baseado na rede neural desenvolvida por (Wang et al., 1998). A estrutura de otimizao
dada por um conjunto de equaes diferenciais e funes de ativao F linear saturada que constituem a arquitetura da
rede neural na forma matricial. A mesma dada pela Eq. 7.
dV (t)
T
dt = v V (t)SU (t) + U (t)SV (t) AU (t) U (t)A Y (t)
(7)
dZ(t)
dt = z Y (t)Z(t)
17.884 2.228
2.533
1.838
2.228 19.229
2.760 2.245
PRN AR =
(8)
2.533
2.760
13.596 4.100
1.838 2.245 4.100 10.859
5. FILTRO DE KALMAN PARA ESTIMAO DOS ESTADOS
Nesta seo formula-se o Filtro de Kalman, FK, de forma a alocar os autovalores e autovetores no problema de
estimao de estado estocstica. Esta nova formulao permite a utilizao de tcnicas de computao evolutiva para
determinar um observador estocstico para estimar os estados com uma dinmica desejada. Fazendo-se uso das restries
de autoestrutura, restries
e autovetores, pode-se formular o problema de estimao de estado estocstica,
P de autovalores
que encontrar L =
(, )C T 1 do FK, de modo que sejam satisfeitas as restries. Este problema pode ser
formulado, como um problema de otimizao, permitindo a determinao de um estimador estocstico L(, ) por meio
de tcnicas de busca aleatria direcionada.
Um AG para a busca das matrizes de covariancias da perturbao do estado e do rudo de medida para o Filtro
de Kalman desenvolvido. Para tanto, tem-se interesse em realizar um algoritmo numrico, que possa ser utilizado em
qualquer problema de estimao de estado estrocstico, objetivando-se a determinao de um ganho L(, ) de forma a
625
s2 +50s+625
(9)
A Eq. 9 apresenta a funo de transferncia do rudo de medio (da Cruz, 1996). Ento, a proposta , ainda segundo
da Cruz (1996), analisar o projeto do controlador LQG de maneira que o sistema real (Planta nominal, Gn, mais efeito do
rudo, Gd ) em malha fechada, satisfaa as seguintes especificaes:
acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para 0, 5rad/s.
sensibilidade a variaes na planta no superior a 15% para 0, 7rad/s.
Para se ter acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para
0, 5rad/s, ou seja , r e d 0, 1, a barreira de desempenho para estas condies dada por:
20 log10(0, 1)
para
0, 5rad/s
Para se ter sensibilidade a variaes da planta com erro no superior a 15% para 0, 7rad/s, ou seja , s 0, 15,
a barreira de desempenho para estas condies dada por:
20 log10(0, 15)
para
0, 7rad/s
A barreira da estabilidade foi determinada encontrando-se o inverso do maior valor singular do rudo de medio,
variando-se a constante de 0,1 a 1,0 , para uma dada frequncia. A variao em toda a frequncia fornece a barreira da
estabilidade.
A Figura 10 mostra o valor singular do sistema nominal aumentado juntamente com as barreiras de desempenho e
de estabilidade. Por esta figura, nota-se que o sistema nominal aumentado est dentro dos limites considerados para este
projeto. Portanto, o sistema atende aos compromissos de sistema que consideram os erros com relao ao rastreamento
do sinal de entrada, rejeio a perturbao e sensibilidade a variao da planta. Alm disso, importante destacar que o
sistema se mantm estvel mesmo na presena do rudo, Gd .
Figure 10. Sistema nominal aumentado (azul) e as barreiras de desempenho (vermelho) e de estabilidade (preto).
Sistema com LQG e barreiras de desempenho e estabilidade
frequncia
7. CONTROLADOR LQG/LTR
O problema LQG/LTR com recuperao da malha de realimentao, formulado como um problema de otimizao
que aplicado na recuperao da malha pela entrada. As metodologias do projeto LQG/LTR, apresentadas em Doyle
and Stein (1979), fornecem importantes resultados tericos, mas a abordagem desprovida de modelos, algoritmos e
procedimentos eficientes, no sentido do mtodo de busca, ajuste de ganho de malha e sua recuperao, salvo mtodos de
tentativas e erros. Nesta pesquisa, um procedimento de projeto para ajustar os ganhos dos observadores apresentado
para recuperar a malha fa funo de transferncia na entrada. O ajuste do ganho baseado em modificaes automticas
no parmetro v, tomando como referncia as matrizes de covarincias determinadas pelo FK, para determinar o ganho
timo do observador de estado, para recuperar as propriedades de robustez, conforme a estrutura de otimizao que ser
formulada.
7.1 Modelo de ajuste de ganho LTR
O problema LQG/LTR para recuperao das propriedades de robustez da malha da funo de transferncia formulado
como um problema de otimizao. O ndice de desempenho a melhor escolha que minimiza o erro da freqncia da
decomposio em valores da estrutura de controle dos projetos LQR e LQG. Destacam-se como objetivos a determinao
do controlador KLQR/LT R , Seo 4, a seleo das matrizes de ponderao Q e R do problema LQR, Seo 3, e a determinao do ganho do observador LLQR/LT R , considerando a recuperao pela entrada, o problema de LQG associado
com a seleo das matrizes de covarincias. O uso de procedimentos por tentativa e erro para o projeto LTR justifica o
desenvolvimento de um algoritmo que fornece um mtodo timo para determinar o ganho de recuperao de malha. O
ganho K do controlador, fixado no procedimento, foi determinado no primeiro relatrio.
O procedimento para a recuperao do ganho de malha do LTR na entrada, mostra que escolhas apropriadas das
matrizes de covarincias funo de um parmetro vi , que pode aproximar a malha de controle LTR da malha de controle
LQR. A abordagem de recuperao das propriedades de robustez do projeto de pesquisa, utilizando algoritmo gentico e
redes neuronais foi motivada no artigo de Sergi (2012).
7.2 Modelo de Busca LTR
A seleo das matrizes (Q, R) e (, ) so as duas alternativas para recuperao de malha do projeto LQR. Na
recuperao pela entrada, a busca direcionada para as matrizes. As variaes das matrizes de ponderaes tm como
referncia as matrizes (Q0 , R0 ) e a lei para esta variao conforme Eq. 11.
(Qi = vi 2 Q0 + CC T , R = vi 2 R0 )
(10)
A Eq. 11 funo de um escalar vi . Na recuperao pela entrada, a busca direcionada para o par de matrizes (, ),
sendo que as matrizes de covarincias tm como referncia as matrizes de covarincias (, ) e uma lei que estabelece
suas variaes i = vi 2 0 + BB T , = vi 2 0 como funo de um escalar vi .
O problema modelado como uma estrutura de otimizao combinatria, permitindo a determinao do ganho do
controlador K = R1 B T PLQR (Q, R) ou ganhos do observador de estado L, que recupera o ganho de malha LLQR
por meio do projeto LLQR/LT R . A recuperao da malha do projeto LQR realizada no domnio da freqncia. Uma
input
vez o sistema aberto no Ponto 1, Figura 1, a funo de transferncia de malha aberta dada por L(s)LT R
=
input
F (s)G(s) = Kr LCB, onde L(s)LT R
a funo de transferncia na entrada. O problema formulado de
maneira que se determine os ganhos L, do observador de estado o qual recupera a malha da funo de transferncia
L(s)LQR , suportado por uma estrutura de otimizao combinatria.
P LLQR
i
min
iKr LCB
L,
s.a |L, |
i,esq. calc. i,dir.
Si , i = 1, ..., n.
(11)