You are on page 1of 10

PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM

MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL


Ivanildo Silva Abreu
Universidade Estadual do Maranho, Cidade Universitria Paulo VI, s/no , Tirirical, CEP 65055970, So Lus, MA.
ivanildoabreu@yahoo.com.br

Alfredo Costa Oliveira Junior


Universidade Estadual do Maranho, Cidade Universitria Paulo VI, s/no , Tirirical, CEP 65055970, So Lus, MA.
alfredo.coj@gmail.com

Resumo. O presente trabalho descreve o projeto e anlise de um controlador robusto LQG/LTR em um manipulador
robtico usando um modelo inteligente gentico neuronal. O manipulador robtico a ser controlado atua diretamente
sobre o ambiente-alvo que deve ser controlado, de modo que as foras de impacto e as foras de estado estacionrio no
danifiquem o alvo. A dinmica do manipulador em malha fechada dada de forma desacoplada, pelas dinmicas da
planta nominal com realimentao direta dos estados e do observador estocstico de estados. Desta forma, objetiva-se
recuperar as propriedades de desempenho e estabilidade robustos que so perdidas com a insero de um estimador
estocstico. A metodologia do projeto LQG/ LTR, atravs do qual estas propriedades de robustez so recuperadas,
formulada pela definio da malha objetivo e em seguida, por meio de um procedimento assinttico que recupera as
caractersticas de resposta em freqncia dessa malha, ajustando um parmetro que iro gerar valores singulares cada
vez mais prximos, usando um algoritmo gentico, em um diagrama de Bode multivarivel. A sintonia realizada
por variaes paramtricas na equao de Riccati coordenadas por um algoritmo gentico e decomposio em valores
singulares. Os resultados oriundos do projeto LQG/LTR permitiram um melhor desempenho com relao a robustez, o
que tambm foi comprovado ao se avaliar as barreiras de desempenho e estabilidade robustas.
Palavras-chave: algoritmo gentico, rede neuronal, equao de Riccati, decomposio em valores singulares, diagrama
de Bode multivarivel.
1. INTRODUO
Este pesquisa apresenta os conceitos bsicos de controle robusto para sistemas lineares e invariantes no tempo (LIT),
em particular, um manipulador robtico. O desenvolvimento deste trabalho realizado nos domnios do tempo e da
freqncia, utilizando-se o diagrama de Bode multivarivel. Discute-se as questes de estabilidade e desempenho robustos
em malha fechada, utilizando-se a tcnica LQG/LTR. Um dos itens de maior ateno da comunidade cientfica de controle
o estudo da robustez dos sistemas de realimentao (Doyle and Stein, 1979).
A robustez uma caracterstica desejvel dos sistemas de controle por duas razes. A primeira diz respeito a preocupao permanente do projetista com que os sistemas de controle funcionem de forma satisfatria, ainda que as condies
de operao sejam distintas daquelas consideradas no modelo de projeto (nominal). E em segundo lugar, as condies
de robustez devem ser utilizadas com o objetivo de se adotar um modelo de projeto intencionalmente simplificado para
facilitar a anlise, e seu impacto sobre a complexidade do controlador resultante.
A metodologia consiste de uma tcnica de projeto de controladores utilizada em sistemas dinmicos multivariveis.
Justifica-se seu uso pela robustez do controlador garantida em face de uma ampla classe de erros de modelagem, a tcnica
empregada em sistemas MIMO, o procedimento do projeto de natureza sistemtica e que a metodologia se fundamenta
numa abordagem freqncial em sistemas MIMO (da Cruz, 1996).
As ferramentas empregadas para o desenvolvimento do projeto do controlador robusto LQG/LTR, so o projeto do
Regulador Linear Quadrtico (LQR) e o Filtro de Kalman (FK) que justifica o projeto LQG (Linear Quagrtico Gaussiano).
Estas ferramentas no sero interpretadas de forma usual em controle timo estocstico, mas utilizadas em funo de suas
propriedades. Neste trabalho, apresenta-se uma metodologia de projeto que permita a determinao de um compensador,
a ser localizado no ramo direto da malha de controle, de modo que sejam atendidos os requisitos de desempenho e
estabilidade. A seguir, descreve-se o manipulador robtico, onde ser empregada a abordagem de controle robusto.
O procedimento de recuperao das propriedades de robustez, perdidas com a estimao das variveis de estados, ,
segundo Doyle and Stein (1979), realizado pelo procedimento LTR (Recuperao da Malha de Transferncia), uma vez
que o manipulador robtico em questo possui zeros de transmisso no semiplano esquerdo (zeros de fase mnima). O
procedimento de recuperao da malha de transferncia est associado matriz de funo de transferncia de malha,
K(s)GN (s), que corresponde a abertura da malha na entrada da planta (ponto (i)), ver Figura 1. Neste procedimento,

Ivanildo S. Abreu, Alfredo C. O. Junior


PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

supe-se fixada convenientemente a princpio a matriz K do compensador, enquanto que a matriz L do observador de
estado varivel.
Esta alternativa consistente com a anlise atravs dos valores singulares de K(s)GN (s) considerada para traduzir
as especificaes do sistema de controle por meio das restries do seu diagrama de Bode multivarivel. Alm disso,
admite-se que a matriz L tenha sido escolhida de modo que Real[i (A KC)] < 0, i = 1, . . . , n, em quanto o ganho do
observador de estados L varivel (da Cruz, 1996).
Como se trata de um problema de controle robusto, a avaliao do desempenho e estabilidade robustas do controlador
LQG/LTR proposto, deu-se por meio da anlise das barreiras de desempenho e estabilidade, segundo da Cruz (1996).

Figure 1. Diagrama de blocos do sistema para estudo do procedimento LTR.

2. MANIPULADOR ROBTICO
Os manipuladores robticos modernos que atuam diretamente sobre o ambiente devem ser controlados de modo que
as foras de impacto, bem como as foras em regime permanente, no danifiquem os objetos. Ao mesmo tempo, o
manipulador deve fornecer uma fora suficiente para executar a tarefa. Ento, para desenvolver um sistema de controle
para regular essas foras, o manipulador robtico e o ambiente devem ser modelados. Admitindo o modelo ilustrado na
Figura 2 tem-se um sistema de quarta ordem com representao no espao de estados. O esquema a seguir consiste de
manipulador, sensor, e ambiente (Chiu and Lee, 1997).
O manipulador deve posicionar o sensor sobre a superfcie de contato de forma controlada para no causar danos a
nenhum dos componentes, ento, a sada do sistema o deslocamento do sensor, e a entrada seria um excitao u(t). O
sistema inclui ainda dois regimes, um sem contato e outro com contato do sensor superfcie de contato. Porm o sistema
um s, ento deve ser encontrada uma nica funo que descreva a dinmica do sistema como um todo. O sistema na
Figura 2 ilustra dois regimes, um sem contato com o meio ambiente e o outro com contato com o meio ambiente. Para
cada regime a dinmica do sistema diferente. Desta forma ser analisado o regime sem contato para testar a metodologia.

Figure 2. Manipulador robtico e ambiente.


Apresenta-se o modelo matemtico em representao no espao de estados do manipulador robtico e ambiente, para
recuperao das propriedades de robustez. O manipulador controlvel e observvel.
x
r + 2x r + 2xr xs x s = u(t); x r xr + x
s + x s + xs = 0

(1)

Assumem-se as variveis de estado como x1 = xr ; x2 = xr ; x3 = xs ; x4 = xs . Desta forma, discute-se a questo de


como escolher o compensador K (s) de modo que o sistema de malha fechada seja estvel e ainda tenha graus de liberdade
em nmero suficiente para dar forma malha, de modo que satisfaa as condies de desempenho e estabilidade. Para
isso, admite-se que todas as variveis de estados sejam mensurveis e que estejam disponveis para realimentao e uma
vez que, o manipulador robtico seja controlvel e observvel, todos os autovalores de malha fechada do sistema podero
ser alocados em qualquer posio desejada, por meio de uma realimentao de estados, desde que seja empregada uma
matriz de ganho apropriada. Ento, para a busca deste ganho timo, neste projeto de pesquisa, utiliza-se o projeto do
Regulador Linear Quadrtico (LQR).

23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)


December 6-11, 2015, Rio de Janeiro, RJ, Brazil

3. CONTROLADOR INTELIGENTE LQR


O problema do LQR formulado por uma estrutura de otimizao no-linear, cujo foco consiste em minimizar um
ndice de desempenho quadrtico. Este problema tem como gargalo, a seleo das matrizes de ponderao de estado e de
controle, Q e R, respectivamente, e resolver a equao algbrica de Riccati (EAR), de modo que, possa alocar autovalores
e autovetores especificados e que garanta a estabilidade e desempenho robustos do sistema de controle. So apresentadas
as evolues de duas abordagens de inteligncia computacional para resolver o problema do LQR. Estas evolues so
resultados de pesquisas utilizando um AG na seleo das matrizes de ponderao Q e R e na soluo da (EAR) por meio
de uma (RNR), conforme Wang et al. (1998) e Abreu and Fonseca (2010).
3.1 Modelagem Clssica do Projeto LQR
O modelo clssico de controle do projeto LQR, busca o vetor de controle u que minimiza um funcional J(.) com
restries para o modelo do sistema. Sabe-se que uma das vantagens do projeto LQR a margem de estabilidade garantida, ou seja, margem de fase de 60o e margem de ganho infinita, possuindo desta maneira, qualidade de robustez de
estabilidade. Tal problema formulado pela Eq. 2.

RT 
min J = 21 t0 xT Qx + uT Ru
s.a x = Ax + Bu

(2)

sendo x Rn e u Rm , o par (A, B ) controlvel, (A, C ) observvel, C 0 (semidefinida positiva) e R > 0


(definida positiva). As metodologias de Clculo Variacional, ?, so utilizadas para resolver o problema de otimizao
(2). Este mtodo fornece a lei de controle que minimiza o ndice de desempenho quadrtico J e satisfaz as restries de
equaes no espao de estado. A lei de controle u = Kx sendo K = R 1 B T P , o ganho do controlador. Este ganho
depende da soluo simtrica e definida positiva da equao algbrica de Riccati (EAR):
AT P + PA PB R 1 B T P + Q = 0

(3)

3.2 Modelagem Inteligente via Algoritmo Gentico


Um dos grandes desafios na teoria de controle, utilizando o projeto do regulador linear quadrtico, a seleo das
matrizes de ponderao Q e R. Nesta pesquisa, utiliza-se uma abordagem de inteligncia computacional para realizar a
busca das mesmas, o AG. Os parmetros matriciais do projeto LQR so utilizados para realizar a sintonia do ganho timo
do compensador. Apresenta-se o modelo matemtico no-linear para exibir estas matrizes, conforme Eq. 4.
n
P
M in
pi si (Q, R)
Q,R i=1
s.a si (Q, R) 1, i = 1, ..., n
i,esq. i,aloc. (Q, R) i,dir. , i = 1, ..., n

(4)

sendo pi os pesos das i-simas sensibilidades Si /i normalizadas com relao i-sima especificao de projeto i . Este
modelo aborda desde a representao gentica das matrizes de ponderao, passando pelas operaes cromossmicas, at
chegar s avaliaes de fitness (desempenho).
Percebe-se que a mesma constitui uma estrutura de otimizao muito complexa, uma vez que, envolve a soluo do
projeto LQR e o clculo dos autovalores de malha fechada. O desempenho de cada cromossomo do indivduo que compe
a populao QR nind. xg avaliado e cada indivduo QR z pontuado. Kz o ganho gerado por um indivduo, Az a
matriz de malha fechada para o ganho Kz , enquanto que z , Vz , Wz constituem os autovalores e autovetores direita
e esquerda, respectivamente. J Sz so as sensibilidades associadas com cada autovalor. As operaes genticas so
representadas pelos modelos de seleo, crossover e mutao, que podem ser consultados em (Neto and Abreu, 2007).
Realizada a computao da auto-estrutura de malha fechada, a estratgia de pontuao de cada indivduo realizada da
seguinte forma: para cada autovalor, dentro da margem especificada na estrutura de otimizao no linear pelo projetista,
atribui-se valor um (01) ao indivduo QR, e um centsimo (0.01) para cada autovetor associado que possua sensibilidade
normalizada, Sz < 1. O indivduo que possuir maior pontuao ser considerado o timo, e para o critrio de empate,
ser considerado melhor, aquele que possuir menor soma das sensibilidades normalizadas.
3.2.1 Desempenho da Populao Inicial
O perfil da populao inicial pode ser definido pelos valores da funo objetivo apresentados na Figura 3. Percebe-se
claramente uma diversidade gentica, sendo a mesma baixa entre o vigsimo e o trigsimo indivduo. Outros indivduos
mostram melhor diversidade. Essas concluses a respeito do processo de inicializao da populao inicial, implicam em
uma populao satisfatria no processo de busca do indivduo QR timo.

Ivanildo S. Abreu, Alfredo C. O. Junior


PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

Figure 3. Sensibilidade total de cada indivduo.

Figure 4. Evoluo do processo-funo objetivo mdia e melhor funo objetivo das geraes.

3.2.2 Desempenho da Populao final


Os valores da funo objetivo para a populao final, em comparao com a mdia da funo objetivo para cada
indivduo da populao, durante o processo de busca, so apresentados na Figura 4. Os valores mdios de cada indivduo
da populao final apresentaram melhorias at o trigsimo indivduo; a partir deste indivduo, no percebe-se muitas
melhorias.
A busca realizada pelo AG, encontrou cinco indivduos viveis, que esto presentes na Tabela 1 e consequentemente,
como esperado, os resultados computacionais para resposta ao sinal impulso mostraram uma ligeira diferena entre todas
as solues viveis apresentadas (Neto and Abreu, 2007).
Table 1. Pop. final AG-sensibilidades e funo objetivo dos indivduos viveis.
P
Indiv.
s1
s2
s3
s4
si
1
20 0.975 0.815 0.694 0.589 3.073
3
13 0.919 0.831 0.677
0.57 2.997
5
17 0.967 0.845 0.684 0.586 3.082
7
14 0.996 0.883 0.686 0.586 3.151
9
48 0.986 0.986 0.683 0.586
3.11

QLQR

41.436
5.494
=
4.069
5.123

5.494
4.069
5.123

44.103 9.148
3.102
, RLQR = 15.225
2.517
9.148 29.682 6.951
3.102
6.951 22.067

2.517
11.568


,

(5)

A Tabela 1 foi escolhida para realizar os testes de avaliao entre os indivduos. Como pode ser visto, todos os indivduos viveis esto prximos das restries de sensibilidade e da funo objetivo. Alm disso, a condio de positividade
das matrizes so mostradas em termos dos traos e autovalores. As matrizes de ponderao timas Q e R do melhor
indivduo factvel, so dadas por Eq. 5. Na Tabela 2, os autovalores e os traos, confirmam a positividade das matrizes
de ponderao. A positividade pode ser usada para orientar o processo de busca do AG, de modo que evite a formao
indesejvel de nicho.
O processo de busca do AG com a configurao de seus parmetros, produziu solues muito prximas uma das outras,
ou seja, o conjunto soluo matricial QR apresentada pelo AG, tem apenas pequenas discrepncias. As sensibilidades da
populao final e a mdia da funo de fitness de cada gerao apresentada na Figura 5.
4. SOLUO DA EQUAO DE RICCATI VIA REDE NEURONAL
Para resolver a EAR, usa-se problema de otimizao combinatria, tendo como restries as matrizes de ponderaes
da Eq.(5). Esta estrutura formulada para minimizar uma funo energia monotnica, no decrescente e limitada inferiormente, (g, h) (Wang, 1998). As matrizes A, B , Q e R so apresentadas, sendo que seu objetivo encontrar uma soluo
matricial simtrica e definida positiva, P. A seguir tem-se o problema de programao no-linear na forma vetorial (Eq.

23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)


December 6-11, 2015, Rio de Janeiro, RJ, Brazil

Table 2. Melhor indivduo da populao final-autovalores e traos das matrizes de ponderao.


P
Indiv.
s1
s2
s3
s4
si
1
20 0.975 0.815 0.694 0.589 3.073
13 0.919 0.831 0.677
0.57 2.997
3
5
17 0.967 0.845 0.684 0.586 3.082
14 0.996 0.883 0.686 0.586 3.151
7
9
48 0.986 0.986 0.683 0.586
3.11

Figure 5. Fitness normalizada de cada gerao e de cada indivduo.


6).
min

n P
n
P

{eij [gij(P )] + eij [hi,j (P , L)]}

P,L i=1 j=1

onde g(P ) =

n P
n
P
k=1 l=1

pik skl plj

n
P

(6)

(aki pkj + pik akj ) qij , eij : R R uma funo matricial convexa. O prob-

k=1

lema para sntese do projeto LQR pode ser considerado como um problema de otimizao irrestrito. A rede neural
artificial recorrente um sistema dinmico no-linear contnuo. A estabilidade dos sistemas dinmicos no-lineares pode
ser analisado usando o mtodo direto de Lyapunov. As condies de estabilidade e soluo simtrica definida da equao
algbrica de Riccati esto garantidas nos teoremas I e II em Wang et al. (1998).
4.1 Modelo Neuronal para Resolver a EAR
O modelo recursivo da RNAR baseado na rede neural desenvolvida por (Wang et al., 1998). A estrutura de otimizao
dada por um conjunto de equaes diferenciais e funes de ativao F linear saturada que constituem a arquitetura da
rede neural na forma matricial. A mesma dada pela Eq. 7.


dV (t)
T
dt = v V (t)SU (t) + U (t)SV (t) AU (t) U (t)A Y (t)
(7)
dZ(t)
dt = z Y (t)Z(t)

Ivanildo S. Abreu, Alfredo C. O. Junior


PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

Figure 6. Arquitetura da RNAR para EAR.


onde Z(t) R nn so matrizes quadradas dos estados de ativaes; F = [.] um campo vetorial de funes de ativaes
no decrescente; V (t) R nxn a soluo da EAR, Z(t) R nn uma matriz triangular inferior dos estados do
fator de Cholesky. Os parmetros positivos de ajuste da rede neuronal so os pesos v e z . A matriz S representa na
equao anterior a influncia da matriz de ponderao R, sendo dada por S = BR 1 B T , considerando que os ganhos
do controlador timo so ajustados tendo por base as variaes nas matrizes Q e R. A Figura 6 ilustra a arquitetura
da rede neuronal para resolver a EAR, sendo formada por quatro camadas conectadas bidirecionalmente. A camada
de sada V (t), representa a soluo da EAR, Z(t) representa o fator de Cholesky de P. O mtodo de Runge-Kutta de
quarta ordem utilizado para computar os valores de V e Z. A funo de desempenho para mensurar o processo de
treinamento da RNAR a funo Erro Mdio Quadrtico, EMQ, que representa a funo energia, sendo a mesma dada
pela combinao dos erros associados a EAR e ao fator de Cholesky. Consequentemente, o EM QRN AR de aprendizagem
2
da RNAR, EM QRN AR = 21 (eEAR + eFC ) , sendo seus componentes dados por: eEAR = Q AT P + PA P SP
T
e eFC = LL P .
4.2 Soluo da EAR via Rede Neural Recorrente No Supervisionada
Esta seo compreende os mtodos de ajuste de convergncia e anlise da RNAR para resolver a equao de Riccati.
Os parmetros de ajustes, v , z , do modelo neuronal, so suportados pela norma do infinito e superfcies da funo
energia da soluo da equao de Riccati. A norma do infinito e a superfcie da funo energia, como funes dos
parmetros (pesos) de dimensionamento v , z , so avaliadas para definir uma configurao para melhorar a estabilidade
de convergncia e caractersticas de solvabilidade da RNAR. Na Figura 7 apresentada a superfcie da norma do infinito
da matriz de entrada U, sendo que os intervalos de modificao para os parmetros v , z so respectivamente, [1000
10000] e [1 10]. Os pesos escolhidos dos parmetros v e z e so 1000 e 1, respectivamente.
A soluo neuronal da equao de Riccati, fundamentado no modelo neuronal que resolve a estrutura de otimizao
que minimiza a funo energia, camada de sada da RNAR, V, dada pela Eq. 8.

17.884 2.228
2.533
1.838
2.228 19.229
2.760 2.245

PRN AR =
(8)
2.533
2.760
13.596 4.100
1.838 2.245 4.100 10.859
5. FILTRO DE KALMAN PARA ESTIMAO DOS ESTADOS
Nesta seo formula-se o Filtro de Kalman, FK, de forma a alocar os autovalores e autovetores no problema de
estimao de estado estocstica. Esta nova formulao permite a utilizao de tcnicas de computao evolutiva para
determinar um observador estocstico para estimar os estados com uma dinmica desejada. Fazendo-se uso das restries
de autoestrutura, restries
e autovetores, pode-se formular o problema de estimao de estado estocstica,
P de autovalores
que encontrar L =
(, )C T 1 do FK, de modo que sejam satisfeitas as restries. Este problema pode ser
formulado, como um problema de otimizao, permitindo a determinao de um estimador estocstico L(, ) por meio
de tcnicas de busca aleatria direcionada.
Um AG para a busca das matrizes de covariancias da perturbao do estado e do rudo de medida para o Filtro
de Kalman desenvolvido. Para tanto, tem-se interesse em realizar um algoritmo numrico, que possa ser utilizado em
qualquer problema de estimao de estado estrocstico, objetivando-se a determinao de um ganho L(, ) de forma a

23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)


December 6-11, 2015, Rio de Janeiro, RJ, Brazil

Figure 7. Superfcie da norma do infinito para v = 1000 10000 e z = 1 10.


alocar autovalores e autovetores. Utiliza-se o mesmo procedimento para o projeto LQR.
A Figura 8 a seguir, exibe os resultados da Filtragem de Kalman. Nela verifica-se as trajetrias dos estados versus os
estados estimados. Nota-se que, apesar da presena de rudos, a ao reguladora detectada em todos os estados. Para
uma anlise mais precisa, a Figura 9 ilustra o erro de estimao em cada estado. Observou-se que o Estado 4 apresenta
o menor erro de estimao, enquanto que o maior erro de estimao foi verificado para o Estado 5 (Abreu and Fonseca,
2010).

Figure 8. Trajetrias dos estados vesus os estimados.

Figure 9. Erro de estimao para cada estado.

6. BARREIRAS DE DESEMPENHO E ESTABILIDADE


Tendo em vista que esta pesquisa se trata de um projeto de controlador robusto, importante verificar os compromissos
de desempenho e estabilidade robusta. Para esta anlise, considerou-se como dinmica desconhecida, o efeito do rudo
provocado por dois polos, conforme 9.
Gd =

625
s2 +50s+625

(9)

Ivanildo S. Abreu, Alfredo C. O. Junior


PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

A Eq. 9 apresenta a funo de transferncia do rudo de medio (da Cruz, 1996). Ento, a proposta , ainda segundo
da Cruz (1996), analisar o projeto do controlador LQG de maneira que o sistema real (Planta nominal, Gn, mais efeito do
rudo, Gd ) em malha fechada, satisfaa as seguintes especificaes:
acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para 0, 5rad/s.
sensibilidade a variaes na planta no superior a 15% para 0, 7rad/s.
Para se ter acompanhamento do sinal de referncia e rejeio de perturbaes com erro no superior a 10% para
0, 5rad/s, ou seja , r e d 0, 1, a barreira de desempenho para estas condies dada por:
20 log10(0, 1)

para

0, 5rad/s

Para se ter sensibilidade a variaes da planta com erro no superior a 15% para 0, 7rad/s, ou seja , s 0, 15,
a barreira de desempenho para estas condies dada por:
20 log10(0, 15)

para

0, 7rad/s

A barreira da estabilidade foi determinada encontrando-se o inverso do maior valor singular do rudo de medio,
variando-se a constante de 0,1 a 1,0 , para uma dada frequncia. A variao em toda a frequncia fornece a barreira da
estabilidade.
A Figura 10 mostra o valor singular do sistema nominal aumentado juntamente com as barreiras de desempenho e
de estabilidade. Por esta figura, nota-se que o sistema nominal aumentado est dentro dos limites considerados para este
projeto. Portanto, o sistema atende aos compromissos de sistema que consideram os erros com relao ao rastreamento
do sinal de entrada, rejeio a perturbao e sensibilidade a variao da planta. Alm disso, importante destacar que o
sistema se mantm estvel mesmo na presena do rudo, Gd .
Figure 10. Sistema nominal aumentado (azul) e as barreiras de desempenho (vermelho) e de estabilidade (preto).
Sistema com LQG e barreiras de desempenho e estabilidade

frequncia

7. CONTROLADOR LQG/LTR
O problema LQG/LTR com recuperao da malha de realimentao, formulado como um problema de otimizao
que aplicado na recuperao da malha pela entrada. As metodologias do projeto LQG/LTR, apresentadas em Doyle
and Stein (1979), fornecem importantes resultados tericos, mas a abordagem desprovida de modelos, algoritmos e

23rd ABCM International Congress of Mechanical Engineering (COBEM 2015)


December 6-11, 2015, Rio de Janeiro, RJ, Brazil

procedimentos eficientes, no sentido do mtodo de busca, ajuste de ganho de malha e sua recuperao, salvo mtodos de
tentativas e erros. Nesta pesquisa, um procedimento de projeto para ajustar os ganhos dos observadores apresentado
para recuperar a malha fa funo de transferncia na entrada. O ajuste do ganho baseado em modificaes automticas
no parmetro v, tomando como referncia as matrizes de covarincias determinadas pelo FK, para determinar o ganho
timo do observador de estado, para recuperar as propriedades de robustez, conforme a estrutura de otimizao que ser
formulada.
7.1 Modelo de ajuste de ganho LTR
O problema LQG/LTR para recuperao das propriedades de robustez da malha da funo de transferncia formulado
como um problema de otimizao. O ndice de desempenho a melhor escolha que minimiza o erro da freqncia da
decomposio em valores da estrutura de controle dos projetos LQR e LQG. Destacam-se como objetivos a determinao
do controlador KLQR/LT R , Seo 4, a seleo das matrizes de ponderao Q e R do problema LQR, Seo 3, e a determinao do ganho do observador LLQR/LT R , considerando a recuperao pela entrada, o problema de LQG associado
com a seleo das matrizes de covarincias. O uso de procedimentos por tentativa e erro para o projeto LTR justifica o
desenvolvimento de um algoritmo que fornece um mtodo timo para determinar o ganho de recuperao de malha. O
ganho K do controlador, fixado no procedimento, foi determinado no primeiro relatrio.
O procedimento para a recuperao do ganho de malha do LTR na entrada, mostra que escolhas apropriadas das
matrizes de covarincias funo de um parmetro vi , que pode aproximar a malha de controle LTR da malha de controle
LQR. A abordagem de recuperao das propriedades de robustez do projeto de pesquisa, utilizando algoritmo gentico e
redes neuronais foi motivada no artigo de Sergi (2012).
7.2 Modelo de Busca LTR
A seleo das matrizes (Q, R) e (, ) so as duas alternativas para recuperao de malha do projeto LQR. Na
recuperao pela entrada, a busca direcionada para as matrizes. As variaes das matrizes de ponderaes tm como
referncia as matrizes (Q0 , R0 ) e a lei para esta variao conforme Eq. 11.
(Qi = vi 2 Q0 + CC T , R = vi 2 R0 )

(10)

A Eq. 11 funo de um escalar vi . Na recuperao pela entrada, a busca direcionada para o par de matrizes (, ),
sendo que as matrizes de covarincias tm como referncia as matrizes de covarincias (, ) e uma lei que estabelece
suas variaes i = vi 2 0 + BB T , = vi 2 0 como funo de um escalar vi .
O problema modelado como uma estrutura de otimizao combinatria, permitindo a determinao do ganho do
controlador K = R1 B T PLQR (Q, R) ou ganhos do observador de estado L, que recupera o ganho de malha LLQR
por meio do projeto LLQR/LT R . A recuperao da malha do projeto LQR realizada no domnio da freqncia. Uma
input
vez o sistema aberto no Ponto 1, Figura 1, a funo de transferncia de malha aberta dada por L(s)LT R
=
input
F (s)G(s) = Kr LCB, onde L(s)LT R
a funo de transferncia na entrada. O problema formulado de
maneira que se determine os ganhos L, do observador de estado o qual recupera a malha da funo de transferncia
L(s)LQR , suportado por uma estrutura de otimizao combinatria.

P  LLQR
i
min
iKr LCB
L,

s.a |L, |
i,esq. calc. i,dir.
Si , i = 1, ..., n.

(11)

onde |L, | so restries operacionais do problema.


A soluo da recuperao do projeto LTR na entrada dada pela seleo do par de matrizes de covarincias, que
realizada pelo modelo de busca LT R, , sendo que essas matrizes constituem os parmetros matriciais da equao
algbrica de Riccati, A + AT + G( 2 0 + BB T )GT C T ( 2 0 )1 C = 0, sendo v o parmetro escalar usado
para ajustar as matrizes de covarincias. A soluo da equao algbrica de Riccati utilizado para computar os ganhos
do observador LLT R = C T ( 2 0 )1 , onde LLT R so os ganhos do observador do Filtro de Kalman.
7.3 Desempenho AG LQR/LT R
O desempenho do projeto do AG- LQG/LTR verificado, comparando-se os valores singulares do projeto LQR e do
projeto LTR. A implementao do algoritmo considera uma populao composta por quartoze indivduos e um ciclo de
busca de sete geraes. O parmetro de operao de crossover tem como valores 0.1 e 0.05. A operao de mutao tem
probabilidade de ocorrncia probmut = 5%.

Ivanildo S. Abreu, Alfredo C. O. Junior


PROJETO DE CONTROLADOR ROBUSTO LQG/LTR EM MANIPULADOR ROBTICO VIA MODELO GENTICO NEURONAL

Figure 11. Valores singulares da recuperao das propriedades de robustez.


A Figura 11 ilustra os valores singulares da recuperao das propriedades de robustez do projeto LQR via projeto LTR,
usando algoritmo gentico. Verificou-se que quando v 0, as propriedades de robustez, perdidas com a estimao, so
completamente recuperadas. Segundo Lewis and Vassilis (1995), os limites para garantir as propriedades de robustez so
dadas em termos dos valores singulares mnimos, sendo grandes nas baixas freqncias (para desempenho da robustez) e
os valores singulares mximos so pequenos nas altas freqncias (para estabilidade de robustez).
8. CONCLUSO
Um modelo hierrquico de algoritmos genticos para recuperao da malha de transferncia na entrada foi apresentado como uma soluo para ajuste de ganhos de controladores e observadores no espao de estados. O desenvolvimento
dos controladores LQR, LQG e LQG/LTR e mtodos de projeto de observadores baseados em uma hierarquia de modelos
de algoritmos genticos e redes neurais artificiais foram utilizados para ajustar os ganhos de malha. Baseado na implementao o modelo e implementao do controlador e observador e o mtodo de ajuste proposto podem ser vistos como
uma boa alternativa para aplicaes prticas em tempo real. Esta soluo inteligente representa o desenvolvimento de um
modelo gentico artificial para ajuste dos ganhos de recuperao da malha de transferncia.
9. AGRADECIMENTOS
Universidade Estadual do Maranho pelo suporte tcnico ao utilizar o Laboratrio de Automao e Controle, a
CAPES e ao Programa de Ps-Graduao em Engenharia de Computao e Sistemas.
10. REFERNCIAS
Abreu, I. and Fonseca, N., 2010. Neural-genetic state space controllers synthesis based on linear quadratic regulatos
design for eigenstrucutre assignment. Systems, man, and Cybernetics, part B; Cybernetics, IEEE Transaction on.
Chiu, D.K. and Lee, S., 1997. Design and experimentation of a jump impact controller. IEEE.
da Cruz, J.J., 1996. Controle robusto multivarivel. DUSP.
Doyle, J.C. and Stein, G., 1979. Robustness with observers. In IEEE Transactions on Automatic Control.
Lewis, F.L. and Vassilis, L.S., 1995. Optimal control. Inc.. USA.
Neto, J.V. and Abreu, I., 2007. A genetic algorithm convergence and models for eigenstrucuture assignment via linear
quadratic regulator. Revista IEEE Amrica Latina.
Sergi, F., 2012. Design and characterization of a compact rotary series elastic actuator for knee assistance during
overground walking. Roma, Italy.
Wang, J., Wub and Guang, 1998. A multilayer recurrent neural network for solving continuous-time algebraic riccati
equations.

You might also like