Professional Documents
Culture Documents
1
1. Introdução
Durante as últimas duas décadas a estrutura de sistemas lineares tem sido exaustivamente estudada por diversos
autores em diferentes contextos. Destacam-se as contribuições de Wolovich (1967), Kailath (1980), Wonham (1985)
e Rosenbrock (1970). A estrutura de polos e zeros do sistema e propriedades de controlabilidade, estabilizabilidade,
observabilidade, detetabilidade desempenham um papel importante no projeto de sistemas de controle. As estruturas
de zeros finitos e infinitos das funções de transferência do sistema dado e da malha objetivo têm um papel
preponderante na análise e procedimento de recuperação de funções de transferência do sistema. Na verdade, o tema
recuperação de funções de transferência de malha pode ser visto como o estudo de atribuição de uma estrutura de
zeros a um sistema a malha fechada dentro das condições impostas pelas estruturas dos zeros da planta e da malha
objetivo. As representações de sistemas relacionadas com as propriedades de sistemas utilizam a decomposição de
Kalman e uma base de coordenada especial de Saberi.
Referências utilizadas:
Colaneri, P., Geromel, J. C. & Locatelli, A. (1997). A Control Theory and Design - An RH2 e RH∞ Viewpoint.
B B B B
Um sistema com uma entrada (m=1) e uma saída (p=1) é chamado sistema SISO das iniciais de single input and
single output, se não for o caso o sistema é chamado MIMO das iniciais de multiple input and multiple output). A
correspondente matriz de transferência entre y e u é definida por:
Y ( s ) = G ( s )U ( s ) (2)
onde
G ( s ) = C ( sI − A) −1 B + D
2
3. Estabilidade
Definição 3.1: Um sistema linear relaxado é dito ser BIBO estável se e só se para qualquer entrada limitada a saída
for limitada.
Caso continuo
t
y (t ) = ∫ g (t ,t )u (t )dt
0 (4)
t
∫0
g (t ,t ) dt ≤ k < ∞ t ∈ (0, ∞)
(5)
Teorema 3.2: (Chen, 1999) Considere um sistema monovariável relaxado
τ
y (τ ) = ∫ g (τ , τ )u (τ )dτ
0 (6)
t
Se ∫0
g (t ,t ) dt ≤ k < ∞ para algum k então tem-se:
1. Se u for uma função periódica com período T; u (t ) = u (t + T ) para todo t ≥ 0 então a saída y (t ) tende a uma
função periódica com o mesmo período T.
2. Se u (t ) for limitada e tender para uma constante então a saída tende para uma constante.
3.Se u for de energia finita, ou seja:
1
∞ 2
2
u 2 = ∫ u (t ) dt ≤ k1 < ∞ (7)
0
então, a saída é também de energia finita, existe k2 dependente de k 1, ou seja,
B B Boise B, ou
1
∞ 2
2
y 2 = ∫ y (t ) dt ≤ k2 < ∞
0
(8)
Definição 3.2: Um sistema é L2 estável ou externamente estável se para toda entrada u pertencente ao espaço linear
com norma L2 , ou seja , u ∈ L2 (0, ∞; R ) , a saída y ∈ L2 (0, ∞; R ) .
m m
t
se ∫ 0
g (t ,t ) dt ≤ k < ∞ para algum k e se u (t ) = senωt , t ≥ 0 então
Verificação:
Lembrando que sen(τ − τ ) = senτ cosτ − cos τ senτ tem-se:
τ
y (τ ) = ∫ g (τ )u (τ - τ )dτ
0
∞ ∞ ∞
= senωτ ∫ g (τ ) cos ωτdτ - cos ω τ ∫ g (τ )senωτdτ - ∫ g (τ )senω (τ - τ )dτ
0 0 τ
∞ ∞ ∞
∫t
g (t ) senω(t − t )dt ≤ ∫ g (t ) senω(t − t ) dt ≤ ∫ g (t ) dt
t t
∞
e g é integrável), ou seja ∫t
g (t ) dt → 0 t → ∞ , tem-se:
senωt = 1
2j (e jωt − e − jωt ) , cos ωt = 12 (e jωt + e − jωt ) , tem-se que y (t ) = 1
2j [ g ( jω )e jωt − g (− jω )e − jωt ] .
Finalmente, usando a notação fasorial para g ( jω ), i.e., g ( jω ) = g ( jω) e jθ e
Teorema 3.3: Um sistema monovariável e relaxado descrito por g(s) própria é BIBO estável se e só se todos os polos
de g(s) estiverem no semiplano lateral esquerdo do plano s ou, equivalentemente, se todos os polos de g(s) tiverem a
parte real negativa.
Caso Multivariável
U
∫−∞ G (t ,t ) dt = k < ∞, ∀t
t
(12)
onde G (t ,t ) := G (t ,t ) ∞
= max ∑ g ij e G (.,.) ∈ R × R . Na verdade qualquer norma poderia ser usada.
p m
i
j
Teorema 3.5: Um sistema multivariável e relaxado descrito por y ( s ) = G ( s )u ( s ) onde G (s ) é uma matriz
racional própria, é BIBO estável se e só se todos os polos de cada elemento de G (s ) tiverem parte real negativa.
O teorema de Hermite Biehler fornece condições necessárias e suficientes para a estabilidade de polinômios usando a
condição de entrelaçamento.
Propriedade 3.1: Se P(s) é um polinômio real de Hurwitz então todos os seus coeficientes são não zero e têm o
mesmo sinal, ou positivo ou negativo.
Propriedade 3.2: Se P(s) é um polinômio real de Hurwitz de grau n, o arg[P(jw)] é uma função contínua e
estritamente crescente de w ∈ ( −∞, ∞) . Além disso, a fase para w ∈ ( −∞, ∞) é nπ.
Teorema 3.6 (Hermite Biehler): Seja δ ( s ) = a0 + a1s + + an −1s n −1 + an s n um polinômio real de grau n.
Escreva δ ( s) = δ e ( s ) + sδ o ( s ) onde δ e ( s ) e sδ o ( s ) são as componentes de δ (s )
2 2 2 2
de potências de s pares
e ímpares, respectivamente. Sejam we1 , we 2 , zeros reais não negativos de δ e (− w ) e wo1 , wo 2 , zeros reais
2
não negativos de δ o (− w 2 ) , ambos dispostos em ordem ascendentes de magnitude. Então, δ (s ) é Hurwitz estável
se e só se todos os zeros de δ e (− w 2 ), δ o (− w 2 ) são reais e distintos, δ n , δ n −1 possuem o mesmo sinal e os zeros
reais não negativos satisfazem a seguinte propriedade de entrelaçamento: 0 < we1 < wo1 < we 2 < wo 2 < . Os
gráficos abaixo ilustram um polinômio estável.
Uma caracterização analítica equivalente do teorema de Hermite Biehler foi dada por Bhatachaaryya (1991) seguida
por sua generalização com vistas a utilização da propriedade de entrelaçamento de polinômios estáveis no projeto de
5
obtenção de famílias de controladores estabilizantes para sistemas monovariáveis não necessariamente de fase
mínima.
Considere o sistema ( A, B, C , D)
x = A(t ) x + B (t )u
y = C (t ) x (13)
Resposta ao estado-zero
U
τ
y (τ ) = ∫ C (τ )Φ (τ ,τ ) B(τ )u (τ )dτ
τ0
τ
= ∫ G (τ ,τ )u (τ )dτ
τ0
(15)
Teorema 3.7: A resposta ao estado zero de ( A, B, C , D) é BIBO estável se e só se existir um número finito k tal
que
t
∫t0
C (t )Φ (t ,t ) B(t ) dt ≤ k < ∞ (19)
x = A(t ) x
x(t ) := s (t ; t 0 , x0 ,0) = Φ (t , t 0 ) x0 (20)
6
Observação: O estado zero, 0 , é sempre um estado de equilíbrio de x = A(t ) x .
Definição 3.2: Um estado de equilíbrio xe é estável em t0 no sentido de Lyapunov (i.s.L) se e só se para todo ε > 0 ,
B B
Estabilidade uniforme
U
O estado de equilíbrio xe é uniformemente estável no sentido de Lyapunov (i.s.L) sobre [t0, ∞) se e só se para cada
B B
ε > 0 , existir um δ positivo que depende de ε mas não de t0 tal que x0 − xe ≤ δ , então
B B
"Escolhe-se primeiro uma bola Bε, e para cada Bε deve existir uma bola Bδ tal que trajetórias iniciando dentro de Bδ
B B B B B B B B
Definição 3.3: O estado de equilíbrio xe é assintoticamente estável em t0 se for estável (i.s.L) em t0 e se toda
B B B B
trajetória iniciando suficientemente próximo de x e converge para x e quando t → ∞ . Dado algum γ > 0 tal que se
x(t1 ) − xe ≤ γ , então para qualquer ε > 0 existe um T , T(ε , γ , t1 ) > 0 tal que
7
Estabilidade assintótica uniforme
U
O estado de equilíbrio xe é uniformemente assintoticamente estável sobre [t0, ∞) se T na Definição 3.3 independe de
B B B B
t1. B B
No plano de fase pode-se fazer a seguinte interpretação de estabilidade. Para haver estabilidade da origem, requer-se
que o ângulo entre o vetor de estado x e vetor velocidade x seja maior do que 90 graus quando uma componente do
vetor velocidade aponta para a origem (a outra é ortonormal ao vetor x) isto é:
De fato, uma vez que 𝑥𝑥̇ =𝐴𝐴𝐴𝐴, tem-se que 𝑥𝑥 𝑇𝑇 𝐴𝐴𝐴𝐴 < 0 o que implica real λ < 0, ver figura.
Considere o sistema
x = f ( x); f ( 0) = 0
A idéia básica do método de Lyapunov é associar a estabilidade do sistema à variação de energia. Se um sistema
possui um estado de equilíbrio estável x e , então a energia total armazenada no sistema decresce com o tempo até a
energia total atingir o seu valor mínimo no estado de equilíbrio. A estabilidade é analisada via uma função escalar
especial chamada função de Lyapunov.
8
Definição. A função de Lyapunov V (x) satisfaz as seguintes condições para todo t1 > t0 e para todo x na
vizinhança de xe , com x = 0 um ponto de equilíbrio do sistema
1. V (x) e suas derivadas parciais são definidas e são contínuas.
2. V (0) = 0
3. V ( x) > 0 para todo x ≠ 0 e V ≤ 0 com V a derivada de V (x) em relação ao tempo, i.e.
V = L V ( x)
f
= Grad xV ( x) T f ( x)
(a) (b)
Representação geométrica de uma função de Lyapunov. (a) Representação 3D da função de Lyapunov ilustrando
𝑉𝑉(𝑥𝑥) ao longo de uma solução iniciando em 𝑥𝑥0 , (b) Curvas de nível: 𝑉𝑉1 < 𝑉𝑉2 < 𝑉𝑉3 e a solução 𝑥𝑥(𝑡𝑡) iniciando em
𝑥𝑥0 .
Sistema estável
Grad xVf ( x)
cos Θ = <0
Grad xV f ( x)
Teorema 3.8. Suponha que uma função de Lyapunov V (x) possa ser determinada para o sistema. Então, o estado
de equilíbrio x = 0 é assintoticamente estável se V for negativa definida e estável no sentido de Lyapunov se V
for semi-definida negativa.
9
Teorema 3.14 (Estabilidade local). Se em uma bola BR0 existe uma função escalar V (x) com derivadas contínuas
tal que:
1. V ( x) > 0 localmente
2. V ( x) ≤ 0 localmente em BR0 .
Então, o ponto de equilíbrio xe = 0 é estável. Se V ( x) < 0 em BR0 então a estabilidade é assimptótica.
Nota-se que a derivada de V (x) é o produto escalar de dois vetores. A função f (x) é um vetor que aponta no
sentido da tangente da trajetória x(t ) do sistema naquele ponto, e grad xV ( x) é um vetor normal, no sentido de
crescimento de V (x) em relação à uma curva de nível V ( x) = c, c > 0 . A figura ilustra o caso em que a
derivada de V (x) é negativa. O teorema seguinte pode garantir a estabilidade assintótica do sistema mesmo que a
derivada da função de Lyapunov V (x) seja semi-definida negativa. A Definição 3.3 é necessária para entender o
teorema.
Definição 3.3 O conjunto M é dito invariante com respeito ao sistema x = f (x ) se para x0 ∈ Μ , a solução do
sistema s(t ; t0 , x0 ,0) ∈ Μ para todo t ∈ R.
Assim, um conjunto invariante com respeito a x = f (x) indica que se a solução pertence a Μ em um instante t,
então a solução pertence a Μ para todo tempo futuro.
Teorema 3.9 [Princípio de invariância de La Salle] Suponha V (x) uma função definida positiva continuamente
diferenciável contendo a origem x = 0 tal que em ω = {x : V ( x) < } tem-se V ≤ 0 . Defina
E = {x ∈ ω : V ( x) = 0} . Então, toda solução s (t ; to , x0 ,0) iniciando em ω = {x : V ( x) < } é atraída para
o maior conjunto invariante em E. Se E não conter outra trajetória a não ser x = 0 , a origem é assintoticamente
estável.
As definições de estabilidade de estados de equilíbrio dadas anteriormente têm uma natureza local porque não se
sabe quão pequenas as constantes δ e γ devem ser. Entretanto, para sistemas lineares por causa da propriedade de
homogeneidade δ e γ as definições de estabilidade podem ser estendidas para todo o espaço de estado. O que
significa que em sistemas lineares estabilidade local implica estabilidade global.
Observação: Se o estado zero for assintoticamente estável, então, o estado zero é o único estado de equilíbrio do
sistema. Se existisse outro diferente de zero, escolhendo-o como condição inicial este não se aproximaria do estado
zero.
10
Teorema 3.11: O estado zero de x = A(t ) x é assintoticamente (exponencialmente) estável em t0 se e só se B B
Φ (t , t 0 ) ≤ k1 e − k 2 (t −t0 )
(22)
para qualquer t 0 ≥ 0 e para todo t ≥ t 0 .
m ni −1
e At = ∑∑ Aik t k e λit
i =1 k = 0
m
= ∑ [ Ai 0 e λit + Ai1te λit + Ai ( ni −1) t ni −1e λit ]
i =1
1 1
Aik = [[ s − li ) ni ( sI − A) −1 ]( ni −1− k ) ].
k! (ni − 1 − k )! lim
s →li
s →li
3. instável se e só se condição (2) não for satisfeita.
Método de Lyapunov
Funções Quadráticas
11
Teorema 3.13. Considere o sistema linear x = Ax com det A ≠ 0 e xe = 0 . Considere
V ( x) = x T Px, P = P T > 0 . Então, V (x) é uma função de Lyapunov do sistema linear se e só se para
qualquer Q = Q T > 0 existe P = P T > 0 tal que:
AT P + PA = −Q
Prova. Para V ( x) = x T Px, P = P T > 0 tem-se V ( x) = x T Px + x T Px . Usando x = Ax pode-se escrever
V ( x) = x T AT Px + x T PAx . Então,
V ( x) = xT [ AT P + PA]x
= − xT Qx < 0, ∀x ≠ 0
e o resultado segue.
Teorema 3.15: A equação x ( k + 1) = Ax( k ) é marginalmente estável ou estável segundo Lyapunov se todos os
autovalores de A tiverem magnitudes menores ou iguais a 1 e aqueles com magnitudes iguais a 1 forem raízes
simples do polinômio mínimo de A .
P − PAT P = Q
4.1 Controlabilidade
O conceito de controlabilidade está relacionado com entradas e estados e o conceito de observabilidade com saídas e
estados. São propriedades estruturais dos sistemas ( A(.), B (.), C (.), D (.)) que fornecem informações relevantes
para o projeto de controle. Antes de definir controlabilidade, o conceito de independência linear para funções do
tempo é necessário (ver Antsaklis, 2007).
12
f1 (t )
f (t )
α T 2 = 0 para todo t ∈ [t1 , t2 ] .
f n (t )
Definição 4.2: Um sistema ( A(.), B (.), C (.), D (.)) é controlável em t0 se existir uma lei de controle u (contínua B B
por partes) que transfira qualquer estado inicial x0 ∈ R a um estado arbitrário x1 ∈ R n em um tempo finito t1>t0.
n
B B B B
Teorema 4.1 (Chen, 1984): Seja f i uma função contínua de valor complexo definida em [t1 , t 2 ] . Seja F uma
matriz nxm com fi sendo sua i-ésima linha. Defina a matriz
B B
t2
W (t1 , t 2 ) = ∫ F (t ) F * (t )dt
t1 (32)
Então f1 f f n são linearmente independentes em [t1 , t 2 ] se e só se W (t1 , t 2 ) for não singular.
B
finito tal que as n linhas da matriz n×m Φ (t0 , t ) B(t ) , sejam linearmente independentes (LI) em [t0, t1]. B B B f
Verificação:
Suficiência. Se as linhas de Φ (t0 , t ) B(t ) forem LI em [t0, t1], pelo Teorema 4.1 a matriz
B B B B
t1
W (t 0 , t1 ) = ∫ Φ(t 0 , t ) B(t ) B(t ) * Φ * (t 0 , t )dt
t0 (33)
é não singular. Para qualquer x(t0)=x0 e qualquer x1 pode-se mostrar que a entrada
B B B B B B
u (t ) = − B * (t )Φ * (t 0 , t )W −1 (t 0 , t )[ x0 − Φ (t 0 , t ) x1 ]
leva x0 ao estado x1 em t=t1.
B B B B B B
Φ (t0 , t ) B(t ) linearmente dependentes em [t 0 , t1 ] , t1>t0 finito. Então existe um vetor n × 1 constante α ≠ 0 tal
B B B B
que
α T Φ (t0 , t ) B(t ) = 0, t ∈ [t0 , t1 ] . (34)
Considere agora a solução da equação espaço de estado para t = t1
t1
Φ (t1 , t0 ) x(t0 ) + ∫ Φ (t ,t ) B(t )u (t )dt
x(t1 ) =
. t0 (35)
Pré-multiplicando a solução acima por Φ (t 0 , t1 ) e escolhendo x(t0)=x0=α’≠0 tem-se B B B B
t1
Φ (t0 , t1 ) x(t1 ) = Φ (t0 , t1 )Φ (t1 , t0 )α + ∫ Φ (t0 , t1 )Φ (t1 ,t ) B(t )u (t )dt
t0
(36)
t1
= α + ∫ Φ (t0 ,t ) B(t )u (t )dt
t0
13
t1
α T Φ(t0 , t1 ) x(t1 ) = α T α + ∫ αΦ(t0 ,t ) B(t )u (t )dt .
t0
Por hipótese, ( A(t ), B (t ), C (t ), D (t )) é controlável em t0. Assim, para qualquer estado x1, em particular
B B B B
x1 = x(t1 ) = 0, existe u(t), t em [t 0 , t1 ] tal que x(t1 ) = 0. Uma vez que por suposição
α Φ (t0 ,.) B(.) = 0, t ∈ [t0 , t1 ] , x(t1 ) = 0 implica α α = 0
T T
e consequentemente que α = 0, o que é uma
contradição e o resultado segue.
− At
2. B são LI em [0,∞) sobre o corpo dos números complexos.
As linhas de e
2 n−1
3. A matriz de controlabilidade U= [ B AB A B A B ] possui posto n.
t
Wc (t ) = ∫ e At BB T e A t dt é não singular para qualquer t>0.
T
4. A matriz
0
Φ (t ) = e At
∞
1 k k
=∑ t A
k = 0 k!
∞
t k n −1 n −1 ∞
tk
=∑ ∑ ki ∑
(α ) Ai
= Ai
∑ (α )
k i
k = 0 k! i = 0 i =0 k =0 k!
∞
tk
Usando a expressão acima na equação de x(t 0 ) e definindo γ i (t ) = ∑ (α k ) i tem-se
k =0 k!
n −1
x(t 0 ) = −∑ A i B ∫ γ i (t 0 − t )u (t )dt
t1
t0
i =0
n −1
= −∑ A i Bq i
i =0
t1
com qi = ∫ γ i (t 0 − t )u (t )dt . Assim, pode-se escrever
t0
14
Teorema 4.4. O sistema dinâmico (A,B,C,D) ou equivalentemente o par (A,B) é controlável se e só se as condições
equivalentes seguintes forem verificadas:
4.2 Estabilizabilidade
Teorema 4.5: O sistema dinâmico (A,B,C,D) ou equivalentemente o par (A,B) é estabilizável se e só se as condições
equivalentes seguintes forem verificadas:
b) PBH teste:
posto[sI − A B ] = n, Re( s ) ≥ 0 (39)
b) Kalman teste: A parte não controlável do sistema é estável. Já para a parte instável o posto
posto[sI − A B ] = n , o que significa que para todo λ e correspondente autovetor v tal que v * A = v * λ e
Re( λ ) ≥ 0 tem - se v * B ≠ 0.
4.3 Observabilidade
pxm e t ∈ ( −∞, ∞) .
Definição 4.3: Um sistema ( A(.), B (.), C (.), D (.)) é observável em t0 se e só se existir um instante tempo finito t1,
B B B B
15
A resposta do sistema ( A(.), B (.), C (.), D (.)) é dada por
t
C (t )Φ (t0 , t ) x(t0 ) + C (t ) ∫ Φ (t0 ,t ) B(t )u (t )dt + D(t )u (t )
y (t ) =
t0 (26)
No estudo da estabilidade de um sistema, a saída y e a entrada u são conhecidas e o estado inicial é desconhecido. Se
x(t0) for conhecido o estado pode ser computado para t>t0 a partir de
B B B B
t
Φ (t0 , t ) x(t0 ) + ∫ Φ (t0 ,t ) B(t )u (t )dt + D(t )u (t )
x(t ) =
t0 (27)
Teorema 4.6: Suponha as matrizes A(.) e C(.) (n-1) vezes diferenciáveis. Então, o sistema ( A(.), B (.), C (.), D (.)) é
observável em t 0 se existir t1 > t 0 finito tal que
B B
N 0 (t1 )
N (t )
1 1
posto N 2 (t1 ) = n
N n −1 (t1 )
(28)
onde
d
N k +1 (t ) = N k (t ) A(t ) + N k (t ), k = 0,1, , n − 1 e N 0 (t ) = C (t )
dt
Teorema 4.7: O sistema ( A(.), B (.), C (.), D (.)) é observável em t 0 se existir t1 > t 0 finito tal que as n colunas da
matriz p×n C (.)Φ (t 0 ,.) forem LI em [t 0 , t1 ] .
2. Kalman teste:
posto[C T AT C T ( AT ) n −1 C T ]T = n (30)
com O = [C
T
AT C T ( AT ) n −1 C T ]T a matriz de observabilidade.
3. Wonham teste: Dado um conjunto arbitrário simétrico Λ de n números complexos, existe uma matriz L tal
que o espectrum de A+LC coincide com Λ.
16
4.4 Detectabilidade
a) PBH teste:
sI − A
posto = n, Re(s) ≥ 0 (31)
C
sI − A
ou seja posto possui posto coluna completo.
C
b) Kalman teste: A parte não observável do sistema é estável. Isto é, para todo λ e correspondente autovetor v tal
que Av = λv e Re(λ ) ≥ 0 tem - se Cv ≠ 0. Caso tenha-se Cv = 0 , pelo PBH teste, o sistema não seria
detetável pois
sI − A sI − A
posto v = 0 com Cv ≠ 0 , tem-se que posto < n, contradizendo a condição de posto
C C
coluna completo.
c) Wonham teste: Existe uma matriz L tal que A+LC é estável.
Teorema 4.10: (Teorema da dualidade)
O par (A,B) é controlável se e só se o par ( AT , B T ) for observável
t
Wc (t ) = ∫ e At BB T e A t dt for não-singular para qualquer t . O par
T
Prova. O par (A,B) é controlável se e só se
0
t
( A, C ) é observável se e só se Wo (t ) = ∫ e A t C T Ce At dt for não singular. Substituindo A por AT e C por B T
T
0
t
em Wo (t ) tem-se Wo (t ) = ∫ e BB e
At T AT t
dt que é não-singular . Assim, Wo (t ) e Wc (t ) são idênticas e o
0
teorema segue.
θ1 θ2
1 2
u M
Equações do movimento:
mv = −mgθ 1 − mgθ 2 + u
⋅
m(v + l iθi ) = mgθ i , i =,12
onde v é a velocidade e u a força externa aplicada.
Pergunta-se:
17
1. É possível controlar os 2 pêndulos (mantê-los na vertical com u(⋅))?
2. O sistema é observável com y = θ1?B B
x = Ax + bu
onde
0 0 1 0 0
0 0
0 1 0
A= , B=
a1 a2 0 0 − 1 / M 1
a 3 a4 0 0 − 1 / M 2
com
( M + m) g mg mg ( M + m) g
a1 = , a2 = a3 = , a4 =
M 1 M 1 M 2 M 2
2.
y = θ 1 , c = [1 0 0 0]
(mg ) 2
det(O) = −a 22 = − ≠0
M 1
onde O é a matriz de observabilidade. Portanto o sistema é observável.
U := [ B AB A2 B An−1 B ] (41)
18
C
CA
V := CA 2
(42)
CA n−1
Controlabilidade
U5
A partir das equações de estado pode-se escrever a sua solução para k no intervalo [0 n-1]
u (n − 1)
u (n − 2)
x(n) = A n x 0 + [ B AB A 2 B A n −1 B]
u (1)
u (0)
(43)
ou
u (n − 1)
u (n − 2)
x(n) − A n x 0 = [ B AB A 2 B A n −1 B]
u (1)
u (0)
.
Analisando a equação acima, qualquer estado inicial x0 pode ser transferido para um estado qualquer em no máximo
n passos se e só se a matriz de controlabilidade U k tiver posto n. Em outras palavras existe [uk −1uk −2 u1u0 ]T para
quaisquer x(k) e x0 se e só se o posto
B B U k = n . E, pelo Teorema de Cayley Hamilton precisa-se verificar se posto
U k = n até k = n . Note que x(k ) pertence ao espaço imagem de U k .
Observabilidade
A partir da equação de saída pode-se escrever a sua solução para k no intervalo [0 n-1]:
19
y (0) = Cx(0)
y (1) = Cx(1)
= CAx(0) + CBu (0)
y (2) = Cx(2) = C ( Ax(1) + Bu (1)) = CA2 x(0) + CABu (0) + CBu (1)
y (k − 1) = CAk −1 x(0) + CAk −2 Bu (0) + CAk −3 Bu (1) + 3 CABu (k − 3) + CBu (k − 2)
(44)
y (0) u (0)
y (1)
= Vx(0) + T u (1) (45)
y (k − 1) u (k − 2)
com
0 0 0
CB 0 0
T = CAB CB 0 .
CA k −2 B CA k − B CB
Analisando (45) acima pode-se afirmar que o estado em t=k pode ser recuperado unicamente a partir das entradas e
saídas se e só se a matriz de observabilidade V tiver posto completo. A equação acima pode ser rescrita para a entrada
u(.) igual a zero e solução y(.) no intervalo [0 k − 1] .
y (0)
y (1)
= Vk x (0)
y ( k − 1) (46)
onde
C
CA
Vk =
k −1
CA .
De acordo com resultados da álgebra linear, x(0) pode ser recuperado unicamente se e só se posto Vk =n, para algum
B B
Alcançabilidade
Teorema 4.11: Uma realização ( A, B, C , D ) é mínima se (A,B) for controlável e (C,A) observável.
20
5. Formas canônicas
x co Aco 0 A13 0 x co B co
x A21 Aco A23 A24 x c 0 B co
( A ,B ,C ,D ) : c 0 = +
x c o 0 0 Ac o 0 x co 0
xc o 0 0 0 Ac o xc o 0
[
y = C co 0 C co ]
0 x + Du
Em que
x c 0 : vetor de estado controlável e observável;
x c 0 : vetor de estado controlável e não observável;
x c o : vetor de estado não controlável e observável;
x co : vetor de estado não controlável não observável.
e a função de transferência de ( A,B,C,D ) é dada por :
G (s) = C co ( sI − Aco ) −1 B co + D
a qual depende apenas da equação controlável e observável do sistema.
[ ]
xc
y = C c C c + Du
xc
xc
com x := Qx , x = e Q = [q1 qk 1 qk1+1 qn ] ,
xc
[q1 qk1 ] gerado pelas colunas linearmente independentes de [ B AB An−1B] . Assim, Aqi é formado
pela combinação linear de [q1 qk1 ] . Portanto a matriz A tem a forma mostrada e o sistema controlável é dado
por:
x c = A c x c + B c u
y = C c xc
21
xc 0
Assim, o espaço de estado x é particionado em dois espaços ortogonais: e com o primeiro sendo o
0 xc
subespaço controlável e o segundo o subespaço não controlável. Então, o subespaço controlável é gerado pelas
colunas qi , i = 1, , k1 ou, equivalentemente , pela imagem da matriz de controlabilidade.
Se a parte controlável não for observável esta pode ser transformada em:
x c o A c o A12 xco B co
= x + u
x co 0 A co co B co
[ ]
x co
y = 0 C co + Du
x co
onde o sistema observável e controlável é:
x co = A c x co + B co u
y = C co x co
Similarmente, a parte não controlável pode ser decomposta em parte observável e parte não observável.
Combinando estas duas partes chega-se à forma canônica de decomposição do sistema. Resta mostrar que
C ( sI-A) B + D = C co ( sI - A co ) -1 B co + D
Utilizando a forma proposta as seguintes correspondências podem ser tiradas:
−1
sI − A co 0 − A13 0 B co
[
C ( sI − A) −1 B → C co 0 C co ]
0
0
A21 sI − A co
0
− A23
sI − Ac o
− A24 B co
0 0
0 0 0 sI − Ac o 0
−1
sI − A co 0 × 0 B co
[
= C co 0 C co ]
0
×
0
sI − A co
0
×
sI − Ac o
×
0
B co
0
0 0 0 sI − Ac o 0
B co
[
= C co ( sI − A co ) −1 0 × 0 ]
B co
0
0
= C co ( sI − A co ) −1 B co + D
Assim, ( Aco , B co , C co ) é observável e controlável. A figura abaixo ilustra as conexões entrada-saída do sistema.
22
co
u y
co
co
co
T
Observação 1: De (53 ), tem-se que o espaço controlável é da forma {[ xco , xcTo ,0,0]T } e o espaço não observável é
da forma {[0, xcTo ,0, xc o ]T } .
Observação 2: Existe uma perda de informação sobre a dinâmica dos estados não observáveis, e não é possível atuar
sobre as entradas não controláveis.
A forma de Jordan permite verificar por inspeção a controlabilidade e observabilidade de um sistema (A,B,C,D).
Considere o sistema espaço de estado
( J,B, C ) : x = Jx + Bu
y = Cx
J está na forma de Jordan. Considere
J := diag ( J 1 , J 2 )
onde J1 consiste de 3 blocos de Jordan associados a um mesmo autovalor λ1 e J2 2 blocos associados a um autovalor
B B B B B B
λ2 :
B B
J 1 := diag ( J 11 , J 12 , J 13 )
J 2 := diag ( J 21 , J 22 )
Denote a linha de B correspondente à última linha de Jij como bij e a coluna de C correspondente à primeira coluna
B B
de Jij como
B B c fij .
Teorema 5.1. O sistema ( J,B, C ) é controlável se e só se as linhas de B {b11 , b12 , b13 } forem linearmente
independentes e os vetores {b 21 , b 22 } forem linearmente independentes. 2. O sistema ( J,B, C ) é observável se e só
se as colunas de C {c f 11 , b f 12 , c f 13 } forem linearmente independentes e as colunas {c f 21 , c f 22 } forem linearmente
independentes.
23
Verificação. Utilizar o PBH teste: posto[ sI − J B] = n , fazendo s = λ1 e operações elementares de colunas e
depois repetir o procedimento para s = λ2 .
Exemplo
U
λ1 1 0 0 0 0 0 0 0 0 b111
0 λ 0 0 0 0 0
1 0 0 1 b11
0 0 λ1 0 0 0 0 0 1 0 b12
x = 0 0 0 λ1 0 0 0 x + 1 1 1u b13
0 0 0 0 λ2 1 0 1 2 3 b121
0 0 0 0 0 λ2 1 0 1 0 b221
0 0 0 0 0 0 λ2 1 1 1
b 21
1 1 2 0 0 2 1
y = 1 0 1 2 0 1 1 x
1 0 2 3 0 2 0
c f 11 c11 c f 12 c f 13 c f 21 c221 c 21
x = [ x111 x11 x12 x13 x121 x221 x 21 ]'
24
u
b111
c11 y
u
1 1 x111
b 11 + c f 11
y
s-λ s-λ
1
x11 1
u
1 x 12
b 12 c f 12 y
s-λ 1
u
1 x 13
b 13 c f 13 y
s-λ 1
u u
b 221
u
1 x 21 1 x221 1 x121
b 21 + + cf21 y
s-λ 2
s-λ 2 s-λ 2
c 21 y c 221 y
Observação: Para um sistema com q blocos de Jordan associados ao mesmo autovalor e com m entradas e p saídas o
sistema é controlável (observável) se e só se q ≤ m ( q ≤ p ) . Caso SISO q = 1 .
A forma modal pode ser obtida a partir da transformação de similaridade x = Px com P −1 = QQ em que
x = Px com Q , por exemplo, para 2 polos complexos dada por:
I 0 0 0
0 0.5 − 0.5 j 0 0
Q = 0 0.5 0.5 j 0 0
0 0 0.5 − 0.5 j
0 0 0 0.5 0.5 j .
U
25
6. Equação de Lyapunov
Os testes de estabilidade, controlabilidade e observabilidade podem ser feitos indiretamente via a equação de
Lyapunov. Considere a equação de Lyapunov (lembrar da equação de Sylvester vista anteriormente
AM + MB = C com 𝐴𝐴 n × n e 𝐵𝐵 m × m
AT P + PA + Q = 0 (47)
com A e Q matrizes quadradas conhecidas). Sabe-se que esta equação possui solução única se
λi ( A) + λ j ( AT ) ≠ 0, ∀i, j = 1,, n. Para mostrar essa condição, escrever (47) da forma
( AT ⊕ A)vec( P) = vec(Q) em que vec(X) é um vetor coluna formado pelas colunas de P empilhadas e ⊕ é a
nm×nm
soma de Kronecker definida por A ⊕ B = ( A ⊗ I m ) + ( I n ⊗ B ) ∈ C com ⊗ o produto de Kronecker, por
exemplo, se A é nxn e B mxm, então, o produto de Kronecker A ⊗ B é a matriz bloco nmxnm:
a11 B a1n B
A ⊗ B =
a n1 B a nn B
.
∞
i ) P = ∫ e A t Qe At
T
ii ) P > 0 se Q > 0 e P ≥ 0 se Q ≥ 0
iii ) se Q ≥ 0 então (Q, A) é observável ssse P > 0
0 0
∞ d AT t At
=∫ e Qe dt
0 dt
∞
= e A t Qe At
T
= 0 − Q = −Q
Para verificar as afirmações ii) e iii) suponha λ um autovalor de A e v um autovetor correspondente tal que
Av = λv . Pré-multiplicando AT P + PA + Q = 0 por v* e pós-multiplicando por v usando v* AT = v*λ* obtém-se:
P P
2 Re(λ )(v Pv) + v Qv = 0 . Agora, desde que A é estável tem-se P > 0 se Q > 0 e P ≥ 0 se Q ≥ 0 e portanto
* *
ii) segue. O resultado iii) pode ser mostrado usando o teste de Kalman para observabilidade do par (Q, A) que diz
que para todo λ e correspondente autovetor v tal que Av = λv tem-se Qv ≠ 0 . Suficiência. Desde que A é estável
e Q ≥ 0 tem-se Qv ≠ 0 se P > 0 . Necessidade. Suponha P > 0 então Qv ≠ 0 e (Q,A) é observável.
Corolário 6.1: Se A for estável o par (C,A) é observável sse a solução da seguinte equação de Lyapunov for
definida positiva
26
A* Lo + Lo A + C *C = 0 . (49)
A solução Lo é chamada de Gramiano de observabilidade. Similarmente, o par (A,B) é controlável sse a solução da
B B B B
seguem. O resultado iii) segue usando contradição. Suponha Re(λ ) ≥ 0 . Uma vez que Q ≥ 0 , isto implica que
v*Qv = 0 , i. e., Qv = 0 usando (52). Isto implica que λ é um modo instável e não observável contradizendo a
suposição (Q,A) detectável.
Lema 6.3. (Desoer, 1991) Suponha Q = Q* > 0 e que a equação de Lyapunov tem solução única P=P*>0, então o
estado de equilíbrio zero de x = Ax é exponencialmente estável, i.e. λ ( A) ⊂ C− .
V ( x) = x * Px
Desde que P=P*>0, pode-se obter P = U ΛU com U U = I e Λ a matriz diagonal contendo os autovalores de P
* *
λmin ( P) x ≤ V ( x) ≤ λmax ( P) x , ∀x ∈ C n
2 2
utilizando
x* Px = x*U *ΛUx = z *Λz; z := Ux
λmin ( P) I ≤ Λ ≤ λmax ( P) I
zT z = x .
2
V ( x ) ≤ V ( x0 ) exp[−2α (t − t 0 )], ∀t ≥ t 0
λmax ( P )
x ≤ exp[−2a (t − t0 )] x0
2 2
λmin ( P ) .
λmax ( P )
exp[ −2a (t − t 0 )], ∀t ≥ t 0
2
Φ (t , t 0 ) ≤
λmin ( P )
e pelo Teorema 3.11 segue que o sistema é exponencialmente estável.
28