10. fejezet - Lineáris kvadratikus szabályozótervezés

Tartalom
10.1. Lineáris kvadratikus regulátor
10.1.1. Véges horizontú LQR
10.1.2. Végtelen horizontú LQR feladat
10.1.3. Általános végtelen horizontú LQR feladat
10.2. Pólusok és zérusok

Az irányítástervezés során gyakran szeretnénk egy irányítás paramétereit úgy megválasztani, hogy valamilyen előre meghatározott minőségi tulajdonság (performancia előírás) teljesüljön. Az optimalizálási feladatokban olyan paraméterek választása a cél ami maximalizál vagy minimalizál egy adott kritérium-függvényt. Ebben a fejezetben megmutatjuk, hogyan lehet megválasztani azokat a paramétereket amik optimalizálnak egy adott kvadratikus specifikációt és amelyek a lehető legkisebb költséggel maximalizálják a megkívánt performanciát.

Tekintsük az alábbi kritérium-függvényt

min u( ) 0 T L( x,u )dt+V( x( T ) )

(378)

a következő dinamikus feltételek mellett

x ˙ =f( x,  u ),  x= n ,

(379)

ahol az x( 0 ) kezdeti feltétel adott és u m . Ez egy korlátozások melletti optimalizálási feladat, ahol egy olyan megengedett ( x( t ),u( t ) ) trajektóriát keresünk ami minimalizálja a perem pontokban korlátozott J költségfüggvényt

J= 0 T L( x,  u )dt+V( x( T ) ),  ψ( x( T ) )=0.

(380)

Az L( x,u ) tag az integrál költség míg V( x( T ) ) a végső, terminális költség. A ψ: n q függvény a terminális korlátozások egy halmazát határozza meg. A korlátozások menlleti optimalizálási feladatoknál szokásos módon egy

H=L+ λ T f=L+ i=1 n λ i f i ,

(381)

Hamilton függvényt definiálunk, ahol bevezetjük az időfüggő λ társváltozókat.

Tétel 9.1 (Maximum elv) Ha ( x * , u * ) optimális akkor létezik λ * ( t ) n és ν * q úgy, hogy

x ˙ i = H λ i      λ ˙ i = H x i

(382)

adott ψ( x( T ) )=0 , x( 0 ) peremfeltételekkel, ahol λ( T )= V x ( x( T ) )+ ν T ψ x és

H( x * ( t ),   u * ( t ), λ * ( t ) )H( x * ( t ),u, λ * ( t ) )

(383)

minden uΩ esetén.

A maximum elv nemlineáris dinamikák esetén is alkalmazható valamint abban az esetben is ha a szabályozó bemenet egy Ω halmaz által van korlátozva. Korlátozások néklül, Ω= m , és differenciálható H esetén az optimalitás egy szükséges feltétele, hogy

H u =0.

(384)

Ha u * =argminH( x,  u,  λ ) létezik, akkor felhasználható mint optimális szabályozó jel.

A bizonyítás elve a következő: a Lagrange féle multiplikátorok módszerét alkalmazva a költségfüggvény alakja

J ˜ ( x,u,λ,ν )=J( x,u )+ 0 T λ T ( t )( x ˙ ( t )f( x,u ) )dt+ ν T ψ( x( T ) )=

= 0 T (L( x,u ) λ T ( t )( x ˙ ( t )f( x,u ) )dt+V( x( T ) )+ ν T ψ( x( T ) ),

(385)

ami a Hamilton függvény felhasználásával

J ˜ ( x,u,λ,ν )= 0 T ( H( x,u ) λ T ( t ) x ˙ )dt+V( x( T ) )+ ν T ψ( x( T ) )

(386)

alakba írható. Az optimális megoldás környezetében linearizálva, azaz x( t )= x * ( t )+δx( t ) , u( t )= u * ( t )+δu( t ) , λ( t )= λ * ( t )+δλ( t ) és ν= ν * +δν esetén, kapjuk, hogy

δ J ˜ = J ˜ ( x * +δx, u * +δu, λ * +δλ, ν * +δν ) J ˜ ( x * , u * , λ * , ν * )

0 T ( H x δx+ H u δu λ T δ x ˙ +( H λ x ˙ T )δλ )dt+

+ V x δx( T )+ ν T ψ x δx( T )+δ ν T ψ( x( T ),  u( T ) ),

(387)

ahol a deriváltak az optimális megoldás mentén értendők.

Parciális integrálással elimináljuk a δ x ˙ -tól való függést

0 T λ T δ x ˙ dt= λ T ( T )δx( T )+ λ T ( 0 )δx( 0 )+ 0 T λ T δxdt.

(388)

Mivel x( 0 )= x 0 adott, az első tag eltűnik és kapjuk, hogy

δ J ˜ 0 T [ ( H x + λ T )δx+ H u δu+( H λ x ˙ T )δλ ]dt+

+( V x + ν T ψ x λ T ( T ) )δx( T )+δ ν T ψ( x( T ),  u( T ) ).

(389)

Az optimalitáshoz megköveteljük,hogy δ J ˜ =0 minden δx,  δu,  δλ és δν esetén, így megkapva a tétel feltételeit.

A továbbiakban a lineáris kvadratikus (LQ) optimális szabályozási feladatot tekintjük: a dinamikus rendszer lineáris időinvariáns és a költségfüggvény kvadratikus, azaz

x ˙ =Ax+Bu,    x( 0 )= x 0 ,

(390)

J= 0 T ( x T Qx+ u T Ru )  dt+ x T ( T ) P f x( T ),

(391)

ahol Q0 az állapothibát bünteti, R>0 a szabályozó bemenetet és P f >0 a végső állapotot súlyozza.

A Q és R tervezési paraméterek meghatározzák az állapotok lineáris kombinációinak és az input energia fontosságát (súlyát):

- A funkcionálban szereplő x T Qx tag a rendszer minőségi jellemzőit súlyozza, a rendszer teljes energiáját bünteti egy Q0 súlymátrix segítségével

- A funkcionálban szereplő u T Ru tag a rendszerbe betáplált szabályozó energiát súlyozza, R>0 mátrix segítségével.

Gyakran a feladatot úgy módosítjuk, hogy egy adott ( x d ,   u d ) pálya követése legyen az elérendő cél, a költségfüggvényt ehhez a ( x x d ) és ( u u d ) tagokkal írjuk át. Van, amikor célszerű a végső x( T )= x f pontot is előírni, ilyenkor egy általánosabb ψ i ( x( T ) )=0,  i=1,  ,  q megszorítást használhatunk. Amikor minden komponensre megszorítás van, azaz q=n , a vonatkozó specifikáció alakja ψ i ( x( T ) )= x i ( T ) x i,f lesz. Ilyenkor V( x( T ) ) elhagyható, mivel értéke rögzített.

Fontos eset, amikor T= és V=0 , azaz a végtelen horizontú LQ feladat.

10.1. Lineáris kvadratikus regulátor

10.1.1. Véges horizontú LQR

A véges horizontú lineáris kvadratikus regulátor(LQR) feladat alakja

x ˙ =Ax+Bu,    x( 0 )= x 0

(392)

az alábbi költségfüggvénnyel:

J ˜ = 1 2 0 T ( x T Qx+ u T Ru )dt+ 1 2 x T ( T ) P f x( T ),

(393)

ahol Q0,  R>0,   P f 0 .

A feladathoz tartozó H Hamilton függvény

H= 1 2 x T Qx+ 1 2 u T Ru+ λ T ( Ax+Bu ).

(394)

A maximum elv alkalmazásával az alábbi szükséges feltételeket kapjuk:

x ˙ = ( H λ ) T =Ax+Bu,    x( 0 )= x 0 ,

(395)

λ ˙ = ( H x ) T =Qx+ A T λ,    λ( T )= P f x( T )

(396)

0= H u =Ru+ λ T B.

(397)

Innen az optimális irányítás alakja

u= R 1 B T λ.

(398)

Az optimális irányítás előállításához egy peremértékfeladatot kell megoldani x( 0 ) és λ( T ) peremfeltételekkel, ami általában egy nehéz feladat.

A társváltozót a λ( t )=P( t )x( t ) alakban keressük, így

λ ˙ = P ˙ x+P x ˙ = P ˙ x+P( AxB R 1 B T P )x,

(399)

azaz

P ˙ =PA+ A T PPB R 1 B T P+Q,    P( T )= P f ,

(400)

amit Riccati differenciál egyenletnek nevezünk.

10.1.2. Végtelen horizontú LQR feladat

A T= esetben a P f =0) feltételből adódik a költségfüggvény alakja:

J= 0 ( x T Qx+ u T Ru )dt.

(401)

Mivel λ végső értékére nincs megszorítás, a P( t ) helyett állandó P mátrixot véve kapjuk a

PA+ A T PPB R 1 B T P+Q=0

(402)

algebrai Riccati egyenletet, és a hozzá tartozó

u= R 1 B T Px

(403)

szabályozót.

Míg R>0 feltételnek mindég teljesülni kell, tipikusan Q0 . A Q= C z T C z alakot véve a költségfüggvény

J= 0 C z x 2 + u T Rudt.

(404)

Az optimális irányítás létezéséhez az ( A, C z ) párnak detektálhatónak kell lenni.

Tétel 9.2 Tekintsük a

x ˙ =Ax+Bu,    x( 0 )= x 0 ,

(405)

lineáris rendszert a

J= 0 x T Qx+ u T Rudt,    Q= C z T C z ,  R>0.

(406)

költségfüggvénnyel, ahol az ( A,B ) pár stabilizálható és az ( A, C z ) megfigyelhető.

Az optimális szabályozó alakja

u= R 1 B T Px,

(407)

ahol P>0 a

PA+ A T PPB R 1 B T P+Q=0.

(408)

algebrai Riccati egyenlet stabilizáló megoldása. A minimális költség J * = x T ( 0 )Px( 0 ) .

Bizonyítás 9.1 Ha A stabil a

A T P+PA+Q=0

(409)

Lyapunov egyenletnek egyértelmű megoldása van: P= 0 e A T t Q e At dt , minden Q= Q T esetén. Ha Q>0 vagy Q0 és ( A,Q ) megfigyelhető, akkor P>0 .

Ha A stabil akkor az u=0 -hoz tartozó megoldás x( t )= e At x( 0 )0 . Ha ( A,  B ) stabilizálható, akkor van F stabilizáló visszacsatolás melyre e ( A+BF )t x 0 0 . E pálya mentén

J min J( x 0 ,0 )= 0 x (t) * Qx( t )dt<

(410)

( J min <J( x 0 ,Fx )= 0 x (t) * ( Q+ F T RF )x( t )dt<),

(411)

vagyis az optimális költség véges..

Egy t P= P T -vel minden u -ra, melyre x0 tekintsük a V( x )= x T Px kvadratikus funkcionált. Mivel

0 d( x T Px ) dt = 0 x ˙ T Px+ x T P x ˙ dt=x (0) T Px( 0 ),

(412)

minden stabil pálya mentén a

0 x T ( A T P+PA )x+2 x T PBudt=x (0) T Px( 0 )

(413)

költség invariáns a visszacsatolásra. Teljes négyzetté való kiegészítéssel kapjuk, hogy

u T Ru+2 x T PBu= (u u o ) T R( u u o ) x T PB R 1 B T Px,

(414)

ahol u o = R 1 B T Px választással P -re előírható, hogy kielégítse az

A T P+PA+QPB R 1 B T P=0

(415)

algebrai Riccati egyenletet. Ekkor az optimális irányítás u o és az optimális költség J( x 0 , u o )= x 0 T P x 0 .

A megfigyelhetőség szerepének illusztrálására tekintsük a stabil A cl =AB R 1 B * P zárt kört. Ekkor algebrai Riccati egyenletből

A cl T P+P A cl +Q+PB R 1 B T P=0,

(416)

vagyis a zárt kör pályája mentén

x T Px= x 0 T P x 0 0 t x T ( τ )PB R 1 BPx( τ )dτ 0 t x T ( τ )Qx( τ )dτ.

(417)

Így 0 x T Px x 0 T P x 0 . Ha P nemszinguláris lenne, létezne egy ξ 0 0 kezdeti érték, melyre Qξ( t )=0  ( C z ξ( t )=0 ) , ami ellent mond z= C z x megfigyelhetőségének. .

Másrészt ha P>0 és ( λ, x 0 ) egy sajátvektor, sajátérték párja A cl -nek, akkor

2Re( λ ) x 0 T P x 0 = x 0 T PB R 1 B T P x 0 x 0 T Q x 0 ,

(418)

azaz Re( λ )0 . Feltéve, hogy λ=jω , következik, hogy B T P x 0 =0 és Q x 0 =0 , vagyis A x 0 =0 .Ebből Q e At x 0 =0 adódna, ami ellentmond z megfigyelhetőségének. Tehát a pozitív definit megoldás stabilizáló a megfigyelhetőségi feltétel mellett.

Az egyértelműség kimutatásához tekintsünk P 1 és P 2 megoldásokat úgy, hogy A 1 =AB R 1 B * P 1 és A 2 =AB R 1 B * P 2 stabilis.

Következik, hogy

( P 1 P 2 ) A 1 + A 2 * ( P 1 P 2 )=0.

(419)

A ( X )=AX+XB Sylvester operátor akkor és csak akkor szinguláris ha A és B közös sajátértékekkel rendelkezik. Mivel A 1 és A 2 stabil, ezért az egyedüli megoldás P 1 P 2 =0 .

10.1.3. Általános végtelen horizontú LQR feladat

Általános z= C z x+ D zu u performancia jelet tekintve a költségfüggvény a

J= 0 x T Qx+2 x T Su+ u T Rudt

(420)

alakot veszi fel.

Ennek a feladathoz ugyancsak az algebrai Riccati egyenlet stabilizáló P0 megoldása

A T P+PA+Q( PB+S ) R 1 ( B T P+ S T )=0

(421)

szolgáltatja az optimális szabályozót:

u o = R 1 ( B T P+ S T )x

(422)

a J( x 0 , u o )= x 0 T P x 0 optimális költséggel.

Példa 9.1

Tervezzen LQ optimális szabályozást a

G( s )= 2 s1

(423)

átviteli függvénnyel leírt rendszerre, ha az irányíthatósági állapottér reprezentációjában mérjük a rendszer állapotait a következő költségfüggvény minimalizálásával:

J= 1 2 0 ( y 2 +r u 2 )dt,

(424)

ahol az r=3.2 súly adott. Tervezze meg a q súly értékét! Tervezze meg az optimális állapotvisszacsatolást!

A feladat megoldása:

Az állapottér reprezentáció irányíthatósági alakban:

x ˙ =x+u

(425)

y=2x

(426)

A feladatot visszavezetjük az optimalizálás standard alakjára az y=2x összefüggés felhasználásával:

J= o ( 4 x 2 +3.2 u 2 )dt

(427)

azaz az állapotokat súlyozó mátrix q=4 .

A Riccati egyenlet megoldása:

A T P+PAPb r 1 b T P+Q=0,    P>0

(428)

ahol A=1 , b=1 , Q=4 , r=3.2 . A megoldás: P=1.6 .

Az állapot-visszacsatolt erősítő:

k T = r 1 b T P=0.5,

(429)

azaz az optimális irányítójel: u=0.5x+v .

Az LQ megoldás robusztussága

- A zárt rendszer mindig stabil lesz. Az LQ tervezés a szabályozott rendszer pólusait automatikusan a bal oldali félsíkba helyezi.

- Az LQ optimális megoldás a végtelen erősítési tartalékot és a 60 -os fázistartalékot biztosít.

GM=

(430)

PM 60

(431)

Példa 9.2

Tervezzünk optimális állapot visszacsatolást LQ módszerrel a következő rendszerhez:

x ˙ =[ 0 1 0 0 ]x+[ 0 1 ]u

(432)

A tervezési paraméterek: Q=[ 1 0 0 0 ] és r=0.1 .

A feladat megoldása:

(a) Riccati egyenlet megoldása:

A T P+PAPb r 1 b T P+Q=0.

(433)

A CARE megoldása: P=[ 0.7953 0.3162 0.3162 0.2515 ] .

(b) k számítása:

k= r 1 b T P.

(434)

Az optimális állapotvisszacsatolás:

k T =[ 3.1623 2.5149 ] és

az optimális irányítójel: u=3.1623 x 1 2.5149 x 2 .

A tervezés frekvencia tartományban
A tervezés frekvencia tartományban
10.1. ábra - A tervezés frekvencia tartományban


GM=

(435)

PM= 65.5     ( 2.76 rad/sec )

(436)

10.2. Pólusok és zérusok

A szabályozott rendszer pólusai a det( sIA+bK )=0 karakterisztikus egyenlet megoldásai. A Hamilton mátrix tartalmazza az optimális irányítás megoldásait, így sajátértékei az optimális megoldás pólusait is megadják.

H=[ A 1 r b b T Q A T ]

(437)

Felhasználva a det[ A B C D ]=det( A )det( DC A 1 B ) összefüggést, felírhatjuk a Hamilton mátrixra vonatkozó karakterisztikus egyenletet:

det[ sIA 1 r b b T Q sI+ A T ]

(438)

=det( sIA )det(sI+ A T 1 r Q( sIA ) 1 b b T )=0

(439)

A karakterisztikus egyenlet (a levezetést mellőzve) a következő alakra hozható:

det( sIA )det( sI A T )

(440)

det[ r+ b T (sI A T ) 1 Q (sIA) 1 b ]=0

(441)

A Hamilton rendszer pólusai tartalmazzák a zárt rendszer pólusait, valamint a pólusok ellenkező előjelű értékeit egyaránt.

Vizsgáljuk meg, hogy a szabályozó tervezésben alkalmazott súlyozás hogyan hat a szabályozott rendszer pólusaira. Válasszuk meg az irányítójelre adott súlyt a következőképpen:

r=ρ r 0 ,

ahol r 0 rögzített és ρ értékét változtatjuk.

Válasszuk az irányítójelre adott súlyt nagy értékre: ρ .

Az irányítási feladatot minél kisebb irányítójellel kívánjuk megoldani.

A karakterisztikus egyenlet a következő alakhoz tart:

det( sIA )det( sI A T )det( ρ r 0 )=0

(442)

A szabályozott rendszer pólusai megközelítik az eredeti rendszer stabil pólusait, valamint az eredeti rendszer nemstabil pólusainak a képzetes tengelyre való tükörképét.

Válasszuk az irányítójelre adott súlyt kis értékre: ρ0 .

Az irányítási feladatban nincs előírás az irányítójel nagyságára nézve.

A karakterisztikus egyenlet a következő alakhoz tart:

det( sIA )det( sI A T )

(443)

det[ b T (sI A T ) 1 Q (sIA) 1 b ]=0

(444)

Átalakítva:

det[ b T adj( sI A T )Qadj( sIA )b ]=0

(445)

A szabályozott rendszer pólusai megközelítik az eredeti rendszer bal félsíkra eső zérusait vagy az eredeti rendszer jobb oldali zérusainak a képzetes tengelyre való tükörképét, illetve végtelenül nagy negatív értéket vesznek fel.

Példa 9.3

Tervezzünk optimális állapot visszacsatolást LQ módszerrel a következő rendszerhez:

x ˙ =[ 1 1 3 4 ]x+[ 1 0 ]u

(446)

y=[ 1 0 ]x

(447)

A rendszer pólusai p=[ 0.302; 3.302 ] , zérusai z=4 . A tervezési paraméterek: Q=[ 1 0 0 0 ] és r=ρ változó. Megjegyzés: Az első állapotváltozót tekintjük kimenetnek, a többi állaptváltozóra 0 súlyt alkalmazunk a tervezésben.

A feladat megoldása:

- ρ választással a Hamilton mátrix sajátértékei: p H =[ ±3.302; ±0.302 ] , míg a tervezett szabályozott rendszer pólusai: p z =[ 3.302; 0.302 ] ,

- ρ0 választással a Hamilton mátrix sajátértékei: p H =[ ±9.99 10 4 ; ±4 ] , míg a tervezett szabályozott rendszer pólusai: p z =[ 9.99 10 4 ; 4 ] ,

Példa 9.4

Tervezzünk optimális állapot visszacsatolást LQ módszerrel a következő nem minimálfázisú rendszerhez:

x ˙ =[ 1 1 3 4 ]x+[ 1 0 ]u

(448)

y=[ 1 0 ]x

(449)

A rendszer pólusai p=[ 2.500±0.866 ] , zérusai z=4 (pozitív). A tervezési paraméterek: Q=[ 1 0 0 0 ] és r=ρ változó. Megjegyzés: Az első állapotváltozót tekintjük kimenetnek, a többi állaptváltozóra 0 súlyt alkalmazunk a tervezésben.

A feladat megoldása:

- ρ választással a Hamilton mátrix sajátértékei:

p H =[ 2.500±0.866i; 2.500±0.866i ] ,

míg a tervezett szabályozott rendszer pólusai: p z =[ 2.500±0.866i ] ,

- ρ0 választással a Hamilton mátrix sajátértékei:

p H =[ ±9.99 10 4 ; ±4 ] ,

míg a tervezett szabályozott rendszer pólusai: p z =[ 9.99 10 4 ; 4 ] ,

A módszer alkalmazásának feltétele:

- Az állapotvektor elemei mértek legyenek.

- Az állapottér reprezentáció teljesítse az irányíthatósági feltételt.

A módszer előnyei:

- A szabályozott rendszer stabilis.

- A szabályozással szemben megfogalmazott minőségi követelmények a Q és r súlyok megválasztásával beépíthetők a szabályozás tervezésbe.

A módszer hátrányai:

- A különböző minőségi követelmények közötti ellentmondások és konfliktusok miatt a súlyok megválasztása bonyolult feladat. A súlyok tervezése során törekedni kell a minőségi követelmények közötti összhang megteremtésére. Emiatt az elért minőségi tulajdonságokat utólagosan ellenőrizni kell.

- A Riccati egyenlet megoldása numerikusan nehéz feladat.