16. fejezet - Mintavételezett rendszerek irányítása

Tartalom
16.1. Diszkrét idejű szabályozás felépítése
16.2. Az egységugrásra ekvivalens diszkrét idejű állapottér reprezentáció
16.3. Diszkrét idejű rendszerek analízise
16.3.1. Diszkrét idejű rendszerek stabilitása
16.3.2. Állapotmegfigyelhetőség és rekonstruálhatóság
16.3.3. Állapot irányíthatóság és elérhetőség
16.4. Diszkrét idejű rendszerek irányítása és a Kalman-szűrő

A fizikai szemlélet megtartásának fontossága miatt a folytonos idejű rendszer leírásokat elterjedten alkalmazzák a mechanikai és jármű modellekben. Ezért az irányítás tervezést is folytonos időben a bemutatott módszerekkel oldják meg. A beavatkozó szervek többnyire folytonos idejű mechanikai, hidraulikai és pneumatikai eszközök, ezek dinamikáját a szabályozott rendszer dinamikával együtt szoktuk kezelni.

A mai -- intelligensnek is nevezett -- rendszereinkben a modern szenzorok, mikroelektronika és informatika alkalmazása dominál. Az irányítás implementációja így igen gyakran digitális számítógépeken történik

16.1. Diszkrét idejű szabályozás felépítése

Egy tipikus szabályozási kört illusztrál a 15.1 ábra. A folytonos idejű rendszer a beavatkozó szerv dinamikát is magában foglalja. A folytonos idejű jelből, amely az A/D átalakító analóg bemenőjele, kódolási eljárással diszkrét idejű impulzus sorozatot állítunk elő, mely az A/D átalakító kimenő jele. Ezt nevezzük A/D átalakításnak. Az átalakítás során fontos szerepet tölt be a tartószerv. A tartószerv feladata hogy az A/D konverter kimenő impulzussorozatából két mintavétel között folytonos idejű jelet biztosítson. A tartószerv típusa meghatározza, hogy két mintavételi időpont között hogyan változik a jel. A legegyszerűbb tartószerv a zérusrendű (ZOH: Zero Order Hold) tartószerv, mely állandó értéken (előző kimeneti függvény érték) tartja a kimenetet, míg a a következő mintavétel sorra nem kerül.

Számítógéppel irányított rendszer blokkvázlata
16.1. ábra - Számítógéppel irányított rendszer blokkvázlata


A zérus rendű tartószerv a D/A átalakító kimenetét integrálja h mintavételi ideig. Így a zérusrendű tartószerv átviteli függvénye:

G ZOH ( s )= 1 e sh s .

(819)

Elsőrendű tartó (FOH) a két mintavételi pont értékeinek adott meredekségű összekötését biztosítja. Működésüket a 15.2 ábra illusztrálja. Léteznek magasabbrendű tartószervek, melyek törekszenek a folytonos jelalak két mintavétel közötti értékének minél tökéletesebb visszaadására.

A zérus és elsőrendű tartók működésének illusztrációja
A zérus és elsőrendű tartók működésének illusztrációja
16.2. ábra - A zérus és elsőrendű tartók működésének illusztrációja


Az időben folytonos rendszer kimenetét diszkrét jellé alakítja kódolási eljárással. Ezt a diszkretizált, majd digitalizált jelet használjuk fel a számítógéppel irányított szabályozó bemeneteként. Ezt a műveletet A/D átalakításnak nevezzük és a 69 ábrán illusztráljuk.

Időben diszkrét és folytonos rendszer időtartományi görbéje
16.3. ábra - Időben diszkrét és folytonos rendszer időtartományi görbéje


16.2. Az egységugrásra ekvivalens diszkrét idejű állapottér reprezentáció

Legyen adott az alábbi folytonos idejű állapottér reprezentáció, x( t 0 )= x 0 kezdeti állapottal:

x ˙ =Ax+bu

y= c T x

ahol az inhomogén állapotegyenlet megoldása a következő:

x( t )= e At x 0 + 0 e A( tτ ) bu( τ )dτ

y( t )= c T x( t ).

Diszkrét t k+1 időpontokra felírva t 0 = t k ,t= t k+1 ,k helyettesítéssel kapjuk az alábbi összefüggést:

x( t k+1 )= e A( t k+1 t k ) x( t k )+ t k t k+1 e A( t k+1 τ ) bu( τ )dτ

Legyen a mintavételi idő állandó, azaz

h= t k+1 t k = állandó ,

valamint feltételezzük, hogy két mintavételi idő között a bemenőjel nem változik. Alkalmazzuk az alábbi változó transzformációt:

dτ=dθ,

továbbá t k+1 τ=( t k+1 t k )+( t k τ )=hθ. Ekkor

t k t k+1 e A( t k+1 τ ) bu( τ )dτ= 0 h e A( hθ ) bu( t k )dθ=

= e Ah [ 0 h e Aθ dθ ]bu( t k )

= e Ah [ A 1 e Aθ ] 0 h bu( t k )

= A 1 e Ah ( e Ah + I n )bu( t k )

= A 1 ( e Ah I n )bu( t k )

Tehát a diszkrét idejű állapottér reprezentáció

x( t k+1 )=Φx( t k )+Γu( t k )

y( t k )= c T x( t k )+Du( t k )

ahol

Φ= e Ah

Γ= A 1 [ e Ah I n ]b

Tömörebb írásmóddal a diszkrét idejű állapottér reprezentáció fenti alakjában a diszkrét időpontokat csak indexükkel szerepeltetjük:

x( k+1 )=Φx( k )+Γu( k ),

y( k )= c T x( k ).

Példa 15.1

Átviteli függvénnyel adott rendszer diszkrét állapottér reprezentációja.

Vizsgáljuk az alábbi egytárolós arányos tagot:

G( s )= 2 s+3 .

Az 1TP tag folytonos állapottér reprezentációját az alábbi alakban írhatjuk fel:

x ˙ =ax+bu

y=x

azaz a=3 , b=2 és c=1 . Határozzuk meg az egységugrásra ekvivalens diszkrét idejű állapottér reprezentáció paraméter mátrixait.

Az egységugrásra ekvivalens diszkrét idejű állapottér reprezentáció mátrixai:

Φ= e ah = e 3h

Γ= 1 a ( e ah 1 )b= 2 3 ( 1 e 3h )

és a diszkrét idejű alak:

x( t k+1 )= e 3h x( t k )+ 2 3 ( 1 e 3h )u( t k )

y( t k )=x( t k )

Példa 15.2

Diagonál alakban adott rendszer diszkrét állapottere.

Adott az alábbi átviteli függvény:

G( s )= s+1 ( s+2 )( s+3 )

Írjuk fel a rendszer folytonos idejű állapottér reprezentációját diagonális alakban. A folytonos rendszer pólusai a p 1 =2 és p 2 =3 helyeken vannak. Levezetés nélkül az állapottér reprezentáció az alábbi:

[ x ˙ 1 x ˙ 2 ]=[ 2 0 0 3 ][ x 1 x 2 ]+[ 1 2 ]u

y=[ 1 1 ][ x 1 x 2 ]

Határozzuk meg az egységugrásra ekvivalens diszkrét idejű állapottér reprezentáció paraméter mátrixait.

Φ= e Ah =[ e 2h 0 0 e 3h ]

Γ= A 1 [ e Ah I 2 ]b

=[ 1 2 0 0 1 3 ][ e 2h 1 0 0 e 3h 1 ][ 1 2 ]=[ e 2h 1 2 2( 1 e 3h ) 3 ]

Példa 15.3

Írjuk fel az alábbi folytonos alakú állapottér reprezentáció diszkrét megfelelőjét. Folytonos állapottér reprezentáció:

[ x ˙ 1 x ˙ 2 ]=[ 3 1 2 0 ][ x 1 x 2 ]+[ 1 0 ]u

y=[ 1 1 ][ x 1 x 2 ]

A diszkrét állapottér reprezentáció elemei:

Φ= e Ah = 1 (sIA) 1 = 1 [ [ s+3 1 2 s ] 1 ]

= 1 [ 1 s 2 + 3 s + 2 [ s 1 2 s + 3 ] ] = 1 [ s ( s + 1 ) ( s + 2 ) 1 ( s + 1 ) ( s + 2 ) 2 ( s + 1 ) ( s + 2 ) s + 3 ( s + 1 ) ( s + 2 ) ]

=[ e h +2 e 2h e h + e 2h 2 e h 2 e 2h 2 e h e 2h ]

Γ = A 1 [ e A h I 2 ] b = [ 0 1 2 1 3 2 ] [ e h + 2 e 2 h 1 e h + e 2 h 2 e h 2 e 2 h 2 e h e 2 h 1 ] [ 1 0 ]

=[ e h e 2h 2 e h + e 2h +1 ]

16.3. Diszkrét idejű rendszerek analízise

A továbbiakban a diszkrét idejű rendszerek legfontosabb tulajdonságaival foglalkozunk. Ezek a stabilitás, megfigyelhetőség, irányíthatóság, továbbá két, a folytonos rendszereknél nem elkülönülő rendszer tulajdonság, az állapot rekonstruálhatóság és elérhetőség.

16.3.1. Diszkrét idejű rendszerek stabilitása

Folytonos idejű stabil rendszerek esetén az állapottér reprezentáció A mátrixa sajátértékeinek a bal komplex félsíkon kell elhelyezkedniük. A mintavételezéssel kapott rendszerben az A mátrixnak a Φ= e Ah mátrix felelt meg. Az exponenciális függvény az A matrix baloldali sajátértékeit a komplex egységkör belsejére képezi le. Így kimondható a következő állítás.

Állítás 15.1 A diszkrét idejű LTI rendszer stabilis akkor és csak akkor, ha | λ i ( Φ ) |<1,     i=1..n.

A folytonos és diszkrét rendszerek pólusainak elhelyezkedésére mutat példát a 15.3.1 ábra.

Folytonos és diszkrét idejű rendszerek pólusainak kapcsolata
16.4. ábra - Folytonos és diszkrét idejű rendszerek pólusainak kapcsolata


16.3.2. Állapotmegfigyelhetőség és rekonstruálhatóság

A diszkrét idejű rendszereknél megkülönböztetünk megfigyelhetőséget, ami a rendszer állapotának a jövőbeli megfigyelésekből (mérésekből) való meghatározhatóságát jelenti, továbbá rekonstruálhatóságot, amely a rendszer állapotának a múltbeli megfigyelésekből (mérésekből) való meghatározhatóságát jelenti.

A folytonos idejű rendszerek megfigyelhetőségére kapott eredmények közvetlenül átvihetők diszkrét idejű rendszereke.

Definíció 15.1 Az O n ( c T ,Φ )

mátrixot a diszkrét idejű rendszer megfigyelhetőségi mátrixának nevezzük, ahol

O n ( c T ,Φ )=[ c T c T Φ c T Φ n1 ].

Állítás 15.2 (A megfigyelhetőség Kálmán-féle rangfeltétele) Egy ( c T ,Φ ) pár megfigyelhető akkor és csak akkor, ha megfigyelhetőségi mátrixuk rangja megegyezik az állapottér dimenziójával, azaz

rang{ O n ( c T ,Φ ) }=n.

A rekonstruálhatóság a rendszeridentifikációban és a predikcióban fontos tulajdonság.

Definíció 15.2 A C o n ( c T ,Φ ) mátrixot a diszkrét idejű rendszer rekonstruálhatósági mátrixának nevezzük, ahol

C o n ( c T ,Φ )=[ c T Φ 1 c T Φ n ].

Állítás 15.3 (Az állapot rekonstruálhatóság rangfeltétele) Egy ( c T ,Φ ) pár rekonstruálható akkor és csak akkor, ha rekonstruálhatósági mátrixuk rangja megegyezik az állapottér dimenziójával, azaz

rang{ C o n ( c T ,Φ ) }=n.

16.3.3. Állapot irányíthatóság és elérhetőség

A folytonos idejű rendszerek irányíthatóságának kapott eredmények közvetlenül átvihetők diszkrét idejű rendszerekre is. Itt is meg kell azonban különböztetni az állapot irányíthatóságát egy tetszőleges kezdő állapotból az állapottér origójába attól az esettől amikor tetszőleges végállapotba kivánjuk a rendszert irányítani.

Az állapottér origójába való irányíthatóságot vizsgáljuk először.

Definíció 15.3 Az C n ( Φ,Γ ) mátrixot a diszkrét idejű rendszer irányíthatósági mátrixának nevezzük, ahol

C n =[ Γ ΦΓ Φ n1 Γ ]

Állítás 15.4 (Az irányíthatóság Kálmán-féle rangfeltétele) Egy ( Φ,Γ ) pár akkor és csak akkor irányítható, ha irányíthatósági mátrixuk rangja megegyezik az állapottér dimenziójával, azaz

rang{ C n ( Φ,Γ ) }=n.

A tetszőleges végállapotba való irányíthatóságot elérhetőségnek nevezzük.

Definíció 15.4 Az R n ( Φ,Γ )=[ Φ 1 Γ,, Φ n Γ ] mátrixot a diszkrét idejű rendszer elérhetőségi mátrixának nevezzük.

Állítás 15.5 (Az állapot elérhetőség rangfeltétele) Egy ( Φ,Γ ) pár akkor és csak akkor elérhető, ha elérhetőségi mátrixuk rangja megegyezik az állapottér dimenziójával, azaz

rang{ R n ( Φ,Γ ) }=n.

Példa 15.4 (Irányíthatóság és megfigyelhetőség)

Vizsgáljuk meg az alábbi állapottér reprezentációval adott rendszer irányíthatóságát és megfigyelhetőségét.

Φ=[ 1 0 0 2 ]Γ=[ 2 3 ] c T =[ 1 5 ]

Írjuk fel az irányíthatósági mátrixot:

C 2 =[ Γ ΦΓ ]=[ 2 2 3 6 ]

Mivel det C 2 0 , ezért a rendszer irányítható. Írjuk fel a megfigyelhetőségi mátrixot:

O 2 =[ c T c T Φ ]=[ 1 5 1 10 ]

Mivel det O 2 0 , ezért a rendszer megfigyelhető.

Példa 15.5 (Irányíthatóság és megfigyelhetőség)

Vizsgáljuk meg az alábbi állapottér reprezentációval adott rendszer irányíthatóságát és megfigyelhetőségét.

Φ=[ 1 0 0 2 ]Γ=[ 2 0 ] c T =[ 0 1 ]

Írjuk fel az irányíthatósági és a megfigyelhetőségi mátrixokat:

C 2 =[ Γ ΦΓ ]=[ 2 2 0 0 ]

O 2 =[ c T c T Φ ]=[ 0 1 0 2 ]

Mivel det C 2 =0 és det O 2 =0 , ezért a rendszer nem irányítható és nem is megfigyelhető.

16.4. Diszkrét idejű rendszerek irányítása és a Kalman-szűrő

Legyen a diszkrét idejű rendszer állapot egyenlete

x( k+1 )=Φx( k )+Γu( k ),    x( o )= x 0 ,

y( k )= c T x( k ),

és legyen a Φ mátrixhoz tartozó karakterisztikus egyenlet

a( z )=det( zIΦ ),zD.

Alkalmazzunk teljes állapot visszacsatolást

u( k )= k T x( k )+r( k )

alakban. A kérdés az, hogy a folytonos idejű rendszereknél megismert módon lehet-e a k erősítés alkalmas megválasztásával a zárt körben tetszőleges karakterisztikus polinomot, azaz tetszőleges pólus konfigurációt elérni.

Bebizonyítható, hogy ha Φ,Γ irányítható, akkor a zárt rendszer

α( z )=det( zIΦ+Γ k T )

karakterisztikus polinomjának együtthatói tetszőlegesen beállíthatók, a k erősítés pedig a már ismert összefüggés alapján számítható:

k T =( αa )τ (a) 1 ( Φ )C (Φ,Γ) 1 ,

ahol α,a az α( z ),a( z ) polinomok együtthatóiból képzett vektorok.

A LQR feladatot az alábbi módon adhatjuk meg. Keressük azt az u o ( k ),k=1,,N irányítást, amely minimalizálja az alábbi kritériumot (funkcionált):

J N = x N T P f x N + k=0 N1 ( x T ( k )Qx( k )+r u 2 ( k ) ),

ahol x N a rendszer végállapota.

Arra az esetre, ha N az LQR kritérium a következőképp irható:

J= k=0 ( x T ( k )Qx( k )+r u 2 ( k ) )

Tegyük fel, hogy ( Φ,Γ, c T Q 1/2 ) elérhető és megfigyelhető. Ekkor az az optimális irányítás:

u o ( k )= k o x o ( k )= [r+ Γ T PΓ] 1 Γ T PΦ x o ( k ),

ahol a P mátrix az alábbi (diszkrét idejű) Riccati - egyenlet (CARE) egyértelmű, pozitív definit megoldása:

P= Φ T [PPΓ( r+ Γ T PΓ ) 1 Γ T P ]Φ+ c T Qc.

Az LQR kritérium minimuma:

J min =J( u o )= x o ( 0 )P x o ( 0 ).

Ha több bemenet és kimenet van, akkor a megfigyelési egyenlet y( k )=Cx( k ) , az LQR kritérium pedig

J= k=0 ( x T ( k )Qx( k )+ u T ( k )Ru( k ) )

alakú, az optimális irányítás

u o ( k )= k o x o ( k )= [R+ Γ T PΓ] 1 Γ T PΦ x o ( k ),

ahol a P mátrix az alábbi (diszkrét idejű) mátrix Riccati - egyenlet (CARE) egyértelmű, pozitív definit megoldása:

P= Φ T [ PPΓ [ R+ Γ T PΓ ] 1 Γ T P]Φ+ C T QC.

Az LQG irányítás és a Kalman - szűrő diszkrét idejű megfelelőjét úgy kapjuk hogy a diszkrét idejű sztochasztikus állapottér reprezentációját írjuk fel a rendszernek (mindjárt a többváltozós eset egyenleteit írva):

x( k+1 )=Φx( k )+Γu( k )+Ψξ,

Ex( 0 )= x 0 ,E( x( 0 ) x 0 ) (x( 0 ) x 0 ) T = P 0 ,

y( k )=Cx( k )+η,

Eξ( k ) ξ T ( l )=Wδ( kl ),Eη( k ) η T ( k )=Vδ( kl ),Eξ( k ) η T ( l )=0k

A diszkrét idejű Kalman szűrő:

x ¯ ( k )=Φ x ¯ ( k1 )+Γu( k1 ),

x ^ ( k )= x ¯ ( k )+ K F ( y( k )C x ^ ( k ) )

Bizonyítható, hogy az állapot kovariancia mátrix nyomát akkor minimalizáljuk, ha a Kalman szűrő erősítési mátrixa

K F = P F C T (C P e C T +V) 1

ahol P F a diszkrét idejű szűrő Riccati egyenlet FARE egyértelmű pozitív definit megoldása (ez létezik, ha C,Φ rekonstruálható):

P F =Φ( P F P F C T ( C P F C T +V ) 1 C P F ) Φ T +ΨW Ψ T

Az LQG irányításban az optimális irányítást a determinisztikus esethez hasonlóan a becsült állapot visszacsatolásával kapjuk

u o ( k )= K c x ^ o ( k )+r( k ),

ahol K c a (ref) CARE megoldása alapján számolt állapot visszacsatolás erősítési mátrixa.