12. fejezet - H2 irányítások tervezése

Tartalom
12.1. Speciális irányítási feladatok
12.2. Teljes információs (FI) szabályozó
12.3. H2 optimális DF és OE szabályozók
12.4. Egyszerűsített OF optimális irányítás

Az előzőekben bemutattuk az LQR probléma megoldását statikus állapot visszacsatolással. A gyakorlatban azonban nem mindig áll rendelkezésre a teljes állapot. Ezért módosítani szükséges a probléma kitűzését arra az esetre, ha csak dinamikus kimenet-visszacsatolás megengedett. A klasszikus sztochasztikus irányításelmélet keretei között ez vezet el a lineáris kvadratikus Gauss eloszlást feltételező (LQG) feladathoz.

Tekintsük az alábbi performancia funkcionált

(501)

ahol és adott szimmetrikus pozitív definit mátrixok valamint az irányító bemenet. Az állapotegyenlet valamint az megfigyelési egyenlet a következő:

(502)

(503)

ahol és független fehér zaj folyamatok. A cél egy irányítás tervezése az megfigyelések alapján, ahol az irányító jel minimalizálja a kritériumfüggvény várható értékét.

A továbbiakban ennek a feladatnak a determinisztikus változatával foglalkozunk, az úgynevezett optimális irányítástervezéssel, aminek kiindulópontja az 53 ábrán látható általános rendszerstruktúra.A feladat során egy olyan irányítás tervezése a cél, ami egyrészt stabilizálja a zárt hurkot valamint minimalizálja a rendszer normát.

Általános rendszerstruktúra
12.1. ábra - Általános rendszerstruktúra


Az alábbiakban egy megoldást adunk a kimenet-visszacsatolásos feladatra. A levezetés először a kimenet-visszacsatolásos feladatot több specifikus, egyszerüsített feladatra vezeti vissza amelyek valamilyen módon mind az úgynevezett teljes információjú probléma variációi. Ez utóbbi feladat megoldását egy klasszikus optimális irányítási problémára vezetjük vissza.

12.1. Speciális irányítási feladatok

A feladat megoldása az egyszerüsített kimenet-visszacsatolásos -- output feedback (OF) -- probléma megoldásán alapszik, amihez az alábbi általános rendszerstruktúra tartozik:

(504)

ahol

(505)

(506)

A és rendszermátrixokra kirótt speciális feltételek, (505) és (506), az egyszerüsített feladat ortogonalitási feltételei. Meg lehet mutatni, hogy a általános kimenet-visszacsatolásos problémát mindig vissza lehet vezetni erre a specifikus formára. Az egyszerűsített probléma lehetővé teszi számunkra, hogy világosabban mutassunk rá az optimális irányítás alapvető tulajdonságaira.

Az egyszerűsített probléma három másik specifikus feladattal van összefüggésben: teljes információs (full information) (FI), előrecsatolt zavarás (disturbance feedforward) (DF), és kimenet becslés (output estimation) (OE). Ebben a részben megfogalmazzuk ezeket a feladatokat és kimutatjuk egymáshoz való viszonyukat. Minden esetben feltételezzük az ortogonalitási feltételek teljesülését.

A teljes információs (FI) feladathoz tartozó általános rendszerstruktúra alakja

(507)

vagyis az irányítás mind a teljes állapotot mind a zavaró bemenetet felhasználhatja.

A előrecsatolt zavarás (DF) feladathoz tartozó általános rendszerstruktúra alakja

(508)

vagyis a zavaró bemenet közvetlenül mérhető.

A kimenet becslési (OE) feladathoz tartozó általános rendszerstruktúra alakja

(509)

ami egy állapotmegfigyelővel hozható összeffüggésbe.

Az alábbi alakból

(510)

nyilvánvaló, hogy az OE és DF feladatok egymás algebrai duálisai. Mivel

(511)

akkor és csak akkor stabilizálja -t ha stabilizálja -t. Mivel a DF és OE problémák duálisak, a DF megoldását fel tudjuk használni az OE szabályozó előállítására.

Az FI és DF feladatok abban az értelemben azonosak, hogy ha mindketten ugyan azzal a szabályozóval stabilizálhatók, akkor a zárt körök megegyeznek. Mivel a FI és a DF feladatok egyenértékűek az FI megoldását fel tudjuk használni a DF szabályozó megkonstruálására.

Lemma 11.1 Tegyük fel, hogy asszimptotikusan stabilis. Ekkor

-

(512)

-

(513)

ahol

(514)

Bizonyítás 11.1 Az első tulajdonság az alábbi összefüggésnek a következménye:

(515)

DF zárt kör
12.2. ábra - DF zárt kör


A második tulajdonság kimutatásához és Redheffer szorzatát kell meghatározni:

(516)

(517)

(518)

(519)

(520)

(521)

ahol a állapot vektora és a állapot vektora. A transzformáció sematikus vázlata a 11.1 ábrán látható.

DF transzformációja FI-be
DF transzformációja FI-be
12.3. ábra - DF transzformációja FI-be


Az hibavektor bevezetésével a transzformált állapotegyenletek a következők:

(522)

(523)

(524)

(525)

Mivel feltettük, hogy stabilis és

(526)

vagyis

(527)

Összefoglalásként, mindhárom feladat megoldása visszavezethető egy alkalmas teljes információs (FI) probléma megoldására.

12.2. Teljes információs (FI) szabályozó

Ahhoz, hogy a rendszernormát minimalizáljuk a stabilizáló szabályozók függvényében, véges horizontú feladok megoldását állítjuk elő, amik konvergálnak az optimális szabályozóhoz.

A véges horizontú feladat költségfüggvénye

(528)

ahol . A megjelenő második tag a hiányzó cél állapottal van összefüggésben. Mivel , a költségfüggvény az alábbi alakra hozható:

(529)

ami megegyezik az LQ/LQG performancia kritériummal, ha és .A szükséges optimalitási feltételek egy teljes négyzetté alakítással kaphatók a , és egyszerüsítő ortogonalitási feltételek mellett.

Az LQ szabályozó levezetése során már látott módon bevezetjük az mátrix függvényt, , ami ki kell hogy elégítse az alábbi differenciál egyenletet:

(530)

Ekkor az

(531)

választással a performancia funkcionál alakja

(532)

Ahhoz, hogy az optimális FI szabályozót megkapjuk a véges horizontú megoldások határértékeként, a terminális feltétel mátrixát minden -re alkalmasan kell megválasztani.

Legyen olyan, amire asszimptotikusan stablilis. Ekkor van hozzá Lyapunov függvény, azaz amire

(533)

Ez az egyenlet átírható az alábbi formába:

(534)

vagyis kielégíti az

(535)

egyenlőtlenséget. Kimutatható, hogy az pár detektálható.

Ezzel a választással legyen az alábbil Riccati differenciál egyenlet megoldása:

(536)

Ekkor

(537)

amely egyenlet megoldása

(538)

ahol és a mátrixhoz tartozó alapmegoldás.Ekkor és mivel az mátrixfüggvény monoton nem-csökkenő -ben.

A renszer időinvarianciáját felhasználva minden -ra

(539)

Így egy monoton nem-növekvő függvény -ben.

Mivel a Riccati egytenlet minden megoldására és bármely esetén, az mátrixfüggvény egyenletesen korlátos minden -re.Ezért létezik a határérték. Az időinvariancia miatt minden és esetén

(540)

Ebből következik, hogy a határérték egy konstans mátrix, ami kielégíti. az alábbi algebrai Riccati egyenletet

(541)

A konstrukcióból hátra van még a stabilitás kimutatása. Először stabilitását bizonyítjuk.Az egyszerűség kedvéért jelölje az mátrixot és .

Tekintsük az alábbi Lyapunov differencál egyenletet:

(542)

ahol.egy megfigyelgetősegi Gram mátrix, így és .Ismert, hogy minden instabil módusa nem megfigyelhető -ra.

Legyen az egy instabil nem megfigyelhető módusa, azaz

(543)

(544)

A Lyapunov egyenletet kétoldalról szorozva és vektorokkal adódik, hogy .Ebből következik, hogy vagy .

Az első esetben a Lyapunov egyenletet -el szorozva adódik, hogy .Azonban stabilizálható, vagyis minden instabil mód irányítható.Ebből következik, hogy .

Tegyük fel tehát, hogy .A Riccati egyenletet -el jobbról szorozva adódik, hogy , amiből következik, hogy bármely esetén, azaz .Tehát instabil de megfigyelhető -re, ami ellentmond a rendszer detektálhatóságának és megválasztásának.Így asszimptotikusan stabilis. Folytonossági megfontolás alapján

(545)

minden -re. Ki kell még mutatnunk, hogy egyenlőség nem állhat fenn.

Feltéve, hogy létezik és úgy, hogy

(546)

a Riccati egyenletből következik, hogy

(547)

azaz, és , ezért .Mivel detektálható ezért nem tűnhet el, ami ellentmondás. Tehát a határérték egy asszimptotikusan stabilis megoldást ad.

Végezetül meg kell mutatni, hogy a határérték egy optimális szabályozó.Jelölje ezt a határérték szabályozót.

Az FI rendszer és egy tetszőleges

(548)

szabályozó az alábbi zárt kört eredményezi:

(549)

(550)

A norma

(551)

ahol a rendszer megfigyelhetőségi Gram mátrixa ami kielégíti az alábbi Lyapunov egyenletet

(552)

Legyen

(553)

ahol kielégíti a következő algebrai Riccati egyenletet

(554)

Ekkor kielégíti az alábbi Lyapunov egyenletet

(555)

Itt a rendszer megfigyelhetőségi Gram mátrixa.Mivel asszimptotikusan stablilis, ez a Gram mátrix pozitív definit, tehát .

Kimutattuk tehát, hogy minden FI szabályozóra

(556)

választással, azaz és esetén . Ekkor

(557)

tehát ez egy optimális irányítás.

12.3. H2 optimális DF és OE szabályozók

Mint azt már láttuk az optimális DF és OE szabályozók megkaphatók egy FI feladat megoldásaként.

Feltéve, hogy asszimptotikusan stabilis, ha stabilizálja -t, akkor stabilizálja -et, ahol

(558)

A zárt kör egyenletei

(559)

(560)

így

(561)

ahol az FI feladat optimális állapot visszacsatolása.

Az OE feladat megoldása az OE és DF problémák dualitását felhasználva adódik:

(562)

Következik, hogy

(563)

ahol és kielégíti az algebraic Riccati egyenletet

(564)

Így az eredeti OE feladat megoldása

(565)

12.4. Egyszerűsített OF optimális irányítás

Az egyszerüsített OF rendszer alakja

(566)

ahol az ortogonalitási feltételek

(567)

(568)

fennállnak.

A szabályozó tervezésénél hasznos úgy tekinteni a rendszert mint amit egy teljes sztatikus állapotirányítás és egy zavarás vezérel. A zavarás szerepe, hogy kompenzálja a teljes állapot ismeretének hiányát.

Az FI irányítás minimalizálja energia normáját minden zavaró jelre. Hogy az eltérésének hatását az hatásától a kimeneten vizsgálhassuk, bevezetjük az új

(569)

bemenetet, aminek segítségével átírjuk az állapotegyenleteket:

(570)

(571)

(572)

A kapott rendszer

(573)

a bemenetet képezi le a kimenetre.Vegyük észre, hogy az OE alakban adott.

A , és jeleket összekötő állapotegyenletek

(574)

(575)

amik az alábbi rendszert határozzák meg

(576)

felbontását erre a két alrendszerre a 56 ábra szemlélteti.

felírása két alrendszerrel
12.4. ábra - felírása két alrendszerrel


Mivel az OE alakban adott, már tudjuk, hogyan határozzuk meg azt a szabályozót ami minimalizálja a zárt kör normáját. A kérdés az, hogy ez a szabályozó minimalizálja-e normáját is.

A válaszhoz írjuk át a zárt kör egyenleteit az új változó figyelembe vételével:

(577)

(578)

ahol and .

Mivel a kimenet két hatás eredménye, a linearitás miatt írható, ahol a jel hatásának eredménye, feltéve, hogy .A jel hasonló módon van definiálva.

A jelet meghatározó rendszer alakja

(579)

míg a jel, amit generál, az alábbi rendszer által van meghatározva

(580)

ahol

(581)

Mivel kapjuk, hogy

(582)

Könnyű leellenőrizni, hogy egy -es normát megtartó leképezés, tehát egy belső függvény, és instabil.Ez utóbbi belátásához ki kell mutatni, hogy . Az és alakjaiból következik, hogy

(583)

A hasonlósági transzformáció alkalmazásával, ahol kielégíti az FI feladathoz tartozó algebrai Riccati egyenletet és kihasználva, hogy egy belső függvény, vagyis

(584)

(585)

a transzformált rendszer állapotegyenleteire

(586)

adódik, azaz

(587)

Ebből következik, hogy .

A két rendszer ortogonalitásából következik, hogy

(588)

ezért az optimális irányításnak ki kell elégíteni az alábbi egyenletet

(589)

A zárt kör normáját minimalizáló szabályozó a hozzárendelt zárt kör minimalizálásával adódik, ahol

(590)

ami egy optimális OE feladat.

Tétel 11.1 Az egyszerüsített OF feladat optimális szabályozója

(591)

ahol , , és valamint kielégíti az alábbi FI és OE algebrai Riccati egyenletet:

(592)

(593)

Mivel az (592), (593) algebrai egyenletek nem csatoltak, ezért az OF szabályozó és erősítéseit egymástól függetlenül meg tudjuk határozni.a teljes állapotvisszacsatolás erősítése míg a Luenberger megfigyelőhöz tartozó erősítés.Az optimális kimenet visszacsatolásos szabályozó alakja egy úgynevezett megfigyelő alapú szabályozó, ahol a megfigyelőt gyakran Kalman szűrőnek nevezzük.Így az optimális kimenet visszacsatolásos szabályozó tervezése során fenn áll a szeparációs elv.