Az előzőekben bemutattuk az LQR probléma megoldását statikus állapot visszacsatolással. A gyakorlatban azonban nem mindig áll rendelkezésre a teljes állapot. Ezért módosítani szükséges a probléma kitűzését arra az esetre, ha csak dinamikus kimenet-visszacsatolás megengedett. A klasszikus sztochasztikus irányításelmélet keretei között ez vezet el a lineáris kvadratikus Gauss eloszlást feltételező (LQG) feladathoz.
Tekintsük az alábbi performancia funkcionált
|
(501) |
ahol és adott szimmetrikus pozitív definit mátrixok valamint az irányító bemenet. Az állapotegyenlet valamint az megfigyelési egyenlet a következő:
|
(502) |
|
(503) |
ahol és független fehér zaj folyamatok. A cél egy irányítás tervezése az megfigyelések alapján, ahol az irányító jel minimalizálja a kritériumfüggvény várható értékét.
A továbbiakban ennek a feladatnak a determinisztikus változatával foglalkozunk, az úgynevezett optimális irányítástervezéssel, aminek kiindulópontja az 53 ábrán látható általános rendszerstruktúra.A feladat során egy olyan irányítás tervezése a cél, ami egyrészt stabilizálja a zárt hurkot valamint minimalizálja a rendszer normát.
Az alábbiakban egy megoldást adunk a kimenet-visszacsatolásos feladatra. A levezetés először a kimenet-visszacsatolásos feladatot több specifikus, egyszerüsített feladatra vezeti vissza amelyek valamilyen módon mind az úgynevezett teljes információjú probléma variációi. Ez utóbbi feladat megoldását egy klasszikus optimális irányítási problémára vezetjük vissza.
A feladat megoldása az egyszerüsített kimenet-visszacsatolásos -- output feedback (OF) -- probléma megoldásán alapszik, amihez az alábbi általános rendszerstruktúra tartozik:
|
(504) |
ahol
|
(505) |
|
(506) |
A és rendszermátrixokra kirótt speciális feltételek, (505) és (506), az egyszerüsített feladat ortogonalitási feltételei. Meg lehet mutatni, hogy a általános kimenet-visszacsatolásos problémát mindig vissza lehet vezetni erre a specifikus formára. Az egyszerűsített probléma lehetővé teszi számunkra, hogy világosabban mutassunk rá az optimális irányítás alapvető tulajdonságaira.
Az egyszerűsített probléma három másik specifikus feladattal van összefüggésben: teljes információs (full information) (FI), előrecsatolt zavarás (disturbance feedforward) (DF), és kimenet becslés (output estimation) (OE). Ebben a részben megfogalmazzuk ezeket a feladatokat és kimutatjuk egymáshoz való viszonyukat. Minden esetben feltételezzük az ortogonalitási feltételek teljesülését.
A teljes információs (FI) feladathoz tartozó általános rendszerstruktúra alakja
|
(507) |
vagyis az irányítás mind a teljes állapotot mind a zavaró bemenetet felhasználhatja.
A előrecsatolt zavarás (DF) feladathoz tartozó általános rendszerstruktúra alakja
|
(508) |
vagyis a zavaró bemenet közvetlenül mérhető.
A kimenet becslési (OE) feladathoz tartozó általános rendszerstruktúra alakja
|
(509) |
ami egy állapotmegfigyelővel hozható összeffüggésbe.
Az alábbi alakból
|
(510) |
nyilvánvaló, hogy az OE és DF feladatok egymás algebrai duálisai. Mivel
|
(511) |
akkor és csak akkor stabilizálja -t ha stabilizálja -t. Mivel a DF és OE problémák duálisak, a DF megoldását fel tudjuk használni az OE szabályozó előállítására.
Az FI és DF feladatok abban az értelemben azonosak, hogy ha mindketten ugyan azzal a szabályozóval stabilizálhatók, akkor a zárt körök megegyeznek. Mivel a FI és a DF feladatok egyenértékűek az FI megoldását fel tudjuk használni a DF szabályozó megkonstruálására.
Lemma 11.1 Tegyük fel, hogy asszimptotikusan stabilis. Ekkor
-
|
(512) |
-
|
(513) |
ahol
|
(514) |
Bizonyítás 11.1 Az első tulajdonság az alábbi összefüggésnek a következménye:
|
(515) |
A második tulajdonság kimutatásához és Redheffer szorzatát kell meghatározni:
|
(516) |
|
(517) |
|
(518) |
|
(519) |
|
(520) |
|
(521) |
ahol a állapot vektora és a állapot vektora. A transzformáció sematikus vázlata a 11.1 ábrán látható.
Az hibavektor bevezetésével a transzformált állapotegyenletek a következők:
|
(522) |
|
(523) |
|
(524) |
|
(525) |
Mivel feltettük, hogy stabilis és
|
(526) |
vagyis
|
(527) |
Összefoglalásként, mindhárom feladat megoldása visszavezethető egy alkalmas teljes információs (FI) probléma megoldására.
Ahhoz, hogy a rendszernormát minimalizáljuk a stabilizáló szabályozók függvényében, véges horizontú feladok megoldását állítjuk elő, amik konvergálnak az optimális szabályozóhoz.
A véges horizontú feladat költségfüggvénye
|
(528) |
ahol . A megjelenő második tag a hiányzó cél állapottal van összefüggésben. Mivel , a költségfüggvény az alábbi alakra hozható:
|
(529) |
ami megegyezik az LQ/LQG performancia kritériummal, ha és .A szükséges optimalitási feltételek egy teljes négyzetté alakítással kaphatók a , és egyszerüsítő ortogonalitási feltételek mellett.
Az LQ szabályozó levezetése során már látott módon bevezetjük az mátrix függvényt, , ami ki kell hogy elégítse az alábbi differenciál egyenletet:
|
(530) |
Ekkor az
|
(531) |
választással a performancia funkcionál alakja
|
(532) |
Ahhoz, hogy az optimális FI szabályozót megkapjuk a véges horizontú megoldások határértékeként, a terminális feltétel mátrixát minden -re alkalmasan kell megválasztani.
Legyen olyan, amire asszimptotikusan stablilis. Ekkor van hozzá Lyapunov függvény, azaz amire
|
(533) |
Ez az egyenlet átírható az alábbi formába:
|
(534) |
vagyis kielégíti az
|
(535) |
egyenlőtlenséget. Kimutatható, hogy az pár detektálható.
Ezzel a választással legyen az alábbil Riccati differenciál egyenlet megoldása:
|
(536) |
Ekkor
|
(537) |
amely egyenlet megoldása
|
(538) |
ahol és a mátrixhoz tartozó alapmegoldás.Ekkor és mivel az mátrixfüggvény monoton nem-csökkenő -ben.
A renszer időinvarianciáját felhasználva minden -ra
|
(539) |
Így egy monoton nem-növekvő függvény -ben.
Mivel a Riccati egytenlet minden megoldására és bármely esetén, az mátrixfüggvény egyenletesen korlátos minden -re.Ezért létezik a határérték. Az időinvariancia miatt minden és esetén
|
(540) |
Ebből következik, hogy a határérték egy konstans mátrix, ami kielégíti. az alábbi algebrai Riccati egyenletet
|
(541) |
A konstrukcióból hátra van még a stabilitás kimutatása. Először stabilitását bizonyítjuk.Az egyszerűség kedvéért jelölje az mátrixot és .
Tekintsük az alábbi Lyapunov differencál egyenletet:
|
(542) |
ahol.egy megfigyelgetősegi Gram mátrix, így és .Ismert, hogy minden instabil módusa nem megfigyelhető -ra.
Legyen az egy instabil nem megfigyelhető módusa, azaz
|
(543) |
|
(544) |
A Lyapunov egyenletet kétoldalról szorozva és vektorokkal adódik, hogy .Ebből következik, hogy vagy .
Az első esetben a Lyapunov egyenletet -el szorozva adódik, hogy .Azonban stabilizálható, vagyis minden instabil mód irányítható.Ebből következik, hogy .
Tegyük fel tehát, hogy .A Riccati egyenletet -el jobbról szorozva adódik, hogy , amiből következik, hogy bármely esetén, azaz .Tehát instabil de megfigyelhető -re, ami ellentmond a rendszer detektálhatóságának és megválasztásának.Így asszimptotikusan stabilis. Folytonossági megfontolás alapján
|
(545) |
minden -re. Ki kell még mutatnunk, hogy egyenlőség nem állhat fenn.
Feltéve, hogy létezik és úgy, hogy
|
(546) |
a Riccati egyenletből következik, hogy
|
(547) |
azaz, és , ezért .Mivel detektálható ezért nem tűnhet el, ami ellentmondás. Tehát a határérték egy asszimptotikusan stabilis megoldást ad.
Végezetül meg kell mutatni, hogy a határérték egy optimális szabályozó.Jelölje ezt a határérték szabályozót.
Az FI rendszer és egy tetszőleges
|
(548) |
szabályozó az alábbi zárt kört eredményezi:
|
(549) |
|
(550) |
A norma
|
(551) |
ahol a rendszer megfigyelhetőségi Gram mátrixa ami kielégíti az alábbi Lyapunov egyenletet
|
(552) |
Legyen
|
(553) |
ahol kielégíti a következő algebrai Riccati egyenletet
|
(554) |
Ekkor kielégíti az alábbi Lyapunov egyenletet
|
(555) |
Itt a rendszer megfigyelhetőségi Gram mátrixa.Mivel asszimptotikusan stablilis, ez a Gram mátrix pozitív definit, tehát .
Kimutattuk tehát, hogy minden FI szabályozóra
|
(556) |
választással, azaz és esetén . Ekkor
|
(557) |
tehát ez egy optimális irányítás.
Mint azt már láttuk az optimális DF és OE szabályozók megkaphatók egy FI feladat megoldásaként.
Feltéve, hogy asszimptotikusan stabilis, ha stabilizálja -t, akkor stabilizálja -et, ahol
|
(558) |
A zárt kör egyenletei
|
(559) |
|
(560) |
így
|
(561) |
ahol az FI feladat optimális állapot visszacsatolása.
Az OE feladat megoldása az OE és DF problémák dualitását felhasználva adódik:
|
(562) |
Következik, hogy
|
(563) |
ahol és kielégíti az algebraic Riccati egyenletet
|
(564) |
Így az eredeti OE feladat megoldása
|
(565) |
Az egyszerüsített OF rendszer alakja
|
(566) |
ahol az ortogonalitási feltételek
|
(567) |
|
(568) |
fennállnak.
A szabályozó tervezésénél hasznos úgy tekinteni a rendszert mint amit egy teljes sztatikus állapotirányítás és egy zavarás vezérel. A zavarás szerepe, hogy kompenzálja a teljes állapot ismeretének hiányát.
Az FI irányítás minimalizálja energia normáját minden zavaró jelre. Hogy az eltérésének hatását az hatásától a kimeneten vizsgálhassuk, bevezetjük az új
|
(569) |
bemenetet, aminek segítségével átírjuk az állapotegyenleteket:
|
(570) |
|
(571) |
|
(572) |
A kapott rendszer
|
(573) |
a bemenetet képezi le a kimenetre.Vegyük észre, hogy az OE alakban adott.
A , és jeleket összekötő állapotegyenletek
|
(574) |
|
(575) |
amik az alábbi rendszert határozzák meg
|
(576) |
felbontását erre a két alrendszerre a 56 ábra szemlélteti.
Mivel az OE alakban adott, már tudjuk, hogyan határozzuk meg azt a szabályozót ami minimalizálja a zárt kör normáját. A kérdés az, hogy ez a szabályozó minimalizálja-e normáját is.
A válaszhoz írjuk át a zárt kör egyenleteit az új változó figyelembe vételével:
|
(577) |
|
(578) |
ahol and .
Mivel a kimenet két hatás eredménye, a linearitás miatt írható, ahol a jel hatásának eredménye, feltéve, hogy .A jel hasonló módon van definiálva.
A jelet meghatározó rendszer alakja
|
(579) |
míg a jel, amit generál, az alábbi rendszer által van meghatározva
|
(580) |
ahol
|
(581) |
Mivel kapjuk, hogy
|
(582) |
Könnyű leellenőrizni, hogy egy -es normát megtartó leképezés, tehát egy belső függvény, és instabil.Ez utóbbi belátásához ki kell mutatni, hogy . Az és alakjaiból következik, hogy
|
(583) |
A hasonlósági transzformáció alkalmazásával, ahol kielégíti az FI feladathoz tartozó algebrai Riccati egyenletet és kihasználva, hogy egy belső függvény, vagyis
|
(584) |
|
(585) |
a transzformált rendszer állapotegyenleteire
|
(586) |
adódik, azaz
|
(587) |
Ebből következik, hogy .
A két rendszer ortogonalitásából következik, hogy
|
(588) |
ezért az optimális irányításnak ki kell elégíteni az alábbi egyenletet
|
(589) |
A zárt kör normáját minimalizáló szabályozó a hozzárendelt zárt kör minimalizálásával adódik, ahol
|
(590) |
ami egy optimális OE feladat.
Tétel 11.1 Az egyszerüsített OF feladat optimális szabályozója
|
(591) |
ahol , , és valamint kielégíti az alábbi FI és OE algebrai Riccati egyenletet:
|
(592) |
|
(593) |
Mivel az (592), (593) algebrai egyenletek nem csatoltak, ezért az OF szabályozó és erősítéseit egymástól függetlenül meg tudjuk határozni.a teljes állapotvisszacsatolás erősítése míg a Luenberger megfigyelőhöz tartozó erősítés.Az optimális kimenet visszacsatolásos szabályozó alakja egy úgynevezett megfigyelő alapú szabályozó, ahol a megfigyelőt gyakran Kalman szűrőnek nevezzük.Így az optimális kimenet visszacsatolásos szabályozó tervezése során fenn áll a szeparációs elv.