Az előzőekben bemutattuk az LQR probléma megoldását statikus állapot visszacsatolással. A gyakorlatban azonban nem mindig áll rendelkezésre a teljes állapot. Ezért módosítani szükséges a probléma kitűzését arra az esetre, ha csak dinamikus kimenet-visszacsatolás megengedett. A klasszikus sztochasztikus irányításelmélet keretei között ez vezet el a lineáris kvadratikus Gauss eloszlást feltételező (LQG) feladathoz.
Tekintsük az alábbi performancia funkcionált
|
(501) |
ahol és
adott szimmetrikus pozitív definit mátrixok valamint
az irányító bemenet. Az állapotegyenlet valamint az
megfigyelési egyenlet a következő:
|
(502) |
|
(503) |
ahol és
független fehér zaj folyamatok. A cél egy
irányítás tervezése az
megfigyelések alapján, ahol az
irányító jel minimalizálja a
kritériumfüggvény várható értékét.
A továbbiakban ennek a feladatnak a determinisztikus változatával foglalkozunk, az úgynevezett optimális irányítástervezéssel, aminek kiindulópontja az 53 ábrán látható általános rendszerstruktúra.A
feladat során egy olyan
irányítás tervezése a cél, ami egyrészt stabilizálja a zárt hurkot valamint minimalizálja a
rendszer normát.
Az alábbiakban egy megoldást adunk a kimenet-visszacsatolásos feladatra. A levezetés először a kimenet-visszacsatolásos feladatot több specifikus, egyszerüsített feladatra vezeti vissza amelyek valamilyen módon mind az úgynevezett teljes információjú
probléma variációi. Ez utóbbi feladat megoldását egy klasszikus optimális irányítási problémára vezetjük vissza.
A feladat megoldása az egyszerüsített kimenet-visszacsatolásos -- output feedback (OF) -- probléma megoldásán alapszik, amihez az alábbi általános rendszerstruktúra tartozik:
|
(504) |
ahol
|
(505) |
|
(506) |
A és
rendszermátrixokra kirótt speciális feltételek, (505) és (506), az egyszerüsített feladat ortogonalitási feltételei. Meg lehet mutatni, hogy a általános kimenet-visszacsatolásos problémát mindig vissza lehet vezetni erre a specifikus formára. Az egyszerűsített probléma lehetővé teszi számunkra, hogy világosabban mutassunk rá az optimális
irányítás alapvető tulajdonságaira.
Az egyszerűsített probléma három másik specifikus feladattal van összefüggésben: teljes információs (full information) (FI), előrecsatolt zavarás (disturbance feedforward) (DF), és kimenet becslés (output estimation) (OE). Ebben a részben megfogalmazzuk ezeket a feladatokat és kimutatjuk egymáshoz való viszonyukat. Minden esetben feltételezzük az ortogonalitási feltételek teljesülését.
A teljes információs (FI) feladathoz tartozó általános rendszerstruktúra alakja
|
(507) |
vagyis az irányítás mind a teljes állapotot mind a
zavaró bemenetet felhasználhatja.
A előrecsatolt zavarás (DF) feladathoz tartozó általános rendszerstruktúra alakja
|
(508) |
vagyis a zavaró bemenet közvetlenül mérhető.
A kimenet becslési (OE) feladathoz tartozó általános rendszerstruktúra alakja
|
(509) |
ami egy állapotmegfigyelővel hozható összeffüggésbe.
Az alábbi alakból
|
(510) |
nyilvánvaló, hogy az OE és DF feladatok egymás algebrai duálisai. Mivel
|
(511) |
akkor és csak akkor stabilizálja -t ha
stabilizálja
-t. Mivel a DF és OE problémák duálisak, a DF megoldását fel tudjuk használni az OE szabályozó előállítására.
Az FI és DF feladatok abban az értelemben azonosak, hogy ha mindketten ugyan azzal a szabályozóval stabilizálhatók, akkor a zárt körök megegyeznek. Mivel a FI és a DF feladatok egyenértékűek az FI megoldását fel tudjuk használni a DF szabályozó megkonstruálására.
Lemma 11.1 Tegyük fel, hogy asszimptotikusan stabilis. Ekkor
-
|
(512) |
-
|
(513) |
ahol
|
(514) |
Bizonyítás 11.1 Az első tulajdonság az alábbi összefüggésnek a következménye:
|
(515) |
A második tulajdonság kimutatásához és
Redheffer szorzatát kell meghatározni:
|
(516) |
|
(517) |
|
(518) |
|
(519) |
|
(520) |
|
(521) |
ahol a
állapot vektora és
a
állapot vektora. A transzformáció sematikus vázlata a 11.1 ábrán látható.
Az hibavektor bevezetésével a transzformált állapotegyenletek a következők:
|
(522) |
|
(523) |
|
(524) |
|
(525) |
Mivel feltettük, hogy stabilis és
|
(526) |
vagyis
|
(527) |
Összefoglalásként, mindhárom feladat megoldása visszavezethető egy alkalmas teljes információs (FI) probléma megoldására.
Ahhoz, hogy a rendszernormát minimalizáljuk a stabilizáló
szabályozók függvényében, véges horizontú feladok megoldását állítjuk elő, amik konvergálnak az optimális
szabályozóhoz.
A véges horizontú feladat költségfüggvénye
|
(528) |
ahol . A megjelenő második tag a hiányzó
cél állapottal van összefüggésben. Mivel
, a költségfüggvény az alábbi alakra hozható:
|
(529) |
ami megegyezik az LQ/LQG performancia kritériummal, ha és
.A szükséges optimalitási feltételek egy teljes négyzetté alakítással kaphatók a
,
és
egyszerüsítő ortogonalitási feltételek mellett.
Az LQ szabályozó levezetése során már látott módon bevezetjük az mátrix függvényt,
, ami ki kell hogy elégítse az alábbi differenciál egyenletet:
|
(530) |
Ekkor az
|
(531) |
választással a performancia funkcionál alakja
|
(532) |
Ahhoz, hogy az optimális FI szabályozót megkapjuk a véges horizontú megoldások határértékeként, a terminális feltétel
mátrixát minden
-re alkalmasan kell megválasztani.
Legyen olyan, amire
asszimptotikusan stablilis. Ekkor van hozzá
Lyapunov függvény, azaz
amire
|
(533) |
Ez az egyenlet átírható az alábbi formába:
|
(534) |
vagyis kielégíti az
|
(535) |
egyenlőtlenséget. Kimutatható, hogy az pár detektálható.
Ezzel a választással legyen
az alábbil Riccati differenciál egyenlet megoldása:
|
(536) |
Ekkor
|
(537) |
amely egyenlet megoldása
|
(538) |
ahol és
a
mátrixhoz tartozó alapmegoldás.Ekkor
és mivel
az
mátrixfüggvény monoton nem-csökkenő
-ben.
A renszer időinvarianciáját felhasználva minden -ra
|
(539) |
Így egy monoton nem-növekvő függvény
-ben.
Mivel a Riccati egytenlet minden megoldására és
bármely
esetén, az
mátrixfüggvény egyenletesen korlátos minden
-re.Ezért létezik a
határérték. Az időinvariancia miatt minden
és
esetén
|
(540) |
Ebből következik, hogy a határérték egy konstans mátrix, ami kielégíti. az alábbi algebrai Riccati egyenletet
|
(541) |
A konstrukcióból hátra van még a stabilitás kimutatása. Először stabilitását bizonyítjuk.Az egyszerűség kedvéért
jelölje az
mátrixot és
.
Tekintsük az alábbi Lyapunov differencál egyenletet:
|
(542) |
ahol.
egy megfigyelgetősegi Gram mátrix, így
és
.Ismert, hogy
minden instabil módusa nem megfigyelhető
-ra.
Legyen az
egy instabil nem megfigyelhető módusa, azaz
|
(543) |
|
(544) |
A Lyapunov egyenletet kétoldalról szorozva és
vektorokkal adódik, hogy
.Ebből következik, hogy
vagy
.
Az első esetben a Lyapunov egyenletet -el szorozva adódik, hogy
.Azonban
stabilizálható, vagyis minden instabil mód irányítható.Ebből következik, hogy
.
Tegyük fel tehát, hogy .A Riccati egyenletet
-el jobbról szorozva adódik, hogy
, amiből következik, hogy
bármely
esetén, azaz
.Tehát
instabil de megfigyelhető
-re, ami ellentmond a rendszer detektálhatóságának és
megválasztásának.Így
asszimptotikusan stabilis. Folytonossági megfontolás alapján
|
(545) |
minden -re. Ki kell még mutatnunk, hogy egyenlőség nem állhat fenn.
Feltéve, hogy létezik és
úgy, hogy
|
(546) |
a Riccati egyenletből következik, hogy
|
(547) |
azaz, és
, ezért
.Mivel
detektálható ezért
nem tűnhet el, ami ellentmondás. Tehát a határérték egy asszimptotikusan stabilis megoldást ad.
Végezetül meg kell mutatni, hogy a határérték egy optimális szabályozó.Jelölje
ezt a határérték szabályozót.
Az FI rendszer és egy tetszőleges
|
(548) |
szabályozó az alábbi zárt kört eredményezi:
|
(549) |
|
(550) |
A norma
|
(551) |
ahol a rendszer megfigyelhetőségi Gram mátrixa ami kielégíti az alábbi Lyapunov egyenletet
|
(552) |
Legyen
|
(553) |
ahol kielégíti a következő algebrai Riccati egyenletet
|
(554) |
Ekkor kielégíti az alábbi Lyapunov egyenletet
|
(555) |
Itt a
rendszer megfigyelhetőségi Gram mátrixa.Mivel
asszimptotikusan stablilis, ez a Gram mátrix pozitív definit, tehát
.
Kimutattuk tehát, hogy minden FI szabályozóra
|
(556) |
választással, azaz és
esetén
. Ekkor
|
(557) |
tehát ez egy optimális irányítás.
Mint azt már láttuk az optimális DF és OE szabályozók megkaphatók egy FI feladat megoldásaként.
Feltéve, hogy asszimptotikusan stabilis, ha
stabilizálja
-t, akkor
stabilizálja
-et, ahol
|
(558) |
A zárt kör egyenletei
|
(559) |
|
(560) |
így
|
(561) |
ahol az FI feladat optimális állapot visszacsatolása.
Az OE feladat megoldása az OE és DF problémák dualitását felhasználva adódik:
|
(562) |
Következik, hogy
|
(563) |
ahol és
kielégíti az algebraic Riccati egyenletet
|
(564) |
Így az eredeti OE feladat megoldása
|
(565) |
Az egyszerüsített OF rendszer alakja
|
(566) |
ahol az ortogonalitási feltételek
|
(567) |
|
(568) |
fennállnak.
A szabályozó tervezésénél hasznos úgy tekinteni a rendszert mint amit egy teljes sztatikus állapotirányítás és egy zavarás vezérel. A zavarás szerepe, hogy kompenzálja a teljes állapot ismeretének hiányát.
Az FI irányítás minimalizálja energia normáját minden
zavaró jelre. Hogy az
eltérésének hatását az
hatásától a kimeneten vizsgálhassuk, bevezetjük az új
|
(569) |
bemenetet, aminek segítségével átírjuk az állapotegyenleteket:
|
(570) |
|
(571) |
|
(572) |
A kapott rendszer
|
(573) |
a bemenetet képezi le a
kimenetre.Vegyük észre, hogy
az OE alakban adott.
A , és
jeleket összekötő állapotegyenletek
|
(574) |
|
(575) |
amik az alábbi rendszert határozzák meg
|
(576) |
felbontását erre a két alrendszerre a 56 ábra szemlélteti.
Mivel az OE alakban adott, már tudjuk, hogyan határozzuk meg azt a szabályozót ami minimalizálja a
zárt kör
normáját. A kérdés az, hogy ez a szabályozó minimalizálja-e
normáját is.
A válaszhoz írjuk át a zárt kör egyenleteit az új változó figyelembe vételével:
|
(577) |
|
(578) |
ahol and
.
Mivel a kimenet két hatás eredménye, a linearitás miatt írható,
ahol
a
jel hatásának eredménye, feltéve, hogy
.A
jel hasonló módon van definiálva.
A jelet meghatározó rendszer alakja
|
(579) |
míg a jel, amit
generál, az alábbi rendszer által van meghatározva
|
(580) |
ahol
|
(581) |
Mivel kapjuk, hogy
|
(582) |
Könnyű leellenőrizni, hogy egy
-es normát megtartó leképezés, tehát egy belső függvény, és
instabil.Ez utóbbi belátásához ki kell mutatni, hogy
. Az
és
alakjaiból következik, hogy
|
(583) |
A hasonlósági transzformáció alkalmazásával, ahol
kielégíti az FI feladathoz tartozó algebrai Riccati egyenletet és kihasználva, hogy
egy belső függvény, vagyis
|
(584) |
|
(585) |
a transzformált rendszer állapotegyenleteire
|
(586) |
adódik, azaz
|
(587) |
Ebből következik, hogy .
A két rendszer ortogonalitásából következik, hogy
|
(588) |
ezért az optimális irányításnak ki kell elégíteni az alábbi egyenletet
|
(589) |
A zárt kör normáját minimalizáló
szabályozó a hozzárendelt
zárt kör minimalizálásával adódik, ahol
|
(590) |
ami egy optimális OE feladat.
Tétel 11.1 Az egyszerüsített OF feladat optimális szabályozója
|
(591) |
ahol ,
, és
valamint
kielégíti az alábbi FI és OE algebrai Riccati egyenletet:
|
(592) |
|
(593) |
Mivel az (592), (593) algebrai egyenletek nem csatoltak, ezért az OF szabályozó és
erősítéseit egymástól függetlenül meg tudjuk határozni.
a teljes állapotvisszacsatolás erősítése míg
a Luenberger megfigyelőhöz tartozó erősítés.Az optimális kimenet visszacsatolásos
szabályozó alakja egy úgynevezett megfigyelő alapú szabályozó, ahol a megfigyelőt gyakran Kalman szűrőnek nevezzük.Így az optimális kimenet visszacsatolásos
szabályozó tervezése során fenn áll a szeparációs elv.