Bár az egyszerüsített kimenet-visszacsatolásos optimális szabályozó kiszámítása jórészt az optimális szabályozó levezetésénél alkalmazott lépéseket követi, vannak lényegi tulajdonságok, amik megkülönböztetik a két esetet.
Egyrészt nyilvánvaló, hogy egy stabil lineáris rendszerre es egy adott esetén akkor es csak akkor, ha létezik amellyel
|
(594) |
minden jelre. Ezt a feltételt átírhatjuk
|
(595) |
alakba, ami azt sugallja, hogy lehetséges egy véges horizontú szabályozót definiálni, ami határesetben, ahogy a tart végtelenhez, megközelíti a szabályozót. Így, mint azt a esetben tettük, először célszerű a véges-horizontú FI feladatot megvizsgálni, ahol a költségfüggvény
|
(596) |
alakú, ahol es .
Kimutatható, hogy ennek a feladatnak a megoldása egy szabályozó, ami egy olyan irányító bemenetet generál, amelyre létezik úgy, hogy
|
(597) |
fennáljon minden esetén, vagyis . Határesetben azt várjuk, hogy
|
(598) |
Azonban az optimális feladattal szemben az optimális irányítástervezésnek nem minig van megoldása, ha túl kicsi, a zavaró tag jelenléte miatt a költségfüggvényben. Tekinthetjük úgy, hogy az optimalizálási feladat megoldása egy olyan játszma kimenetele, amelyben a szabályozó célja egy, a költséget minimalizáló irányító bemenet tervezése, míg a környezet egy olyan zavarással hat ami maximalizálja ezt a költséget.
Tehát a költség függvénye -nak és -nek. Ha a zavarási stratégia adott akkor egy konvex függvény aminek globális minimuma az irányításra vétetik fel, amit az optimális szabályozó general. Ha az irányítás fix és a környezeti hatás változik akkor a egy konkáv funkcionál, aminek aminek globális maximuma esetén adódik.
A két játékos optimális stratégiája a nyeregpontban van, vagyis a költségfüggvény inflexiós pontjában, ahol a szabályozó a lehető legjobb irányítást alkalmazza a legrosszabb szavarás feltételezése mellett.
Legyen ez a nyeregponti stratégia, amit az alábbi feltétel jellemez:
|
(599) |
Tehát a optimális eljárás a legrosszabb esetre készül fel, ami egy konkrét zavarás esetén nem feltétlenül adja az arra a zavarásra optimális választ.
A véges horizontú FI feladat a
|
(600) |
költségfüggvény nyeregponti stratégiáját keresi, ahol a rendszer az alábbi formában adott:
|
(601) |
A továbbiakban feltételezzük, hogy létezik ilyen nyeregpont.
Elöször rögzítsük -t és tekintsük jelet, ahol egy kis állandó. Jelölje a nyeregponti trajektóriát, vagyis
|
(602) |
és legyen az által meghatározott trajektória, vagyis
|
(603) |
Következik, hogy ahol kielégíti a
|
(604) |
egyenletet, azaz ahol az -nak megfelelő alapmátrix.
Ekkor a perturbált költségfüggvény alakja
|
(605) |
Mivel az első tag és
|
(606) |
következik, hogy
|
(607) |
Elég kis esetén a jobboldal negatív. Mivel adódik, hogy
|
(608) |
Bevezetve az alábbi társváltozót
|
(609) |
minden -ra, a következő feltétel adódik:
|
(610) |
azaz a nyeregponti optimális irényítás
|
(611) |
ahol .
A fenti gondolatmenetet megismételhetjük, hogy a legrosszabb zavarás egy jellemzését megkapjuk: rögzítsük -t és ahol . A perturbáló jel egy tetszőleges -beli függvény és egy tetszőleges állandó.
Eza perturbáció egy trajektórát generál, ahol és kielégíti az
|
(612) |
egyenletet, azaz .
Ezt behelyettesítve -be kapjuk, hogy
|
(613) |
vagyis minden esetén
|
(614) |
A társváltozó segítségével a legrosszabb zavarás kifejezhető mint
|
(615) |
ahol .
Mint ahogyan az optimális LQ irányításnál már láttuk, az optimális állapot és társváltozó kielégíti az alábbi peremérték feladatot:
|
(616) |
|
(617) |
A
|
(618) |
mátrix a rendszerhez rendelt Hamiltonian mátrix. A társváltozó kifejezhető mint
|
(619) |
ahol egy mátrixértékű függvény. Ekkor az optimális irányítás és a legrosszabb zavarás alakja
|
(620) |
Várakozásunknak megfelelően megoldása egy mátrix Riccati differenciál egyenletnek:
|
(621) |
Ennek az -nek a segítségével a költségfüggvény alakja
|
(622) |
formában írható.
Bevezetve azt az rendszert ami -t a -be viszi, kapjuk, hogy
|
(623) |
Ezzel következik, hogy
|
(624) |
ahol . Így az optimális szabályozó kielégíti a
|
(625) |
feltételt minden esetén, azaz bisztosítja, hogy .
A esetben már látott módon a végtelen horizontú optimális irányítás alakja
|
(626) |
ahol a
|
(627) |
algebrai Riccati egyenlet pozitív definit megoldása amire aszimptotikusan stabilis.
A és eset közötti különbség az algebrai Riccati egyenlet alakjában nyilvánul meg. Míg a Riccati egyenletnek létezik stabilizáló megoldása, ha
(a) stablizálható,
(b) párnak nincsenek nem megfigyelhető módusai a képzetes tengelyen,
ez nem elégséges a Riccati egyenletre. A továbbiakban feltesszük, hogy ezek a szükséges feltételek fennállnak és a
|
(628) |
Riccati differenciál egyenletnek vannak megoldásai minden -re, ahol a alakú
|
(629) |
Riccati egyenlet megoldása.
Feltehetjük, hogy a véges horizontú feladatok költségfüggvényei
|
(630) |
alakban írhatók, azaz a terminális kültség.
Legyen egy tetszőleges nemzérus kezdeti érték és tetszőleges -beli zavarás.Hogy kimutassuk egyenletes korlátosságát -ben, meg kell mutatnunk, hogylétezik amire minden esetén.
A linearitást felhasználva ahol és jelöli az és hatását -re.Mivel a szabályozó stabilizálja a rendszert, létezik amire .Mivel a szabályozó garantálja, hogy , létezik úgy, hogy . Következik, hogy
|
(631) |
azaz,
|
(632) |
minden és minden esetén.
Mivel
|
(633) |
ahol
|
(634) |
minden -re, következik, hogy
|
(635) |
Mésrészt az optimális szabályozót használva esetén
|
(636) |
Ezért
|
(637) |
felhasználásával következik, hogy
|
(638) |
minden jelre.
Ezen egyenlőtlenségek felhasználásával adódik, hogy
|
(639) |
minden -re. Tehát egyenletesen korlátos -ben.
Az időinvariancia miatt , így létezik , hogy
|
(640) |
amiből következik, hogy a differenciál Riccati egyenlet megoldásai egyenletesen korlátosak -ben.
A monotonitás kimutatásához tekintsük a Riccati egyenlet deriváltját
|
(641) |
ami egy lineáris egyenlet, tehát
|
(642) |
ahol az alapmátrixa. A Riccati egyenletből következik, hogy
|
(643) |
vagyis, egy minoton nem növekvő függvény -ben.
Ahogyan a esetben is, az időinvarianciát felhasználva , vagyis egy monoton nem csökkenő függvénye -nek.
Ugyan így, , tehát határesetben
|
(644) |
ahol egy konstans mátrix, amire , mivel minden esetén. Mivel a Riccati egyenlet megoldásai folytonosan függnek a peremfeltételektől
|
(645) |
Ezért kielégíti a Riccati differencál egyenletet, ahol a peremfeltétel , azaz
|
(646) |
Kimutattuk tehát, hogy az algebrai Riccati egyenlet megoldásának létezése szükséges a feltétel a FI szabnályozó létezéséhez, feltéve, hogy stabilizálható, párnak nincsenek nem-megfigyelhető módusai a képzetes tengelyen és a Riccati differenciál egyenleteknek van megoldása minden -re. Kimutatható, hogy ez utóbbi feltátel nem szükséges és a algebrai Riccati egyenlet stabilizáló megoldásának létezése ekvivalens azzal, hogy a Hamiltonian mátrixnak nincsenek sajátértékei a képzetes tengelyen.
A továbbiakban az eljárás követi a esetben már látottakat: alkalmazva az visszacsatolást, a zárt kör
|
(647) |
|
(648) |
Ki kell mutatni, hogy ez a rendszer stabil. A Riccati egyenletből kapjuk, hogy
|
(649) |
Mivel , a minden instabik módusa nem megfigyelhető -re. Legyen az egy instabil módusa,
|
(650) |
Következik, hogy
|
(651) |
azaz, az -nak is egy módusa. De ez a mátrix stabilis, így összes módusa stabil és megfigyelhető.
Mivel asszimptotikusan stabilis, a KYP lemmából következik, hogy lemma that if and only létezik ami kielégíti az alábbi algebrai Riccati egyenletet:
|
(652) |
ahol asszimptotikusan stabilis.Nyílvánvaló, hogy egy megoldás, így .
Az FI feladat megoldását felhasználhatjuk az OE szűrési feladat megoldásának előállítására. A esetben felírt Kalman szűrővel analó módon képzelhetjük el a szűrőt: míg a Kalman szűrő az állapotbcslést négyzetes középben minimalizállja a Gauss eloszlású bemenetekre nézve, a szűrő a becslési hiba erősítését egy szintnél kisebbre garantálja minden lehetséges korlátos energiájú bemenet esetén.
A feladatnál már látott módon az OE rendszer alakja
|
(653) |
ahol stabilis. Ekkor ha
|
(654) |
ahol és kielégíti az alábbi algebraic Riccati egyenletet
|
(655) |
Lemma 12.1 Egy rendszer esetén, ahol
|
(656) |
akkor és csak akkor, ha ahol .
Bizonyítás 12.1 Az irányítással, ahol kielégíti a FI feladat algebrai Riccati egyenletét, , ahol a -ről -re vett átviteli függvény.
A véges horizontú feladatra
|
(657) |
és
|
(658) |
Legyen a jelet -re képző rendszer:
|
(659) |
Ha , akkor létezik , hogy
|
(660) |
azaz, .
Fordítva, ha , akkor
|
(661) |
amiből következik, hogy .
Ebből az eredményből kiindulva írjul át az eredeti rendszert a esethez hasonlóan két rendszer, és , Redheffer szorzataként:
|
(662) |
|
(663) |
ahol
|
(664) |
Mivel és a által generált jel , következik, hogy
|
(665) |
ami a határesetben is igaz marad.
egy OE típusú feladatot határoz meg a hozzá tartozó
|
(666) |
szabáltozóval, ahol és ahol és kielégíti az
|
(667) |
algebrai Riccati egyenletet.
Figyeljük meg, hogy a esettel ellentétben a probléma két algebrai Riccati egyenlete nem független egymástól: -ben az mátrix az FI Riccati egyenlet megoldása.
Ha megköveteljük azonban, hogy , vagyis invertálható, akkor az
|
(668) |
transzformáció invertálható és akkor és csak akkor elégíti ki az OF Riccati egyenletet ha megoldása az
|
(669) |
OE algebrai Riccati egyenletnek.
Összegzésként az egyszerüsített kimenet visszacsatolásos feladat megoldását az alábbi algoritmus írja le:
Tétel 12.1 Az egyszerüsített OF feladat megoldása
|
(670) |
ahol
|
(671) |
|
(672) |
|
(673) |
|
(674) |
|
(675) |