Bár az egyszerüsített kimenet-visszacsatolásos optimális szabályozó kiszámítása jórészt az optimális
szabályozó levezetésénél alkalmazott lépéseket követi, vannak lényegi tulajdonságok, amik megkülönböztetik a két esetet.
Egyrészt nyilvánvaló, hogy egy stabil lineáris rendszerre es egy adott
esetén
akkor es csak akkor, ha létezik
amellyel
|
(594) |
minden jelre. Ezt a feltételt átírhatjuk
|
(595) |
alakba, ami azt sugallja, hogy lehetséges egy véges horizontú szabályozót definiálni, ami határesetben, ahogy a tart végtelenhez, megközelíti a
szabályozót. Így, mint azt a
esetben tettük, először célszerű a véges-horizontú FI feladatot megvizsgálni, ahol a költségfüggvény
|
(596) |
alakú, ahol es
.
Kimutatható, hogy ennek a feladatnak a megoldása egy szabályozó, ami egy olyan
irányító bemenetet generál, amelyre létezik
úgy, hogy
|
(597) |
fennáljon minden esetén, vagyis
. Határesetben azt várjuk, hogy
|
(598) |
Azonban az optimális feladattal szemben az optimális
irányítástervezésnek nem minig van megoldása, ha
túl kicsi, a zavaró
tag jelenléte miatt a költségfüggvényben. Tekinthetjük úgy, hogy az optimalizálási feladat megoldása egy olyan játszma kimenetele, amelyben a szabályozó célja egy, a költséget minimalizáló
irányító bemenet tervezése, míg a környezet egy olyan
zavarással hat ami maximalizálja ezt a költséget.
Tehát a költség függvénye
-nak és
-nek. Ha a zavarási stratégia adott akkor
egy konvex függvény aminek globális minimuma az
irányításra vétetik fel, amit az optimális
szabályozó general. Ha az irányítás fix és a
környezeti hatás változik akkor a
egy konkáv funkcionál, aminek aminek globális maximuma
esetén adódik.
A két játékos optimális stratégiája a nyeregpontban van, vagyis a költségfüggvény inflexiós pontjában, ahol a szabályozó a lehető legjobb irányítást alkalmazza a legrosszabb szavarás feltételezése mellett.
Legyen ez a nyeregponti stratégia, amit az alábbi feltétel jellemez:
|
(599) |
Tehát a optimális eljárás a legrosszabb esetre készül fel, ami egy konkrét zavarás esetén nem feltétlenül adja az arra a zavarásra optimális választ.
A véges horizontú FI feladat a
|
(600) |
költségfüggvény nyeregponti stratégiáját keresi, ahol a rendszer az alábbi formában adott:
|
(601) |
A továbbiakban feltételezzük, hogy létezik ilyen nyeregpont.
Elöször rögzítsük -t és tekintsük
jelet, ahol
egy kis állandó. Jelölje
a nyeregponti trajektóriát, vagyis
|
(602) |
és legyen az
által meghatározott trajektória, vagyis
|
(603) |
Következik, hogy ahol
kielégíti a
|
(604) |
egyenletet, azaz ahol
az
-nak megfelelő alapmátrix.
Ekkor a perturbált költségfüggvény alakja
|
(605) |
Mivel az első tag és
|
(606) |
következik, hogy
|
(607) |
Elég kis esetén a jobboldal negatív. Mivel
adódik, hogy
|
(608) |
Bevezetve az alábbi társváltozót
|
(609) |
minden -ra, a következő feltétel adódik:
|
(610) |
azaz a nyeregponti optimális irényítás
|
(611) |
ahol .
A fenti gondolatmenetet megismételhetjük, hogy a legrosszabb zavarás egy jellemzését megkapjuk: rögzítsük
-t és
ahol
. A perturbáló jel egy tetszőleges
-beli függvény és
egy tetszőleges állandó.
Eza perturbáció egy trajektórát generál, ahol
és
kielégíti az
|
(612) |
egyenletet, azaz .
Ezt behelyettesítve -be kapjuk, hogy
|
(613) |
vagyis minden esetén
|
(614) |
A társváltozó segítségével a legrosszabb zavarás kifejezhető mint
|
(615) |
ahol .
Mint ahogyan az optimális LQ irányításnál már láttuk, az optimális állapot és társváltozó kielégíti az alábbi peremérték feladatot:
|
(616) |
|
(617) |
A
|
(618) |
mátrix a rendszerhez rendelt Hamiltonian mátrix. A társváltozó kifejezhető mint
|
(619) |
ahol egy mátrixértékű függvény. Ekkor az optimális irányítás és a legrosszabb zavarás alakja
|
(620) |
Várakozásunknak megfelelően megoldása egy mátrix Riccati differenciál egyenletnek:
|
(621) |
Ennek az -nek a segítségével a költségfüggvény alakja
|
(622) |
formában írható.
Bevezetve azt az rendszert ami
-t a
-be viszi, kapjuk, hogy
|
(623) |
Ezzel következik, hogy
|
(624) |
ahol . Így az optimális
szabályozó kielégíti a
|
(625) |
feltételt minden esetén, azaz bisztosítja, hogy
.
A esetben már látott módon a végtelen horizontú optimális irányítás alakja
|
(626) |
ahol a
|
(627) |
algebrai Riccati egyenlet pozitív definit megoldása amire aszimptotikusan stabilis.
A és
eset közötti különbség az algebrai Riccati egyenlet alakjában nyilvánul meg. Míg a
Riccati egyenletnek létezik stabilizáló megoldása, ha
(a) stablizálható,
(b) párnak nincsenek nem megfigyelhető módusai a képzetes tengelyen,
ez nem elégséges a Riccati egyenletre. A továbbiakban feltesszük, hogy ezek a szükséges feltételek fennállnak és a
|
(628) |
Riccati differenciál egyenletnek vannak megoldásai minden
-re, ahol
a
alakú
|
(629) |
Riccati egyenlet megoldása.
Feltehetjük, hogy a véges horizontú feladatok költségfüggvényei
|
(630) |
alakban írhatók, azaz a terminális kültség.
Legyen egy tetszőleges nemzérus kezdeti érték és
tetszőleges
-beli zavarás.Hogy kimutassuk
egyenletes korlátosságát
-ben, meg kell mutatnunk, hogylétezik
amire
minden
esetén.
A linearitást felhasználva ahol
és
jelöli az
és
hatását
-re.Mivel a szabályozó stabilizálja a rendszert, létezik
amire
.Mivel a szabályozó garantálja, hogy
, létezik
úgy, hogy
. Következik, hogy
|
(631) |
azaz,
|
(632) |
minden és minden
esetén.
Mivel
|
(633) |
ahol
|
(634) |
minden -re, következik, hogy
|
(635) |
Mésrészt az optimális szabályozót használva
esetén
|
(636) |
Ezért
|
(637) |
felhasználásával következik, hogy
|
(638) |
minden jelre.
Ezen egyenlőtlenségek felhasználásával adódik, hogy
|
(639) |
minden -re. Tehát
egyenletesen korlátos
-ben.
Az időinvariancia miatt , így létezik
, hogy
|
(640) |
amiből következik, hogy a differenciál Riccati egyenlet megoldásai egyenletesen korlátosak -ben.
A monotonitás kimutatásához tekintsük a Riccati egyenlet deriváltját
|
(641) |
ami egy lineáris egyenlet, tehát
|
(642) |
ahol az
alapmátrixa. A Riccati egyenletből következik, hogy
|
(643) |
vagyis, egy minoton nem növekvő függvény
-ben.
Ahogyan a esetben is, az időinvarianciát felhasználva
, vagyis
egy monoton nem csökkenő függvénye
-nek.
Ugyan így, , tehát határesetben
|
(644) |
ahol egy konstans mátrix, amire
, mivel
minden
esetén. Mivel a Riccati egyenlet megoldásai folytonosan függnek a peremfeltételektől
|
(645) |
Ezért kielégíti a
Riccati differencál egyenletet, ahol a peremfeltétel
, azaz
|
(646) |
Kimutattuk tehát, hogy az algebrai Riccati egyenlet megoldásának létezése szükséges a feltétel a FI szabnályozó létezéséhez, feltéve, hogy
stabilizálható,
párnak nincsenek nem-megfigyelhető módusai a képzetes tengelyen és a Riccati differenciál egyenleteknek van megoldása minden
-re. Kimutatható, hogy ez utóbbi feltátel nem szükséges és a
algebrai Riccati egyenlet stabilizáló megoldásának létezése ekvivalens azzal, hogy a
Hamiltonian mátrixnak nincsenek sajátértékei a képzetes tengelyen.
A továbbiakban az eljárás követi a esetben már látottakat: alkalmazva az
visszacsatolást, a zárt kör
|
(647) |
|
(648) |
Ki kell mutatni, hogy ez a rendszer stabil. A Riccati egyenletből kapjuk, hogy
|
(649) |
Mivel , a
minden instabik módusa nem megfigyelhető
-re. Legyen
az
egy instabil módusa,
|
(650) |
Következik, hogy
|
(651) |
azaz, az
-nak is egy módusa. De ez a mátrix stabilis, így
összes módusa stabil és megfigyelhető.
Mivel asszimptotikusan stabilis, a KYP lemmából következik, hogy lemma that
if and only létezik
ami kielégíti az alábbi algebrai Riccati egyenletet:
|
(652) |
ahol asszimptotikusan stabilis.Nyílvánvaló, hogy
egy megoldás, így
.
Az FI feladat megoldását felhasználhatjuk az OE szűrési feladat megoldásának előállítására. A esetben felírt Kalman szűrővel analó módon képzelhetjük el a
szűrőt: míg a Kalman szűrő az állapotbcslést négyzetes középben minimalizállja a Gauss eloszlású bemenetekre nézve, a
szűrő a becslési hiba erősítését egy
szintnél kisebbre garantálja minden lehetséges korlátos energiájú bemenet esetén.
A feladatnál már látott módon az OE rendszer alakja
|
(653) |
ahol stabilis. Ekkor
ha
|
(654) |
ahol és
kielégíti az alábbi algebraic Riccati egyenletet
|
(655) |
Lemma 12.1
Egy
rendszer esetén, ahol
|
(656) |
akkor és csak akkor, ha ahol
.
Bizonyítás 12.1
Az
irányítással, ahol
kielégíti a
FI feladat algebrai Riccati egyenletét,
, ahol
a
-ről
-re vett átviteli függvény.
A véges horizontú feladatra
|
(657) |
és
|
(658) |
Legyen a
jelet
-re képző rendszer:
|
(659) |
Ha , akkor létezik
, hogy
|
(660) |
azaz, .
Fordítva, ha , akkor
|
(661) |
amiből következik, hogy .
Ebből az eredményből kiindulva írjul át az eredeti rendszert a
esethez hasonlóan két rendszer,
és
, Redheffer szorzataként:
|
(662) |
|
(663) |
ahol
|
(664) |
Mivel és a
által generált jel
, következik, hogy
|
(665) |
ami a határesetben is igaz marad.
egy OE típusú feladatot határoz meg a hozzá tartozó
|
(666) |
szabáltozóval, ahol és ahol
és
kielégíti az
|
(667) |
algebrai Riccati egyenletet.
Figyeljük meg, hogy a esettel ellentétben a
probléma két algebrai Riccati egyenlete nem független egymástól:
-ben az
mátrix az FI Riccati egyenlet megoldása.
Ha megköveteljük azonban, hogy , vagyis
invertálható, akkor az
|
(668) |
transzformáció invertálható és akkor és csak akkor elégíti ki az OF Riccati egyenletet ha
megoldása az
|
(669) |
OE algebrai Riccati egyenletnek.
Összegzésként az egyszerüsített kimenet visszacsatolásos feladat megoldását az alábbi algoritmus írja le:
Tétel 12.1 Az egyszerüsített OF feladat megoldása
|
(670) |
ahol
|
(671) |
|
(672) |
|
(673) |
|
(674) |
|
(675) |