12. fejezet - H2 irányítások tervezése

Tartalom
12.1. Speciális irányítási feladatok
12.2. Teljes információs (FI) szabályozó
12.3. H2 optimális DF és OE szabályozók
12.4. Egyszerűsített OF optimális irányítás

Az előzőekben bemutattuk az LQR probléma megoldását statikus állapot visszacsatolással. A gyakorlatban azonban nem mindig áll rendelkezésre a teljes állapot. Ezért módosítani szükséges a probléma kitűzését arra az esetre, ha csak dinamikus kimenet-visszacsatolás megengedett. A klasszikus sztochasztikus irányításelmélet keretei között ez vezet el a lineáris kvadratikus Gauss eloszlást feltételező (LQG) feladathoz.

Tekintsük az alábbi performancia funkcionált

J( u )= 0 ( x T ( t )Qx( t )+ u T ( t )Ru( t ) )dt

(501)

ahol Q és R adott szimmetrikus pozitív definit mátrixok valamint u( t ) az irányító bemenet. Az állapotegyenlet valamint az y( t ) megfigyelési egyenlet a következő:

x ˙ =Ax+Bu+w,

(502)

y=Cx+Du+v

(503)

ahol w és v független fehér zaj folyamatok. A cél egy K irányítás tervezése az y megfigyelések alapján, ahol az u irányító jel minimalizálja a J( u ) kritériumfüggvény várható értékét.

A továbbiakban ennek a feladatnak a determinisztikus változatával foglalkozunk, az úgynevezett optimális 2 irányítástervezéssel, aminek kiindulópontja az 53 ábrán látható általános rendszerstruktúra.A 2 feladat során egy olyan K irányítás tervezése a cél, ami egyrészt stabilizálja a zárt hurkot valamint minimalizálja a l ( P,  K ) 2 rendszer normát.

Általános rendszerstruktúra
12.1. ábra - Általános rendszerstruktúra


Az alábbiakban egy megoldást adunk a 2 kimenet-visszacsatolásos feladatra. A levezetés először a kimenet-visszacsatolásos feladatot több specifikus, egyszerüsített feladatra vezeti vissza amelyek valamilyen módon mind az úgynevezett teljes információjú 2 probléma variációi. Ez utóbbi feladat megoldását egy klasszikus optimális irányítási problémára vezetjük vissza.

12.1. Speciális irányítási feladatok

A 2 feladat megoldása az egyszerüsített kimenet-visszacsatolásos -- output feedback (OF) -- probléma megoldásán alapszik, amihez az alábbi általános rendszerstruktúra tartozik:

P( s )=[ A B 1 B 2 C 1 0 D 12 C 2 D 21 0 ]

(504)

ahol

D 12 T ( C 1 D 12 )=( 0 I ),

(505)

( B 1 D 21 ) D 21 T =( 0 I ).

(506)

A C és D rendszermátrixokra kirótt speciális feltételek, (505) és (506), az egyszerüsített feladat ortogonalitási feltételei. Meg lehet mutatni, hogy a általános kimenet-visszacsatolásos problémát mindig vissza lehet vezetni erre a specifikus formára. Az egyszerűsített probléma lehetővé teszi számunkra, hogy világosabban mutassunk rá az optimális 2 irányítás alapvető tulajdonságaira.

Az egyszerűsített probléma három másik specifikus feladattal van összefüggésben: teljes információs (full information) (FI), előrecsatolt zavarás (disturbance feedforward) (DF), és kimenet becslés (output estimation) (OE). Ebben a részben megfogalmazzuk ezeket a feladatokat és kimutatjuk egymáshoz való viszonyukat. Minden esetben feltételezzük az ortogonalitási feltételek teljesülését.

A teljes információs (FI) feladathoz tartozó általános rendszerstruktúra alakja

P FI ( s )=[ A B 1 B 2 C 1 D 11 D 12 I 0 0 0 I 0 ],

(507)

vagyis az irányítás mind a teljes x állapotot mind a w zavaró bemenetet felhasználhatja.

A előrecsatolt zavarás (DF) feladathoz tartozó általános rendszerstruktúra alakja

P DF ( s )=[ A B 1 B 2 C 1 D 11 D 12 C 2 I 0 ],

(508)

vagyis a w zavaró bemenet közvetlenül mérhető.

A kimenet becslési (OE) feladathoz tartozó általános rendszerstruktúra alakja

P OE ( s )=[ A B 1 B 2 C 1 D 11 I C 2 D 21 0 ],

(509)

ami egy állapotmegfigyelővel hozható összeffüggésbe.

Az alábbi alakból

P DF T =[ A T C 1 T C 2 T B 1 T D 11 T I B 2 T D 12 T 0 ]

(510)

nyilvánvaló, hogy az OE és DF feladatok egymás algebrai duálisai. Mivel

( ( P,  K )) T = ( P T ,   K T ),

(511)

K akkor és csak akkor stabilizálja P -t ha K T stabilizálja P T -t. Mivel a DF és OE problémák duálisak, a DF megoldását fel tudjuk használni az OE szabályozó előállítására.

Az FI és DF feladatok abban az értelemben azonosak, hogy ha mindketten ugyan azzal a szabályozóval stabilizálhatók, akkor a zárt körök megegyeznek. Mivel a FI és a DF feladatok egyenértékűek az FI megoldását fel tudjuk használni a DF szabályozó megkonstruálására.

Lemma 11.1 Tegyük fel, hogy A B 1 C 2 asszimptotikusan stabilis. Ekkor

-

( P DF ,   K DF )= ( P FI ,   K DF ( C 2 I ) )

(512)

-

( P FI ,   K FI )= ( P DF ,     ( P ^ DF ,   K FI ) ),

(513)

ahol

P ^ DF =[ A B 1 C 2 B 1 B 2 0 0 I I 0 0 C 2 I 0 ].

(514)

Bizonyítás 11.1 Az első tulajdonság az alábbi összefüggésnek a következménye:

P DF =( I 0 0 0 C 2 I ) P FI .

(515)

DF zárt kör
12.2. ábra - DF zárt kör


A második tulajdonság kimutatásához P DF és P ^ DF Redheffer szorzatát kell meghatározni:

dx dt =Ax+ B 1 w+ B 2 z ^ ,

(516)

d x ^ dt =( A B 1 C 2 ) x ^ + B 1 y+ B 2 u,

(517)

z= C 2 x+ D 11 w+ D 12 Z ^ ,

(518)

z ^ =u,

(519)

y= C 2 x+w,

(520)

y ^ =( y ^ 1 y ^ 2 )=( x ^ C 2 x ^ +y ),

(521)

ahol x a P DF állapot vektora és x ^ a P ^ DF állapot vektora. A transzformáció sematikus vázlata a 11.1 ábrán látható.

DF transzformációja FI-be
DF transzformációja FI-be
12.3. ábra - DF transzformációja FI-be


Az e=x x ^ hibavektor bevezetésével a transzformált állapotegyenletek a következők:

dx dt =Ax+ B 1 w+ B 2 u,

(522)

de dt =( A B 1 C 2 )e,

(523)

z= C 1 x+ D 11 w+ D 12 u,

(524)

y ^ =( x ^ C 2 x ^ +y )=( xe C 2 e+w ).

(525)

Mivel feltettük, hogy A B 1 C 2 stabilis és e( 0 )=0

( P DF , P ^ DF )( s )=[ A B 1 B 2 C 1 D 11 D 12 I 0 0 0 I 0 ]= P FI ( s ),

(526)

vagyis

( P FI , K FI )= ( ( P DF , P ^ DF ), K FI )= ( P DF , ( P ^ DF , K FI ) ).

(527)

Összefoglalásként, mindhárom feladat megoldása visszavezethető egy alkalmas teljes információs (FI) probléma megoldására.

12.2. Teljes információs (FI) szabályozó

Ahhoz, hogy a ( P FI ,  K ) 2 rendszernormát minimalizáljuk a stabilizáló K szabályozók függvényében, véges horizontú feladok megoldását állítjuk elő, amik konvergálnak az optimális 2 szabályozóhoz.

A véges T horizontú feladat költségfüggvénye

J( u,T,Ψ )= 0 T z T zdt+ x T ( T )Ψx( T ).

(528)

ahol Ψ0 . A megjelenő második tag a hiányzó x T cél állapottal van összefüggésben. Mivel z= C 1 x+u , a költségfüggvény az alábbi alakra hozható:

J( u,T,Ψ )= 0 T ( x T C 1 T C 1 x+ u T u )dt+ x T ( T )Ψx( T ),

(529)

ami megegyezik az LQ/LQG performancia kritériummal, ha Q= C 1 T C 1 és R=I .A szükséges optimalitási feltételek egy teljes négyzetté alakítással kaphatók a C 1 T D 12 =0 , D 12 T C 1 =0 és D 12 T D 12 =I egyszerüsítő ortogonalitási feltételek mellett.

Az LQ szabályozó levezetése során már látott módon bevezetjük az X( t )=X( t,T,Ψ )0 mátrix függvényt, X( T )=Ψ , ami ki kell hogy elégítse az alábbi differenciál egyenletet:

dX dt = A T X+XAX B 2 T B 2 X+ C 1 T C 1 .

(530)

Ekkor az

u opt = B 2 T Xx

(531)

választással a performancia funkcionál alakja

J( u,T,Ψ )= 0 T ( w T B 1 T Xx+ x T X B 1 w )dt.

(532)

Ahhoz, hogy az optimális FI 2 szabályozót megkapjuk a véges horizontú megoldások határértékeként, a terminális feltétel Ψ mátrixát minden T -re alkalmasan kell megválasztani.

Legyen K olyan, amire A B 2 K asszimptotikusan stablilis. Ekkor van hozzá V( x )= x T Ψx Lyapunov függvény, azaz Ψ0 amire

Ψ( A B 2 K )+ (A B 2 K) T Ψ+ C 1 T C 1 + K T K=0.

(533)

Ez az egyenlet átírható az alábbi formába:

ΨA+ A T ΨΨ B 2 B 2 T Ψ+ C 1 T C 1 = (K B 2 T Ψ) T ( K B 2 T Ψ )0,

(534)

vagyis Ψ kielégíti az

ΨA+ A T ΨΨ B 2 B 2 T Ψ+ C 1 T C 1 0

(535)

egyenlőtlenséget. Kimutatható, hogy az ( A,( C 1 Ψ ) ) pár detektálható.

Ezzel a Ψ választással legyen X T ( t ) az alábbil Riccati differenciál egyenlet megoldása:

d dt X T ( t )  =   X T A+ A T X T X T B 2 B 2 T X T + C 1 T C 1 ,     X T ( T )=Ψ.

(536)

Ekkor

d 2 d t 2 X T = X ˙ T A+ A T X ˙ T X ˙ T B 2 B 2 T X T X T B 2 T B 2 X ˙ T =

= X ˙ T ( A B 2 B 2 T X T )+ (A B 2 B 2 T X T ) T X ˙ T ,

(537)

amely egyenlet megoldása

d dt X T ( t )=Φ( t,  T )[ d dt X T ( T ) ] Φ T ( t,  T )0

(538)

ahol X T ( T )=Ψ és Φ( t,  T ) a (A B 2 B 2 T X T ) T mátrixhoz tartozó alapmegoldás.Ekkor d dt X T ( t )0 és mivel X T ( T )0 az X T ( t ) mátrixfüggvény monoton nem-csökkenő t -ben.

A renszer időinvarianciáját felhasználva minden τ>0 -ra

X T+τ ( t )= X T ( tτ ).

(539)

Így X T ( t ) egy monoton nem-növekvő függvény T -ben.

Mivel a Riccati egytenlet minden megoldására X T ( t )0 és X T ( t )Ψ bármely tT esetén, az X T ( t ) mátrixfüggvény egyenletesen korlátos minden T -re.Ezért létezik a Π( t )= lim T X T ( t ) határérték. Az időinvariancia miatt minden t 1 és t 2 esetén

Π( t 1 )= lim T X T ( t 1 )= lim T X T+ t 2 t 1 ( t 2 )=Π( t 2 ).

(540)

Ebből következik, hogy a határérték egy konstans Π mátrix, ami kielégíti. az alábbi algebrai Riccati egyenletet

ΠA+ A T ΠΠ B 2 T B 2 Π+ C 1 T C 1 =0.

(541)

A konstrukcióból hátra van még a stabilitás kimutatása. Először A B 2 B 2 T X T ( 0 ) stabilitását bizonyítjuk.Az egyszerűség kedvéért X T jelölje az X T ( 0 ) mátrixot és F T = B 2 X T .

Tekintsük az alábbi Lyapunov differencál egyenletet:

X T ( A+ B 2 F T )+ (A+ B 2 F T ) T X T + F T T F T + C 1 T C 1 + X ˙ T =0

(542)

ahol X ˙ T = d dt X T ( t ) | t=0 . X T egy megfigyelgetősegi Gram mátrix, így X T 0 és X ˙ T 0 .Ismert, hogy A+ B 2 F T minden instabil módusa nem megfigyelhető ( F T T C 1 T X ˙ T ) T -ra.

Legyen ( λ,  x ) az A+ B 2 F T egy instabil nem megfigyelhető módusa, azaz

( A B 2 F T )x=λx,    Re( λ )0,

(543)

( F T C 1 X ˙ T )x=0.

(544)

A Lyapunov egyenletet kétoldalról szorozva x * és x vektorokkal adódik, hogy 0=( λ+ λ ¯ ) x * X T x .Ebből következik, hogy λ+ λ ¯ =0 vagy X T x=0 .

Az első esetben a Lyapunov egyenletet x -el szorozva adódik, hogy A T X T x=jω X T x .Azonban ( A, B 2 ) stabilizálható, vagyis minden instabil mód irányítható.Ebből következik, hogy X T x=0 .

Tegyük fel tehát, hogy X T x=0 .A Riccati egyenletet x -el jobbról szorozva adódik, hogy X ˙ T x=0 , amiből következik, hogy X T ( t )x=0 bármely tT esetén, azaz Ψx=0 .Tehát ( λ,  x ) instabil de megfigyelhető ( C 1 Ψ ) -re, ami ellentmond a rendszer detektálhatóságának és Ψ megválasztásának.Így A B 2 B 2 T X T asszimptotikusan stabilis. Folytonossági megfontolás alapján

Re( λ i ( A B 2 B 2 T Π ) )0

(545)

minden i -re. Ki kell még mutatnunk, hogy egyenlőség nem állhat fenn.

Feltéve, hogy létezik ω és x úgy, hogy

( A B 2 B 2 T Π )x=jωx,

(546)

a Riccati egyenletből következik, hogy

0= x * ( ΠA+ A T ΠΠ B 2 B 2 T Π+ C 1 T C 1 )x=

= x * Π( A B 2 B 2 T Π )x+ x * ( A T Π B 2 B 2 T )Πx+ x * ( Π B 2 B 2 T Π )x+ x * C 1 T C 1 x=

= x * Πλx+ x * λ ¯ Πx+ x * ( Π B 2 B 2 T Π )x+ x * C 1 T C 1 x= B 2 Πx 2 2 + C 1 x 2 2 .

(547)

azaz, C 1 x=0 és B 2 T Πx=0 , ezért Ax=jωx .Mivel ( A, C 1 ) detektálható ezért C 1 x nem tűnhet el, ami ellentmondás. Tehát a határérték egy asszimptotikusan stabilis megoldást ad.

Végezetül meg kell mutatni, hogy a határérték egy 2 optimális szabályozó.Jelölje K 2 ezt a határérték szabályozót.

Az FI rendszer és egy tetszőleges

K( s )=[ A ^ B ^ 1 B ^ 2 C ^ D ^ 1 D ^ 2 ]

(548)

szabályozó az alábbi zárt kört eredményezi:

d d t ( x x ^ ) = A ¯ ( x x ^ ) + B ¯ w = ( A + B 2 D ^ 1 B 2 C ^ B ^ 1 A ^ ) ( x x ^ ) + ( B 1 + B 2 D ^ 2 B ^ 2 ) w ,

(549)

z= C ¯ ( x x ^ )+ D ¯ w=( C 1 0 D 12 D ^ 1 D 12 C ^ )( x x ^ )+( 0 D 12 D ^ 2 )w.

(550)

A 2 norma

( P FI ,  K ) 2 =Trace( B ¯ T Q ¯ B ¯ )

(551)

ahol Q ¯ a rendszer megfigyelhetőségi Gram mátrixa ami kielégíti az alábbi Lyapunov egyenletet

A ¯ T Q ¯ + Q ¯ A ¯ + C ¯ T C ¯ =0.

(552)

Legyen

X ¯ =( X 0 0 0 )

(553)

ahol X kielégíti a következő algebrai Riccati egyenletet

XA+ A T CX B 2 B 2 T X+ C 1 T C 1 =0.

(554)

Ekkor Q ¯ X ¯ kielégíti az alábbi Lyapunov egyenletet

( Q ¯ X ¯ ) A ¯ + A ¯ T ( Q ¯ X ¯ )+( ( D ^ 1 + B 2 T X) T C ^ )( D ^ 1 + B 2 T X C ^ )=0.

(555)

Itt ( Q ¯ X ¯ ) a ( A ¯ ,( D ^ 1 + B 2 T X C ^ ) ) rendszer megfigyelhetőségi Gram mátrixa.Mivel A ¯ asszimptotikusan stablilis, ez a Gram mátrix pozitív definit, tehát Q ¯ P ¯ .

Kimutattuk tehát, hogy minden K FI szabályozóra

( P,  K ) 2 =Trace( B ¯ T Q ¯ B ¯ T )Trace( B ¯ T X ¯ B ¯ ).

(556)

K 2 választással, azaz D ^ 1 = B 2 T X és C ^ =0 esetén Q ¯ = X ¯ . Ekkor

min K ( P,  K ) 2 =Trace( B ¯ T X ¯ B ¯ )=Trace( B 1 T X B 1 ),

(557)

tehát ez egy 2 optimális irányítás.

12.3. H2 optimális DF és OE szabályozók

Mint azt már láttuk az optimális DF és OE szabályozók megkaphatók egy FI feladat megoldásaként.

Feltéve, hogy A B 1 C 2 asszimptotikusan stabilis, ha K FI =[ F 2   0 ] stabilizálja P FI -t, akkor K DF = ( P ^ DF , K FI ) stabilizálja P DF -et, ahol

P ^ DF ( s )=[ A B 1 C 2 B 1 B 2 0 0 I I 0 0 C 2 I 0 ].

(558)

A zárt kör egyenletei

d dt x ^ =( A B 1 C 2 ) x ^ + B 1 y+ B 2 u=

=( A B 1 C 2 + B 2 F 2 ) x ^ + B 1 y,

(559)

z ^ =   F 2 x ^ ,

(560)

így

K DF ( s )=[ A+ B 2 F 2 B 1 C 2 B 1 F 2 0 ],

(561)

ahol F 2 az FI feladat optimális állapot visszacsatolása.

Az OE feladat megoldása az OE és DF problémák dualitását felhasználva adódik:

[ ( P OE , K OE )] T = ( P DF T , K DF T ).

(562)

Következik, hogy

K OE T ( s )=[ A T + C 2 T L 2 T C 1 T B 2 T C 1 T L 2 T 0 ],

(563)

ahol L 2 = C 2 T Y és Y kielégíti az algebraic Riccati egyenletet

AY+Y A T Y C 2 T C 2 Y+ B 1 B 1 T =0.

(564)

Így az eredeti OE feladat megoldása

K OE ( s )=[ A+ L 2 C 2 B 2 C 1 L 2 C 1 0 ].

(565)

12.4. Egyszerűsített OF optimális H 2 irányítás

Az egyszerüsített OF rendszer alakja

P OF ( s )=[ A B 1 B 2 C 1 0 D 12 C 2 D 21 0 ]

(566)

ahol az ortogonalitási feltételek

C 1 T D 12 =0,     B 1 D 21 T =0,

(567)

D 21 D 21 T =I,     D 12 T D 12 =I

(568)

fennállnak.

A szabályozó tervezésénél hasznos úgy tekinteni a rendszert mint amit egy teljes sztatikus u * = B 2 T Xx= F 2 x állapotirányítás és egy zavarás vezérel. A zavarás szerepe, hogy kompenzálja a teljes állapot ismeretének hiányát.

Az FI irányítás minimalizálja z= C 1 x+ D 12 w energia normáját minden w 2 zavaró jelre. Hogy az u eltérésének hatását az u * hatásától a kimeneten vizsgálhassuk, bevezetjük az új

v=u F 2 x=u u *

(569)

bemenetet, aminek segítségével átírjuk az állapotegyenleteket:

x ˙ =Ax+ B 1 w+ B 2 u,

(570)

v= F 2 x+u,

(571)

y= C 2 x+ D 21 w.

(572)

A kapott rendszer

P tmp ( s )=[ A B 1 B 2 F 2 0 I C 2 D 21 0 ],

(573)

a ( w u ) bemenetet képezi le a ( v y ) kimenetre.Vegyük észre, hogy P tmp az OE alakban adott.

A w,  v , és z jeleket összekötő állapotegyenletek

x ˙ =Ax+ B 1 w+ B 2 u=Ax+ B 1 w+ B 2 ( v+ F 2 x )=

=( A+ B 2 F 2 )x+ B 1 w+ B 2 v,

(574)

z= C 2 x+ D 12 u+ C 2 x+ D 12 ( v+ F 2 x )=

=( C 2 + D 12 F 2 )x+ D 12 v

(575)

amik az alábbi rendszert határozzák meg

P 1 ( s )=[ A+ B 2 F 2 B 1 B 2 C 1 + D 12 F 2 0 D 12 ].

(576)

P OF felbontását erre a két alrendszerre a 56 ábra szemlélteti.

felírása két alrendszerrel
12.4. ábra - felírása két alrendszerrel


Mivel P tmp az OE alakban adott, már tudjuk, hogyan határozzuk meg azt a szabályozót ami minimalizálja a ( P tmp ,K ) zárt kör 2 normáját. A kérdés az, hogy ez a szabályozó minimalizálja-e ( P,K ) normáját is.

A válaszhoz írjuk át a zárt kör egyenleteit az új v( t ) változó figyelembe vételével:

x ˙ =Ax+ B 1 w+ B 2 u=( A+ B 2 F 2 )x+ B 1 w+ B 2 v=

= A F x+ B 1 w+ B 2 v,

(577)

z=( C 1 + D 12 F 2 )x+ D 12 v= C F x+ D 12 v.

(578)

ahol A F =A+ B 2 F 2 and C F = C 1 + D 12 F 2 .

Mivel a z kimenet két hatás eredménye, a linearitás miatt írható, z= z w + z v ahol z w a w jel hatásának eredménye, feltéve, hogy v=0 .A z v jel hasonló módon van definiálva.

A z w jelet meghatározó rendszer alakja

P c ( s )=[ A F B 1 C F 0 ],

(579)

míg a z v jel, amit v= ( P tmp ,K ) generál, az alábbi rendszer által van meghatározva

z v =U ( P tmp ,K )w

(580)

ahol

U( s )=[ A F B 2 C F D 12 ].

(581)

Mivel z= z w + z v kapjuk, hogy

z=( P c +U ( P tmp ,K ) )w= ( P,K )w.

(582)

Könnyű leellenőrizni, hogy U egy 2 -es normát megtartó leképezés, tehát egy belső függvény, és U : P c instabil.Ez utóbbi belátásához ki kell mutatni, hogy U : P c 2 . Az U : és P c alakjaiból következik, hogy

U : P c ( s )=[ A F 0 B 1 C F T C F A F T 0 D 12 T C F B 2 T 0 ].

(583)

A T=( I 0 X I ) hasonlósági transzformáció alkalmazásával, ahol X kielégíti az FI feladathoz tartozó algebrai Riccati egyenletet és kihasználva, hogy U egy belső függvény, vagyis

D 12 T C F + B 2 T X=0

(584)

A F X+ XA F T + C F T C F =0,

(585)

a transzformált rendszer állapotegyenleteire

U : P c ( s )=[ A F 0 I 0 A F T X B 1 0 B 2 T 0 ],

(586)

adódik, azaz

U : P c ( s )=[ A F T X B 1 B 2 T 0 ].

(587)

Ebből következik, hogy U : P c H 2 .

A két rendszer ortogonalitásából következik, hogy

( P,K ) 2 2 = P c +U ( P tmp ,K ) 2 2 = P c 2 2 +U ( P tmp ,K ) 2 2 =

= P c 2 2 + ( P tmp ,K ) 2 2 ,

(588)

ezért az optimális irányításnak ki kell elégíteni az alábbi egyenletet

min K ( P,K ) 2 2 = P c 2 2 + min K ( P tmp ,K ) 2 2 .

(589)

A zárt kör 2 normáját minimalizáló K szabályozó a hozzárendelt ( P tmp ,K ) zárt kör minimalizálásával adódik, ahol

P tmp ( s )=[ A B 1 B 2 F 2 0 I C 2 D 21 0 ],

(590)

ami egy optimális OE feladat.

Tétel 11.1 Az egyszerüsített OF feladat optimális szabályozója

K OF ( s )=[ A+ L 2 C 2 + B 2 F 2 L 2 F 2 0 ],

(591)

ahol L 2 =Y C 2 T , F 2 = B 2 T X , és X valamint Y kielégíti az alábbi FI és OE algebrai Riccati egyenletet:

A T X+XAX B 2 B 2 T X+ C 1 T C 1 =0,

(592)

AY+Y A T Y C 2 T C 2 T Y+ B 1 B 1 T =0.

(593)

Mivel az (592), (593) algebrai egyenletek nem csatoltak, ezért az OF szabályozó F 2 és L 2 erősítéseit egymástól függetlenül meg tudjuk határozni. F 2 a teljes állapotvisszacsatolás erősítése míg L 2 a Luenberger megfigyelőhöz tartozó erősítés.Az optimális kimenet visszacsatolásos 2 szabályozó alakja egy úgynevezett megfigyelő alapú szabályozó, ahol a megfigyelőt gyakran Kalman szűrőnek nevezzük.Így az optimális kimenet visszacsatolásos 2 szabályozó tervezése során fenn áll a szeparációs elv.