Die Vorlage als doc-Datei (700 kByte)

Werbung
Linear-Quadratisch-Optimale Zustandsrückführung (LQR)
1. Aufgabenstellung
2. Bemerkungen und Erklärungen zur Aufgabenstellung
2.1 Zum Modell der Regelstrecke
2.2 Zum quadratischen Gütemaß
3. Lösung des Optimierungsproblems mittels der Hamilton-Gleichungen
4. Zusammenfassung der Entwurfsschritte
5. Modifiziertes Optimierungsproblem und seine Lösung: Quadratisch bewichtete
Ausgangsgrößen
6. Zusammenhang zwischen Bewichtungsmatrizen Q, R und Polen des
geschlossenen Systems
Linear-Quadratisch-Optimale Zustandsrückführung (LQR)
1. Aufgabenstellung
Für eine lineare zeitinvariante Mehrgrößenregelstrecke
x t   A x t   B u t , x 0  x o
y t   C x t 
(1)
n. Ordnung, mit m Stellgrößen ui und r Ausgangsgrößen (Regelgrößen) yj soll ein
Regelungsgesetz in Form einer Zustandsrückführung u = u(x) gefunden werden, so
daß das quadratische Gütemaß
J 

o
xT t Q xt   uT t  Rut  dt
(2)
minimal wird.
2
2. Bemerkungen und Erklärungen zur Aufgabenstellung
2.1.
Zum Modell der Regelstrecke (1)
Meistens ist (1) das Ergebnis der Linearisierung des i.a. nichtlinearen Prozeßmodells
x  f  x, u 
y  g  x ,
wobei die Linearisierung um einen stationären Betriebspunkt (Arbeitspunkt) durchgeführt wird.
Es wird hier angenommen bzw. vereinbart:
V1:
Der Arbeitspunkt, in dessen Umgebung die Regelstrecke durch das linearisierte Modell (1) näherungsweise beschrieben wird, sei
AP: x = 0.
(3)
Liegt der Arbeitspunkt an einer anderen Stelle des Zustandsraumes, so kann man
durch eine entsprechende Parallelverschiebung des Koordinatensystems die durch
V1 gekennzeichnete Situation immer erreichen.
Damit sind alle Variablen xi, ui, yi in (1) Abweichungsvariable vom Arbeitspunkt.
Zum Anfangszeitpunkt t = 0 befinde sich der Zustandspunkt der Strecke bei x(0) = xo,
was wie folgt zu interpretieren ist:
Vorangegangene (t < 0) Störungen haben die Strecke aus dem Arbeitspunkt x = 0
ausgelenkt, so daß sich die Strecke zum Anfangszeitpunkt t = 0, in dem die
Betrachtung des Systems beginnen soll, im Anfangszustand x(0) = xo befinde.
2.2.
Zum quadratischen Gütemaß (2)
Grundsätzliche Zielstellung:
Die zu findende Zustandsrückführung u = u(x) soll den Anfangszustand x(0) = xo, der
einen beliebigen Punkt im Zustandsraum des Systems darstellt, wieder in den gewünschten Arbeitspunkt x = 0 bringen.
 Dieser Übergangsvorgang x  0 soll nun so erfolgen, daß das quadratische
Gütemaß (2) minimal wird!
Welche Anforderungen an diesen Übergangsvorgang drückt J gemäß (2) aus?
(1) Der erste Term in J drückt quantitativ die Forderung aus:
 Der Übergang xo 0 soll nicht zu langsam sein und nicht zu stark oszillieren,
wobei große Abweichungen der Zustandsvariablen vom Arbeitspunkt x = 0
stärker „bestraft“ werden.
Wenn die (n, n)-Matrix Q als Diagonalmatrix mit positiven Diagonalelementen
3
(qii > 0) gewählt wird, stellt die quadratische Form xT(t)  Q  x(t) die gewichtete
Quadratsumme der einzelnen Zustandsvariablen dar:
T
x (t ) Q x (t ) 
n
 qii xi2(t ),
i 1
(4)
q11

 q

22





Q









qun 

.
Je größer der Zahlenwert qii > 0 gewählt wird, umso stärker wird die zugehörige
Zustandsvariable xi in der quadratischen Form „gewichtet“.
Durch den ersten Integralterm in (2)




J1   x (t ) Q x(t )dt   q11 x12 (t )      qun xn2 (t ) dt
T
o
(5)
o
werden also mit der Wahl der Bewichtungsfaktoren qii > 0 Möglichkeiten
geschaffen, einzelne Zustandsvariablen über die Beiträge ihrer individuellen
quadratischen Abweichungsflächen

qii  xi2 (t ) dt
o
bei der Minimierung von (2) unterschiedlich zu bewerten bzw. zu bestrafen.
Große qii bewirken starke Bestrafung. Dadurch, daß die xi(t) quadratisch eingehen, werden Vorzeicheneinflüsse (z.B. bei schwingendem Übergangsverläufen)
ausgeschaltet.
Wenn die Zustandsvariablen xi(t) der Strecke physikalische Größen mit
technisch/technologischer Interpretierbarkeit darstellen, wird eine sinnvolle,
zweckmäßige Festlegung der Wichungsfaktoren qii gezielt und angepaßt an die
regelungstechnische Entwurfsaufgabe möglich sein.
Werden ein oder mehrere qii = 0 gewählt, dann bedeutet das, daß die zugehörige
(n) Zustandsvariable(n) im Gütemaß (2) nicht erfaßt werden. Dann ist aber die
Minimierung von (2) ein regelungstechnisch unsinniges Optimierungsproblem: Die
zu qii = 0 gehörende Zustandsvariable xi(t) könnte über alle Grenzen wachsen
und da diese Zustandsvariable in J nicht eingeht, kann eine Minimierung von (2)
in einer solchen Situation die Erfüllung der o.g. grundlegenden Zielstellung nicht
4
in Aussicht stellen oder gar garantieren! Man wird also in (4) alle Diagonalelemente qii > 0 vorgeben! Insbesondere wenn die ungeregelte Strecke (1)
instabil ist, ist es wichtig, daß alle xi(t) in J1 nach (5) und damit in das quadratische Gütemaß (2) eingehen. Nur wenn durch die Zustandsrückführung u(x) ein
stabiles geschlossenes System entsteht, wird das grundlegende Ziel
xo  0
erreicht, d.h.
lim xi (t )  0
t
für alle i = 1, 2, ..., n. Und nur dann kann J nach (2) einen endlichen (minimalen!)
Wert annehmen.
(2) In diesem Zusammenhang erkennt man auch den Sinn des zweiten Termes in
(2), der die Stellgrößen in bewichteter Form in das quadratische Gütemaß einbezieht.
Würde dieser zweite Term fehlen, so würde (2) in J1 gemäß (5) übergehen. Setzt
man wieder voraus, daß durch die zu entwerfende Zustandsrückführung u(x) ein
stabiles geschlossenes System entsteht, also alle xi(t) auf ihren Arbeitspunkt 0
abklingen, so würde die als Minimierungsproblem formulierte Entwurfsaufgabe
„Bestimme u = u(x) so, daß



!
J1   x T (t ) Q x(t ) dt 
 Min"
o
zu nicht realistischen und nicht realisierbaren Idealverläufen der einzelnen
Zustandsübergänge xi(t) führen, nämlich zu solchen, die J1 zum absoluten
Minimum J1 = 0 führen:
 Min führt zu unrealistischen Verläufen der xi(t)
Bild 2.1: J1 
Ein solcher Idealverlauf kann aber nicht mit Hilfe der realen, an der Regelstrecke
technische verfügbaren Stellgrößen „erzwungen“ werden. Um den Idealverlauf
der Zustandsübergänge zu erzwingen, müßten in einem Zustandsregler offenbar
sehr (unendlich) große Stellamplituden und Stellgrößenänderungsgeschwindigkeiten generiert werden, die dann auch noch über die Stelleinrichtungen auf die
5
Regelstrecke zur Wirkung gebracht werden müßten. Beides ist nicht realisierbar.
Man denke nur an die Stellgrößenbegrenzungen realer Stelleinrichtungen!
Realitätsbezogen wird also ein mathematisch als Minimierungsaufgabe formuliertes Entwurfsproblem erst, wenn Stellgrößenbegrenzungen in geeigneter Weise
Berücksichtigung finden. Im vorliegenden Fall wird dies durch die Hinzunahme
des zweiten Termes uT R u im Integranden des Gütemaßes (2) erreicht. Durch
ihn wird praktisch die „Steuerenergie“ mitbewertet, die erforderlich ist, um diejenigen Zustandsübergänge xo0 zu erzeugen, die die durch den ersten Term in J
ausgedrückten Anforderungen („nicht zu langsam“ und „nicht zu stark oszillierend“) erfüllen.
Die (m, m)-Matrix R wird ebenfalls als Diagonalmatrix mit sämtlich positiven
Diagonalelementen rii > 0 angesetzt. Die quadratische Form
u T (t )  R  u (t ) 
m
 rii ui2 (t )
i 1
(6)
r11

 r

22





R 









rmm 

ist dann positiv und stellt die gewichtete Quadratsumme der Stellgrößen
(-abweichungen vom AP) dar. Dann kann




2
J 2   uT R u dt   r11 u12 (t )  r22 u22 (t )  ...  rmm um
(t ) dt
o
( 7)
o
als ein Maß für die der Regelstrecke beim Übergang xo  0 zugeführte Stellenergie angesehen werden.
Die Bewichtung des Anteiles, den eine einzelne Stellgröße ui(t) dabei hat, kann
durch Festlegung des zugehörigen rii > 0 nach technisch relevanten Gesichtspunkten erfolgen. Wie man sieht, kommt es wieder in erster Linie auf die relative
Größe des Zahlenwertes rii bezogen auf die Größe der anderen an.
Man hat mit den Bewichtungsmatrizen
Q = diag (qii) ,
R = diag (rii) ,
qii > 0
rii > 0
i = 1, 2, ..., n
i = 1, 2, ..., m
im quadratischen Gütemaß offenbar eine große Zahl von Freiheitsgraden, die
sich in einer leider nicht direkt zu übersehenden Form auf die Zustandsübergänge
xo  0 und die zugehörigen Stellgrößenverläufe im geschlossenen System auswirken. Tendenziell läßt sich sagen:
6


Große qii bestrafen die zugehörigen Übergangsvorgänge xi(t) bei der Minimierung von J stark – stärker als solche xj(t), die mit kleineren qjj bewichtet in J
eingehen.
Große rii bestrafen die zugehörigen Stellgrößen ui(t) in dem Sinne stark, als

daß die mit ui(t) verbundene Steuerenergie
 ui (t ) dt
2
bei der Minimierung von
o
J stark „gedrückt“ wird, was – so kann man annehmen – auch eine
entsprechend starke „Quasibeschränkung“ der Stellamplitude u i(t) bewirkt.
Dadurch, daß sowohl die Verläufe x(t) des Zustandsübergangs xo  0 als auch
u(t) als Steuervektor (Stellgrößenverläufe) der Zustandsrückführung in das quadratische Gütemaß (2) eingehen, hat man eine geeignete mathematische Formulierung für die regelungstechnisch einsichtigen o.g. Entwurfsforderungen gefunden. Da x(t) und u(t) von dem zu findenden Zustandsregler abhängen, ist auch
das quadratische Gütemaß (2) eine Funktion von diesem. Das Regelungsgesetz
u = u(x), d.h. der Zustandsregler, ist nun für die gegebene Regelstrecke (1) so zu
bestimmen, daß J gemäß (2) zum Minimum wird. Mit anderen Worten:
Der Zustandsregler ist so zu bestimmen, daß der im geschlossenen System
ablaufende Übergangsvorgang xo  0 in Bezug auf das quadratische Gütemaß (2) optimal ist.
Es ist daher folgendes mathematisches Optimierungsproblem OP1 zu lösen:
Geg:
Gütefunktional
J
1
2

 x(t ) Q x(t )  u

(t ) R u(t ) dt
o
Q>0
Nebenbedingung
T
R>0
(8)
x (t )  A x (t )  B u(t )
y (t )  C x (t ) ,
Randbedingungen x(0)  x o
x()  0 .
Ges.:
u  u x(t )
so, daß
J  Min !
u( x )
Zu seiner Lösung sind die mathematischen Methoden der Variationsrechnung anzuwenden. Der im Gütefunktional eingeführte Faktor 1/2 ist nicht wesentlich; er
erleichtert die nachfolgenden Rechnungen im Zusammenhang mit der Lösung des
OP1 etwas.
7
Da in der Formulierung dieses OP1 weder den Zustandsvariablen noch den Stellgrößen irgendwelche Beschränkungen auferlegt sind, kann man die Lösung mittels
der Hamilton-Gleichungen der klassischen Variationsrechnung gewinnen.
8
3. Lösung des Optimierungsproblems mittels der Hamilton-Gleichungen
Um das Optimierungsproblem mit Nebenbedingungen, wie es als OP1 formuliert
wurde, zu lösen, wird zunächst die Hamilton-Funktion definiert:
H x, p, u   p T
rechte Seite der
Strecken  Dgl .
ˆ Nebenbed. in OP1

A x  B u
von J
Integrand


1 T
T
 x Q xu Ru
2


( 9)
Der hier auftretende (n, 1) – Vektor p
 p1 (t ) 
 p (t ) 
 2 
  
p (t )  

  
  


 pn ( t ) 
wird als Vektor der adjungierten Variablen oder Kozustandsvektor bezeichnet.
Per Definition erhält man aus der Hamilton-Funktion durch die folgenden Operationen der partiellen Ableitungsbildung die sog. kanonischen Differentialgleichungen
x 
H
p
p  
H
x
(10)
(11)
und die sog. Steuerungsgleichung
H
 0.
u
(12)
Um die partiellen Ableitungen von H bilden zu können, werden die folgenden
Rechenregeln für die Differentiation benötigt:
9



p T A x  AT p
x


 T
x Q x  2Q x
x


 T
u Ru  2Ru
u

pT A x  A x
p

pT B u  B u
p

pT B u  BT u
u






(13)
Damit erhält man für die kanonischen Differentialgleichungen
H
 Ax Bu
x
H
p  
  AT p  Q x
x
x 
(14)
(15)
und für die Steuerungsgleichung
H
 BT p  R u  0 .
u
(16)
Man erkennt aus (14), daß die partielle Ableitung von H nach p die Vektordifferentialgleichung der Regelstrecke liefert. Die kanonische Differentialgleichungen (14), (15)
bilden ein System von 2 n linearen gekoppelten Differentialgleichungen in den n
Zustandsvariablen xi(t) der Strecke und den n Kozustandsvariablen oder adjungierten
Variablen pi(t).
Die Steuerungsgleichung (16) stellt eine lineare algebraische Beziehung zwischen u
und p dar und kann nach u aufgelöst werden:
u  R 1 B T p .
(17)
Wegen
R  diag rii  , rii  0
existiert die Inverse R-1.
Spätestens jetzt ist zu fragen: Was haben die per Definition eingeführte HamiltonFunktion (9) und die aus ihr durch partielle Differentiationen formal gewonnenen
weiteren Gleichungen mit der Lösung des OP1 zu tun? Die Antwort liefert die Variationsrechnung:
Bilden u*(t) und x*(t) eine Lösung des OP1, so gibt es eine Lösung p* der adH
jungierten Differentialgleichung p  
, d.h. die optimale Steuerung u*(t)
x
und die optimalen Trajektorien x*(t) und p*(t) erfüllen die kanonischen Differentialgleichungen
10
x 
H
p
p  
H
,
x
und für die Hamilton-Funktion gilt die Maximumbedingung
H (x*, p*, u*)  H (x*, p*, u),
(18)
wobei u(t) irgend eine andere Steuerung ist.
Dieser Satz stellt notwendige Bedingungen zusammen, die die Lösungen des OP1 –
das sind die bezüglich J optimale Steuerung u*(t) und optimale Zustandstrajektorie
x*(t) – erfüllen müssen.
Es sei bemerkt, daß mit der Angabe der notwendigen Bedingungen, die u*(t) und
x*(t) erfüllen müssen, die Lösungen selbst natürlich noch nicht gefunden sind! Und
weiter muß darauf hingewiesen werden, daß als regelungstechnisch interessierende,
ursprüngliche Aufgabenstellung etwas ganz anderes formuliert war:
 Gesucht ist eine bzgl. J optimale Zustandsrückführung u = u*(x(t)) und
nicht die optimalen Zeitfunktionen (Extremalen) u*(t), x*(t), die J einen
minimalen Wert erteilen!
Regelungstechnisch interessiert eigentlich nur der Entwurf, d.h. die Synthese des
bzgl. J optimalen Zustandsreglers u = u*(x(t)), so daß u*(t) und x*(t) als Lösungen
des Variationsproblems als Zeitfunktionen für die Synthese des Reglers explizit gar
nicht benötigt werden. Diese Besonderheit wird zweckmäßigerweise beim weiteren
Fortgang der Problemlösung zu beachten sein.
Dieser beginnt nun bei der Maximumbedingung (18) für die Hamilton-Funktion. Notwendig für ein Maximum der Hamilton-Funktion in Abhängigkeit von u ist, daß
H
 0.
u
Diese partielle Ableitung von H nach u wurde oben schon berechnet und als Steuerungsgleichung (16) angegeben. Als notwendige Bedingung für ein Extremum der
Hamilton-Funktion in ihrer Abhängigkeit von u betrachtet erhält (16) jetzt einen verständlichen Sinn. Daß als Extremwert von H tatsächlich ein Maximum vorliegt, zeigt
die zweite Ableitung von H nach u.
H
Dazu ist
aus (16) nochmals nach u abzuleiten.
u
2H
u
2



 T
B p  R u   R  0.
u
Da R = diag (rii), rii > 0, i = 1, 2, ..., m eine eindeutig positiv definite Matrix ist, ist
11
2H
negativ, was den Extremwert von H in Abhängigkeit von u als Maximum
u 2
ausweist.
Durch Umstellen der (einen) notwendigen Bedingung (16) für ein Maximum von H
erhielt man (17).
Wenn in (17) die optimale Trajektorie p*(t) des Kozustandsvektores für p eingesetzt
wird, so erhält man die optimale Steuerung u* als Funktion von p*:
u*(t) = R-1 BT p*(t).
(19)
Aber:
p*(t) ist bis jetzt ebensowenig bekannt wie die optimale Trajektorie x*(t). Beide
müssen als Lösungen der kanonischen Differentialgleichungen (14) und (15) ermittelt
werden, denn diese sind nach dem o.g. Satz weitere notwendige Bedingungen, die
die Lösungen des OP1 erfüllen müssen. Setzt man zunächst (19) in (14) ein, so
erhält man
x  A x  BR 1 B T p
( 20)
p  Q x  AT p
( 21)
.
In diesen beiden kanonischen Differentialgleichungen kommen jetzt nur noch die
beiden Unbekannten x(t) und p(t) vor. Der Stern wurde weggelassen, weil nur diejenigen Lsösungen von (20), (21) die optimalen Trajektorien sind, die gleichzeitig auch
die Randbedingungen des OP1 erfüllen.
(20), (21) wird in Vektor-Matrix-Schreibweise notiert
 x   A
 p   
  Q
BR 1BT   x 
 
  p
 AT
(22)
.
(20), (21) bzw. (22) werden als Hamilton-Gleichungen und die in (22) vorkommende
(2n, 2n)-Matrix als Hamilton-Matrix des linear quadratischen OP1 bezeichnet.
Die Hamilton-Gleichungen sind lineare Differentialgleichungen für x und p. Daher
kann man vermuten, daß auch zwischen den Lösungen x und p eine lineare Beziehung besteht. Daher wird folgender Ansatz postuliert
p(t) = - P  x(t),
(23)
wobei P eine noch zu bestimmende (n, n)-Matrix ist.
Wenn sich dieser Ansatz bestätigt, dann erhält man durch Einsetzen von (23) in (17)
eine lineare Zustandsrückführung
u = - R-1 BT Px = - Kopt x ,
(24)
die das gesuchte, bezüglich J aus (8) optimale Regelungsgesetz darstellt.
12
Um die unbekannte Matrix P zu ermitteln, wird (23) in die kanonischen Differentialgleichungen (Hamilton-Gleichungen) (20) und (21) eingesetzt
x
 A x  B R 1 BT P x
 P x  Q x  AT P x .
(25)
( 26)
Durch Einsetzen von (25) in (26) erhält man daraus eine Gleichung für P:
- P A x + P BR-1 BT P x = Q x + AT P x
(P B R-1 BT P – PA - AT P – Q) x = 0 .
Da diese Gleichung für beliebige x gelten soll, muß die (n, n)-Matrix in der Klammer
die Nullmatrix sein:
P B R-1 BT P – P A – AT P – Q = 0 .
(27)
Dies ist eine algebraische Matrix-Gleichung für die unbekannte (n, n)-Matrix P. Man
bezeichnet sie als algebraische Matrix-Riccati-Gleichung zur Bestimmung von P.
Wegen des ersten Summanden auf der linken Seite ist sie nichtlinear!

Sie hat eine eindeutig bestimmte symmetrische, positiv definite Lösung, welche
die gesuchte Matrix P in (23) bzw. (24) – d.h. in der Lösung des OP1 – darstellt,
wenn die Strecke (1) stabilisierbar ist:
V 2:
(A, B) stabilisierbar.
Das mit dieser Matrix P gebildete Regelungsgesetz (24)
u*(t) = -R-1 BT P x(t) = - Kopt x(t)
(24a)
ist in der Tat bzgl. J aus (2) bzw. (9) optimal, liefert ein stabiles geschlossenes
System und erteilt dem Gütefunktional (9) den minimalen Wert
J min 
1 T
x P xo .
2 o
( 28)
Die Voraussetzung V2 ist plausibel: Wenn die Regelstrecke instabile Eigenwerte hat,
dann muß gesichert sein, daß diese instabilen Eigenwerte – genauer, die ihnen zugeordneten instabilen Modi der Strecke – steuerbar sind; d.h. (A, B) muß stabilisierbar sein. Wenn das nicht der Fall ist, kann keine Zustandsrückführung – also auch
nicht die nach (24) – die Stabilität des geschlossenen Systems erreichen, und das
quadratische Gütemaß J kann gewiß keinen endlichen oder gar minimalen Wert
annehmen.
Es muß noch die Eigenschaft der positien Definitheit der symmetrischen Matrix P, die
als einzig interessierende Lösung der algebraischen Matrix-Riccati-Gleichung (27) in
Frage kommt, erklärt werden. Die symmetrische Matrix P heißt positiv definit (in
Kurzform geschrieben: P > 0), wenn sie sämtlich positive Eigenwerte hat. Ohne die
Eigenwerte zu berechnen, kann diese Eigenschaft auch mit dem Kriterium von
Sylvester festgestellt werden: Die symmetrische Matrix P
13
 p11 p12 p13    p1n 
p
p
p   
 12 22 23

 

 
P


 
 
 

 


 p1n         pnn 
n ( n  1)
, wegen der Symmetrie zur Hauptdiagonale eigentlich nur signifi2
kanten Elementen pij) heißt positiv definit, wenn alle n „nordwestlichen“ Unterdeterminanten positiv sind
(mit ihren
p11  0 ,
p11 p12
p12 p22
 0,     , det P  0 .
(29)
Daraus folgt, daß eine positiv definite Matrix P > 0 immer regulär ist. Auch gibt es für
sie immer eine reguläre Matrix M derart, daß
MT M = P
(30)
gilt.
14
4. Zusammenfassung und Entwurfsschritte
Für die Regelstrecke
x  A x  B u
ist das bzgl. des quadratischen Gütemaßes
J
mit
1
2
Q = diag qii
R = diag rii

 x
T

Q x  uT R u dt
o
qii > 0
rii > 0
i = 1, 2, ..., n
i = 1, 2, ..., m
optimale Regelungsgesetz eine lineare konstante Zustandsrückführung
u = - R-1 BT P x = - Kopt x.
Voraussetzung für die Existenz dieses optimalen Zustandsreglers ist weiterhin die
Stabilisierbarkeit der Regelstrecke:
(A, B) stabilisierbar.
Die zur Berechnung der optimalen Zustandsrückführung erforderliche (n, n)-Matrix P
ist als symmetrische, positiv definite Lösung der algebraischen Matrix-Riccatigleichung
P B R-1 BT P – P A – AT P – Q = 0
zu ermitteln. Unter den genannten Bedingungen existiert eine solche Lösung. Das so
geregelte System
Bild 4.1: Optimale Zustandsregelung als Lösung des OP1
15


x  A  BR 1 BT P x ,
x(0)  x o
ist stabil

 
e i A  BR 1 BT P  0
i  1, 2,    , n ,
und der minimale (optimale) Wert des quadratischen Gütemaßes ist
J min 
1 T
x P xo
2 o
und
V ( x)  xT P x
ist eine Ljapunow-Funktion des geschlossenen Systems.
Folgende Entwurfsschritte sind durchzuführen:
(1) Prüfen der Strecke auf Steuerbarkeit bzw. Stabilisierbarkeit. (Eine vollständig
steuerbare Strecke ist natürlich stabilisierbar)
(2) Wahl der Bewichtungsmatrizen
Q  diag qii
qii  0
i  1, 2    , n
R  diag rii
rii  0
i  1, 2,    , m .
Es sind also sämtliche Diagonalelemente größer Null anzusetzen, so daß Q und
R beide positiv definit sind. Bei der Festlegung der Zahlenwerte für die Elemente
können nur tendenziell die Wirkungen auf das Verhalten, den Verlauf der xi(t)
bzw. ui(t) in etwa vorausgesehen werden. Die in einem speziellen Anwendungsfall
regelungstechnisch günstigste Konstellation der Zahlenwerte für die Elemente q ii
und rii wird man nur interativ finden, was ein mehrmaliges rechnergestütztes
Durchlaufen der Schritte (2) bis (6) erfordert.
(3) Berechnung der positiv definiten symmetrischen Lösungsmatrix P der algebraischen Matrix-Riccatigleichung
P B R-1 BTP – P A - ATP – Q = 0 ,
wofür effektive Lösungsalgorithmen existieren.
(4) Berechnung der „optimalen“ Zustandsrückführmatrix
Kopt = R-1 BTP .
(5) Berechnung von Jmin für relevante Anfangszustandsvektoren xo
Jmin =
1 T
x P xo .
2 o
16
(6) Berechnung der Systemmatrix des geschlossenen Systems
Ag = A – B R-1 BT P
und Simulation des Übergangsvorgangs xo  0 des geschlossenen Systems
x (t )  Ag x(t ) ,
x(0)  x o
:  x (t )
einschließlich der Stellgrößenverläufe
u(t) = - Kopt  x(t)
und ggf. zur Beurteilung und Kontrolle auch noch Berechnung der Eigenwerte des
geschlossenen Systems
:  i (Ag)
i = 1, 2,    , n .
Diese liegen sämtlich in der linken Hälfte der komplexen Ebene; keiner der n
Eigenwerte liegt auf der imaginären Achse.
Die Lösung des LQR liefert also unter den genanntnen Bedingungen Q > 0, R > 0,
(A, B) stabilisierbar ein garantiert stabiles geschlossenes System. Die Schritte (5), (6)
sind optional; (6) wird man im Sinne eines abschließenden Gütenachweises oder als
Anlaß für eine interative, günstigere Festlegung von Q, R zur weiteren „optimaleren“
Formung der Übergangsvorgänge (siehe Bemerkungen zu Schritt (2)) wohl immer
durchführen.
17
5. Modifiziertes Optimierungsproblem und seine Lösung:
Quadratisch bewichtete Ausgangsgrößen
Häufig sind nicht alle Zustandsvariablen xi im Modell der Regelstrecke (1) Variablen
mit physikalischer Bedeutung; bei technisch nicht interpretierbaren Zustandsvariablen dürfte es aber praktisch kaum möglich sein, die Elemente qii der diagonalen
Bewichtungsmatrix Q = diag qii , qii > 0, i = 1, 2,    , n gestützt auf technisches a
priori-Wissen gezielt und sinnvoll festzulegen.
Dagegen sind die r Ausgangsgrößen yi der Strecke gewiß technisch signifikante und
meist auch meßbare physikalische Größen. Es liegt daher nahe, in einem quadratischen Gütemaß die gewichtete Quadratsumme der r Ausgangsgrößen zu verwenden, anstelle von (4) also anzusetzen
r
~
y T Q y   q~ii yi2
i 1
mit der diagonalen (r, r)-Wichtungsmatrix
q~11



~
q22


 ~

~ 
Q
 , qii  0 , i  1, 2    , r .








~
qrr 

(31)
Das modifizierte quadratische Gütemaß lautet damit anstelle von (8)
~ 1
J
2

 y

~
Q y  u T R u dt .
(32)

 T T~

T
x
C
Q
C
x

u
R
u
 dt.
  

o 
Q

(33)
T
o
Wegen
y=Cx
wird daraus
~ 1
J
2

Bezeichnet man in der hier auftretenden quadratischen Form der xi die resultierende
Bewichtungsmatrix wieder mit Q
~
Q  CT Q C ,
(34)
18
so ist Q zwar symmetrisch, aber nicht mehr diagonal! Selbst wenn (31) gilt, ist Q eine
n-reihige, symmetrische aber i.a. nur noch positiv semidefinite Matrix Q  0:
 q11 q12      q1n 
q q       
 12 22

 

 
Q
 .
  
 
 
  


 q1n    qnn 
Hier können durchaus diverse qij Null sein. Wenn man bedenkt, daß die (r, n)-Ausgabematrix C der Strecke häufig zahlreiche Nullelemente enthält, wird dies sicher keine
seltene Situation sein.
Die quadratische Form
n
~
~
y T Q y  x T C T Q C x  x T Q x   qij xi x j
i , j 1
mit positiv semidefiniter Matrix Q kann also Null werden, obwohl x  0 ist.
Beispiel:
 x1 
 y1  1 0 0  
 y    0 1 0  x 2 
 
 2 
 x3 
y  C  x
~

~ q
Q   11 ~   0
q22 

 q~11 0 0   x1 
~
x T C T Q C x  x T Q x   x1 x2 x3  0 q~22 0   x2 

 
0 0 0  x3 
 q~11 x12  q~22 x22 .
 0
 x Q x  0 für x  0  0 .
 
1 
T
19
Geht man also, was physikalisch technisch sehr nahe liegt, an die Bildung des quadratischen Gütemaßes über den Ansatz einer quadratischen Form primär für die r
Ausgangsgrößen yi(t) der Strecke heran, so ist im resultierenden Gütefunktional
~ 1
J
2


x T Q x  uT R u dt
(35)
o
Q0
R0
die Bewichtungsmatrix
~
Q  CT Q C
eine symmetrische, i.a. aber nichtdiagonale und nur noch positiv semidefinite (n, n)Matrix.
Im Unterschied zu dem in 2. formulierten Optimierungsproblem OP1 liegt mit dem
Gütefunktional (35) mit Q gemäß (34) ein modifiziertes Optimierungsproblem OP2
vor.
Modifiziertes OP2:
Geg.:
~ 1
J
2

 x
T

Q x  uT R u dt
o
mit
Q  0
x  A x  B u ,
R>0
x o  x(0)
y C x
Ges.:
~
u  u [ x ] , so daß J  Min !
u
Die Regelstrecke kann dabei natürlich auch instabil sein.
Lösung des OP2:
Die Existenz einer Lösung des OP2 ist zunächst auch gebunden an die Voraussetzung
VI:
(A, B) ist stabilisierbar.
Dies ist notwendig, weil instabile Eigenwerte der Strecke durch die Zustandsrückfüh~
rung in die linke Halbebene verschoben werden müssen; andernfalls könnte J keinen endlichen Wert annehmen.
(Wenn die Regelstrecke vollständig steuerbar ist, ist VI erst recht erfüllt).
20
Da Q nur noch die Eigenschaft besitzt, positiv semidefinit zu sein, muß darüber hinaus noch geprüft werden, ob alle ggf. instabilen Eigenvorgänge der Strecke über y
~
beobachtet werden können und so in J erfaßt werden. Deshalb ist eine zweite Voraussetzung notwendig:
VII:
Es sei D eine (r, n)-Matrix, mit der Q  0 wie folgt ausgedrückt werden kann
DT D = Q ,
(36)
und es sei
(D, A) detektierbar.
VII bedeutet, daß über die fiktiven Ausgangsgrößen z = D x die instabilen Modi der
Strecke beobachtbar sind.
Dann existiert genau eine symmetrische, positiv semidefinite Lösung P  0 der algebraischen Matrix-Riccatigleichung
P B R-1 BT P – P A – AT P – Q = 0 ,
und das mit dem konstanten Regelungsgesetz
u = - R-1 BT P x
~
optimal bzgl. J geregelte System


x  A  B R 1 BT P x ;
x o  x(0)
ist (asymptotisch) stabil
 

e i A  B R 1 B T P  0
und der zugehörige endliche, minimale Wert des Gütefunktionals ist
1
~
J min  x To P x o .
2
Ist weitergehend als VII sogar die Voraussetzung
VIIa:
(D, A) beobachtbar
erfüllt, dann existiert genau eine Lösung der algebraischen Matrix-Riccatigleichung
mit der Eigenschaft P > 0, und
V(x) = x T P x
ist eine Ljapunow-Funktion des geschlossenen Systems.
21
Hinweis:
Mit (31) und (34) ist D aus (36) wie folgt zu bestimmen:
1
~
D Q 2
 q~11



q~22






C,
C









~
qrr 

so daß
(D, A) detektierbar  (C, A) detektierbar.
D.h. VII ist erfüllt, wenn die instabilen Modi der Strecke über y beobachtbar sind, was
gewiß gegeben ist, wenn die Regelstrecke vollständig beobachtbar ist. Die Beobachtbarkeit impliziert die Detektierbarkeit.
Wenn das Entwurfsproblem als OP2 formuliert wird, sind folgende Entwurfsschritte
durchzuführen:
(1) Prüfen der Strecke auf Steuerbarkeit bzw. Stabilisierbarkeit. (Eine vollständig
steuerbare Strecke ist natürlich stabilisierbar).
(2) Wahl der Bewichtungsmatrizen
~
Q  diag ( q~ii )
q~ii  0
R  diag ( rii )
rii  0
i  1, 2,    , r
i  1, 2,    , m .
(3) Berechnen der symmetrischen, i.a. aber nur positiv semidefiniten (n, n)-Matrix Q
~
Q  CT Q C
und Zerlegen in die Form
DT D = Q
mit einer (r, n)-Matrix D. (Nach dem oben gegebenen Hinweis ist
1
~
D Q 2 C. )
(4) Prüfen, ob (D, A) detektierbar ist. Wenn gemäß (2) alle Diagonalelemente
~
q~ii  0 gewählt sind, also Q  0 , dann impliziert die Detektierbarkeit der Regelstrecke, d.h. die Detektierbarkeit von (C, A), die von (D, A). Ist die Regelstrecke
sogar vollständig beobachtbar, dann ist sie erst recht detektierbar.
22
(5) Berechnung der symmetrischen, positiv semidefiniten (im Falle der vollständigen
~
Beobachtbarkeit der Strecke und Q gemäß (2) sogar positiv definiten) Lösungsmatrix P der algebraischen Matrix-Riccatigleichung
P B R-1 BT P – P A – AT P – Q = 0.
(6) Berechnung der „optimalen“ Zustandsrückführmatrix
Kopt = - R-1 BT P
(7) Berechnung von
1
~
J min x To P x o
2
(8) Gütenachweis:
 Ag  A  B R 1 B T P
 i ( Ag )
 Simulation x  Ag x , x o
y C x
u   K opt x
:  y (t )
:  u (t )
und ggf . auch
:  x (t ) .
Die Lösung des OP2 liefert unter den genannten Bedingungen
~
Q >0
R >0
(A, B) stabilisierbar ( steuerbar)
(C, A) detektierbar ( beobachtbar)
ein garantiert stabiles geschlossenes System.
Die Schritte (7), (8) sind optional
23
6. Zusammenhang zwischen Bewichtungsmatrizen Q, R und Polen des
geschlossenen Systems
Die Lösungen der LQR-Probleme haben eine bemerkenswerte Eigenschaft: Wenn
die genannten Bedingungen bzw. Voraussetzungen erfüllt sind, liefern sie ein garantiert (asymptotisch) stabiles geschlossenes System.
Trotzdem hat man mit der Wahl der Bewichtungsmatrizen Q, R einen großen Spielraum, um über sie auf den Verlauf der Zustandsvariablen xi(t) und der Stellgrößen
ui(t) Einfluß zu nehmen. Hinweise, die allerdings nur Tendenzaussagen enthielten,
wurden dazu oben gegeben und können an Beispielen verifiziert werden. Starke Bewichtung der Stellgrößen ui (d.h. große Zahlenwerte rii > 0 in R) führt zu geringeren
Stellgliedaktivitäten bzw. Stellenergien, meist verbunden mit geringeren Stellamplituden usw. Dies wirkt sich in langsameren, ruhigeren Verläufen der xi(t) aus.
Genauere, quantitativ und direkt faßbare Zusammenhänge zwischen Q, R und dem
sich dazu jeweils ergebenden Zeitverhalten der xi(t) und ui(t) können i.a. nicht angegeben werden. Deshalb wurde auf ein ggf. iteratives Durchlaufen der Entwurfsschritte und damit eine iterative Bestimmung der im speziellen Anwendungsfall
günstigsten Bewichtungsmatrizen Q, R hingewiesen. Ein solcher Ablauf ist rezeptmäßig und formal zu handhaben. Da für alle Schritte heute hoch effektive algorithmische und Rechnerunterstützung gewährleistet ist, besticht der LQR-Entwurf durch
seine "Rezeptmäßigkeit" und die Eigenschaft, immer zu einem "schön stabilen"
System zu führen.
Natürlich bestand und besteht der Wunsch fort, die Zusammenhänge zwischen Q, R
und dem Verhalten von u(t), x(t) transparenter zu gestalten. Da der Charakter des
Zeitverhaltens in einem linearen System durch die Art und die Lage der Pole (Eigenwerte) des Systems bestimmt wird, liegt es nahe, zunächst die Zusammenhänge
zwischen den Bewichtungsmatrizen Q, R im quadratischen Gütemaß und der Lage
der Pole des LQR-optimalen Systems aufzudecken und ggf. für den praktischen
Entwurf nutzbar zu machen. Im Mehrgrößenfall gelingt letzteres leider nur in ziemlich
grober Weise bei Annahme spezieller Relationen zwischen Q und R. Trotzdem sind
die Kenntnisse dieser Zusammenhänge nützlich. Dies vor allem dann, wenn man
einen LQR-Entwurf nur als Startschritt oder Vergleichsmaßstab für andere, speziellere Verfahren (z.B. Entwurf von Ausgangsrückführungen zur Polvergabe oder
Polgebietsvorgabe) des Mehrgrößenregelungsentwurfs verwenden will.
Die Aufdeckung dieser nützlichen Zusammenhänge beginnt mit der Sichtbarmachung einer interessanten Eigenschaft der Hamilton-Matrix aus (22), die im folgenden mit Z bezeichnet wird
A
Z 
Q
BR 1 BT 


 AT
(37)
.
Zunächst sollen Aussagen zu den Eigenwerten dieser Hamilton-Matrix Z gemacht
werden. Es ist bekannt, daß die Eigenwerte einer Matrix invariant gegenüber einer
Ähnlichkeitstransformation der Matrix sind:
Z und T Z T 1  Zˆ
24
haben, wenn T eine reguläre Transformationsmatrix ist, die gleichen Eigenwerte. Die
Anwendung der folgenden Transformationsmatrix
In
T 
P
0 
In
mit T 1  

In 
 P
0 
I n 
(38)
,
wobei P die Lösung der algebraischen Matrix-Riccatigleichung (27) des LQR-Problems ist, auf (37) führt zu der bemerkenswerten Erkenntnis, daß die Eigenwerte von
Z die Vereinigungsmenge der Eigenwerte von (A - B Kopt) und -(A - B Kopt)T sind:
I
Zˆ  T Z T 1  
P
I

P
BR 1 B T 

 AT 
0  A

I  Q

0
I 
I
 P

 A  BR 1 B T P

Q  AT P
0
I 
BR 1 B T 


 AT
 A  BR 1 B T P

BR 1 B T


 PA  PBR 1 B T P  Q  AT P PBR 1 B T  AT 
 A  B K opt

 0

 A  B K opt

 0

BR 1 B T


1 T
T
 A  BR B P 


BR 1 B T


T
 A  B K opt 


(39)
Bei diesen Umformungsschritten wurde Gebrauch gemacht von
 der Matrix-Riccatigleichung (27)
 Kopt = R-1 BT P nach (24)
 der Tatsache, daß P als Lösung von (27) sowie R und damit R-1 symmetrisch sind und daher gilt
(PBR-1 BT)T = BR-1 BT P .
Ẑ nach (39) ist eine obere Dreiecks(hyper)matrix, so daß die Eigenwerte von Ẑ und
damit von Z durch die Vereinigungsmenge der Eigenwert der beiden Hauptdiagonalblöcke in Ẑ gegeben sind. In der linken oberen Ecke steht die Systemmatrix des
geschlossenen, optimal geregelten Systems
Ag = A - B Kopt .
(40)
Ihre Eigenwerte i (Ag), i = 1, 2,   , n ergeben sich als Wurzeln der charakteristischen Gleichung
det [sI - (A - B Kopt)] = Pg(s) = 0 .
(41)
25
Das charakteristische Polynom des optimal geregelten Systems ist hier mit P g(s)
bezeichnet worden und stellt ein Polynom n. Grades in s dar.
Entprechend sind die anderen n Eigenwerte von Ẑ bzw. Z als Eigenwerte der in (39)
rechts unten stehenden Blockmatrix
(A - B Kopt)T = - AgT
(42)
zu berechnen.
det [sI + (A - B Kopt)T] = 0 .
(43)
Für die linke Seite von (43) sind folgende Umformungen möglich:
det [sI + (A - B Kopt)T] = (- 1)n det [-sI - (A - B Kopt)T]
= (- 1)n det [-sI - (A - B Kopt)]T
= (- 1)n det [-sI - (A - B Kopt)]
= (- 1)n  Pg (- s) .
(44)
 
Dies ist das charakteristische Polynom von AgT . Damit kann für das charakteristische Polynom der (2n, 2n)-Hamilton-Matrix Z die bemerkenswerte Gleichung angegeben werden:
 (s) = det (sI2n - Z) = (- 1)n  Pg(s)  Pg(-s) .
(45)
Daraus folgt; Wenn s = ig als Nullstelle von Pg(s) ein Eigenwert von Z ist, so ist
s = -ig Nullstelle von Pg(-s) und damit ebenfalls ein Eigenwert von Z. Die 2n Eigenwerte von Z liegen also symmetrisch zur imaginären Achse der S-Ebene. Da bei Einhaltung der erforderlichen Voraussetzungen der LQR-Entwurf ein stabiles geschlossenes System liefert, d.h. die Eigenwerte von Ag = A - B Kopt in der linken s-Halbebene liegen und gemäß (41) die n Nullstellen von Pg(s) sind, liefert gemäß (45) das
Polynom Pg(-s) die n genau spiegelbildlich zur imaginären Achse dazu liegenden n
anderen, also in der rechten s-Halbebene liegenden Eigenwerte von Z:
̂
n Nullstellen Pg(s)
n Eigenwerte des
n Nullstellen Pg(-s),
spiegelbildlich zu den ig
optimal geregelten
26
Systems
ig , i = 1, 2,    , n
Bild 6.1: Eigenwertverteilung von Z
Wenn die Bedingungen bzw. Voraussetzungen für einen erfolgreichen LQR-Entwurf
wie in 4. und 5. beschrieben eingehalten sind, dann hat Z keine Eigenwerte auf der
imaginären Achse.
Ein formaler, mathematischer-Ausdruck dieser Eigenschaften ist u.a.:
 Das charakteristische Polynom von Z ist ein biquadratisches Polynom
( S )  ( 1) n s 2n   2n  2 s 2n  2       2 s 2   o .
(46)
 Die Koeffizienten bei ungeraden Potenzen von s in den Polynomen P g(s) und
Pg(-s) unterscheiden sich nur im Vorzeichen, die Koeffizienten bei geraden
Potenzen sind gleich.
Nun soll versucht werden, gewisse Aussagen zum Einfluß von Q und R im quadratischen Gütemaß auf die Eigenwerte ig des optimal geregelten Systems zu gewinnen.
Da Q und R beide in die Hamilton-Matrix eingehen und die Eigenwerte der HamiltonMatrix in der angegebenen Weise mit den Eigenwerten (Polen) des optimal geregelten Systems zusammenhängen, ist zu hoffen, daß man diese Kausalkette noch
sichtbarer und gezielt nutzbar im Sinne der gewünschten Aussagen machen kann.
Um die Pole ig in Relation zu Q, R zu bringen, wird erneut von (45) ausgegangen:
 1n Pg ( s )  Pg (  s )  det sI 2n  Z 
 sI n  A
 det 
  Q
( 47)
 BR 1 B T 

sI n  AT 
Für die nachfolgenden Ableitungen ist es zweckmäßig, R-1 aufzuspalten in
R
1
R

1
2

R
1
2
(48)
und Q in der Form (36) zu schreiben
Q  DT D .
(49)
Mit der Determinanten-Formel

 M1 M 2 
det 
 det M1  det M 4  M 3 M11 M 2

M 3 M 4 

(50)
erhält man aus (47) dann
27
1
1




1
T
T

2
 1 Pg ( s) Pg (  s)  det sI  A det sI  A  D D  sI  A  BR R 2 B T 




n
Klammert man in der eckigen Klammer den Faktor (sI + AT) aus, so wird
 1n Pg ( s ) Pg (  s )  det sI  A  det( sI  AT ) 
(51)
1
1




T 1
T
1
T

2
2
 det I n  sI  A
 D D ( sI  A) BR R B






.
Nun gilt


det sI  AT  det sI  AT  det ( sI  A)
  1n det  sI  A.
Bekanntlich ist det (sI - A) das charakteristische Polynom der Regelstrecke
det (sI - A) = P(s),
(52)
aus dem die Eigenwerte der Strecke i(A), i = 1, 2,    , n folgen. Dann gilt
det (-sI - A) = P(-s).
Damit erhält man aus (51)
Pg ( s )  Pg (  s )  P( s )  P  s ) 
(53)
1
1




1 T
T

1
T
2
2

 det I n  sI  A
D  D sI  A BR
R B






.
Wendet man hier die Determinantenidentität
det (In + M N) = det (Ir + N M)
(54)
an, wobei M und N Matrizen passender Dimension sind, so ergibt sich
Pg ( s )  Pg (  s )  P( s )  P(  s ) 
(55)
1 
1



 





1
T
T 1 T 

2
2
 det I r   D sI  A BR    R B sI  A
D 







 



Der hier auftretende Matrixfaktor
28
1

~
1
G( s)  D( sI  A) B R 2
(56)
kann als Matrixübertragungsfunktion eines fiktiven Systems gedeutet werden, das
aus der Regelstrecke hervorgeht und daher deren Pole besitzt:
Bild 6.2:
~
Deutung von (56) als fiktives System G
Damit erhält man aus (55)


~
~
Pg ( s)  Pg (s)  P( s)  P(s)  det I r  G( s)  GT (s) .
(57)
Hierbei wurde noch beachtet, daß zunächst aus (56) folgt
1
1


~
G(  s)  D sI  A1 BR 2   D sI  A1 BR 2 ,
so daß
T
1
1

 

  D sI  A1 BR 2    R 2 B T sI  A1 T D T





R

1
2


(58)

1 T
~
B T sI  AT
D  G T ( s) .
Gleichung (57) ist nun eine sehr wichtige Beziehung:
29
Sie stellt nämlich eine Relation her zwischen
 den Polen des optimal geregelten Systems ig (Nullstellen von Pg(s)
 den Polen der Regelstrecke i, die bei der konstanten optimalen Zustandsrückführung u = - Kopt x identisch mit den Polen des offenen Systems sind (Nullstellen
von P(s)
und
~
 den Wichtungsmatrizen Q und R (zwar noch etwas versteckt in G ( s ) ).
Um den Effekt einer Variation von Q und R auf die Pole ig des geschlossenen, optimal geregelten Systems zu untersuchen, muß leider eine stark vereinfachende Anname über die Art der vorzunehmenden bzw. zugelassenen Variationen von Q und R
eingeführt werden:
D T D  Q  q  Qˆ
R  r  Rˆ
(59)
wobei Qˆ  0 und Rˆ  0 die nominalen Bewichtungsmatrizen sind und q und r positive skalare Parameter darstellen. Dies wird, wie nun gezeigt werden soll, Grenzwertbetrachtungen für diejenigen Polverteilungen des geschlossenen Systems erq
möglichen, die zu erwarten sind, wenn der Parameter
in einem Extremfall gegen
r
Null und im anderen Extremfall gegen Unendlich strebt. Um diese sog. asymptotischen Eigenschaften der Polverteilung eines LQR-geregelten Systems zu erhalten,
muß der Determinantenterm in (57) unter Benutzung der Determinantenidentität (54)
jeweils in die geeignete Form gebracht werden, aus der die asymptotischen Eigenq
schaften für  0 bzw.   erschlossen werden können.
r
Grenzbetrachtungen für
q
0 :
r
Man beginnt am zweckmäßigsten mit der in (53) enthaltenen Form des Determinantenterms und formt ihn schrittweise um:


1
1




1
T 1 T
T

det I n  sI  A
D D sI  A B R 2 R 2 B 




1 ˆ 1


qQˆ
R
r






1
1


 det  I n   sI  AT
qQˆ sI  A1 B Rˆ 1 B T 
r




1 
q

 det  I n  sI  A1 B Rˆ  2 B T  sI  AT
Qˆ  .
r


Für
(60)
q
 0 nimmt diese Determinante den Wert 1 an, so daß aus (53) folgt
r
30
Pg ( s )  Pg  s  
 P( s ) P(  s ) .
(61)
q
0
r
Da der LQR-Entwurf immer zu einem asymptotisch stabilen geschlossenen System
führt, kann aus (61) geschlußfolgert werden, daß die n Pole des geschlossenen
q
optimalen Systems für  0 gegen die stabilen Nullstellen von P(s)  P(-s) streben;
r
das sind
a) die stabilen Pole der Regelstrecke ( des offenen Systems)
und
b) die instabilen Pole des offenen Systems gespiegelt an der imaginären
Achse.
a) und b) zusammen liefern die n stabilen Pole des geschlossenen Systems, d.h. die
Nullstellen von Pg(s).
q
 0 bedeutet, daß die Stellgrößen ui im quadratischen Gütemaß wesentlich stärr
ker als die Zustände xi bewichtet werden, d.h. man zielt auf minimalen Stellenergieaufwand ab: Sog. "billige" (bezogen auf den Stellaufwand) Regelung. Die Folge ist,
daß die stabilen Streckenpole liegen bleiben wo sie sind und die instabilen Streckenpole einfach an der imaginären Achse in die linke s-Halbebene gespiegelt werden.
Diese Erkenntnis kann nützlich sein, wenn man bei Anwendung von Polvorgabeverfahren als Entwurfsmethode ein "aufwandsminimales" (bzgl. der Stellenergie) Regelungsgesetz erreichen möchte, das die instabile Strecke mit Sicherheit stabilisiert.
Die dafür vorzugebenden Pole sind die aus a) und b). Man kann dann hoffen, daß
die Stellamplituden entsprechend klein sind und Stellgrößenbegrenzungen
eingehalten werden in dem Sinne, daß sie nicht angefahren werden.
Grenzbetrachtungen für
q
 :
r
Diese sind wesentlich komplizierter durchzuführen und sollen daher nur im Ansatz
behandelt werden.
Mit (54) und (56) gilt für die Determinante in (57)

 



~
~
~
~
det I r  G( s)  G T (  s)  det I m  G T (  s)  G( s)
(62)
1
1


 
1 T

1
T
T
 det  I m  R 2 B  sI  A
D D sI  A BR 2 




Ohne Einschränkung der Allgemeinheit sei
31
D  q  Dˆ und damit Qˆ  Dˆ T Dˆ ,
(63)
und die Zahl der Ein- und Ausgänge der analog zu (56) nunmehr zu definierenden
fiktiven Strecke gleich m.
Bild 6.3
Definition eines weiteren fiktiven Systems Ĝ
Diese fiktive Strecke hat die (m, m)-Matrixübertragungsfunktion
1

1

Dˆ adj sI  ABRˆ 2
Gˆ ( s )  Dˆ sI  A1 B Rˆ 2 
.
P( s )
(64)
Mit (62) und (64) nimmt die entscheidende Gleichung (57) die Form an
q


Pg ( s )  Pg (  s )  P( s )  P(  s ) det  I m  Gˆ T (  s ) Gˆ ( s ) .
r


Für
(65)
q
  dominiert in der Determinante der zweite Summand. Damit wird man für
r
q
  auf der rechten Seite von (65) ein Polynom vom Grade 2 p  0 erhalten,
r
wenn man annimmt, daß man für det Gˆ ( s ) mit Gˆ ( s ) aus (64) ein Zählerpolynom vom
Grade p > 0 erhält:
p
det Gˆ ( s ) 
  s  i 
i 1
P( s )
.
 ist eine Konstante.
Entsprechend ist dann
p
det Gˆ T (  s ) 
   s   i 
i 1
P(  s )
.
Der Grad p der hier vorkommenden Zählerpolynome kann höchstens (n - m) werden.
Man erkennt, daß die Nullstellen dieser beiden Zählerpolynome auch spiegelbildlich
32
zur imaginären Achse sind. Also strebt p > 0 die rechte Seite von (65) im Grenzüberq
gang   gegen das Polynom
r


p
p
i 1
i 1
P( s)  P(  s)  det Gˆ T (  s)  Gˆ ( s)   2   (  s  i )   ( s  i ) . (66)
q
  streben 2 p der insgesamt 2n Nullstellen des
r
Polynoms Pg(s)  Pg(-s) auf der linken Seite von (65) gegen die Nullstellen des Polynoms in (66). Die restlichen (2n - 2p) Nullstellen gehen gegen Unendlich.
Also gilt: Im Grenzübergang
Da einLQR-Entwurf immer stabile Pole liefert - das sind die n Nullstellen von Pg(s) q
müssen diejenigen p Nullstellen von Pg(s), die für  
r
endlich bleiben, die stabilen Nullstellen des Polynoms (66) sein:
 endliche Nullstelle n 

  stabile Nullstelle n 

 von P ( s ), wenn q      von (66)

 

g
r


oder
 Pole des LQR  geregelten 


 Systems, die für q  
  ˆ   i wenn  i  0
i 


r
  i wenn  i  0


endlichen
Werten
zustreben


i  1, 2,    , p .


Man muß also nur die p Nullstellen i vom Zähler det Gˆ ( s ) ermitteln. Häufig werden diese als Nullstellen von Gˆ ( s ) (der Matrixübertragungsunktion der fiktiven Mehrgrößenstrecke (64)) definiert. Wenn die so definierten Nullstellen von Gˆ ( s ) alle in der
linken Halbebene liegen, d.h. wenn für alle p ˆi gilt ˆi  i , dann kürzen sich die
q
genau dorthin für   strebenden Pole des geschlossenen Systems gegen diese
r
"Nullstellen der offenen Kette", und ihr Effekt ist in den Zeitvorgängen der Ausgangsgrößen nicht feststellbar. Es sind nun noch Angaben zu machen, wie und wohin die
q
restlichen (n - p) Pole des LQR-geregelten Systems für   ins Unendliche der
r
komplexen s-Ebene streben.
Diese gruppieren sich in bestimmten Butterworth-Konfigurationen verschiedener
q
Ordnung und mit verschiedenen Radien, die mit
selbst gegen Unendlich gehen.
r
33
"q
groß" kann man Abschätzungen für die Entfernung dieser den Butterworthr
Verteilungen zustrebenden Pole vom Koordinatenursprung angeben. Für genauere
Angaben der jeweiligen Pollagen muß man besser eine maschinelle Berechnung
vornehmen. Jedenfalls ist dies für den Mehrgrößenfall die zu empfehlende Variante.
Es sei noch angemerkt, daß Butterworth-Polverteilungen "gute" Zeitvorgänge ergeben. Im Eingrößenfall werden Butterworth-Polverteilungen daher häufig für Modellübertragungsfunktionen, die ein gewünschtes Übertragungsverhalten eines geschlossenen Systems ergeben, vorgeschrieben.
Für
q
Eine geeignete Berechnungsmöglichkeit der Polwanderung ig   ergibt sich aus
r
folgenden Überlegungen. Die in (65) auftretende Matrix
q ˆT

ˆ 
 I m  r G (  s ) G ( s )
wird als Rückführdifferenzmatrix des fiktiven Mehrgrößenregelkreises (Schnittstelle
bei xa)
Bild 6.4:
Zweckmäßige Einführung eines fiktiven Regelkreises
interpretiert. Damit ist (65) genau die Aussage des Hsu-Chen-Theorems für diesen
Regelkreis:
q

 char. Polynom geschl . RK
det  I m  Gˆ T (  s ) Gˆ ( s ) 
r

 char. Polynom offene Kette
Pg ( s )  Pg (  s )

P( s )  P (  s )
Das charakteristische Polynom des geschlossenen fiktiven Regelkreises
Pg(s)  Pg(-s) ist vom Grade 2n und die stabilen Pole des LQR-geregelten Systems
sind - wie oben gezeigt - gerade die n Nullstellen von Pg(s). Wenn man nun eine Zustandsbeschreibung für den geschlossenen fiktiven Regelkreis angeben kann, so
sind diese n Pole des LQR-geregelten Systems genau die n in der linken Halbebene
liegenden Eigenwerte der (2n, 2n) - Systemmatrix des geschlossenen fiktiven Regelkreises.
Zu dem fiktiven Teilsystem Gˆ ( s ) der offenen Kette gehört nach (64) folgendes
Zustandsmodell
34
z1  A z1  B Rˆ
yˆ  Dˆ z1 .

1
2
uˆ
Entsprechend gehört zu dem Teilsystem Gˆ T ( s)
z 2   AT z 2  Dˆ T yˆ   AT z 2  Dˆ T Dˆ z1   AT z 2  Qˆ z1
x a  Rˆ

1
2
BT z 2 .
Die Schließungsbedingung lautet
1
q
q 
uˆ  x e  x a  x e  Rˆ 2 B T z 2 .
r
r
Daraus folgt für das Zustandsmodell des geschlossenen fiktiven Regelkreises
1

q
z1  A z1  B Rˆ 1 B T z 2  B Rˆ 2 x e
r
z   Qˆ z  AT z
2
1
2
1

ˆ 2
x a  O z1  R
BT z 2 ,
bzw. in Vektor-Matrix-Schreibweise

 z1   A
 z   
 2   Qˆ


xa   0



q ˆ 1 T 
BR B 
r

 AT

1


T
2
ˆ
R B


1

 z1   ˆ  2 
z   B R  x e
 2  0 


 z1 
z 
 2
In der Systemmatrix

A
A = 

 Qˆ

q ˆ 1 T 
BR B 
r

 AT

35
q
q
q
ein im Bereich 0    variierender Parameter. Für jeweils feste Werte
aus
r
r
r
dem Wertebereich berechnet man die 2n Eigenwerte von A. Die gesuchten Pole des
LQR-geregelten Systems sind die n in der linken Halbebene liegenden Eigenwerte
q
aus dieser Menge. Jeder dieser n Eigenwerte ig   beschreibt in Abhängigkeit von
r
q
einen Ast der "multivariablen Wurzelortskurve" des LQR-geregelten Systems mit
r
dem speziellen quadratischen Gütekriterium
ist
1
J
2

 q x
T

Qˆ x  uT Rˆ u dt .
o
Man muß zunächst die nominalen Bewichtungsmatrizen Qˆ  0 ; Rˆ  0
( )
angepaßt an das konkrete Problem sinnvoll wählen. Die Voraussetzungen für die
Existenz einer Lösung des Optimierungsproblems - je nach dem, ob es sich um ein
OP1 oder OP2 handelt, sind, soweit sie Q  q Qˆ betreffen, dabei selbstverständlich
zu beachten:
OP1 :
q  0,
Qˆ  0
OP 2 :
q  0,
Qˆ  Dˆ T Dˆ  0
( Dˆ , A) detektierbar.
q
skaliert die Wichtungsmatrizen im Gütefunktional relativ zueinanr
der und ist gleichzeitig Parameter der WOK-Äste. Man wählt denjenigen Wert
q
, für den sich eine gewünschte Polverteilung ig , i = 1, 2,   , n ergibt . Wenn für
r
gewählte Qˆ und Rˆ die WOK keine "ausreichend optimale" Polverteilung zu erreichen
gestatten, dann muß man das Verfahren mit anderen Qˆ , Rˆ wiederholen, bis man eine
Der Parameter
gewünschte, optimal erscheinende LQR-Polverteilung gefunden hat.
Für den Eingrößenfall sind erwartungsgemäß in den vorangegangenen Betrachtungen Vereinfachungen möglich. Mit diesen Vereinfachungen ergibt sich schließlich
das für den Eingrößenfall durchaus praktikable Reglerentwurfsverfahren nach der
Methode des sog. "symmetrischen Wurzelortes" (englisch: square root locus). Dieser
stellt eine symmetrisch auch zur imaginären Achse verlaufende Wurzelortskurve dar
r
mit einem skalaren Parameter  , der aus der relativen Wichtung
der Stell- und
q
Regelgröße im quadratischen Gütekriterium hervorgeht. Da ein LQR-Entwurf garantiert stabile Regelkreise liefert, hat man nur die in der linken Hälfte der komplexen
Ebene verlaufenden Äste des symmetrischen Wurzelortes zu betrachten. Auf diesen
wählt man nach den üblichen Regeln eine "schön stabile" Polverteilung aus und mit
36
dem dazu gehörenden Parameterwert für  findet man dann das korrespondierende
LQR-Optimierungsproblem. Seine Standardlösung liefert den Regler.
37
Herunterladen