Linear-Quadratisch-Optimale Zustandsrückführung (LQR) 1. Aufgabenstellung 2. Bemerkungen und Erklärungen zur Aufgabenstellung 2.1 Zum Modell der Regelstrecke 2.2 Zum quadratischen Gütemaß 3. Lösung des Optimierungsproblems mittels der Hamilton-Gleichungen 4. Zusammenfassung der Entwurfsschritte 5. Modifiziertes Optimierungsproblem und seine Lösung: Quadratisch bewichtete Ausgangsgrößen 6. Zusammenhang zwischen Bewichtungsmatrizen Q, R und Polen des geschlossenen Systems Linear-Quadratisch-Optimale Zustandsrückführung (LQR) 1. Aufgabenstellung Für eine lineare zeitinvariante Mehrgrößenregelstrecke x t A x t B u t , x 0 x o y t C x t (1) n. Ordnung, mit m Stellgrößen ui und r Ausgangsgrößen (Regelgrößen) yj soll ein Regelungsgesetz in Form einer Zustandsrückführung u = u(x) gefunden werden, so daß das quadratische Gütemaß J o xT t Q xt uT t Rut dt (2) minimal wird. 2 2. Bemerkungen und Erklärungen zur Aufgabenstellung 2.1. Zum Modell der Regelstrecke (1) Meistens ist (1) das Ergebnis der Linearisierung des i.a. nichtlinearen Prozeßmodells x f x, u y g x , wobei die Linearisierung um einen stationären Betriebspunkt (Arbeitspunkt) durchgeführt wird. Es wird hier angenommen bzw. vereinbart: V1: Der Arbeitspunkt, in dessen Umgebung die Regelstrecke durch das linearisierte Modell (1) näherungsweise beschrieben wird, sei AP: x = 0. (3) Liegt der Arbeitspunkt an einer anderen Stelle des Zustandsraumes, so kann man durch eine entsprechende Parallelverschiebung des Koordinatensystems die durch V1 gekennzeichnete Situation immer erreichen. Damit sind alle Variablen xi, ui, yi in (1) Abweichungsvariable vom Arbeitspunkt. Zum Anfangszeitpunkt t = 0 befinde sich der Zustandspunkt der Strecke bei x(0) = xo, was wie folgt zu interpretieren ist: Vorangegangene (t < 0) Störungen haben die Strecke aus dem Arbeitspunkt x = 0 ausgelenkt, so daß sich die Strecke zum Anfangszeitpunkt t = 0, in dem die Betrachtung des Systems beginnen soll, im Anfangszustand x(0) = xo befinde. 2.2. Zum quadratischen Gütemaß (2) Grundsätzliche Zielstellung: Die zu findende Zustandsrückführung u = u(x) soll den Anfangszustand x(0) = xo, der einen beliebigen Punkt im Zustandsraum des Systems darstellt, wieder in den gewünschten Arbeitspunkt x = 0 bringen. Dieser Übergangsvorgang x 0 soll nun so erfolgen, daß das quadratische Gütemaß (2) minimal wird! Welche Anforderungen an diesen Übergangsvorgang drückt J gemäß (2) aus? (1) Der erste Term in J drückt quantitativ die Forderung aus: Der Übergang xo 0 soll nicht zu langsam sein und nicht zu stark oszillieren, wobei große Abweichungen der Zustandsvariablen vom Arbeitspunkt x = 0 stärker „bestraft“ werden. Wenn die (n, n)-Matrix Q als Diagonalmatrix mit positiven Diagonalelementen 3 (qii > 0) gewählt wird, stellt die quadratische Form xT(t) Q x(t) die gewichtete Quadratsumme der einzelnen Zustandsvariablen dar: T x (t ) Q x (t ) n qii xi2(t ), i 1 (4) q11 q 22 Q qun . Je größer der Zahlenwert qii > 0 gewählt wird, umso stärker wird die zugehörige Zustandsvariable xi in der quadratischen Form „gewichtet“. Durch den ersten Integralterm in (2) J1 x (t ) Q x(t )dt q11 x12 (t ) qun xn2 (t ) dt T o (5) o werden also mit der Wahl der Bewichtungsfaktoren qii > 0 Möglichkeiten geschaffen, einzelne Zustandsvariablen über die Beiträge ihrer individuellen quadratischen Abweichungsflächen qii xi2 (t ) dt o bei der Minimierung von (2) unterschiedlich zu bewerten bzw. zu bestrafen. Große qii bewirken starke Bestrafung. Dadurch, daß die xi(t) quadratisch eingehen, werden Vorzeicheneinflüsse (z.B. bei schwingendem Übergangsverläufen) ausgeschaltet. Wenn die Zustandsvariablen xi(t) der Strecke physikalische Größen mit technisch/technologischer Interpretierbarkeit darstellen, wird eine sinnvolle, zweckmäßige Festlegung der Wichungsfaktoren qii gezielt und angepaßt an die regelungstechnische Entwurfsaufgabe möglich sein. Werden ein oder mehrere qii = 0 gewählt, dann bedeutet das, daß die zugehörige (n) Zustandsvariable(n) im Gütemaß (2) nicht erfaßt werden. Dann ist aber die Minimierung von (2) ein regelungstechnisch unsinniges Optimierungsproblem: Die zu qii = 0 gehörende Zustandsvariable xi(t) könnte über alle Grenzen wachsen und da diese Zustandsvariable in J nicht eingeht, kann eine Minimierung von (2) in einer solchen Situation die Erfüllung der o.g. grundlegenden Zielstellung nicht 4 in Aussicht stellen oder gar garantieren! Man wird also in (4) alle Diagonalelemente qii > 0 vorgeben! Insbesondere wenn die ungeregelte Strecke (1) instabil ist, ist es wichtig, daß alle xi(t) in J1 nach (5) und damit in das quadratische Gütemaß (2) eingehen. Nur wenn durch die Zustandsrückführung u(x) ein stabiles geschlossenes System entsteht, wird das grundlegende Ziel xo 0 erreicht, d.h. lim xi (t ) 0 t für alle i = 1, 2, ..., n. Und nur dann kann J nach (2) einen endlichen (minimalen!) Wert annehmen. (2) In diesem Zusammenhang erkennt man auch den Sinn des zweiten Termes in (2), der die Stellgrößen in bewichteter Form in das quadratische Gütemaß einbezieht. Würde dieser zweite Term fehlen, so würde (2) in J1 gemäß (5) übergehen. Setzt man wieder voraus, daß durch die zu entwerfende Zustandsrückführung u(x) ein stabiles geschlossenes System entsteht, also alle xi(t) auf ihren Arbeitspunkt 0 abklingen, so würde die als Minimierungsproblem formulierte Entwurfsaufgabe „Bestimme u = u(x) so, daß ! J1 x T (t ) Q x(t ) dt Min" o zu nicht realistischen und nicht realisierbaren Idealverläufen der einzelnen Zustandsübergänge xi(t) führen, nämlich zu solchen, die J1 zum absoluten Minimum J1 = 0 führen: Min führt zu unrealistischen Verläufen der xi(t) Bild 2.1: J1 Ein solcher Idealverlauf kann aber nicht mit Hilfe der realen, an der Regelstrecke technische verfügbaren Stellgrößen „erzwungen“ werden. Um den Idealverlauf der Zustandsübergänge zu erzwingen, müßten in einem Zustandsregler offenbar sehr (unendlich) große Stellamplituden und Stellgrößenänderungsgeschwindigkeiten generiert werden, die dann auch noch über die Stelleinrichtungen auf die 5 Regelstrecke zur Wirkung gebracht werden müßten. Beides ist nicht realisierbar. Man denke nur an die Stellgrößenbegrenzungen realer Stelleinrichtungen! Realitätsbezogen wird also ein mathematisch als Minimierungsaufgabe formuliertes Entwurfsproblem erst, wenn Stellgrößenbegrenzungen in geeigneter Weise Berücksichtigung finden. Im vorliegenden Fall wird dies durch die Hinzunahme des zweiten Termes uT R u im Integranden des Gütemaßes (2) erreicht. Durch ihn wird praktisch die „Steuerenergie“ mitbewertet, die erforderlich ist, um diejenigen Zustandsübergänge xo0 zu erzeugen, die die durch den ersten Term in J ausgedrückten Anforderungen („nicht zu langsam“ und „nicht zu stark oszillierend“) erfüllen. Die (m, m)-Matrix R wird ebenfalls als Diagonalmatrix mit sämtlich positiven Diagonalelementen rii > 0 angesetzt. Die quadratische Form u T (t ) R u (t ) m rii ui2 (t ) i 1 (6) r11 r 22 R rmm ist dann positiv und stellt die gewichtete Quadratsumme der Stellgrößen (-abweichungen vom AP) dar. Dann kann 2 J 2 uT R u dt r11 u12 (t ) r22 u22 (t ) ... rmm um (t ) dt o ( 7) o als ein Maß für die der Regelstrecke beim Übergang xo 0 zugeführte Stellenergie angesehen werden. Die Bewichtung des Anteiles, den eine einzelne Stellgröße ui(t) dabei hat, kann durch Festlegung des zugehörigen rii > 0 nach technisch relevanten Gesichtspunkten erfolgen. Wie man sieht, kommt es wieder in erster Linie auf die relative Größe des Zahlenwertes rii bezogen auf die Größe der anderen an. Man hat mit den Bewichtungsmatrizen Q = diag (qii) , R = diag (rii) , qii > 0 rii > 0 i = 1, 2, ..., n i = 1, 2, ..., m im quadratischen Gütemaß offenbar eine große Zahl von Freiheitsgraden, die sich in einer leider nicht direkt zu übersehenden Form auf die Zustandsübergänge xo 0 und die zugehörigen Stellgrößenverläufe im geschlossenen System auswirken. Tendenziell läßt sich sagen: 6 Große qii bestrafen die zugehörigen Übergangsvorgänge xi(t) bei der Minimierung von J stark – stärker als solche xj(t), die mit kleineren qjj bewichtet in J eingehen. Große rii bestrafen die zugehörigen Stellgrößen ui(t) in dem Sinne stark, als daß die mit ui(t) verbundene Steuerenergie ui (t ) dt 2 bei der Minimierung von o J stark „gedrückt“ wird, was – so kann man annehmen – auch eine entsprechend starke „Quasibeschränkung“ der Stellamplitude u i(t) bewirkt. Dadurch, daß sowohl die Verläufe x(t) des Zustandsübergangs xo 0 als auch u(t) als Steuervektor (Stellgrößenverläufe) der Zustandsrückführung in das quadratische Gütemaß (2) eingehen, hat man eine geeignete mathematische Formulierung für die regelungstechnisch einsichtigen o.g. Entwurfsforderungen gefunden. Da x(t) und u(t) von dem zu findenden Zustandsregler abhängen, ist auch das quadratische Gütemaß (2) eine Funktion von diesem. Das Regelungsgesetz u = u(x), d.h. der Zustandsregler, ist nun für die gegebene Regelstrecke (1) so zu bestimmen, daß J gemäß (2) zum Minimum wird. Mit anderen Worten: Der Zustandsregler ist so zu bestimmen, daß der im geschlossenen System ablaufende Übergangsvorgang xo 0 in Bezug auf das quadratische Gütemaß (2) optimal ist. Es ist daher folgendes mathematisches Optimierungsproblem OP1 zu lösen: Geg: Gütefunktional J 1 2 x(t ) Q x(t ) u (t ) R u(t ) dt o Q>0 Nebenbedingung T R>0 (8) x (t ) A x (t ) B u(t ) y (t ) C x (t ) , Randbedingungen x(0) x o x() 0 . Ges.: u u x(t ) so, daß J Min ! u( x ) Zu seiner Lösung sind die mathematischen Methoden der Variationsrechnung anzuwenden. Der im Gütefunktional eingeführte Faktor 1/2 ist nicht wesentlich; er erleichtert die nachfolgenden Rechnungen im Zusammenhang mit der Lösung des OP1 etwas. 7 Da in der Formulierung dieses OP1 weder den Zustandsvariablen noch den Stellgrößen irgendwelche Beschränkungen auferlegt sind, kann man die Lösung mittels der Hamilton-Gleichungen der klassischen Variationsrechnung gewinnen. 8 3. Lösung des Optimierungsproblems mittels der Hamilton-Gleichungen Um das Optimierungsproblem mit Nebenbedingungen, wie es als OP1 formuliert wurde, zu lösen, wird zunächst die Hamilton-Funktion definiert: H x, p, u p T rechte Seite der Strecken Dgl . ˆ Nebenbed. in OP1 A x B u von J Integrand 1 T T x Q xu Ru 2 ( 9) Der hier auftretende (n, 1) – Vektor p p1 (t ) p (t ) 2 p (t ) pn ( t ) wird als Vektor der adjungierten Variablen oder Kozustandsvektor bezeichnet. Per Definition erhält man aus der Hamilton-Funktion durch die folgenden Operationen der partiellen Ableitungsbildung die sog. kanonischen Differentialgleichungen x H p p H x (10) (11) und die sog. Steuerungsgleichung H 0. u (12) Um die partiellen Ableitungen von H bilden zu können, werden die folgenden Rechenregeln für die Differentiation benötigt: 9 p T A x AT p x T x Q x 2Q x x T u Ru 2Ru u pT A x A x p pT B u B u p pT B u BT u u (13) Damit erhält man für die kanonischen Differentialgleichungen H Ax Bu x H p AT p Q x x x (14) (15) und für die Steuerungsgleichung H BT p R u 0 . u (16) Man erkennt aus (14), daß die partielle Ableitung von H nach p die Vektordifferentialgleichung der Regelstrecke liefert. Die kanonische Differentialgleichungen (14), (15) bilden ein System von 2 n linearen gekoppelten Differentialgleichungen in den n Zustandsvariablen xi(t) der Strecke und den n Kozustandsvariablen oder adjungierten Variablen pi(t). Die Steuerungsgleichung (16) stellt eine lineare algebraische Beziehung zwischen u und p dar und kann nach u aufgelöst werden: u R 1 B T p . (17) Wegen R diag rii , rii 0 existiert die Inverse R-1. Spätestens jetzt ist zu fragen: Was haben die per Definition eingeführte HamiltonFunktion (9) und die aus ihr durch partielle Differentiationen formal gewonnenen weiteren Gleichungen mit der Lösung des OP1 zu tun? Die Antwort liefert die Variationsrechnung: Bilden u*(t) und x*(t) eine Lösung des OP1, so gibt es eine Lösung p* der adH jungierten Differentialgleichung p , d.h. die optimale Steuerung u*(t) x und die optimalen Trajektorien x*(t) und p*(t) erfüllen die kanonischen Differentialgleichungen 10 x H p p H , x und für die Hamilton-Funktion gilt die Maximumbedingung H (x*, p*, u*) H (x*, p*, u), (18) wobei u(t) irgend eine andere Steuerung ist. Dieser Satz stellt notwendige Bedingungen zusammen, die die Lösungen des OP1 – das sind die bezüglich J optimale Steuerung u*(t) und optimale Zustandstrajektorie x*(t) – erfüllen müssen. Es sei bemerkt, daß mit der Angabe der notwendigen Bedingungen, die u*(t) und x*(t) erfüllen müssen, die Lösungen selbst natürlich noch nicht gefunden sind! Und weiter muß darauf hingewiesen werden, daß als regelungstechnisch interessierende, ursprüngliche Aufgabenstellung etwas ganz anderes formuliert war: Gesucht ist eine bzgl. J optimale Zustandsrückführung u = u*(x(t)) und nicht die optimalen Zeitfunktionen (Extremalen) u*(t), x*(t), die J einen minimalen Wert erteilen! Regelungstechnisch interessiert eigentlich nur der Entwurf, d.h. die Synthese des bzgl. J optimalen Zustandsreglers u = u*(x(t)), so daß u*(t) und x*(t) als Lösungen des Variationsproblems als Zeitfunktionen für die Synthese des Reglers explizit gar nicht benötigt werden. Diese Besonderheit wird zweckmäßigerweise beim weiteren Fortgang der Problemlösung zu beachten sein. Dieser beginnt nun bei der Maximumbedingung (18) für die Hamilton-Funktion. Notwendig für ein Maximum der Hamilton-Funktion in Abhängigkeit von u ist, daß H 0. u Diese partielle Ableitung von H nach u wurde oben schon berechnet und als Steuerungsgleichung (16) angegeben. Als notwendige Bedingung für ein Extremum der Hamilton-Funktion in ihrer Abhängigkeit von u betrachtet erhält (16) jetzt einen verständlichen Sinn. Daß als Extremwert von H tatsächlich ein Maximum vorliegt, zeigt die zweite Ableitung von H nach u. H Dazu ist aus (16) nochmals nach u abzuleiten. u 2H u 2 T B p R u R 0. u Da R = diag (rii), rii > 0, i = 1, 2, ..., m eine eindeutig positiv definite Matrix ist, ist 11 2H negativ, was den Extremwert von H in Abhängigkeit von u als Maximum u 2 ausweist. Durch Umstellen der (einen) notwendigen Bedingung (16) für ein Maximum von H erhielt man (17). Wenn in (17) die optimale Trajektorie p*(t) des Kozustandsvektores für p eingesetzt wird, so erhält man die optimale Steuerung u* als Funktion von p*: u*(t) = R-1 BT p*(t). (19) Aber: p*(t) ist bis jetzt ebensowenig bekannt wie die optimale Trajektorie x*(t). Beide müssen als Lösungen der kanonischen Differentialgleichungen (14) und (15) ermittelt werden, denn diese sind nach dem o.g. Satz weitere notwendige Bedingungen, die die Lösungen des OP1 erfüllen müssen. Setzt man zunächst (19) in (14) ein, so erhält man x A x BR 1 B T p ( 20) p Q x AT p ( 21) . In diesen beiden kanonischen Differentialgleichungen kommen jetzt nur noch die beiden Unbekannten x(t) und p(t) vor. Der Stern wurde weggelassen, weil nur diejenigen Lsösungen von (20), (21) die optimalen Trajektorien sind, die gleichzeitig auch die Randbedingungen des OP1 erfüllen. (20), (21) wird in Vektor-Matrix-Schreibweise notiert x A p Q BR 1BT x p AT (22) . (20), (21) bzw. (22) werden als Hamilton-Gleichungen und die in (22) vorkommende (2n, 2n)-Matrix als Hamilton-Matrix des linear quadratischen OP1 bezeichnet. Die Hamilton-Gleichungen sind lineare Differentialgleichungen für x und p. Daher kann man vermuten, daß auch zwischen den Lösungen x und p eine lineare Beziehung besteht. Daher wird folgender Ansatz postuliert p(t) = - P x(t), (23) wobei P eine noch zu bestimmende (n, n)-Matrix ist. Wenn sich dieser Ansatz bestätigt, dann erhält man durch Einsetzen von (23) in (17) eine lineare Zustandsrückführung u = - R-1 BT Px = - Kopt x , (24) die das gesuchte, bezüglich J aus (8) optimale Regelungsgesetz darstellt. 12 Um die unbekannte Matrix P zu ermitteln, wird (23) in die kanonischen Differentialgleichungen (Hamilton-Gleichungen) (20) und (21) eingesetzt x A x B R 1 BT P x P x Q x AT P x . (25) ( 26) Durch Einsetzen von (25) in (26) erhält man daraus eine Gleichung für P: - P A x + P BR-1 BT P x = Q x + AT P x (P B R-1 BT P – PA - AT P – Q) x = 0 . Da diese Gleichung für beliebige x gelten soll, muß die (n, n)-Matrix in der Klammer die Nullmatrix sein: P B R-1 BT P – P A – AT P – Q = 0 . (27) Dies ist eine algebraische Matrix-Gleichung für die unbekannte (n, n)-Matrix P. Man bezeichnet sie als algebraische Matrix-Riccati-Gleichung zur Bestimmung von P. Wegen des ersten Summanden auf der linken Seite ist sie nichtlinear! Sie hat eine eindeutig bestimmte symmetrische, positiv definite Lösung, welche die gesuchte Matrix P in (23) bzw. (24) – d.h. in der Lösung des OP1 – darstellt, wenn die Strecke (1) stabilisierbar ist: V 2: (A, B) stabilisierbar. Das mit dieser Matrix P gebildete Regelungsgesetz (24) u*(t) = -R-1 BT P x(t) = - Kopt x(t) (24a) ist in der Tat bzgl. J aus (2) bzw. (9) optimal, liefert ein stabiles geschlossenes System und erteilt dem Gütefunktional (9) den minimalen Wert J min 1 T x P xo . 2 o ( 28) Die Voraussetzung V2 ist plausibel: Wenn die Regelstrecke instabile Eigenwerte hat, dann muß gesichert sein, daß diese instabilen Eigenwerte – genauer, die ihnen zugeordneten instabilen Modi der Strecke – steuerbar sind; d.h. (A, B) muß stabilisierbar sein. Wenn das nicht der Fall ist, kann keine Zustandsrückführung – also auch nicht die nach (24) – die Stabilität des geschlossenen Systems erreichen, und das quadratische Gütemaß J kann gewiß keinen endlichen oder gar minimalen Wert annehmen. Es muß noch die Eigenschaft der positien Definitheit der symmetrischen Matrix P, die als einzig interessierende Lösung der algebraischen Matrix-Riccati-Gleichung (27) in Frage kommt, erklärt werden. Die symmetrische Matrix P heißt positiv definit (in Kurzform geschrieben: P > 0), wenn sie sämtlich positive Eigenwerte hat. Ohne die Eigenwerte zu berechnen, kann diese Eigenschaft auch mit dem Kriterium von Sylvester festgestellt werden: Die symmetrische Matrix P 13 p11 p12 p13 p1n p p p 12 22 23 P p1n pnn n ( n 1) , wegen der Symmetrie zur Hauptdiagonale eigentlich nur signifi2 kanten Elementen pij) heißt positiv definit, wenn alle n „nordwestlichen“ Unterdeterminanten positiv sind (mit ihren p11 0 , p11 p12 p12 p22 0, , det P 0 . (29) Daraus folgt, daß eine positiv definite Matrix P > 0 immer regulär ist. Auch gibt es für sie immer eine reguläre Matrix M derart, daß MT M = P (30) gilt. 14 4. Zusammenfassung und Entwurfsschritte Für die Regelstrecke x A x B u ist das bzgl. des quadratischen Gütemaßes J mit 1 2 Q = diag qii R = diag rii x T Q x uT R u dt o qii > 0 rii > 0 i = 1, 2, ..., n i = 1, 2, ..., m optimale Regelungsgesetz eine lineare konstante Zustandsrückführung u = - R-1 BT P x = - Kopt x. Voraussetzung für die Existenz dieses optimalen Zustandsreglers ist weiterhin die Stabilisierbarkeit der Regelstrecke: (A, B) stabilisierbar. Die zur Berechnung der optimalen Zustandsrückführung erforderliche (n, n)-Matrix P ist als symmetrische, positiv definite Lösung der algebraischen Matrix-Riccatigleichung P B R-1 BT P – P A – AT P – Q = 0 zu ermitteln. Unter den genannten Bedingungen existiert eine solche Lösung. Das so geregelte System Bild 4.1: Optimale Zustandsregelung als Lösung des OP1 15 x A BR 1 BT P x , x(0) x o ist stabil e i A BR 1 BT P 0 i 1, 2, , n , und der minimale (optimale) Wert des quadratischen Gütemaßes ist J min 1 T x P xo 2 o und V ( x) xT P x ist eine Ljapunow-Funktion des geschlossenen Systems. Folgende Entwurfsschritte sind durchzuführen: (1) Prüfen der Strecke auf Steuerbarkeit bzw. Stabilisierbarkeit. (Eine vollständig steuerbare Strecke ist natürlich stabilisierbar) (2) Wahl der Bewichtungsmatrizen Q diag qii qii 0 i 1, 2 , n R diag rii rii 0 i 1, 2, , m . Es sind also sämtliche Diagonalelemente größer Null anzusetzen, so daß Q und R beide positiv definit sind. Bei der Festlegung der Zahlenwerte für die Elemente können nur tendenziell die Wirkungen auf das Verhalten, den Verlauf der xi(t) bzw. ui(t) in etwa vorausgesehen werden. Die in einem speziellen Anwendungsfall regelungstechnisch günstigste Konstellation der Zahlenwerte für die Elemente q ii und rii wird man nur interativ finden, was ein mehrmaliges rechnergestütztes Durchlaufen der Schritte (2) bis (6) erfordert. (3) Berechnung der positiv definiten symmetrischen Lösungsmatrix P der algebraischen Matrix-Riccatigleichung P B R-1 BTP – P A - ATP – Q = 0 , wofür effektive Lösungsalgorithmen existieren. (4) Berechnung der „optimalen“ Zustandsrückführmatrix Kopt = R-1 BTP . (5) Berechnung von Jmin für relevante Anfangszustandsvektoren xo Jmin = 1 T x P xo . 2 o 16 (6) Berechnung der Systemmatrix des geschlossenen Systems Ag = A – B R-1 BT P und Simulation des Übergangsvorgangs xo 0 des geschlossenen Systems x (t ) Ag x(t ) , x(0) x o : x (t ) einschließlich der Stellgrößenverläufe u(t) = - Kopt x(t) und ggf. zur Beurteilung und Kontrolle auch noch Berechnung der Eigenwerte des geschlossenen Systems : i (Ag) i = 1, 2, , n . Diese liegen sämtlich in der linken Hälfte der komplexen Ebene; keiner der n Eigenwerte liegt auf der imaginären Achse. Die Lösung des LQR liefert also unter den genanntnen Bedingungen Q > 0, R > 0, (A, B) stabilisierbar ein garantiert stabiles geschlossenes System. Die Schritte (5), (6) sind optional; (6) wird man im Sinne eines abschließenden Gütenachweises oder als Anlaß für eine interative, günstigere Festlegung von Q, R zur weiteren „optimaleren“ Formung der Übergangsvorgänge (siehe Bemerkungen zu Schritt (2)) wohl immer durchführen. 17 5. Modifiziertes Optimierungsproblem und seine Lösung: Quadratisch bewichtete Ausgangsgrößen Häufig sind nicht alle Zustandsvariablen xi im Modell der Regelstrecke (1) Variablen mit physikalischer Bedeutung; bei technisch nicht interpretierbaren Zustandsvariablen dürfte es aber praktisch kaum möglich sein, die Elemente qii der diagonalen Bewichtungsmatrix Q = diag qii , qii > 0, i = 1, 2, , n gestützt auf technisches a priori-Wissen gezielt und sinnvoll festzulegen. Dagegen sind die r Ausgangsgrößen yi der Strecke gewiß technisch signifikante und meist auch meßbare physikalische Größen. Es liegt daher nahe, in einem quadratischen Gütemaß die gewichtete Quadratsumme der r Ausgangsgrößen zu verwenden, anstelle von (4) also anzusetzen r ~ y T Q y q~ii yi2 i 1 mit der diagonalen (r, r)-Wichtungsmatrix q~11 ~ q22 ~ ~ Q , qii 0 , i 1, 2 , r . ~ qrr (31) Das modifizierte quadratische Gütemaß lautet damit anstelle von (8) ~ 1 J 2 y ~ Q y u T R u dt . (32) T T~ T x C Q C x u R u dt. o Q (33) T o Wegen y=Cx wird daraus ~ 1 J 2 Bezeichnet man in der hier auftretenden quadratischen Form der xi die resultierende Bewichtungsmatrix wieder mit Q ~ Q CT Q C , (34) 18 so ist Q zwar symmetrisch, aber nicht mehr diagonal! Selbst wenn (31) gilt, ist Q eine n-reihige, symmetrische aber i.a. nur noch positiv semidefinite Matrix Q 0: q11 q12 q1n q q 12 22 Q . q1n qnn Hier können durchaus diverse qij Null sein. Wenn man bedenkt, daß die (r, n)-Ausgabematrix C der Strecke häufig zahlreiche Nullelemente enthält, wird dies sicher keine seltene Situation sein. Die quadratische Form n ~ ~ y T Q y x T C T Q C x x T Q x qij xi x j i , j 1 mit positiv semidefiniter Matrix Q kann also Null werden, obwohl x 0 ist. Beispiel: x1 y1 1 0 0 y 0 1 0 x 2 2 x3 y C x ~ ~ q Q 11 ~ 0 q22 q~11 0 0 x1 ~ x T C T Q C x x T Q x x1 x2 x3 0 q~22 0 x2 0 0 0 x3 q~11 x12 q~22 x22 . 0 x Q x 0 für x 0 0 . 1 T 19 Geht man also, was physikalisch technisch sehr nahe liegt, an die Bildung des quadratischen Gütemaßes über den Ansatz einer quadratischen Form primär für die r Ausgangsgrößen yi(t) der Strecke heran, so ist im resultierenden Gütefunktional ~ 1 J 2 x T Q x uT R u dt (35) o Q0 R0 die Bewichtungsmatrix ~ Q CT Q C eine symmetrische, i.a. aber nichtdiagonale und nur noch positiv semidefinite (n, n)Matrix. Im Unterschied zu dem in 2. formulierten Optimierungsproblem OP1 liegt mit dem Gütefunktional (35) mit Q gemäß (34) ein modifiziertes Optimierungsproblem OP2 vor. Modifiziertes OP2: Geg.: ~ 1 J 2 x T Q x uT R u dt o mit Q 0 x A x B u , R>0 x o x(0) y C x Ges.: ~ u u [ x ] , so daß J Min ! u Die Regelstrecke kann dabei natürlich auch instabil sein. Lösung des OP2: Die Existenz einer Lösung des OP2 ist zunächst auch gebunden an die Voraussetzung VI: (A, B) ist stabilisierbar. Dies ist notwendig, weil instabile Eigenwerte der Strecke durch die Zustandsrückfüh~ rung in die linke Halbebene verschoben werden müssen; andernfalls könnte J keinen endlichen Wert annehmen. (Wenn die Regelstrecke vollständig steuerbar ist, ist VI erst recht erfüllt). 20 Da Q nur noch die Eigenschaft besitzt, positiv semidefinit zu sein, muß darüber hinaus noch geprüft werden, ob alle ggf. instabilen Eigenvorgänge der Strecke über y ~ beobachtet werden können und so in J erfaßt werden. Deshalb ist eine zweite Voraussetzung notwendig: VII: Es sei D eine (r, n)-Matrix, mit der Q 0 wie folgt ausgedrückt werden kann DT D = Q , (36) und es sei (D, A) detektierbar. VII bedeutet, daß über die fiktiven Ausgangsgrößen z = D x die instabilen Modi der Strecke beobachtbar sind. Dann existiert genau eine symmetrische, positiv semidefinite Lösung P 0 der algebraischen Matrix-Riccatigleichung P B R-1 BT P – P A – AT P – Q = 0 , und das mit dem konstanten Regelungsgesetz u = - R-1 BT P x ~ optimal bzgl. J geregelte System x A B R 1 BT P x ; x o x(0) ist (asymptotisch) stabil e i A B R 1 B T P 0 und der zugehörige endliche, minimale Wert des Gütefunktionals ist 1 ~ J min x To P x o . 2 Ist weitergehend als VII sogar die Voraussetzung VIIa: (D, A) beobachtbar erfüllt, dann existiert genau eine Lösung der algebraischen Matrix-Riccatigleichung mit der Eigenschaft P > 0, und V(x) = x T P x ist eine Ljapunow-Funktion des geschlossenen Systems. 21 Hinweis: Mit (31) und (34) ist D aus (36) wie folgt zu bestimmen: 1 ~ D Q 2 q~11 q~22 C, C ~ qrr so daß (D, A) detektierbar (C, A) detektierbar. D.h. VII ist erfüllt, wenn die instabilen Modi der Strecke über y beobachtbar sind, was gewiß gegeben ist, wenn die Regelstrecke vollständig beobachtbar ist. Die Beobachtbarkeit impliziert die Detektierbarkeit. Wenn das Entwurfsproblem als OP2 formuliert wird, sind folgende Entwurfsschritte durchzuführen: (1) Prüfen der Strecke auf Steuerbarkeit bzw. Stabilisierbarkeit. (Eine vollständig steuerbare Strecke ist natürlich stabilisierbar). (2) Wahl der Bewichtungsmatrizen ~ Q diag ( q~ii ) q~ii 0 R diag ( rii ) rii 0 i 1, 2, , r i 1, 2, , m . (3) Berechnen der symmetrischen, i.a. aber nur positiv semidefiniten (n, n)-Matrix Q ~ Q CT Q C und Zerlegen in die Form DT D = Q mit einer (r, n)-Matrix D. (Nach dem oben gegebenen Hinweis ist 1 ~ D Q 2 C. ) (4) Prüfen, ob (D, A) detektierbar ist. Wenn gemäß (2) alle Diagonalelemente ~ q~ii 0 gewählt sind, also Q 0 , dann impliziert die Detektierbarkeit der Regelstrecke, d.h. die Detektierbarkeit von (C, A), die von (D, A). Ist die Regelstrecke sogar vollständig beobachtbar, dann ist sie erst recht detektierbar. 22 (5) Berechnung der symmetrischen, positiv semidefiniten (im Falle der vollständigen ~ Beobachtbarkeit der Strecke und Q gemäß (2) sogar positiv definiten) Lösungsmatrix P der algebraischen Matrix-Riccatigleichung P B R-1 BT P – P A – AT P – Q = 0. (6) Berechnung der „optimalen“ Zustandsrückführmatrix Kopt = - R-1 BT P (7) Berechnung von 1 ~ J min x To P x o 2 (8) Gütenachweis: Ag A B R 1 B T P i ( Ag ) Simulation x Ag x , x o y C x u K opt x : y (t ) : u (t ) und ggf . auch : x (t ) . Die Lösung des OP2 liefert unter den genannten Bedingungen ~ Q >0 R >0 (A, B) stabilisierbar ( steuerbar) (C, A) detektierbar ( beobachtbar) ein garantiert stabiles geschlossenes System. Die Schritte (7), (8) sind optional 23 6. Zusammenhang zwischen Bewichtungsmatrizen Q, R und Polen des geschlossenen Systems Die Lösungen der LQR-Probleme haben eine bemerkenswerte Eigenschaft: Wenn die genannten Bedingungen bzw. Voraussetzungen erfüllt sind, liefern sie ein garantiert (asymptotisch) stabiles geschlossenes System. Trotzdem hat man mit der Wahl der Bewichtungsmatrizen Q, R einen großen Spielraum, um über sie auf den Verlauf der Zustandsvariablen xi(t) und der Stellgrößen ui(t) Einfluß zu nehmen. Hinweise, die allerdings nur Tendenzaussagen enthielten, wurden dazu oben gegeben und können an Beispielen verifiziert werden. Starke Bewichtung der Stellgrößen ui (d.h. große Zahlenwerte rii > 0 in R) führt zu geringeren Stellgliedaktivitäten bzw. Stellenergien, meist verbunden mit geringeren Stellamplituden usw. Dies wirkt sich in langsameren, ruhigeren Verläufen der xi(t) aus. Genauere, quantitativ und direkt faßbare Zusammenhänge zwischen Q, R und dem sich dazu jeweils ergebenden Zeitverhalten der xi(t) und ui(t) können i.a. nicht angegeben werden. Deshalb wurde auf ein ggf. iteratives Durchlaufen der Entwurfsschritte und damit eine iterative Bestimmung der im speziellen Anwendungsfall günstigsten Bewichtungsmatrizen Q, R hingewiesen. Ein solcher Ablauf ist rezeptmäßig und formal zu handhaben. Da für alle Schritte heute hoch effektive algorithmische und Rechnerunterstützung gewährleistet ist, besticht der LQR-Entwurf durch seine "Rezeptmäßigkeit" und die Eigenschaft, immer zu einem "schön stabilen" System zu führen. Natürlich bestand und besteht der Wunsch fort, die Zusammenhänge zwischen Q, R und dem Verhalten von u(t), x(t) transparenter zu gestalten. Da der Charakter des Zeitverhaltens in einem linearen System durch die Art und die Lage der Pole (Eigenwerte) des Systems bestimmt wird, liegt es nahe, zunächst die Zusammenhänge zwischen den Bewichtungsmatrizen Q, R im quadratischen Gütemaß und der Lage der Pole des LQR-optimalen Systems aufzudecken und ggf. für den praktischen Entwurf nutzbar zu machen. Im Mehrgrößenfall gelingt letzteres leider nur in ziemlich grober Weise bei Annahme spezieller Relationen zwischen Q und R. Trotzdem sind die Kenntnisse dieser Zusammenhänge nützlich. Dies vor allem dann, wenn man einen LQR-Entwurf nur als Startschritt oder Vergleichsmaßstab für andere, speziellere Verfahren (z.B. Entwurf von Ausgangsrückführungen zur Polvergabe oder Polgebietsvorgabe) des Mehrgrößenregelungsentwurfs verwenden will. Die Aufdeckung dieser nützlichen Zusammenhänge beginnt mit der Sichtbarmachung einer interessanten Eigenschaft der Hamilton-Matrix aus (22), die im folgenden mit Z bezeichnet wird A Z Q BR 1 BT AT (37) . Zunächst sollen Aussagen zu den Eigenwerten dieser Hamilton-Matrix Z gemacht werden. Es ist bekannt, daß die Eigenwerte einer Matrix invariant gegenüber einer Ähnlichkeitstransformation der Matrix sind: Z und T Z T 1 Zˆ 24 haben, wenn T eine reguläre Transformationsmatrix ist, die gleichen Eigenwerte. Die Anwendung der folgenden Transformationsmatrix In T P 0 In mit T 1 In P 0 I n (38) , wobei P die Lösung der algebraischen Matrix-Riccatigleichung (27) des LQR-Problems ist, auf (37) führt zu der bemerkenswerten Erkenntnis, daß die Eigenwerte von Z die Vereinigungsmenge der Eigenwerte von (A - B Kopt) und -(A - B Kopt)T sind: I Zˆ T Z T 1 P I P BR 1 B T AT 0 A I Q 0 I I P A BR 1 B T P Q AT P 0 I BR 1 B T AT A BR 1 B T P BR 1 B T PA PBR 1 B T P Q AT P PBR 1 B T AT A B K opt 0 A B K opt 0 BR 1 B T 1 T T A BR B P BR 1 B T T A B K opt (39) Bei diesen Umformungsschritten wurde Gebrauch gemacht von der Matrix-Riccatigleichung (27) Kopt = R-1 BT P nach (24) der Tatsache, daß P als Lösung von (27) sowie R und damit R-1 symmetrisch sind und daher gilt (PBR-1 BT)T = BR-1 BT P . Ẑ nach (39) ist eine obere Dreiecks(hyper)matrix, so daß die Eigenwerte von Ẑ und damit von Z durch die Vereinigungsmenge der Eigenwert der beiden Hauptdiagonalblöcke in Ẑ gegeben sind. In der linken oberen Ecke steht die Systemmatrix des geschlossenen, optimal geregelten Systems Ag = A - B Kopt . (40) Ihre Eigenwerte i (Ag), i = 1, 2, , n ergeben sich als Wurzeln der charakteristischen Gleichung det [sI - (A - B Kopt)] = Pg(s) = 0 . (41) 25 Das charakteristische Polynom des optimal geregelten Systems ist hier mit P g(s) bezeichnet worden und stellt ein Polynom n. Grades in s dar. Entprechend sind die anderen n Eigenwerte von Ẑ bzw. Z als Eigenwerte der in (39) rechts unten stehenden Blockmatrix (A - B Kopt)T = - AgT (42) zu berechnen. det [sI + (A - B Kopt)T] = 0 . (43) Für die linke Seite von (43) sind folgende Umformungen möglich: det [sI + (A - B Kopt)T] = (- 1)n det [-sI - (A - B Kopt)T] = (- 1)n det [-sI - (A - B Kopt)]T = (- 1)n det [-sI - (A - B Kopt)] = (- 1)n Pg (- s) . (44) Dies ist das charakteristische Polynom von AgT . Damit kann für das charakteristische Polynom der (2n, 2n)-Hamilton-Matrix Z die bemerkenswerte Gleichung angegeben werden: (s) = det (sI2n - Z) = (- 1)n Pg(s) Pg(-s) . (45) Daraus folgt; Wenn s = ig als Nullstelle von Pg(s) ein Eigenwert von Z ist, so ist s = -ig Nullstelle von Pg(-s) und damit ebenfalls ein Eigenwert von Z. Die 2n Eigenwerte von Z liegen also symmetrisch zur imaginären Achse der S-Ebene. Da bei Einhaltung der erforderlichen Voraussetzungen der LQR-Entwurf ein stabiles geschlossenes System liefert, d.h. die Eigenwerte von Ag = A - B Kopt in der linken s-Halbebene liegen und gemäß (41) die n Nullstellen von Pg(s) sind, liefert gemäß (45) das Polynom Pg(-s) die n genau spiegelbildlich zur imaginären Achse dazu liegenden n anderen, also in der rechten s-Halbebene liegenden Eigenwerte von Z: ̂ n Nullstellen Pg(s) n Eigenwerte des n Nullstellen Pg(-s), spiegelbildlich zu den ig optimal geregelten 26 Systems ig , i = 1, 2, , n Bild 6.1: Eigenwertverteilung von Z Wenn die Bedingungen bzw. Voraussetzungen für einen erfolgreichen LQR-Entwurf wie in 4. und 5. beschrieben eingehalten sind, dann hat Z keine Eigenwerte auf der imaginären Achse. Ein formaler, mathematischer-Ausdruck dieser Eigenschaften ist u.a.: Das charakteristische Polynom von Z ist ein biquadratisches Polynom ( S ) ( 1) n s 2n 2n 2 s 2n 2 2 s 2 o . (46) Die Koeffizienten bei ungeraden Potenzen von s in den Polynomen P g(s) und Pg(-s) unterscheiden sich nur im Vorzeichen, die Koeffizienten bei geraden Potenzen sind gleich. Nun soll versucht werden, gewisse Aussagen zum Einfluß von Q und R im quadratischen Gütemaß auf die Eigenwerte ig des optimal geregelten Systems zu gewinnen. Da Q und R beide in die Hamilton-Matrix eingehen und die Eigenwerte der HamiltonMatrix in der angegebenen Weise mit den Eigenwerten (Polen) des optimal geregelten Systems zusammenhängen, ist zu hoffen, daß man diese Kausalkette noch sichtbarer und gezielt nutzbar im Sinne der gewünschten Aussagen machen kann. Um die Pole ig in Relation zu Q, R zu bringen, wird erneut von (45) ausgegangen: 1n Pg ( s ) Pg ( s ) det sI 2n Z sI n A det Q ( 47) BR 1 B T sI n AT Für die nachfolgenden Ableitungen ist es zweckmäßig, R-1 aufzuspalten in R 1 R 1 2 R 1 2 (48) und Q in der Form (36) zu schreiben Q DT D . (49) Mit der Determinanten-Formel M1 M 2 det det M1 det M 4 M 3 M11 M 2 M 3 M 4 (50) erhält man aus (47) dann 27 1 1 1 T T 2 1 Pg ( s) Pg ( s) det sI A det sI A D D sI A BR R 2 B T n Klammert man in der eckigen Klammer den Faktor (sI + AT) aus, so wird 1n Pg ( s ) Pg ( s ) det sI A det( sI AT ) (51) 1 1 T 1 T 1 T 2 2 det I n sI A D D ( sI A) BR R B . Nun gilt det sI AT det sI AT det ( sI A) 1n det sI A. Bekanntlich ist det (sI - A) das charakteristische Polynom der Regelstrecke det (sI - A) = P(s), (52) aus dem die Eigenwerte der Strecke i(A), i = 1, 2, , n folgen. Dann gilt det (-sI - A) = P(-s). Damit erhält man aus (51) Pg ( s ) Pg ( s ) P( s ) P s ) (53) 1 1 1 T T 1 T 2 2 det I n sI A D D sI A BR R B . Wendet man hier die Determinantenidentität det (In + M N) = det (Ir + N M) (54) an, wobei M und N Matrizen passender Dimension sind, so ergibt sich Pg ( s ) Pg ( s ) P( s ) P( s ) (55) 1 1 1 T T 1 T 2 2 det I r D sI A BR R B sI A D Der hier auftretende Matrixfaktor 28 1 ~ 1 G( s) D( sI A) B R 2 (56) kann als Matrixübertragungsfunktion eines fiktiven Systems gedeutet werden, das aus der Regelstrecke hervorgeht und daher deren Pole besitzt: Bild 6.2: ~ Deutung von (56) als fiktives System G Damit erhält man aus (55) ~ ~ Pg ( s) Pg (s) P( s) P(s) det I r G( s) GT (s) . (57) Hierbei wurde noch beachtet, daß zunächst aus (56) folgt 1 1 ~ G( s) D sI A1 BR 2 D sI A1 BR 2 , so daß T 1 1 D sI A1 BR 2 R 2 B T sI A1 T D T R 1 2 (58) 1 T ~ B T sI AT D G T ( s) . Gleichung (57) ist nun eine sehr wichtige Beziehung: 29 Sie stellt nämlich eine Relation her zwischen den Polen des optimal geregelten Systems ig (Nullstellen von Pg(s) den Polen der Regelstrecke i, die bei der konstanten optimalen Zustandsrückführung u = - Kopt x identisch mit den Polen des offenen Systems sind (Nullstellen von P(s) und ~ den Wichtungsmatrizen Q und R (zwar noch etwas versteckt in G ( s ) ). Um den Effekt einer Variation von Q und R auf die Pole ig des geschlossenen, optimal geregelten Systems zu untersuchen, muß leider eine stark vereinfachende Anname über die Art der vorzunehmenden bzw. zugelassenen Variationen von Q und R eingeführt werden: D T D Q q Qˆ R r Rˆ (59) wobei Qˆ 0 und Rˆ 0 die nominalen Bewichtungsmatrizen sind und q und r positive skalare Parameter darstellen. Dies wird, wie nun gezeigt werden soll, Grenzwertbetrachtungen für diejenigen Polverteilungen des geschlossenen Systems erq möglichen, die zu erwarten sind, wenn der Parameter in einem Extremfall gegen r Null und im anderen Extremfall gegen Unendlich strebt. Um diese sog. asymptotischen Eigenschaften der Polverteilung eines LQR-geregelten Systems zu erhalten, muß der Determinantenterm in (57) unter Benutzung der Determinantenidentität (54) jeweils in die geeignete Form gebracht werden, aus der die asymptotischen Eigenq schaften für 0 bzw. erschlossen werden können. r Grenzbetrachtungen für q 0 : r Man beginnt am zweckmäßigsten mit der in (53) enthaltenen Form des Determinantenterms und formt ihn schrittweise um: 1 1 1 T 1 T T det I n sI A D D sI A B R 2 R 2 B 1 ˆ 1 qQˆ R r 1 1 det I n sI AT qQˆ sI A1 B Rˆ 1 B T r 1 q det I n sI A1 B Rˆ 2 B T sI AT Qˆ . r Für (60) q 0 nimmt diese Determinante den Wert 1 an, so daß aus (53) folgt r 30 Pg ( s ) Pg s P( s ) P( s ) . (61) q 0 r Da der LQR-Entwurf immer zu einem asymptotisch stabilen geschlossenen System führt, kann aus (61) geschlußfolgert werden, daß die n Pole des geschlossenen q optimalen Systems für 0 gegen die stabilen Nullstellen von P(s) P(-s) streben; r das sind a) die stabilen Pole der Regelstrecke ( des offenen Systems) und b) die instabilen Pole des offenen Systems gespiegelt an der imaginären Achse. a) und b) zusammen liefern die n stabilen Pole des geschlossenen Systems, d.h. die Nullstellen von Pg(s). q 0 bedeutet, daß die Stellgrößen ui im quadratischen Gütemaß wesentlich stärr ker als die Zustände xi bewichtet werden, d.h. man zielt auf minimalen Stellenergieaufwand ab: Sog. "billige" (bezogen auf den Stellaufwand) Regelung. Die Folge ist, daß die stabilen Streckenpole liegen bleiben wo sie sind und die instabilen Streckenpole einfach an der imaginären Achse in die linke s-Halbebene gespiegelt werden. Diese Erkenntnis kann nützlich sein, wenn man bei Anwendung von Polvorgabeverfahren als Entwurfsmethode ein "aufwandsminimales" (bzgl. der Stellenergie) Regelungsgesetz erreichen möchte, das die instabile Strecke mit Sicherheit stabilisiert. Die dafür vorzugebenden Pole sind die aus a) und b). Man kann dann hoffen, daß die Stellamplituden entsprechend klein sind und Stellgrößenbegrenzungen eingehalten werden in dem Sinne, daß sie nicht angefahren werden. Grenzbetrachtungen für q : r Diese sind wesentlich komplizierter durchzuführen und sollen daher nur im Ansatz behandelt werden. Mit (54) und (56) gilt für die Determinante in (57) ~ ~ ~ ~ det I r G( s) G T ( s) det I m G T ( s) G( s) (62) 1 1 1 T 1 T T det I m R 2 B sI A D D sI A BR 2 Ohne Einschränkung der Allgemeinheit sei 31 D q Dˆ und damit Qˆ Dˆ T Dˆ , (63) und die Zahl der Ein- und Ausgänge der analog zu (56) nunmehr zu definierenden fiktiven Strecke gleich m. Bild 6.3 Definition eines weiteren fiktiven Systems Ĝ Diese fiktive Strecke hat die (m, m)-Matrixübertragungsfunktion 1 1 Dˆ adj sI ABRˆ 2 Gˆ ( s ) Dˆ sI A1 B Rˆ 2 . P( s ) (64) Mit (62) und (64) nimmt die entscheidende Gleichung (57) die Form an q Pg ( s ) Pg ( s ) P( s ) P( s ) det I m Gˆ T ( s ) Gˆ ( s ) . r Für (65) q dominiert in der Determinante der zweite Summand. Damit wird man für r q auf der rechten Seite von (65) ein Polynom vom Grade 2 p 0 erhalten, r wenn man annimmt, daß man für det Gˆ ( s ) mit Gˆ ( s ) aus (64) ein Zählerpolynom vom Grade p > 0 erhält: p det Gˆ ( s ) s i i 1 P( s ) . ist eine Konstante. Entsprechend ist dann p det Gˆ T ( s ) s i i 1 P( s ) . Der Grad p der hier vorkommenden Zählerpolynome kann höchstens (n - m) werden. Man erkennt, daß die Nullstellen dieser beiden Zählerpolynome auch spiegelbildlich 32 zur imaginären Achse sind. Also strebt p > 0 die rechte Seite von (65) im Grenzüberq gang gegen das Polynom r p p i 1 i 1 P( s) P( s) det Gˆ T ( s) Gˆ ( s) 2 ( s i ) ( s i ) . (66) q streben 2 p der insgesamt 2n Nullstellen des r Polynoms Pg(s) Pg(-s) auf der linken Seite von (65) gegen die Nullstellen des Polynoms in (66). Die restlichen (2n - 2p) Nullstellen gehen gegen Unendlich. Also gilt: Im Grenzübergang Da einLQR-Entwurf immer stabile Pole liefert - das sind die n Nullstellen von Pg(s) q müssen diejenigen p Nullstellen von Pg(s), die für r endlich bleiben, die stabilen Nullstellen des Polynoms (66) sein: endliche Nullstelle n stabile Nullstelle n von P ( s ), wenn q von (66) g r oder Pole des LQR geregelten Systems, die für q ˆ i wenn i 0 i r i wenn i 0 endlichen Werten zustreben i 1, 2, , p . Man muß also nur die p Nullstellen i vom Zähler det Gˆ ( s ) ermitteln. Häufig werden diese als Nullstellen von Gˆ ( s ) (der Matrixübertragungsunktion der fiktiven Mehrgrößenstrecke (64)) definiert. Wenn die so definierten Nullstellen von Gˆ ( s ) alle in der linken Halbebene liegen, d.h. wenn für alle p ˆi gilt ˆi i , dann kürzen sich die q genau dorthin für strebenden Pole des geschlossenen Systems gegen diese r "Nullstellen der offenen Kette", und ihr Effekt ist in den Zeitvorgängen der Ausgangsgrößen nicht feststellbar. Es sind nun noch Angaben zu machen, wie und wohin die q restlichen (n - p) Pole des LQR-geregelten Systems für ins Unendliche der r komplexen s-Ebene streben. Diese gruppieren sich in bestimmten Butterworth-Konfigurationen verschiedener q Ordnung und mit verschiedenen Radien, die mit selbst gegen Unendlich gehen. r 33 "q groß" kann man Abschätzungen für die Entfernung dieser den Butterworthr Verteilungen zustrebenden Pole vom Koordinatenursprung angeben. Für genauere Angaben der jeweiligen Pollagen muß man besser eine maschinelle Berechnung vornehmen. Jedenfalls ist dies für den Mehrgrößenfall die zu empfehlende Variante. Es sei noch angemerkt, daß Butterworth-Polverteilungen "gute" Zeitvorgänge ergeben. Im Eingrößenfall werden Butterworth-Polverteilungen daher häufig für Modellübertragungsfunktionen, die ein gewünschtes Übertragungsverhalten eines geschlossenen Systems ergeben, vorgeschrieben. Für q Eine geeignete Berechnungsmöglichkeit der Polwanderung ig ergibt sich aus r folgenden Überlegungen. Die in (65) auftretende Matrix q ˆT ˆ I m r G ( s ) G ( s ) wird als Rückführdifferenzmatrix des fiktiven Mehrgrößenregelkreises (Schnittstelle bei xa) Bild 6.4: Zweckmäßige Einführung eines fiktiven Regelkreises interpretiert. Damit ist (65) genau die Aussage des Hsu-Chen-Theorems für diesen Regelkreis: q char. Polynom geschl . RK det I m Gˆ T ( s ) Gˆ ( s ) r char. Polynom offene Kette Pg ( s ) Pg ( s ) P( s ) P ( s ) Das charakteristische Polynom des geschlossenen fiktiven Regelkreises Pg(s) Pg(-s) ist vom Grade 2n und die stabilen Pole des LQR-geregelten Systems sind - wie oben gezeigt - gerade die n Nullstellen von Pg(s). Wenn man nun eine Zustandsbeschreibung für den geschlossenen fiktiven Regelkreis angeben kann, so sind diese n Pole des LQR-geregelten Systems genau die n in der linken Halbebene liegenden Eigenwerte der (2n, 2n) - Systemmatrix des geschlossenen fiktiven Regelkreises. Zu dem fiktiven Teilsystem Gˆ ( s ) der offenen Kette gehört nach (64) folgendes Zustandsmodell 34 z1 A z1 B Rˆ yˆ Dˆ z1 . 1 2 uˆ Entsprechend gehört zu dem Teilsystem Gˆ T ( s) z 2 AT z 2 Dˆ T yˆ AT z 2 Dˆ T Dˆ z1 AT z 2 Qˆ z1 x a Rˆ 1 2 BT z 2 . Die Schließungsbedingung lautet 1 q q uˆ x e x a x e Rˆ 2 B T z 2 . r r Daraus folgt für das Zustandsmodell des geschlossenen fiktiven Regelkreises 1 q z1 A z1 B Rˆ 1 B T z 2 B Rˆ 2 x e r z Qˆ z AT z 2 1 2 1 ˆ 2 x a O z1 R BT z 2 , bzw. in Vektor-Matrix-Schreibweise z1 A z 2 Qˆ xa 0 q ˆ 1 T BR B r AT 1 T 2 ˆ R B 1 z1 ˆ 2 z B R x e 2 0 z1 z 2 In der Systemmatrix A A = Qˆ q ˆ 1 T BR B r AT 35 q q q ein im Bereich 0 variierender Parameter. Für jeweils feste Werte aus r r r dem Wertebereich berechnet man die 2n Eigenwerte von A. Die gesuchten Pole des LQR-geregelten Systems sind die n in der linken Halbebene liegenden Eigenwerte q aus dieser Menge. Jeder dieser n Eigenwerte ig beschreibt in Abhängigkeit von r q einen Ast der "multivariablen Wurzelortskurve" des LQR-geregelten Systems mit r dem speziellen quadratischen Gütekriterium ist 1 J 2 q x T Qˆ x uT Rˆ u dt . o Man muß zunächst die nominalen Bewichtungsmatrizen Qˆ 0 ; Rˆ 0 ( ) angepaßt an das konkrete Problem sinnvoll wählen. Die Voraussetzungen für die Existenz einer Lösung des Optimierungsproblems - je nach dem, ob es sich um ein OP1 oder OP2 handelt, sind, soweit sie Q q Qˆ betreffen, dabei selbstverständlich zu beachten: OP1 : q 0, Qˆ 0 OP 2 : q 0, Qˆ Dˆ T Dˆ 0 ( Dˆ , A) detektierbar. q skaliert die Wichtungsmatrizen im Gütefunktional relativ zueinanr der und ist gleichzeitig Parameter der WOK-Äste. Man wählt denjenigen Wert q , für den sich eine gewünschte Polverteilung ig , i = 1, 2, , n ergibt . Wenn für r gewählte Qˆ und Rˆ die WOK keine "ausreichend optimale" Polverteilung zu erreichen gestatten, dann muß man das Verfahren mit anderen Qˆ , Rˆ wiederholen, bis man eine Der Parameter gewünschte, optimal erscheinende LQR-Polverteilung gefunden hat. Für den Eingrößenfall sind erwartungsgemäß in den vorangegangenen Betrachtungen Vereinfachungen möglich. Mit diesen Vereinfachungen ergibt sich schließlich das für den Eingrößenfall durchaus praktikable Reglerentwurfsverfahren nach der Methode des sog. "symmetrischen Wurzelortes" (englisch: square root locus). Dieser stellt eine symmetrisch auch zur imaginären Achse verlaufende Wurzelortskurve dar r mit einem skalaren Parameter , der aus der relativen Wichtung der Stell- und q Regelgröße im quadratischen Gütekriterium hervorgeht. Da ein LQR-Entwurf garantiert stabile Regelkreise liefert, hat man nur die in der linken Hälfte der komplexen Ebene verlaufenden Äste des symmetrischen Wurzelortes zu betrachten. Auf diesen wählt man nach den üblichen Regeln eine "schön stabile" Polverteilung aus und mit 36 dem dazu gehörenden Parameterwert für findet man dann das korrespondierende LQR-Optimierungsproblem. Seine Standardlösung liefert den Regler. 37