Vorlesungsskriptum Regelung nichtlinearer mechatronischer Systeme 2 Kurt Schlacher Institut für Regelungstechnik und Prozessautomatisierung Johannes Kepler Universität Linz WS 2016/2017 Inhaltsverzeichnis 1 Mathematische Grundlagen 1.1 Geometrische Methoden . . . . . . . . . . . . . . 1.2 Der Zustandsraum autonomer Systeme . . . . . . 1.3 AI-Systeme . . . . . . . . . . . . . . . . . . . . . 1.4 Beispiele zu AI Systemen . . . . . . . . . . . . . . 1.4.1 Einfache mechanische Systeme . . . . . . . 1.4.2 Die Kurzschlussläufer Asynchronmaschine 1.5 Abstrakte Mannigfaltigkeiten . . . . . . . . . . . 1.6 Bündel . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Das Tangential- und Kotangentialbündel . 1.6.2 Freie und autonome Systeme . . . . . . . . 1.6.3 Systeme mit Eingang . . . . . . . . . . . . 1.7 Transformationen . . . . . . . . . . . . . . . . . . 1.8 Schlussbemerkungen . . . . . . . . . . . . . . . . 1.9 Aufgaben . . . . . . . . . . . . . . . . . . . . . . 1.9.1 AI-Systeme . . . . . . . . . . . . . . . . . 1.9.2 Mannigfaltigkeiten . . . . . . . . . . . . . 1.9.3 Bündel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 4 5 7 7 8 11 19 22 27 29 31 33 34 34 34 35 2 Eingangs/Ausgangslinearisierung 2.1 Der Eingrößenfall . . . . . . . . . . . . . . . . 2.2 Tensor Bündel . . . . . . . . . . . . . . . . . . 2.2.1 Lie-Ableitungen und die Lie-Klammer 2.2.2 Die äußere Ableitung . . . . . . . . . . 2.3 Der Eingrößenfall II . . . . . . . . . . . . . . . 2.4 Der Mehrgrößenfall . . . . . . . . . . . . . . . 2.5 Schlussbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 39 40 43 45 45 47 3 Erreichbarkeit und Beobachtbarkeit 3.1 Distributionen und die Sätze von Frobenius 3.2 Beobachtbarkeit . . . . . . . . . . . . . . . . 3.3 Erreichbarkeit . . . . . . . . . . . . . . . . . 3.4 Eingangs/Zustandslinearisierung . . . . . . . 3.4.1 Der Eingrößenfall . . . . . . . . . . . 3.4.2 Der Mehrgrößenfall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 49 53 58 61 62 64 i . . . . . . INHALTSVERZEICHNIS 3.5 INHALTSVERZEICHNIS Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4 Mathematische Grundlagen 4.1 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Topologische Räume . . . . . . . . . . . . . . . . . 4.1.2 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . 4.1.3 Konvergenz und Hausdorff-Räume . . . . . . . . . . 4.1.3.1 Teilräume, Produkt und Quotientenraum 4.1.4 Metrische Räume . . . . . . . . . . . . . . . . . . . 4.1.5 Kompaktheit . . . . . . . . . . . . . . . . . . . . . 4.1.6 Zusammenhang . . . . . . . . . . . . . . . . . . . . 4.2 Inverse und implizite Funktion . . . . . . . . . . . . . . . . 4.2.1 Mittelwertsätze . . . . . . . . . . . . . . . . . . . . ii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 67 67 70 72 72 74 75 77 79 82 Kapitel 1 Mathematische Grundlagen Diese Vorlesung widmet sich dynamischen Systemen, der Art ẋ = f (t, x, u) y = c (t, x, u) (1.1) (1.2) mit dem n-dimensionalen Zustand x, dem m-dimensionalen Eingang u und dem l-dimensionalen Ausgang y. Vorerst sind f und c nur Funktionen passender Dimension. So ein System wird auch als nichtlineares Regelungssystem in Zustandsdarstellung genannt. Allerdings ist die Klasse der nichtlinearen Regelungssysteme zu allgemein, und es werden im weiteren Einschränkungen für die Funktionen f und c so gesucht, dass die eingeschränkte Klasse von Systemen leichter handhabbar wird, aber auch für die Anwendung interessant bleibt. Die Wahl f (t, x, u) = Ax + Bu c (t, x, u) = Cx + Du mit geeigneten Matrizen A, B, C, D führt z.B. auf die Klasse der linearen und zeitinvarianten Systeme. So ist die Wahl des Zustandsraumes Rn , siehe auch aut1, aut2, eine natürliche für diese Klasse. Wie später gezeigt wird, trifft dies auf nichtlineare Systeme nicht mehr zu. Ähnliche Überlegungen gelten für den Eingangs- und Ausgangsraum. Im Rahmen dieser Vorlesung wird nun nicht mehr die Matrizenschreibweise, siehe auch aut1, aut2, benutzt, sondern die weitaus flexiblere Tensorschreibweise. Beispielhaft betrachte man den Rn mit einer Basis B = {e1 , . . . , en } und Koordinaten (x1 , . . . , xn ). Ein Punkt p des Rn wird dann mittels der Koordinaten xi = xi (p), i = 1, . . . , n durch p = xi (p) ei beschrieben. Man beachte, dass das Symbol xi sowohl eine Koordinate als auch die Koordinatenfunktion xi : Rn → R bezeichnet, also jene Funktion, die dem Punkt p die Koordinate xi bezüglich der Basis B zuordnet. Auch wurde bereits die Einsteinsche Konvention für Summen mit der Abkürzung n X ai bi = ai bi i=1 verwendet, wobei der Indexbereich i = 1, . . . , n noch unterdrückt wird, wenn er vom Zusammenhang her bekannt ist. Man betrachte nun eine stetig differenzierbare Funktion 1 1.1. Geometrische Methoden 1. Mathematische Grundlagen f (x) : Rn → R, dann verwenden wir für die partiellen Ableitungen die Abkürzung ∂ f (x) = ∂i f (x) , ∂xi ∂ = ∂i ∂xi sofern keine Verwechslung möglich ist. Die Wahl des Zustands-, Eingangs- und Ausgangsraumes war im linearen und zeitinvarianten Fall nun sehr einfach. Im nichtlinearen Fall muss nun ebenfalls für jede Systemklasse ein geeigneter Zustandsraum gewählt werden. Dies wird vorerst an Hand von einigen Beispielen diskutiert. 1.1 Geometrische Methoden Dynamische Systeme der Art ẋ = f (x, u) y = c (x, u) (1.3) (1.4) mit dem n-dimensionalen Zustand x, m-dimensionalen Eingang u und l-dimensionalen Ausgang y werden hier mit (differential-) geometrischen Methoden behandelt. Es bezeichne x (t), u (t), y (t) eine Lösung obigen Systems, es gilt also ∂t x (t) = f (x (t) , u (t)) y (t) = c (x (t) , u (t)) , (1.5) (1.6) dann sind durch t 7→ x (t), t 7→ u (t), t 7→ y (t) Abbildungen gegeben, wobei noch deren Bildbereich zu klären ist. Außerdem liegen diese Kurven in speziellen Flächen, siehe (1.5), (1.6), die wieder in Räumen mit Koordinaten (ẋ, x, u) und (y, x, u) liegen. Also muss vorerst die Beschaffenheit dieser Räume geklärt werden, damit man diese Flächen untersuchen kann. Beides wird nun mit differentialgeometrischen Methoden geschehen. Die Gleichungen dieser Flächen sind offensichtlich durch (1.3), (1.4) gegeben. Man betrachte nun Transformationen der Art x̄ = ϕ (x) (x̄, ū) = ψ (x, u) = (ϕ (x) , υ (x, u)) ȳ = χ (x, u, y) , wobei die Abbildungen ϕ, ψ, χ umkehrbar eindeutig seien, dann hat das transformierte System die Gestalt x̄˙ i = ∂j ϕi ◦ ψ −1 (x̄, ū) f j ◦ ψ −1 (x̄, ū) = ∂j ϕi f j ◦ ψ −1 (x̄, ū) ȳ = χ (x, u, c (x, u)) ◦ ψ −1 (x̄, ū) . Offensichtlich ist dieses System wieder ein Regelungssystem. Weiters ändern unter gewissen (einfachen) Bedingungen solche Transformationen nicht die geometrischen Eigenschaften obiger Flächen. Daher werden solche Transformationen ein wichtiges Hilfsmittel 2 1.1. Geometrische Methoden 1. Mathematische Grundlagen sein, die Eigenschaften dieser Flächen zu klären. Zusammenfassend kann man festhalten, dass wir hier mehr an den geometrischen Eigenschaften der durch (1.3), (1.4) definierten Flächen als an den Lösungen (1.5), (1.6) interessiert sind. 10 9 70 8 60 7 6 ẋ x̄˙ 50 5 4 40 3 30 2 1 20 10 0 0.0 0.2 u 0.4 0.6 0.8 1.0 10 9 7 8 6 5 4 0 0 3 1 2 ū x 3 4 5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 x̄ 1.5 1.0 0.5 0.0 Bild 1.1: Graph zu Glg. (1.7) links und Glg. (1.8) rechts. Als einfaches Beispiel wird das System ẋ = x ln (x) + x u ln (x) (1.7) betrachtet. Den Graphen dazu zeigt die linke Seite von Bild 1.1. Die Transformation x̄ = ln (x) , ū = x u ln (x) führt nun zu 1 x x̄˙ = x ln (x) + u x ln (x) = (x̄ + ū) . (1.8) Der zugehörige Graph ist der rechten Seite von Bild 1.1 zu entnehmen. Die speziellen Lösungen u = et , x̄ = (t + 2) et , t u = (t + 2) e2t−(t+2)e , t x = e(t+2)e , x̄˙ = (t + 3) et ẋ = (t + 3) et+(t+2)e t liegen nun in den jeweiligen Flächen. Das Problem, eine Transformation so zu finden, dass das transformierte System linear ist, ist also äquivalent zur Bestimmung einer Transformation, die die Fläche der linken Seite von Bild 1.1 auf eine Ebene, siehe die rechte Seite, abbildet. Man sieht also einfach, dass dieser Ansatz speziell für nichtlineare Systeme geeignet ist, da man mit diesem Zugang die Lösung des dynamischen Systems nicht konstruieren muss. 3 1.2. Der Zustandsraum autonomer Systeme 1.2 1. Mathematische Grundlagen Der Zustandsraum autonomer Systeme Man betrachte vorerst das lineare und zeitinvariante System ẋi = Aij xj (1.9) mit i, j = 1, . . . , n. Wählt man nun den linearen Vektorraum Rn als Zustandsraum X , dann sind die strukturerhaltenden Koordinatentransformation auf die Klasse x̄i = Tji xj (1.10) mit invertierbarer Matrix Tji eingeschränkt. Ein Lösung des Systems (1.9) ist eine Abbildung γ : R → Rn oder eine Kurve mit Kurvenparamter τ ∈ R, die der Beziehung ∂τ γ i (τ ) = Aij γ j (τ ) genügt. Das Paar (γ i (τ ) , ∂τ γ i (τ )) ist nun Element eines neuen Raumes, des Tangentialraums T (Rn ) von Rn , für den wir die Koordinaten (xi , ẋi ) verwenden. Aus (1.10) folgt nun γ̄ i (τ ) = Tji γ j (τ ) ∂τ γ̄ i (τ ) = Tji ∂τ γ j (τ ) oder x̄˙ i = Tji ẋj . (1.11) Damit gilt aber auch T (Rn ) = Rn × Rn , eine besondere Eigenschaft, die den Rn auszeichnet. Für nichtlineare Systeme ist es jedoch zweckmäßig, allgemeinere Transformationen zuzulassen. Dazu betrachte man folgendes System ẋ1 = x1 ln x2 ẋ2 = −x2 ln x1 , dessen Zustandsraum wegen x1 , x2 > 0 nicht der R2 sein kann. Die Transformation R+ × R+ → R2 x̄1 = ln x1 x̄2 = ln x2 mit 1 1 ẋ x1 1 x̄˙ 2 = 2 ẋ2 x x̄˙ 1 = führt auf das lineare System x̄˙ 1 = x̄2 x̄˙ 2 = −x̄1 , 4 1.3. AI-Systeme 1. Mathematische Grundlagen wobei man für den Zustandsraum hier den R2 wählen kann. Mit Hilfe von nichtlinearen Zustandstransformationen lassen sich also überraschende Ergebnisse erzielen. So wird obiges System durch lineare Differentialgleichungen beschrieben. Wenn nicht anders darauf hingewiesen wird, werden in dieser Vorlesung autonome Systeme der Art ẋi = f i (x) , i = 1, . . . , n (1.12) betrachtet, deren Zustandsraum X eine abstrakte, n-dimensionale, glatte Mannigfaltigkeit mit Koordinaten (xi ), i = 1, . . . , n ist. Die zulässigen Koordinatentransformationen sind nichtlineare Diffeomorphismen der Art x̄i = ϕi (x) . (1.13) Nun folgen aus dieser Beziehung für eine Kurve γ : [0, ε) → X , ε ∈ R+ , die Lösung von (1.12) ist, d.h. es gilt ∂τ γ i (τ ) = f i ◦ γ (τ ) aus (1.12), (1.13) die Beziehungen γ̄ i (τ ) = ϕi ◦ γ (τ ) ∂τ γ̄ i (τ ) = ∂j ϕi ◦ γ (τ ) ∂τ γ j (τ ) , j = 1, . . . , n aus denen man die Transformationsvorschrift x̄˙ i = ∂j ϕi (x) ẋj (1.14) gewinnt. Man beachte, dass im nichtlinearen Fall die Transformation für die Koordinaten ẋi nicht mehr mit der für die Koordinaten xi zusammen fällt. Das Paar (γ i (τ ) , ∂τ γ i (τ )) ist wieder Element eines neuen Raumes, des Tangentialraums T (X ) des Zustandsraumes X . Um die Eigenschaften dieses Raumes zu klären, muss man wissen, wie T (X ) von X abgeleitet wird. Abschließend ist noch zu bemerken, dass der Zustandsraum freier Systeme n-ter Ordnung nicht eine abstrakte, n-dimensionale, glatte Mannigfaltigkeit, sondern ein Bündel ist. 1.3 AI-Systeme Ein zeitinvariantes, dynamisches System n-ter Ordnung mit m Eingängen und l Ausgängen der Form ẋi = ai (x) + Bςi (x) uς y ζ = cζ (x) + Dςζ (x) uς (1.15) (1.16) und i = 1, . . . , n, ς = 1, . . . , m, ζ = 1, . . . , l wird AI-System (Affine Input) genannt. Diese Bezeichnung bezieht sich ausschließlich auf die Form der rechten Seiten von (1.15, 1.16). Die Elemente der Größen a(x), B(x), c(x) und D(x) werden als glatt vorausgesetzt. Man 5 1.3. AI-Systeme 1. Mathematische Grundlagen beachte, dass diese Voraussetzung lediglich aus Gründen der Vermeidung von Fallunterscheidungen getroffen wird. Erfüllt ein System diese nicht, dann sind die Untersuchungen entsprechend zu erweitern. Ein AI Eingrößensystem hat noch die Form ẋi = ai (x) + bi (x) u y = c (x) + d (x) u Sehr viele technische Systeme haben nun die Form von AI Systemen. So sind lineare Systeme der Form ẋi = Aij xj + Bςi uς y χ = Ciχ xi + Dςχ uς wegen ai (x) = Aij xj , Bςi (x) = Bςi , cζ (x) = Ciζ xi und Dςζ (x) = Dςζ natürlich AI-Systeme. Die bilinearen Systeme gehören ebenfalls zur Klasse der AI Systeme. Sie haben die Form i ẋi = Aij xj + Nj,ς xj + Bςi uς y χ = Ciχ xi , wobei die Nichtlinearität nur beim Stelleingriff auftritt. Man beachte nun eine Koordinatentransformation der Art x̄ = ϕ (x) (x̄, ū) = ψ (x, u) = (ϕ (x) , k (x) + M (x) u) ȳ = l (x) + N (x) y , wobei die Abbildungen ϕ umkehrbar eindeutig und [Mτς (x)], [Nκχ (x)] regulär seien. Das transformierte System hat nun die Gestalt x̄˙ i = ∂j ϕi ◦ ϕ−1 (x̄) aj ◦ ϕ−1 (x̄) + ∂j ϕi Bςj ◦ ϕ−1 (x̄) M̄τς ◦ ϕ−1 (x̄) ūτ − k τ ◦ ϕ−1 (x̄) = ∂j ϕi aj ◦ ϕ−1 (x̄) − ∂j ϕi Bςj M̄τς k τ ◦ ϕ−1 (x̄) + ∂j ϕi Bςj M̄τς ◦ ϕ−1 (x̄) ūτ ȳ χ = lχ ◦ ϕ−1 (x̄) + Nκχ ◦ ϕ−1 (x̄) cκ ◦ ϕ−1 (x̄) + +Dςκ ◦ ϕ−1 (x̄) M̄τς ◦ ϕ−1 (x̄) ūτ − k τ ◦ ϕ−1 (x̄) = lχ + Nκχ cκ − Dςκ M̄τς k τ ◦ ϕ−1 (x̄) + Nκχ Dςκ M̄τς ◦ ϕ−1 (x̄) ūτ , es ist offensichtlich wieder ein AI System, wobei M̄τς die zu [Mτς ] inverse Matrix ist. Als triviales Ergebnis erhält man, dass die Rückkopplung die AI Struktur erhält. Man zeigt ebenfalls einfach, dass die Parallelschaltung, Hintereinanderschaltung und Inversion, sofern möglich, von AI Systemen wieder auf AI Systeme führt. Im Folgenden Abschnitt werden AI Systeme betrachtet, deren Zustandsraum eine ndimensionale, abstrakte und glatte Mannigfaltigkeit ist. 6 1.4. Beispiele zu AI Systemen 1.4 1. Mathematische Grundlagen Beispiele zu AI Systemen Differentialgeometrische Methoden haben viele Anwendungen in der Praxis. Dazu werden zwei Beispiele, eines aus der Robotik und eines aus dem Gebiet der elektrischen Maschinen betrachtet. Kann man einen Roboter mit n Freiheitsgraden durch Gleichungen vom Lagrange’schen Typ mit n Stellgrößen beschreiben, dann ist dieses System nämlich äquivalent zu n Doppelintegratoren. Auch eine Asynchronmaschine vom Käfigläufertyp ist abgesehen von einem speziellen Zustand äquivalent zu einem linearen System. Daher ist die Regelung so einer Maschine nur in der Nähe dieses singulären Punktes nicht trivial. 1.4.1 Einfache mechanische Systeme Ein einfaches mechanisches System kann durch die Lagrange’schen Gleichungen beschrieben werden. Es seien x, i = 1, . . . , n die Koordinaten des Konfigurationsraumes K, dann sind (xi , ẋi ) Koordinaten des Zustandsraumes X . Für den Zustandsraum X gilt hier offensichtlich X = T (K). Mit der Lagrange Funktion L : X → R folgt aus d ˙ ∂i L (x, ẋ) − ∂i L (x, ẋ) = ui , dt für ∂ ∂˙i = i , ∂ ẋ d = ẍj ∂˙j + ẋj ∂j + ∂t dt 1 L = ẋj Mjk (x) ẋk − V (x) 2 sofort 1 Mik (x) ẋk − ẋj ∂i Mjk (x) ẋk + ∂i V 2 1 j 1 k j j l Mik (x) ẋ + ẋ Mji (x) − ẋ ∂i Mjk (x) ẋk + ∂i V Mij (x) ẍ + ẋ ∂l 2 2 1 j Mij (x) ẍ + (∂j Mik (x) + ∂k Mji (x) − ∂i Mjk (x)) ẋj ẋk + ∂i V 2 Mij (x) ẍj + Γijk (x) ẋj ẋk + ∂i V ẍ ∂˙l + ẋl ∂l + ∂t l (x) = ui (x) = ui (x) = ui (x) = ui . Um im Weiteren Fallunterscheidungen zu vermeiden, wird angenommen, dass die Massenmatrix [Mij ] regulär ist. Die Transformation ui = ∂i V (x) + Γijk (x) ẋj ẋk + Mij (x) ūj mit dem neuen Eingang ū führt nun auf Mij (x) ẍj = Mij (x) ūj ẍj = ūj . Dieses System ist offensichtlich linear, es besteht aus n Doppelintegratoren. 7 1.4. Beispiele zu AI Systemen 1.4.2 1. Mathematische Grundlagen Die Kurzschlussläufer Asynchronmaschine Ein Prinzipbild für die Kurzschlussläuferasynchronmaschine ist in Abbildung 1.2 angegeben. Mit den Größen us = u1s u2s u3s = ujs , j = 1, . . . , 3 is = i1s i2s i3s = ijs , j = 1, . . . , 3 (1.17) 1 2 3 j Ψs = Ψs Ψs Ψs = Ψs , j = 1, . . . , 3 kann das elektrische Teilsystem des Statorkreises in der Form ujs = Rs ijs + d j Ψ, dt s j = 1, . . . , 3 (1.18) modelliert werden. Ψ1s , . . . ,Ψ3s bezeichnen hier die verketteten Flüsse der 3 Statorphasen, i1s , . . . , i3s die zugehörigen Ströme und u1s , . . . , u3s die anliegenden externen Spannungen. Der elektr. Widerstand der Ständerspulen ist symmetrisch mit Rs angenommen. Weiters gilt für den verketteten Fluss Ψjs = Ljs,k iks + Ljsr,k (φ) ikr mit den Strömen der Rotorspulen ir = i1r i2r i3r = ijr , j = 1, . . . , 3 der Induktivitätsmatrix des Stators L0 + Lσ − L20 − L20 Ls = Ljs,k = − L20 L0 + Lσ − L20 , − L20 L0 + Lσ − L20 sowie der Koppelinduktivitätsmatrix zwischen Stator und Rotor L0 cos (φ) L0 cos φ + 2π L0 cos φ − 2π 3 3 2π L cos (φ) L cos φ + Lsr = Ljsr,k = L0 cos φ − 2π 0 0 3 3 . 2π 2π L0 cos φ + 3 L0 cos φ − 3 L0 cos (φ) (1.19) (1.20) Das mathematische Modell des elektrischen Rotor-Teilsystems kann nun analog in der Form d ujr = Rr ijr + Ψjr , j = 1, . . . , 3 dt angegeben werden, wobei hier die Komponenten des verketteten Rotorflusses mit Ψr = Ψ1r Ψ2r Ψ3r = Ψjr , j = 1, . . . , 3 bezeichnet werden und für den Widerstand in den Rotorspulen Rr gilt. Der verkettete Rotorfluss genügt wieder der Beziehung Ψjr = Ljr,k ikr + Ljsr,k (φ) iks , 8 1.4. Beispiele zu AI Systemen 1. Mathematische Grundlagen ab-System b d dq-System φ q s2 r1 s1 r2 a r3 Stator s3 Rotor Bild 1.2: Prinzipbild einer Kurzschlussläuferasynchronmaschine. wobei hier Ljr,k = Ljs,k angenommen wird. Für den Rotorkreis einer Kurzschlussläuferasynchronmaschine gilt nun ujr = 0, j = 1, . . . , 3. Mit der magnetischen Energie bzw. Koenergie ko Wmag = Wmag = 1 i is δi,k Ψks + iir δi,k Ψkr 2 kann das elektrisch erzeugte Drehmoment der Maschine zu Mel = − ∂ 1 ∂ i ko is δi,k Ψks + iir δi,k Ψkr Wmag =− ∂φ 2 ∂φ angegeben werden. Mit den Abkürzungen für die Induktivitätsmatrix bzw. die Widerstandsmatrix k j diag (Rs ) 0 Ls Lsr (φ) L (φ) = Ll = , R = Rl = 0 diag (Rr ) LTsr (φ) Lr kann das mathematische Modell mit Ψ = (Ψs , Ψr ) kompakt in der Form l d j j m us , Ψ = −Rlj L−1 (φ) k Ψk + gm dt mit gii = 1 und gji = 0 für i 6= j geschrieben werden. Die Blondel-Park-Transformation (siehe z.B. [4]) erlaubt es nun, die beiden elektrischen Teilsysteme 3. Ordnung als äquivalente Systeme 2. Ordnung darzustellen. Man benützt die Transformation Ψ̄i = Pi,j (φ) Ψj , (Pi,j ) = P = P0 exp (V φ) 9 1.4. Beispiele zu AI Systemen 1. Mathematische Grundlagen mit exp (V φ) = I 0 , 0 exp (V22 φ) V22 und P0 = P0,11 0 , 0 P0,22 P0,11 = P0,22 0 −1 1 1 = √ 1 0 −1 3 −1 1 0 1 − 12 − 21 √ √ = 0 21 3 − 12 3 . 1 1 1 und erhält ein System, in dem ein stabiles, autonomes Teilsystem für die Stator- bzw. Rotorflüsse der Form Rs 3 d Ψ̄3s − Lσs 0 Ψ̄s = (1.21) Rr 3 0 − Lσr Ψ̄3r dt Ψ̄r entsteht, welches für die weiteren Untersuchungen vernachlässigt werden kann. Die Kurzschlussläufer-Asynchronmaschine kann nun durch ein dynamisches System 5. Ordnung der Form d i Ψ̄s = −a1 Ψ̄is + b1 Ψ̄ir + ūis , i = 1, 2 (1.22) dt d i Ψ̄ = b2 Ψ̄is − a2 Ψ̄ir + ωJji Ψ̄js , i = 1, 2 (1.23) dt r 1 d (MEl − ML ) , MEl = 2d Ψ̄1s Ψ̄2r − Ψ̄2s Ψ̄1r (1.24) ω= dt θm 0 −1 i mit J = Jj = und geeigneten Konstanten a1 , b1 , c1 , a2 , b2 , c2 und d beschrieben 1 0 werden. Das duch die Maschine erzeugte elektrische Moment wird mit MEl bezeichnet und das extern aufgebrachte Lastmoment mit ML . Darin bezeichnen weiter Ψ̄s = Ψ̄1s , Ψ̄2s und Ψ̄r = Ψ̄1r , Ψ̄2r die Komponenten des verketteten Stator- bzw. Rotorflusses in 2Achsen Darstellung. ω ist die Drehwinkelgeschwindigkeit des Rotors und die Stellgrößen für dieses System sind durch die Statorspannungen ūs = (ū1s , ū2s ) in 2-Achsen Darstellung gegeben. θm bezeichnet das Trägheitsmoment des Rotors. Das System (1.22)-(1.24) ist nun offensichtlich ein Mehrgrößen-AI-System. Für dieses System kann nun eine exakte Linearisierung, wie sie im Abschnitt 1.4.1 angewandt wurde, für ein Teilsystem so vorgenommen werden, dass die Ausgänge dieser Teilsysteme die für den Betrieb der Maschine interessanten Größen elektrisches Moment und Rotorflussnorm sind. Wählt man als gedachte Ausgänge das elektrische Moment MEl und die Quadratnorm des Rotorflusses kΨr k22 , so kann die folgende Zustandstransformation aufgebaut werden: Man bildet die totale zeitliche Ableitung dieser beiden Größen und wertet das Ergebnis entlang der Systemtrajektorien aus. Dies ergibt d ˙ 2 Ψ̄1 − Ψ̄ ˙ 1 Ψ̄2 + Ψ̄2 Ψ̄ ˙ 1 − Ψ̇1 Ψ̄ ˙ 2 = 2d Ψ̄ MEl s r s r s r s r ẋ=a(x)+B(x)u dt ẋ=a(x)+B(x)u = α1 (x) + β11 (x) ū1s + β21 (x) ū2s , 10 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen mit geeigneten Funktionen α1 (x), β11 (x) und β21 (x) (Bitte Nachrechnen!). Genauso verfährt man mit dem Quadrat der Rotorflussnorm. Hier ist dieser Vorgang zwei Mal zu wiederholen, bis man ein System der Form ! d d 2 = α2 (x) + β12 (x) ū1s + β22 (x) ū2s kΨr k2 dt dt ẋ=a(x)+B(x)u ẋ=a(x)+B(x)u erhält. Beim vorliegenden System ist die Matrix β = Stellgrößentransformation ū1s ū2s =β −1 β11 β21 β12 β22 invertierbar, sodass die 1 α v1 2 − α2 v ein lineares Teilsystem der Form ż 1 = v 1 ż 2 = z 3 ż 3 = v 2 mit einem weiteren Teilsystem, welches als Nulldynamik bezeichnet wird. Im Rahmen der Rechenübungen wird dieses Beispiel ausführlich diskutiert und ein Maple-Paket vorgestellt, welches den Benutzer bei den notwendigen Rechenschritten unterstützt. Ziel der weiteren Überlegungen im Rahmen der Vorlesung soll es nun sein eine Methodik zu erarbeiten, zu testen, ob durch Zustandsrückführung so ein lineares Teilsystem erzeugt werden kann und wie die maximale Dimension dieses Teilsystems ist. Weiters sollen die Bestimmungsgleichungen (wir werden sehen, es sind partielle Differentialgleichungen) für die im Weiteren entscheidenden “linearisierenden Ausgänge” hergeleitet werden. Dazu werden aber einige Grundlagen der Differentialgeometrie benötigt. 1.5 Abstrakte Mannigfaltigkeiten Mannigfaltigkeiten gehören zu den wichtigsten Begriffen bei der Untersuchung von nichtlinearen, dynamischen Systemen. Hiezu betrachte man die Bewegung eines Punktes entlang der x Achse, es gilt ẋ = v (1.25) mit der Geschwindigkeit v. Gilt nun v = v (t) ∈ C ∞ ([0, ∞)), dann kann man diese Gleichung elementar lösen. Als Zustandsmenge kann R gewählt werden. Untersucht man jedoch die Bewegung eines Punktes auf dem Einheitskreis, es gelte ϕ̇ = ω , (1.26) dann kann wieder für ω = ω(t) die Gleichung elementar gelöst werden. Aber die Wahl von R für die Zustandsmenge ist nicht sinnvoll, da x + 2kπ, k ∈ N dieselbe physikalische 11 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen Position beschreibt. Natürlich ist hier der Einheitskreis S1 die adäquate Zustandsmenge. Anstelle obiger Gleichung kann man auch die Beziehungen ẋ1 = ωx2 , ẋ2 = −ωx1 (1.27) 2 2 untersuchen, wobei die Anfangsbedingungen der Restriktion (x1 (0)) + (x2 (0)) = 1 genügen müssen. Setzt man noch x1 = sin(ϕ) , x2 = cos(ϕ) , (1.28) dann folgt cos(ϕ) (ϕ̇ − ω) = 0, sin(ϕ) (ϕ̇ − ω) = 0 . Offensichtlich ist also (1.26) die lokale Version von (1.27). Man beachte, dass die Abbildung (1.28) für ϕ ∈ R nicht injektiv ist. Diese hier beschriebenen Probleme treten bei der Gleichung (1.25) nicht auf. Eine glatte Mannigfaltigkeit ist die Verallgemeinerung einer m-dimensionalen glatten Fläche im Rn mit n ≥ m. Obwohl man jede m-dimensionale glatte Mannigfaltigkeit in den R2m+1 einbetten kann, beschreiten wir hier einen anderen Weg. Wir geben eine abstraktere Definition einer glatten Mannigfaltigkeit, die ohne Einbettung in den Rn , für ein geeignetes n, auskommt. M p φβ φα y x x = φα (p) = φα φ−1 β (y) y = φβ (p) = φβ (φ−1 α (x)) Bild 1.3: Zu Trägern und Koordinatenfunktionen von Karten. Definition 1.1 Eine glatte m-dimensionale Mannigfaltigkeit ist eine Menge M, zusammen mit einer abzählbaren Menge von Teilmengen Uα ⊂ M, den Trägern der Karten, und bijektiven Abbildungen φα : Uα → Vα auf zusammenhängenden offenen Teilmengen Vα ⊂ Rm , den Koordinatenfunktionen, die folgende Eigenschaften aufweist. Die Menge der Paare (Uα , φα ) heißen Karten. 1. Die Träger der Karte überdecken M, oder M = ∪α Uα . 2. Es gelte Uα ∩ Uβ = U = 6 { }, dann ist die Abbildung φβ ◦ φ−1 α : φα (U) → φβ (U) glatt. 3. Für jedes Paar von Punkten p ∈ Uα , q ∈ Uβ , p 6= q existieren offene Teilmengen Wα , Wβ ⊂ Rm so, dass gilt φα (p) ∈ Wα ⊂ Vα , φβ (q) ∈ Wβ ⊂ Vβ und φ−1 α (Wα ) ∩ −1 φβ (Wβ ) = {}. 12 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen Man beachte, dass Karten eine Topologie für M ermöglichen, wobei man die offenen m Mengen φ−1 festlegt. Mit dieser α (W ) mittels der offenen Mengen W ⊂ φα (Uα ) ⊂ R Topologie besagt Punkt 3 von Definition 1.1, dass M die Trennungseigenschaft von Hausdorff besitzt. Der Grad der Differenzierbarkeit der Funktion φβ ◦ φ−1 α bestimmt den von M. Wir werden nur glatte Mannigfaltigkeiten betrachten. Neben der ursprünglichen Karte φα : Uα → Vα kann man weitere Karten hinzufügen φγ : Uγ → Vγ ⊂ Rm mit der −1 Bedingung, dass die Funktionen φγ ◦ φ−1 α , φα ◦ φγ auf den Mengen φα (Uγ ∩ Uα ) 6= {} glatt für alle α, γ sind. In diesem Fall heißt die Karte φγ : Uγ → Vγ kompatibel mit der Basiskarte. Die größtmögliche Menge aller kompatiblen Karten heißt ein Atlas von M. Diesen Sachverhalt veranschaulicht Bild 1.3. Der einfachste Fall einer m-dimensionalen Mannigfaltigkeit ist der Rm . Das m-Tupel x = (x1 , . . . , xm ) sei ein Koordinatensystem des Rm , und ϕi seien Koordinatenfunktionen, die jeden Punkt q ∈ Rm in den R mittels xi = ϕi (q) abbilden. Bitte beachten Sie die Änderung in der Notation. Wir schreiben xi für die i-te Koordinate xi oder das i-te Element des Tupels (x1 , . . . , xi , . . . , xm ). Für die k-te Potenz von xi wird die Bezeichnung k (xi ) verwendet. Für eine m-dimensionale Mannigfaltigkeit M, mit Trägern Uα und Koordinatenfunktionen φα kann die zusammengesetzte Abbildung ϕi ◦ φα : M → R durch ϕi ◦ φα (p) eingeführt werden. Man nennt nun die Funktionen xi (p) = ϕi ◦ φα (p) ebenfalls Koordinatenfunktionen. Obwohl verschiedene Dinge gleich bezeichnet werden, sollte keine Gefahr der Verwechslung bestehen. Darüberhinaus werden wir oft x = (x1 , . . . , xm ) als lokales Koordinatensystem für M bezeichnen. Dies bedeutet soviel wie, es existieren auf dem Träger Uα mit p ∈ Uα Koordinatenfunktionen φα : Uα → Vα auf offenen Mengen Vα ⊂ Rm des Rm so, dass xi = φiα (p) = ϕi ◦ φα (p) gilt. Kennt man die Koordinaten von p in einer Karte, dann sind sie natürlich für alle anderen Karten festgelegt. b = φ2 (p) = φ2 φ−1 1 (a) b y a = φ1 (p) = φ1 φ−1 2 (b) p a x xxxxxxxxxx Bild 1.4: Karten für den Einheitskreis S1 . Beispiele von Mannigfaltigkeiten wären die Kugel, der Torus, eine Gerade oder eine Fläche im R3 . Alle diese Mannigfaltigkeiten lassen sich natürlich im R3 einbetten. In vielen 13 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen Fällen reicht eine Karte nicht aus. Bild 1.4 ist der Einheitskreis S1 mit den vier Karten y (p) x (p) x (p) b= y (p) y (p) c=− x (p) a= d=− x (p) y (p) für x (p) > 0 für y (p) > 0 für x (p) < 0 für y (p) < 0 zu entnehmen. Diese Karten überlappen sich jeweils. So stehen im Bereich x (p) > 0 und y (p) > 0 die Koordinaten der Karten 1 und 2 in der Beziehung a= 1 b bzw. b= 1 . a Ebenso Mannigfaltigkeiten sind die m-dimensionalen Einheitskugeln Sm . Sie folgen aus der Beziehung m+1 X 2 xi = 1 , i=1 deren Lösungen glatte Untermannigfaltigkeiten des Rm+1 sind. Die Träger Ui = Sm ∩ x ∈ Rm+1 | xi > 0 , U1+m+i = Sm ∩ x ∈ Rm+1 | xi < 0 zusammen mit den Projektionen auf die Ebenen xi = 0 und den Kartenfunktionen φi , φ1+m+i , bilden eine Karte. Im Gegensatz dazu ist der 2-dimensionale Kegel x1 2 − x2 2 − x3 2 =0, eingebettet im R3 , keine Mannigfaltigkeit, denn für den Ursprung existiert kein Träger Uα , der bijektiv auf eine offene Menge des R2 abgebildet werden kann. Weniger triviale Beispiele einer m-dimensionalen Mannigfaltigkeit wären der projektive Raum Pm (R), die Menge aller Geraden durch den Ursprung im Rm+1 , oder die Menge der Drehungen im R3 . Relativ einfache Objekte, die man auf Mannigfaltigkeiten studieren kann, sind Funktion. Es sei M eine m-dimensionale glatte Mannigfaltigkeit und f : M → R eine Funktion. Für einen Träger Uα mit Koordinatenfunktionen φα erhält man dann die Darstellung f : Uα → R , fα = f ◦ φ−1 α , y = fα (x) = f ◦ φ−1 α (x) , wobei x Koordinaten von M und y die Koordinaten von R bezeichnen. Siehe dazu auch Bild 1.5. Man nennt f an der Stelle p ∈ Uα differenzierbar (glatt), wenn fα an der Stelle x = φα (p) differenzierbar (glatt) ist. Man überzeugt sich leicht, dass diese Eigenschaft unabhängig von der Wahl der Karte ist. Bitte überlegen Sie sich diese Konstruktion! Die 14 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen M p f y = f (p) φα f◦ x φα−1 y = fα (x) = f (φα−1 (x)) Bild 1.5: Zu den glatten Funktionen f = C ∞ (M). Menge aller glatten Funktionen auf M wird mit C ∞ (M) bezeichnet. Unter der Einschränkung auf einen Träger kann man offensichtlich die Differential- und Integralrechnung wie gewohnt betreiben, sofern man dafür sorgt, dass die Operationen in allen kompatiblen Karten gültig bleiben. Als nächstes werden Abbildungen zwischen Mannigfaltigkeiten betrachtet. Es seien M und N zwei glatte m- und n-dimensionale Mannigfaltigkeiten und f eine Abbildung der Form f : M → N , siehe Bild 1.6. Man sagt nun, f ist glatt in einer Umgebung von p, M N f p q φα ϕβ ϕβ ◦ f ◦ φα−1 y x Bild 1.6: Zur Abbildung f : M → N zwischen Mannigfaltigkeiten M, N . wenn es Karten mit p ∈ Uα , f (p) ∈ Vβ und Koordinatenfunktionen φα , ϕβ so gibt, dass die Funktion fαβ , fαβ = ϕβ ◦ f ◦ φ−1 α , fαβ : φα (Uα ) → ϕβ (Vβ ) ⊂ ϕβ ◦ f (Uα ) glatt in den gewählten Karten ist. Die Darstellung dieser Zusammenhänge in der Form der Abbildungen 1.5 oder 1.6 ist nun etwas schwerfällig, einen Ersatz liefern die nachstehenden Diagramme. M −1 φα ↑↓ φα f −→ R k f ◦φ−1 α φα (Uα ) ⊂ Rm −→ R M φ−1 α ↑↓ φα φα (Uα ) ⊂ Rm 15 f −→ ϕβ ◦f ◦φ−1 α −→ N ϕ−1 β ↑↓ ϕβ ϕβ (Vβ ) ⊂ Rn 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen Eine glatte Abbildung f : M → N erlaubt aus einer Funktion g ∈ C ∞ (N ) eine Funktion f ∗ (g) ∈ C ∞ (M) mittels der Vorschrift f ∗ (g) = g ◦ f : M → R zu konstruieren. Dies veranschaulicht auch das nachstehende Diagramm. f M −→ N k ↓g , g◦f M −→ R ∗ f (g) f M −→ N ↓g k g◦f −1 R ←− N Die Funktion f ∗ (g) heißt auch der pullback von g durch f . Nur wenn f : M → N ein (lokaler) Diffeomorphismus ist, können Funktionen von M auch nach N übergeführt werden. Durch geschickte Wahl von Karten können Abbildungen eine besonders einfache Gestalt annehmen. Hierzu interpretiere man die Abbildung f : U → V mit U ⊂ Rn und V ⊂ Rn von Satz 4.10 als Abbildungen zwischen Mannigfaltigkeiten M und N . Es gelte f (p) = q, p ∈ Uα , q ∈ Vβ . Nun findet man offene Mengen Uα′ ⊂ Uα , Vβ′ ⊂ Vβ so, dass f (Uα′ ) = Vβ′ gilt. x, y seien lokale Koordinaten für M und N mit Koordinatenfunktionen φα , ϕβ . Wählt man nun φ′α = ϕβ ◦ f , ϕ′β = ϕβ auf Uα′ , Vβ′ , dann nimmt dort fαβ die simple Form −1 −1 fαβ = ϕ′β ◦ f ◦ (φ′α ) = ϕ′β ◦ f ◦ f −1 ◦ ϕ′β = id oder xi = y i , i = 1, . . . , n , an. Eine andere Wahl wäre φ′α = φα , ϕ′β = φ′α ◦ f −1 . Das nachstehende Diagramm verdeutlicht diesen Sachverhalt für einen (lokalen) Diffeomorphismus f : M → N . M φ′α ↓ f ⇄ f −1 id φα (Uα′ ) ⊂ Rn ⇄ ϕβ N ↓ ϕ′β Vβ′ ⊂ Rn Auf Grund obiger Konstruktion kann man den Rang einer Abbildung f : M → N einführen. Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten und f eine Abbildung f : M → N , der Rang von f an der Stelle p ist dann einfach durch den Rang der Jacobi Matrix in den speziellen Karten (Uα , φα ), (Vβ , ϕβ ) für M, N oder durch ∂ j −1 rank (f ) (p) = dim ϕ ◦ f ◦ (φα ) (φα (p)) , i = 1, . . . , m , j = 1, . . . , n ∂xi β gegeben. Man sagt, f habe den Rang k auf einer Menge U ∈ M, falls der Rang von f auf U konstant ist. Weiters sagt man, f habe maximalen Rang, falls rank (f ) = min (m, n) gilt. Der Fall m = n ist bereits behandelt. Es gelte m > n, dann existieren Karten (Uα , φα), (Vβ , ϕβ ) und Koordinaten x, y für M, N so, dass f durch y = fαβ (x) = ϕβ ◦ f ◦ φ−1 α (x) 16 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen gegeben ist. Nun existieren immer Funktionen g i so, dass die Abbildung g : Rm → Rm , i x̄i = g i (x) = fαβ (x) , i = 1, . . . , n x̄j = g j (x) , j = n + 1, . . . , m maximalen Rang hat und damit ein (lokaler) Diffeomorphismus ist. Die Abbildung x̄ = g (x) ist also lokal umkehrbar, und es existieren offene Mengen U1 ⊂ Rn , U2 ⊂ Rm−n und V ⊂ Rn so, dass gilt g (φα (Uα′ )) = U1 × U2 , V = ϕβ Vβ′ für offene Mengen Uα′ ⊂ Uα , f (Uα′ ) = Vβ′ ⊂ Vβ . In den Koordinaten x̄ und y hat f nun die einfache Form y i = y i fαβ ◦ g −1 (x̄) = x̄i , i = 1, . . . , n . Dies veranschaulicht wieder das nachfolgende Diagramm. f M φα ↓ −→ fαβ φα (Uα′ ) ⊂ Rm −→ ϕβ g↓ pr1 U1 × U2 −→ N ↓ ϕβ ′ Vβ ⊂ R n k V Man nennt so ein f auch eine (lokale) Submersion. Nun gelte m < n, dann existieren wieder Karten (Uα , φα ), (Vβ , ϕβ ) und Koordinaten x, y für M, N so, dass f durch y = fαβ (x) = ϕβ ◦ f ◦ φ−1 α (x) gegeben ist und die Matrix ∂ i f (x) ∂xj αβ , i, j = 1, . . . , m regulär ist. Damit existieren aber immer Funktionen hj so, dass die Abbildung h : Rn → Rn i y i = hi (ȳ) = fαβ ȳ 1 , . . . , ȳ m , i = 1, . . . , m j ȳ 1 , . . . , ȳ m + ȳ j , j = m + 1, . . . , n y j = hj (ȳ) = fαβ ein (lokaler) Diffeomorphismus ist. Die Abbildung y = h (ȳ) ist also lokal umkehrbar, und es existieren offene Mengen U ⊂ Rm und V1 ⊂ Rm , V2 ⊂ Rn−m so, dass gilt −1 ′ h ϕβ Vβ = V1 × V2 , U = φα (Uα′ ), Vβ′ = f (Uα′ ) für offene Mengen Uα′ ⊂ Uα , Vβ′ ⊂ Vβ . In den Koordinaten x, ȳ hat f nun die einfache Form ȳ i = ȳ i h−1 ◦ fαβ (x) = xi , i = 1, . . . , m ȳ j = ȳ j h−1 ◦ fαβ (x) = 0 , j = m + 1, . . . , n . 17 1.5. Abstrakte Mannigfaltigkeiten 1. Mathematische Grundlagen Diesen Sachverhalt veranschaulicht wieder das nachfolgende Diagramm. f M φα ↓ −→ φα (Uα′ ) ⊂ Rm k U N ↓ ϕβ fαβ −→ ϕβ Vβ′ ⊂ Rn h−1 ↓ i −→ V1 × V2 In diesem Fall nennt man f auch eine (lokale) Immersion. Als nächstes wollen wir den Begriff einer Untermannigfaltigkeit einführen. Grob gesprochen ist eine Untermannigfaltigkeit S einer Mannigfaltigkeit M eine Teilemenge S ⊂ M, die selbst wieder eine Mannigfaltigkeit ist. Bis zu diesem Punkt stimmt die Literatur weitgehend überein, allerdings werden für S verschiedene Topologien zugelassen. Zur Veranschaulichung der Probleme betrachte man zuerst die Beispiele. f : R → R3 , f (t) = (cos(2πt) , sin(2πt) , t) (1.29) f : R → R2 , f (t) = (cos(2πt) , sin(2πt)) 2 f : (1, ∞) → R , f (t) = 2 f : (1, ∞) → R , f (t) = 1 1 cos(2πt) , sin(2πt) t t (1.30) t+1 t+1 cos(2πt) , sin(2πt) 2t 2t f : R → R2 , f (t) = (2 cos(t − π/2) , sin(2 (t − π/2))) f : R → R2 , f (t) = (2 cos(2 arctan(t) + π/2) , sin(2 (2 arctan(t) + π/2))) (1.31) (1.32) (1.33) (1.34) Diese Beispiele zeigen, dass eine Immersion nicht injektiv sein muss, siehe Gl. (1.30) und Gl. (1.33). Dazu nachstehende Definition. Definition 1.2 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f sei eine injektive Immersion f : M → N . Das Paar (f, M) heißt Untermannigfaltigkeit. Eine Untermannigfaltigkeit kann eine sehr allgemeine Struktur haben, siehe dazu Gl. (1.34). Die Menge S = f (R) entspricht der Figur 8, die sicher nicht homeomorph zu R ist. Dazu nachstehende Definition. Definition 1.3 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f sei eine injektive Immersion f : M → f (M). Ist f auch noch ein Homeomorphismus, dann heißt f eine Einbettung, und das Paar (f, M) heißt eine eingebettete Untermannigfaltigkeit. 18 1.6. Bündel 1. Mathematische Grundlagen Offensichtlich sind die Beispiele Gl. (1.29), Gl. (1.31) und Gl. (1.32) Einbettungen. Es sei f : M → N eine Immersion, dann gibt es zu jedem Punkt p ∈ M eine offene Menge Up mit p ∈ Up so, dass f eingeschränkt auf Up eine Einbettung ist. Reguläre Untermannigfaltigkeiten haben nun in speziellen Koordinaten eine besonders einfache Darstellung. Definition 1.4 Es sei N eine glatte n-dimensionale Mannigfaltigkeit. Man sagt die Menge S ⊂ N habe die m-Untermannigfaltigkeitseigenschaft, wenn gilt: Für jedes p ∈ S existiert eine Karte (U, φ) mit lokalen Koordinaten x = (x1 , . . . , xn ) so, dass φ (p) = 0 und für alle q ∈ U ∩ S gilt xm+i = φm+i (q) = 0 , i = 1, . . . , n − m . Eine reguläre m-dimensionale Untermannigfaltigkeit von N ist eine Menge S ⊂ N , die die m-Untermannigfaltigkeitseigenschaft besitzt. Die meisten Mannigfaltigkeiten in dieser Vorlesung sind regulär, sodass wir nicht immer darauf hinweisen werden. Man kann nun mit Abbildungen zwischen Mannigfaltigkeiten Untermannigfaltigkeiten erzeugen. Dies zeigen die nachstehenden Sätze. Satz 1.1 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f sei eine Einbettung. Die Untermannigfaltigkeit (iN , f (M)) ist eine reguläre m-dimensionale Untermannigfaltigkeit. Der nachstehende Satz besagt nun, wann die Untermannigfaltigkeit regulär ist. Satz 1.2 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f sei eine injektive Immersion. Ist N oder M kompakt, dann ist (f, M) eine reguläre m-dimensionale Untermannigfaltigkeit. Der nachstehende Satz ist die Übertragung des Satzes 4.11 auf Mannigfaltigkeiten. Satz 1.3 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f sei eine Submersion. Die Untermannigfaltigkeit (iM , f −1 (p)), p ∈ f (M) ⊂ N ist eine abgeschlossene, reguläre (m − n)-dimensionale Untermannigfaltigkeit. 1.6 Bündel Bündel können auch als die Verallgemeinerung kartesischer Koordinatensysteme angesehen werden. Bild 1.7 zeigt auf der linken Seite den Graph einer Funktion f : R → R im R2 . Der Graph von f ist nichts anderes als die Abbildung gr (f ) : R → R2 mit x → (x, f (x)), die offensichtlich die Bedingung pr1 (gr (f ) (x)) = x erfüllt. Diese Konstruktion kann nun einfach auf Mannigfaltigkeiten übertragen werden. M und N seien zwei Mannigfaltigkeiten, f : M → N eine Abbildung zwischen ihnen. 19 1.6. Bündel 1. Mathematische Grundlagen Ex u E (x, f (x)) σ (p) π p pr1 x x B Ep Bild 1.7: Zu Graph und Bündel. Der Graph von f ist die neue Abbildung gr (f ) : M → M × N , p ∈ M, die natürlich wieder der Bedingung pr1 (gr (f ) (p)) = p genügt. Das Produkt M×N nennt man die totale Mannigfaltigkeit und M die Basismannigfaltigkeit oder Basis. Allerdings kann diese Konstruktion noch einfach verallgemeinert werden, siehe dazu die Abbildung 1.7. Definition 1.5 Eine gefaserte Mannigfaltigkeit ist das Tripel (E, π, B) mit den Mannigfaltigkeiten E, dim (E) = m + n, B, dim (B) = m und der Abbildung π : E → B, die eine surjektive Submersion ist. Die Mannigfaltigkeit E heißt die totale Mannigfaltigkeit, die Abbildung π die Projektion und die Mannigfaltigkeit B die Basismannigfaltigkeit. Die Teilmenge Ep = π −1 (p) von E heißt die Faser über p ∈ B. In vielen Fällen ist die Idee einer gefaserten Mannigfaltigkeit zu allgemein, da verschiedene Fasern verschiedene topologische Strukturen besitzen können. Dieses Problem kann man lösen, wenn man darauf besteht, dass verschiedene Fasern diffeomorph zur typischen Faser sind. Diese Konstruktion führt dann auf ein Bündel. Definition 1.6 Eine gefaserte Mannigfaltigkeit (E, π, B) ist genau dann ein Bündel, wenn eine Mannigfaltigkeit F , die typische Faser, und eine Abbildung ψ : π −1 (Up ) → Up × F , definiert auf einer Umgebung Up von p ∈ B so existiert, dass pr1 ◦ ψ = π gilt, sowie dass F , Ep für alle p diffeomorph sind. Diesen Sachverhalt veranschaulicht das nachstehende Diagramm. (x,u) ψ π −1 (Up ) −→ Rm × Rn π↓ ↓ pr1 π −1 (Up ) −→ Up × F π↓ ↓ pr1 Up = Up Up (x) −→ Rm Für ein Bündel kann man adaptierte Koordinaten (x, u) lokal einführen mit xi , i = 1, . . . , m als Koordinaten für die Basismannigfaltigkeit B und uα , α = 1, . . . , n als Koordinaten für die typische Faser. Dies veranschaulicht ebenfalls obiges Diagramm. Bitte 20 1.6. Bündel 1. Mathematische Grundlagen beachten Sie, dass die Symbole x, u sowohl für die Koordinaten als auch für die Koordinatenfunktionen verwendet werden. Ein noch einfacheres Bild erhält man, wenn man x als die unabhängigen und u als die abhängigen Koordinaten auffasst. Wir verwenden von jetzt an lateinische Indizes für die unabhängigen und griechische Indizes für die abhängigen Variablen. Darüberhinaus wird die Indexmenge nicht mehr angeführt, wenn sie vom Kontext her klar ist. Definition 1.7 Eine gefaserte Mannigfaltigkeit (E, π, B) heißt trivial, wenn sie isomorph zu einem Produkt (B × F , pr1 , B) ist. Das Möbiusband ist ein Bündel, das nicht trivial ist. Wenn die typische Faser ein linearer Vektorraum ist, heißt das Bündel Vektorbündel. Nun können wir den Begriff des Graphen einer Funktion f : R → Rn auf Mannigfaltigkeiten übertragen. Definition 1.8 (E, π, B) sei eine gefaserte Mannigfaltigkeit. Eine Abbildung σ : B → E heißt ein Schnitt von π, wenn sie π ◦ σ = idB auf ihrem Definitionsgebiet mit der identischen Abbildung idB auf B erfüllt. Die Menge aller Schnitte von (E, π, B) wird mit Γ (E) abgekürzt. Eine Mannigfaltigkeit muss nicht einen global definierten Schnitt besitzen. Ein einfaches Beispiel dazu ist die Kugel S2 ⊂ R3 , denn man kann sich einfach vorstellen, dass man nicht jedem Punkt von S2 auf stetige Weise einen nicht verschwindenden Tangentialvektor zuweisen kann. So wie man Abbildungen zwischen Mannigfaltigkeiten studiert, kann man Abbildungen zwischen Bündeln studieren, wobei solche von besonderem Interesse sind, die die Bündelstruktur erhalten. ¯ π̄, B̄ seien zwei Bündel. Ein Bündelhomomorphismus Definition 1.9 (E, π, B) und E, ¯ welche die Bedingung ist ein Paar f = (fB , fE ) von Abbildungen fB : B → B̄, fE : E → E, π̄ ◦ fE = fB ◦ π auf ihren Definitionsgebieten erfüllen. Diesen Sachverhalt veranschaulicht das nachstehende Diagramm. Dort ist auch gezeigt, dass ein Schnitt σ ∈ Γ (E) eine spezielle Bündelabbildung ist. f B idB k E E −→ Ē π↓ ↓ π̄ f B B B −→ B̄ σ −→ idB = E ↓π B Wählt man adaptierte Koordinaten (x, u) und (x̄, ū) für die Bündel (E, π, B), Ē, π̄, B̄ , dann ist ein Bündelhomomorphismus f durch die lokale Darstellung x̄ = f¯B (x) , (x̄, ū) = f¯E (x, u) gegeben, wobei f¯B , f¯E die Abbildungen fB , fE in diesen Koordinaten repräsentieren. Von obigem Diagramm erkennt man sofort, dass ein Bündelhomomorphismus f = (fB , fE ) die Konstruktion der Abbildung fE ◦ σ = f∗ (σ) : B → E¯ , 21 1.6. Bündel 1. Mathematische Grundlagen für einen beliebigen Schnitt σ ∈ Γ (E) erlaubt. Ist allerdings fB ein Diffeomorphismus, dann kann ein Schnitt σ ∈ Γ (E) zu einem Schnitt σ̄ ∈ Γ Ē übergeführt werden gemäß der Beziehung σ̄ = f∗ (σ) ◦ fB−1 = fE ◦ σ ◦ fB−1 . Man nennt den Schnitt σ̄ auch pushforward von σ durch f . Diesen Sachverhalt veranschaulicht das nachfolgende Diagramm. f E E −→ Ē π ↓↑ σ π̄ ↓↑ σ̄ B 1.6.1 fB B̄ ⇄ −1 fB Das Tangential- und Kotangentialbündel Wie bereits oben erwähnt, ist ein Vektorbündel ein Bündel, dessen typische Faser ein linearer Vektorraum ist. Es sei (E, π, B) ein Bündel mit lokalen Koordinatensystemen (x, u) und (y, v), dann besteht zwischen diesen Systemen folgende Beziehung dim(E)−dim(B) i i α y = f (x) , v = mαβ β (x) u = X mαβ (x) uβ β=1 mit einem Diffeomorphismus f und einer regulären Matrix mαβ . Von jetzt ab wird immer die Einsteinsche Konvention für Summen verwendet, sofern die Indexmenge vom Kontext her klar ist. Diese erlaubt die Gleichungen übersichtlich und kurz zu halten. Das Tangential- und das Kotangentialbündel sind nun spezielle Vektorbündel. Die adaptierten Koordinaten des Tangentialbündels T (M) einer Mannigfaltigkeit M werden üblicherweise mit (xi , ẋj ), i, j = 1, . . . , dim (M) bezeichnet und ein Schnitt σ ∈ Γ (T (M)), ẋi = σ i (x) , σ = σ i ∂i , ∂ = ∂i ∂xi (1.35) wird als Tangentialvektorfeld bezeichnet. Wieso die Notation als Differentialoperator für ein Tangentialvektorfeld sinnvoll ist, wird noch gezeigt. Nun seien (xi , ẋj ), (y i , ẏ j ) zwei Koordinatensysteme von T (M), dann gilt y i = f i (x) , ẏ i = ∂j f i (x) ẋj (1.36) für einen Diffeomorphismus f . Zu einer Mannigfaltigkeit M werden üblicherweise die adaptierten Koordinaten des Kotangentialbündels T ∗ (M) mit (xi , ẋj ), i, j = 1, . . . , dim (M) bezeichnet und ein Schnitt σ ∈ Γ (T ∗ (M)), ẋi = σi (x) , σ = σi dxi (1.37) wird als Kotangentialvektorfeld bezeichnet. Wieso dies sinnvoll ist, wird noch gezeigt. Für zwei Koordinatensysteme (xj , ẋj ), (y i , ẏi ) von T ∗ (M) gilt y i = f i (x) , ẋi = ∂i f j (x) ẏj 22 (1.38) 1.6. Bündel 1. Mathematische Grundlagen für einen Diffeomorphismus f . Dass die Notation als Differential für ein Kotangentialvektorfeld sinnvoll ist, muss ebenfalls noch gezeigt werden. Ehe die Betrachtungen fortgeführt werden können, wird noch nachstehende Definition benötigt. Definition 1.10 Es sei I ⊂ R ein offenes reelles Intervall, das 0 beinhaltet, und M eine m-dimensionale glatte Mannigfaltigkeit. Eine glatte Abbildung ϕ : I × M → M heißt ein (lokaler) Fluss auf M, wenn ϕ die folgenden Beziehungen ϕ0 (p) = p ϕε1 +ε2 (p) = ϕε1 ◦ ϕε2 (p) = ϕε2 ◦ ϕε1 (p) ϕ−1 ε (p) = ϕ−ε (p) für alle ε, ε1, ε2 ∈ Ī ⊂ I mit einem geeigneten Unterintervall Ī und alle p ∈ Uq , q ∈ M erfüllt. Ein Fluss erlaubt zwei einfache Interpretationen. Hält man ε ∈ I fest, dann ist ϕε : M → M ein Diffeomorphismus auf M. Für festes p ∈ M ist ϕε (p) : I → M eine Kurve in der Umgebung von p. Ein Fluss ϕε unterteilt also die Mannigfaltigkeit M lokal in eine Menge von 1-dimensionalen Untermannigfaltigkeiten ϕε (p) : I → M. Darüberhinaus zeigt der folgende Satz, dass ein Fluss in speziellen Koordinaten eine sehr einfache Darstellung hat. Satz 1.4 Es sei ϕε : I × M → M ein (lokaler) glatter Fluss auf einer m-dimensionalen glatten Mannigfaltigkeit M. Die Umgebung Up von p ∈ M gehöre zur Definitionsmenge von ϕ, dann existieren Koordinaten (x) = (x1 , . . . , xm ) nahe p so, dass ϕε in diesen Koordinaten gegeben ist durch ϕ̄ε = x1 + ε, x2 , . . . , xm . Dieser Satz heißt auch Flow Box Theorem. Zum Beweis des Satzes 1.4 wähle man Koordinaten (y) so, dass die Darstellung ϕ̃ε von ϕε den Bedingungen, ∂ 1 0 = φ (p) , 6= 0 ϕ̃ (y) ∂ε ε ε=0,y=0 genügt. Man überzeugt sich nun leicht, dass die Abbildung f , y = f (x) = ϕ̃x1 0, x2 , . . . , xm , ein Diffeomorphismus ist, und dass ϕε in diesen Koordinaten das Aussehen ϕ̄ε (x) = f −1 ◦ ϕ̃ε ◦ f (x) = f −1 ◦ ϕ̃ε+x1 0, x2 , . . . , xm = x1 + ε, x2 , . . . , xm hat. Es sei ϕε ein Fluss auf M mit der Darstellung ϕ̄ε in einem Koordinatensystem x. Differenziert man nun ϕ̄ε nach ε, erhält man ∂ i ∂ i i i = v̄ ◦ ϕ̄ε (x) , v̄ = (1.39) ϕ̄ (x) ϕ̄ ∂τ τ ∂ε ε ε=0 τ =ε 23 1.6. Bündel 1. Mathematische Grundlagen mit den Funktionen v̄ i ∈ C ∞ (Rm ). Diese Beziehung ist aber nichts anderes als das folgende System ∂ i x (ε) = v̄ i (x (ε)) (1.40) ∂ε von m gewöhnlichen Differentialgleichungen in der unabhängigen Variablen ε. Ein Fluss ϕε erzeugt also ein System von m gewöhnlichen Differentialgleichungen. Ist die Lösung des Systems (1.39) eindeutig, dann erzeugt ein System von m Differentialgleichungen einen (lokalen) Fluss. Dies folgt aus dem Satz über die Existenz und Eindeutigkeit des Anfangswertproblems für explizite gewöhnliche Differentialgleichungen. Das m-Tupel v̄ = (v̄ 1 , . . . , v̄ m ) nennt man auch den infinitesimalen Generator von ϕ̄ε in den Koordinaten x. Man überzeugt sich nun einfach, dass für v̄ die Transformationsregeln (1.36) gelten, v̄ ist also ein Tangentialvektor. Der infinitesimale Generator eines Flusses ϕε ist vorläufig nur in einer Karte definiert. Um eine koordinatenfreie Darstellung zu gewinnen, wählt man eine Funktion g ∈ C ∞ (M) und einen Fluss ϕε . Bezeichnet man mit ḡ, ϕ̄ε die Größen g, ϕε in einem Koordinatensystem x, dann kann man einfach ḡ (ϕ̄ε ) nach ε differenzieren und für p ∈ U ⊂ M folgt dann ∂ (1.41) = v̄ i (x) ∂i ḡ (x) = v̄ i ◦ φ (p) (∂i ḡ) ◦ φ (p) ḡ (ϕ̄ε ) | {z } ∂ε ε=0 v̄ mit den Funktionen v̄ i von (1.39). Man überzeugt sich wieder leicht, dass v̄ = v̄ i (x) ∂i gemäß (1.36) transformiert wird. Dazu beachte man lediglich v̄ f i (x) = ∂j f i (x) v̄ j (x) . Weiters sieht man sofort, dass nur die Größen v̄ i ◦ φ (p) in die Beziehung (1.39) eingehen. Damit entspricht der infinitesimale Generator eines Flusses v̄x = v̄ i (x) ∂i (1.42) einem Differentialoperator, der folgende Regeln v̄x (α1 g1 + α2 g2 ) = α1 v̄x (g1 ) + α2 v̄x (g2 ) , Linearität über R v̄x (g1 g2 ) = v̄x (g1 ) g2 + g1 v̄x (g2 ) , Leibniz Regel für alle g1 , g2 ∈ C ∞ (M) und Zahlen α1 , α2 ∈ R erfüllt. Diese Eigenschaft erlaubt nun, den Tangentialraum an einem Punkt p ∈ M einer Mannigfaltigkeit M zu definieren. Definition 1.11 Der Tangentialraum Tp (M) an der Stelle p ∈ M einer glatten mdimensionalen Mannigfaltigkeit M wird durch die Menge aller linearen Abbildungen vp , wp : C ∞ (M) → R, die linear über den reellen Zahlen sind, und die Leibniz Regel erfüllen, gebildet. Die Vektorraumoperationen sind (vp + wp ) (f ) = vp (f ) + wp (f ) , (αvp ) (f ) = vp (αf ) für alle f ∈ C ∞ (M) und α ∈ R. Weiters gilt dim (Tp (M)) = m. 24 1.6. Bündel 1. Mathematische Grundlagen Eine lineare Abbildung, die die Leibniz Regel erfüllt, heißt Ableitung. Man gelangt nun zum Tangentialbündel T (M) der Mannigfaltigkeit M, indem man die Tangentialräume Tp (M) zu einem Bündel zusammenfügt. Satz 1.5 Es sei M eine glatte m-dimensionale Mannigfaltigkeit, dann ist die Menge T (M) = ∪p∈M Tp (M) ein Bündel (T (M) , τM , M) mit der Projektion τM . Man nennt dieses Bündel auch das Tangentialbündel von M. Die typische Faser F dieses Bündels ist ein m-dimensionaler R-Vektorraum. Zum Beweis dieses Satzes sei auf die Literatur verwiesen. Die Menge aller glatten Tangentialvektorfelder, oder der glatten Schnitte von T (M), wird wieder mit Γ (T (M)) bezeichnet. Es wird aber nicht verlangt, dass ein Schnitt global existiert. Es sei nun f : M → N eine glatte Abbildung zwischen zwei Mannigfaltigkeiten M, N , dann kann man f zu einem Bündelhomomorphismus (fB , fE ) erweitern, indem man fB = f setzt und verlangt, dass fE = fT (M) : T (M) → T (N ) der Bedingung fT (M) (v) (g) = v (fB∗ (g)) für alle g ∈ C ∞ (N ), v ∈ Γ (T (M)) genügt. Die Darstellung von fE in adaptierten Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ), (y 1, . . . , y m, ẏ 1 , . . . , ẏ m ) für T (M), T (N ) lautet dann y i = f¯i (x) , ẏ i = ∂j f¯i (x) ẋj , wobei f¯ die Darstellung von f in diesen Koordinaten bezeichnet. Ist f ein Diffeomorphismus, dann kann man den sogenannten “pushforward” eines Feldes v ∈ Γ (T (M)) durch f, fT (M) gemäß der Vorschrift ṽ = fT (M) ◦ v ◦ f −1 = (f∗ (v)) ◦ f −1 (1.43) bestimmen. Man vergleiche dazu die nachstehenden Diagramme f∗ T (M) −→ T (N ) τM ↓↑ v τN ↓↑ ṽ f∗ T (M) −→ T (N ) τM ↓ τN ↓ , M f −→ M N f ⇄ f −1 . N Gegeben sei das Tangentialbündel (T (M) , τM , M) einer glatten m-dimensionalen Mannigfaltigkeit M und ein Punkt p ∈ M, dann ist die typische Faser Tp (M) ein linearer Vektorraum über p. Wie in der linearen Algebra betrachtet man nun die linearen Abbildungen ωp : Tp (M) → R. Wählt man nun Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) für T (M), dann hat ein Schnitt v ∈ Γ (T (M)) die Form v̄ = v̄ i (x) ∂i (1.44) mit glatten Funktionen v̄ i (x). Es bezeichne nun ω̄x die Abbildung ωp : Tp (M) → R in diesen Koordinaten, dann gilt ωp (vp ) = hωp , vp i = ω̄i (x) v̄ i (x) , 25 x = φ (p) 1.6. Bündel 1. Mathematische Grundlagen für glatte Funktionen ω̄i (x). Man beachte, dass diese Beziehung zusammen mit Gl. (1.36) erzwingt, dass sich ω̄x = ω̄i (x) dxi (1.45) gemäß (1.38) transformiert. Ein wohlbekannter Satz der linearen Algebra besagt nun, dass der Raum aller linearen Funktionen (Linearformen, linearen Funktionale) Tp (M) → R ein m-dimensionaler R-Vektorraum ist. Dieser Raum wird mit Tp∗ (M) bezeichnet, er wird auch Dualraum genannt. Offensichtlich ist nun Tp∗ (M) punktweise konstruiert, und man kann nun die Vorgehensweise beim Tangentialbündel übernehmen, indem man die Räume Tp∗ (M) zu einem Bündel verschmilzt. Satz 1.6 Es sei M eine glatte m-dimensionale Mannigfaltigkeit, dann ist die Menge T ∗ (M) = ∪p∈M Tp∗ (M) ∗ ∗ ein Bündel (T ∗ (M) , τM , M) mit der Projektion τM . Das Bündel heißt das Kotangentialbündel von M, seine typische Faser F ist ein m-dimensionaler R-Vektorraum. Auch hier sei für den Beweis auf die Literatur verwiesen. Die bilineare Abbildung h·, ·ip : Tp∗ (M) × Tp (M) → R lässt sich nun einfach zu einer Abbildung h·, ·i : T ∗ (M) × T (M) → C ∞ (M) erweitern. In Koordinaten hat dieser Ausdruck die Form ẋi ẋi oder v⌋ω = hω, vi = ω̄i v̄ i für Schnitte (1.35) und (1.37). Zusätzlich gilt i dx , ∂j = δji mit dem Kronecker Symbol δji . Ist nun f : M → N eine glatte Abbildung zwischen den Mannigfaltigkeiten M, N , dann kann man den pull back eines Schnittes ω ∈ Γ (T ∗ (N )) berechnen. Man schreibt nun für diese Abbildung f ∗ : T ∗ (N ) → T ∗ (M), und sie erfüllt natürlich die Regel hf ∗ (ω) , vi = hω ◦ f, f∗ (v)i für einen Schnitt v ∈ Γ (T (M)). Das folgende Diagramm f∗ T ∗ (M) ⇄ T ∗ (N ) f∗ ∗ τM ↓↑ f ∗ (ω) M f −→ τN∗ ↓↑ ω N zeigt, dass f ∗ (ω) auch existiert, wenn f kein Diffeomorphismus ist. In den Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) und (y 1 , . . . , y n , ẏ1, . . . , ẏn ) für T ∗ (M) und T ∗ (N ) lautet die Beziehung dann ẋi = ∂i f¯j ẏj ◦ f¯ . (1.46) Ist f sogar ein Diffeomorphismus, dann kann ein Schnitt von T ∗ (M) in einen Schnitt von T ∗ (N ) übergeführt werden. Man beachte hier diesen wesentlichen Unterschied bei der Transformation von Tangentialvektoren und Kotangentialvektoren. Von besonderem Interesse sind nun Kotangentialvektoren, die von Funktionen erzeugt werden. 26 1.6. Bündel 1. Mathematische Grundlagen Definition 1.12 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Das Differential dg ∈ Γ (T ∗ (M)) zu g ∈ C ∞ (M) ist jener Kovektor, welcher der Bedingung v⌋dg = hdg, vi = v (g) für alle v ∈ Γ (T (M)) genügt. Man überzeugt sich nun leicht, dass in Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) für T ∗ (M) gilt dḡ = ∂i ḡdxi oder ẋi = ∂i ḡ . (1.47) Mit dieser Beziehung folgt für (1.46) sofort f¯∗ dy j = df¯j = ∂i f¯j dxi . 1.6.2 Freie und autonome Systeme Betrachtet man nochmals das autonome System ẋi = f i (x) , i = 1, . . . , n , (1.48) dann erkennt man sofort, dass dieses System ein Vektorfeld f = f i (x) ∂i (1.49) auf einer Mannigfaltigkeit M mit lokalen Koordinaten (x1 , . . . , xn ) beschreibt. Von jetzt an wird auf das Symbol f¯ verzichtet, das auf die Beschreibung in einer speziellen Karte hinweist. Wegen Satz 1.4 lassen sich lokal sogar Koordinaten so finden, dass gilt ẋ1 = 1 , ẋi = 0 , i = 2, . . . , n . Das Vektorfeld f von (1.48) ist natürlich auch ein Differentialoperator und damit eine Abbildung f : C ∞ (M) → C ∞ (M). Als nächstes wird das freie System ẋi = f i (t, x) , i = 1, . . . , n (1.50) untersucht. Um ein geometrisches Bild zu erhalten, betrachte man das Bündel (E, π, B) mit adaptierten Koordinaten (t) für B und (t, x1 , . . . , xn ) für E. Offensichtlich ist dann f = f i (t, x) ∂i ein Vektorfeld f ∈ Γ (T (E)). Aber f erfüllt noch die Bedingung π∗ (f ) = 0 . Man betrachte dazu wieder das nachstehende Diagramm τ E E ←− T (E) π↓ π∗ ↓ . τB B ←− T (B) 27 (1.51) 1.6. Bündel 1. Mathematische Grundlagen Ein Vektorfeld v ∈ Γ (T (E)) heißt nun projizierbar, wenn π∗ (v) ∈ Γ (T (B)) gilt. Nun muss ein projizierbares Vektorfeld in adaptierten Koordinaten die Form v = f t (t) ∂t + f i (t, x) ∂i haben. Offensichtlich ist das Feld von (1.51) projizierbar. Es hat aber noch die spezielle Eigenschaft f t = 0. Dazu nun folgende Definition. Definition 1.13 (E, π, B) sei eine gefaserte Mannigfaltigkeit. Die Menge aller Schnitte v ∈ Γ (T (E)) mit π∗ (v) = 0 ist ein Unterbündel von T (E). Dieses Bündel heißt das vertikale Bündel, und es wird mit V (E) bezeichnet. Man könnte nun f von (1.51) als ein vertikales Vektorfeld auffassen, dann müsste aber ṫ = 0 gelten. Man betrachte nun einen Schnitt σ ∈ Γ (E) zusammen mit dem Diagramm τ E E ←− T (E) π ↓↑ σ π∗ ↓↑ σ∗ . τB B ←− T (B) Die Abbildung σ∗ : T (B) → T (E) ist offensichtlich durch t = t ṫ 1 ẋ1 ∂t σ 1 (t) x1 = σ 1 (t) , .. = .. .. . . . xn = σ n (t) ẋn ∂t σ n (t) gegeben. Man schreibt nun dafür, das Produkt ⊗ wird später erklärt, ∂t ⌋dt ⊗ fe = fe , dt ⊗ fe ⌋dt ⊗ fe = dt ⊗ fe mit dem speziellen Vektorfeld fe = ∂t + f i (t, x) ∂i = ∂t + f . (1.52) Wählt man g ∈ C ∞ (E) und bezeichnet ϕτ den Fluss zum Feld von (1.52), dann gilt d . fe (g) = g ◦ ϕτ (t, x) dτ τ =0 Damit beschreibt fe die totale zeitliche Änderung von g entlang einer Lösung von Gl. 1.50. Das freie System erzeugt damit auch den Differentialoperator von (1.52). 28 1.6. Bündel 1. Mathematische Grundlagen Eine weitere Darstellung des Systems (1.50) erhält man mittels den speziellen Kovektoren ω i = dxi − f i (t, x) dt ∈ Γ (T ∗ (E)) . (1.53) Man betrachte nun einen Schnitt σ ∈ Γ (E) zusammen mit dem Diagramm τ∗ E E ←− T ∗ (E) π ↓↑ σ π ∗ ↑↓ σ ∗ , B τ∗ B ←− T ∗ (B) dann folgt mit sofort σ ∗ ω i = dσ i (t) − f i ◦ σ (t) dt = ∂t σ i (t) − f i ◦ σ (t) dt = 0 ∂t σ i (t) = f i ◦ σ (t) , i = 1, . . . , n . Zusätzlich beachte man noch die Beziehung fe ⌋ω i = 0 , i = 1, . . . , n . 1.6.3 Systeme mit Eingang Betrachtet man nun das System ẋi = f i (x, u) , i = 1, . . . , n , (1.54) auf einer Mannigfaltigkeit M mit lokalen Koordinaten (x1 , . . . , xn ), dann erkennt man sofort, dass für das Vektorfeld f , f = f i (x, u) ∂i (1.55) gilt f∈ / Γ (T (M)) . Das Feld f beschreibt vielmehr eine Untermannigfaltigkeit des T (M), mit den lokalen Koordinaten (x, u). Gilt insbesondere f i (x, u) = ai (x) + bir (x) ur , dann beschreibt das System sogar eine affine Untermannigfaltigkeit. Um ein besseres geometrisches Bild zu bekommen, führt man nun das Bündel (Z, ρ, M) ein. Siehe dazu das folgende Diagramm. Z τZ ⇆ T (Z) f ρ ↓↑ σ ρ∗ ↓ τM M ←− T (M) 29 1.6. Bündel 1. Mathematische Grundlagen Ein Schnitt σ ∈ Γ (Z) ist offensichtlich wegen ur = σ r (x) , r = 1, . . . , m eine Zustandsregelung. Man beachte, dass zwar f = f i (x, u) ∂i ∈ Γ (T (Z)) gilt, aber f ist wegen ρ∗ (f ) = f nicht projizierbar. Allerdings wäre (f i ◦ σ) ∂i ∈ Γ (T (M)) gegeben. Dazu nun folgender Satz. Satz 1.7 Gegeben sei das Bündel (E, π, B) und eine Abbildung f : B̄ → B zwischen den Mannigfaltigkeiten B̄, B. Die Menge f ∗ (E) = (x̄, (x, u)) ∈ B̄ × E | π ((x, u)) = x = f (x̄) ist eine gefaserte Mannigfaltigkeit mit der Projektion pr1 : f ∗ (E) → B̄ , (x̄, (x, u)) 7→ (x̄) . Diesen Sachverhalt veranschaulicht auch das Diagramm pr 2 f ∗ (E) −→ E pr1 ↓ π ↓↑ σ , f B̄ −→ B pr 2 π̄ ∗ (E) −→ E pr1 ↓ ↓π , π̄ ¯ E −→ B pr 2 Ē π (E) −→ pr1 ↓ ↓ π̄ π E −→ B Ist ein σ ∈ Γ (E) gegeben, dann ist offensichtlich durch (x̄, σ ◦ f (x̄)) ein Schnitt von f ∗ (E) ¯ Ē, π, B , dann schreibt man auch gegeben. Gilt noch B̄ = E, E ×B Ē . In diesem Fall sind π̄ ∗ (E), π ∗ (E) Bündel. Vergleicht man nun die Diagramme, dann erhält man pr2 ρ∗ T (M) T (Z) −→ ρ∗ (T (M)) −→ τZ ↓ pr1 ↓ ↓ τM Z = Z ρ ⇄ σ M und somit das Ergebnis f = f i (x, u) ∂i ∈ Γ (ρ∗ (T (M))). Man beachte, dass im Allgemeinen aber für g ∈ C ∞ (Z) gilt f i (x, u) ∂i g ◦ σ 6= f i ◦ σ ∂i (g ◦ σ) . Der zeitvariante Fall ẋi = f i (t, x, u) , i = 1, . . . , n , (1.56) kann nun fast analog zum invarianten behandelt werden. Man wählt nun ein Bündel (E, π, B) mit lokalen Koordinaten (t, x) für E und (t) für B. Wieder gilt für das Vektorfeld f, f = ∂t + f i (t, x, u) ∂i (1.57) 30 1.7. Transformationen 1. Mathematische Grundlagen die Beziehung f∈ / Γ (T (E)) . Analog zu oben führt nun das Bündel (Z, ρ, E) mit lokalen Koordinaten (t, x, u) für Z ein. Ein Schnitt σ ∈ Γ (Z) ist offensichtlich wegen ur = σ r (t, x) , r = 1, . . . , m eine Zustandsregelung. Man beachte, dass zwar f = ∂t + f i (t, x, u) ∂i ∈ T (Z) gilt, aber f nicht projizierbar ist, sowie dass ∂t + (f i ◦ σ) ∂i ∈ T (E) erfüllt ist. Damit folgt aber sofort das gewünschte Resultat f = ∂t + f i (t, x, u) ∂i ∈ ρ∗ (T (E)). Das folgende Diagramm zeigt dazu die Zusammenhänge. pr ρ∗ 2 T (Z) −→ ρ∗ (T (E)) −→ T (E) τZ ↓ pr1 ↓ ↓ τE Z = Z ρ ⇄ σ E Eine weitere Darstellung des Systems (1.50) erhält man mittels der speziellen Kovektoren ω i = dxi − f i (t, x, u) dt ∈ ρ∗ (T ∗ (E)) , (1.58) wobei zur Vollständigkeit das zurückgezogene Bündel ρ∗ (T ∗ (E)) im folgenden Diagramm dargestellt ist. pr2 ρ∗ T ∗ (Z) ←− ρ∗ (T ∗ (E)) −→ T ∗ (E) τZ∗ ↓ pr1 ↓ ↓ τE∗ Z 1.7 = Z ρ ⇄ σ E Transformationen Abschließend werden noch einmal die relevanten Transformationen zusammengefasst. Hier bezeichnen (t, x, u) die Koordinaten des gegebenen und (τ, y, v) die des transformierten Systems. Im autonomen Fall (1.50) gilt dann ẋα = f α (x) , ẏ α = f¯α (y) = (∂β ϕα ) f β ◦ ϕ−1 (y) y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ . Für den freien Fall (1.52) folgt ṫ = f t (t, x) = 1 , ẋα = f α (t, x) τ̇ = f¯1 (τ, y) = (∂t φ) ◦ φ−1 (τ ) , ẏ α = f¯α (τ, y) = (∂β ϕα ) f β + ∂t ϕα ◦ ϕ−1 (τ, y) τ = φ (t) , (τ, y) = ϕ (t, x) , τ̇ = ∂t φ (t) ṫ , ẏ α = ∂β ϕα (t, x) ẋβ + ∂t ϕα (t, x) ṫ . Man beachte, dass im Allgemeinen τ̇ 6= 1 gilt. Man kann dies jedoch immer erreichen, wenn man die nachstehende Transformation τ̇ = 1 , ẏ α = f¯α (τ, y) = ∂β ϕα f β + ∂t ϕα ∂t φ−1 ◦ ϕ−1 (τ, y) 31 1.7. Transformationen 1. Mathematische Grundlagen verwendet. Beachten Sie bitte aber den Bedeutungsunterschied. Man beachte aber, dass für die Darstellung des Systems (1.53) sich die Transformation folgendermaßen ändert dxαx − f αx (t, x) dt ∂βy ϕαx (τ, y) dy βy + (∂τ ϕαx (τ, y) − f αx (t, x) ◦ ϕ (τ, y) ∂τ φ (τ )) dτ t = φ (τ ) , (t, x) = ϕ (τ, y) dt − ∂τ φ (τ ) dτ , dxαx − ∂βy ϕαx (τ, y) dy βy − ∂τ ϕαx (τ, y) dτ . Für Systeme mit Eingang erhält man im zeitinvarianten Fall die Beziehungen ẋα = f α (x, u) , ẏ α = f¯α (y, v) = (∂β ϕα ) f β ◦ ψ −1 (y, v) y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ , (y, v) = (ϕ (x) , ϕ̄ (x, u)) = ψ (x, u) , die sich für AI-Systeme folgendermaßen vereinfachen ẏ α = āα (y) + b̄ααu (y) v αu ẋα = aα (x) + bααu (x) uαu = (∂β ϕα ) aβ − bβαu ψ̄βαuu ψ0βu ◦ ϕ−1 (y) + bβαu ψ̄βαuu ◦ ϕ−1 (y) v βu y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ , v αu = ψ0αu (x) + ψβαuu (x) uβu , ψβαuu ψ̄γβuu = δγαuu . Im zeitvarianten Fall werden obige Transformationen für Systeme mit Eingang nur ein wenig aufwendiger, aber es ändert sich nichts Prinzipielles. Als Anwendung betrachte man das PCH-System (Port Controlled Hamiltonian) ẋi = J ij (x) − Rij (x) ∂j H (x) + Bτi (x) uτ yς = ∂i H (x) Bςi (x) mit Hamiltonfunktion H, schiefsymmetrischer Strukturmatrix [J ij ] = − [J ji ], positiv semidefiniter Dissipationsmatrix [Rij ] = [Rji ], dem m-dimensionalen Eingang uγ , γ = 1, . . . , m und dem m-dimensionalen Ausgang yς , ς = 1, . . . , m. Man beachte, dass dieses System die (Passivitäts) Ungleichung ẋi ∂i H (x) = −∂i H (x) Rij (x) ∂j H (x) + ∂i H (x) Bγi (x) uγ = −∂i H (x) Rij (x) ∂j H (x) + yγ uγ erfüllt. Die Koordinatentransformation x̄ī = ϕī (x) , ūγ̄ = Mγγ̄ (x) uγ , ȳς¯ = M̄ς¯ς (x) yς , wobei M̄γ̄γ die zu Mγγ̄ inverse Matrix bezeichnet, führt das System nun über in x̄˙ ī = ∂i ϕī (x) J ij (x) − Rij (x) ∂j H (x) + Bγi (x) uγ γ −1 i γ̄ ī ij ij j̄ = ∂i ϕ (x) J (x) − R (x) ∂j ϕ (x) ∂j̄ H ◦ ϕ (x̄) + Bγ (x) M̄γ̄ (x) u = J¯īj̄ (x̄) − R̄īj̄ (x̄) ∂j̄ H̄ (x̄) + B̄γ̄ī (x̄) uγ̄ 32 1.8. Schlussbemerkungen 1. Mathematische Grundlagen bzw. ȳς¯ = ∂i H̄ ◦ ϕ (x) Bςi (x) M̄ς¯ς (x) = ∂ī H̄ ◦ ϕ (x) ∂i ϕī (x) Bςi (x) M̄ς¯ς (x) = ∂ī H̄ (x̄) B̄ς¯ī (x̄) mit −1 H̄ (x̄) = H ◦ ϕ (x̄) , B̄ (x̄) = ∂i ϕī (x) Bγi (x) M̄γ̄γ (x) , īj̄ ī ij j̄ ¯ J (x̄) = ∂i ϕ (x) J (x) ∂j ϕ (x) ◦ ϕ−1 (x̄) , R̄īj̄ (x̄) = ∂i ϕī (x) Rij (x) ∂j ϕj̄ (x) ◦ ϕ−1 (x̄) . Es bezeichne X die Zustandsmannigfaltigkeit. Der Eingangsraum U ist ein Vektorbündel mit Koordinaten (xi , uγ ) und Basis X , dessen typische Faser der Rm ist. Der Ausgangsraum ist das Vektorbündel Y dual zu U mit Koordinaten (xi , uγ ) und Basis X , dessen typische Faser der (Rm )∗ ist. Die Matrix [Bτi ] repräsentiert eine lineare Abbildung B : U → T (X ) wie auch deren duale Abbildung B ∗ : T ∗ (X ) → Y = U ∗ . Die Matrizen [J ij ], [Rij ] repräsentieren eine schiefsymmetrische und eine positiv semidefinite Abbildung vom Typ J, R : T ∗ (X ) → T (X ). Die obigen Transformationen drücken nun genau diese Eigenschaften aus. Man beachte, dass noch gilt ẋi ∂i H ◦ ϕ−1 (x̄) = − ∂i H (x) Rij (x) ∂j H (x) ◦ ϕ−1 (x̄) + yγ uγ −∂ī H̄ (x̄) R̄īj̄ (x̄) ∂j̄ H̄ (x̄) + ȳγ̄ ūγ̄ . Obige Transformation kann jedoch noch verallgemeinert werden. Dazu betrachte man den Ansatz x̄ī = ϕī (x) ūγ̄ = k γ̄ (x) + Mγγ̄ (x) uγ , wobei k eine Lösung der Gleichungen 0 = J ij (x) − Rij (x) ∂j Ĥ (x) − Bγi (x) k γ (x) für eine geeignete Funktion Ĥ ist. Man bestimme nun die Eigenschaften des Eingangsraums U und des Ausgangsraums Y , denn beide müssen hier affin sein. Weiters überlege man, wie die Hamiltonfunktion H transformiert wird. 1.8 Schlussbemerkungen Naturgemäß konnte in diesem Kapitel nur ein kleiner Ausschnitt aus der Differentialgeometrie und ihre Anwendungen auf regelungstechnische Probleme präsentiert werden. Regelungstheoretische Untersuchungen von AI-Systemen findet man z.B. in [8, 13, 17]. Das Buch [5] präsentiert zahlreiche Anwendungen von differentialgeometrischen Methoden auf physikalische Probleme. Sucht man eine mathematische Einführung in die Differentialgeometrie, dann sind die Bücher [1, 3, 5, 19] zu empfehlen. Weiterführende Themen, die sowohl für die Theorie dynamischer Systeme und die Regelungstheorie von Interesse sind findet man z.B. in [2, 6, 14, 15, 16, 18], wobei zum Studium dieser Werke gute Kenntnisse der Grundlagen der Differentialgeometrie erforderlich sind. 33 1.9. Aufgaben 1.9 1.9.1 1. Mathematische Grundlagen Aufgaben AI-Systeme Aufgabe 1.1 Zeigen Sie, dass die Hintereinanderschaltung, Parallelschaltung und Inversion von AI–Systemen wieder zu AI–Systemen führt. 1.9.2 Mannigfaltigkeiten Aufgabe 1.2 Gegeben sei die Einheitskugel im R3 (S2 ). Bestimmen Sie dazu eine Karte (U, z). Wieviele Karten benötigt man für einen Atlas mindestens? Aufgabe 1.3 Gegeben sei die Einheitskugel S2 im R3 (siehe obige Aufgabe). Bestimmen Sie für einen Punkt x∈S2 und eine Karte (U, z) eine Basis für den Tangentialraum T (S2 ). Aufgabe 1.4 Gegeben sei die Einheitskugel S2 im R3 (siehe obige Aufgabe). Zeigen Sie, dass der Tangentialraum T (S2 ) unabhängig von der Wahl der speziellen Karte ist. Aufgabe 1.5 Zeigen Sie, dass der Rn selbst eine n-dimensionale Mannigfaltigkeit ist. Welche Gestalt hat der Tangentialraum des Rn an einer Stelle ? Aufgabe 1.6 Der Zustand eines starren Körpers wird durch die Angabe seines Schwerpunktes, der Geschwindigkeit des Schwerpunktes, durch drei Winkel und drei Winkelgeschwindigkeiten festgelegt. Das sind also 12 Größen. Suchen Sie in der Literatur nach dem geeigneten Zustandsraum. Hinweis: Für kleine Bewegung ist R12 sicher geeignet. Trifft dies auch global zu ? Aufgabe 1.7 Die Abbildung f : R2 → R2 sei gegeben durch die Beziehung 1 1 f (x1 , x2 ) = (ex cos(x2 ), ex sin(x2 )) . Für welche (x1 , x2 ) ist diese Abbildung umkehrbar eindeutig ? P n i=1 2 i i 2 Aufgabe 1.8 Gegeben ist die Abbildung f : R → R mit f (x) = (x ) xj . P Zeigen Sie, dass diese Abbildung C ∞ ist und dass die Einheitskugel ni=1 (x ) = 1 mittels dieser Abbildung umkehrbar eindeutig auf sich selbst abgebildet wird. n n j Aufgabe 1.9 Ein bilineares System hat die Form P ẋ = Ax + m j=1 (Nj x + bj ) uj y = Cx . bzw. mit der Einsteinschen Summenkonvention ẋi = aij xj + nij,k xj + bik uk y l = clj xj . Führen Sie für obiges System eine reguläre Zustandstransformation der Form 34 1.9. Aufgaben 1. Mathematische Grundlagen 1. z = Tx bzw. z i = tij xj und 2. z = t(x) bzw. z i = ti (x) durch und überprüfen Sie, ob das System im transformierten Zustand z wieder ein bilineares System ergibt. Aufgabe 1.10 Die Funktion f : R2 → R3 ist durch die Gleichung 2 2 1 2 2 2 2 2 f (x1 , x2 ) = x1 x1 + x2 ,x x + x2 , x1 + x2 gegeben und M bezeichne das Bild von f . Ist mit M im Sinne der Definition 1.1 eine Mannigfaltigkeit gegeben ? Hinweis: Zeichnen Sie diese Funktion. Aufgabe 1.11 Gegeben ist eine unendlich oft stetig differenzierbare Funktion f : Rn → Rm . Zeigen Sie, dass durch die Gleichung f (x) = c ∈ Rm eine Mannigfaltigkeit definiert ist, sofern die Jacobi-Matrix von f (x) für alle x ∈ Rn regulär ist. Aufgabe 1.12 Zeigen Sie, dass durch z −1 cos(2πt) = sin(2πt) keine Karte für den gesamten Einheitskreis definiert wird. 1.9.3 Bündel Aufgabe 1.13 Bei der Behandlung eines dynamischen Systems der Form ẋi = f i (x, u) mit differentialgeometrischen Methoden unterscheidet man zwischen zwei Beschreibungsformen: Der Beschreibung durch ein Vektorfeld (v = ∂t + f i ∂i ∈ Γ (T (E))) und der sogenannten dualen Beschreibung durch ein System von 1-Formen der Art i dx − f i (x, u) dt . Diskutieren Sie, welche Transformationen der Art z = tz (x, u) , v = tv (x, u) die Struktur der gewählten Darstellung nicht verändern. ( Hinweis: Berechnen Sie jeweils das transformierte System in den neuen Koordinaten) Aufgabe 1.14 Begründen Sie die folgende Ungleichung für Schnitte σ ∈ Γ (E) der Form f i (x, u) ∂i g ◦ σ 6= f i ◦ σ ∂i (g ◦ σ) . 35 1.9. Aufgaben 1. Mathematische Grundlagen Aufgabe 1.15 Begründen Sie, wieso das Vektorfeld (v ∈ T (R3 )) v = a x1 , x2 ∂1 im Bündel ((R3 , ρ31 , R1 )) mit (ρ31 : (x1 , x2 , x3 ) → (x1 )) nicht projizierbar ist, hingegen im Bündel ((R3 , ρ32 , R2 )) mit (ρ32 : (x1 , x2 , x3 ) → (x1 , x2 )) schon. Aufgabe 1.16 Welches der folgenden Vektorfelder v1 = a (x1 , x2 ) ∂1 v2 = a (x1 , x2 ) ∂2 + ∂3 v3 = ∂1 + a (x1 , x2 ) ∂3 ist im Bündel ((R3 , ρ31 , R1 )) mit (ρ31 : (x1 , x2 , x3 ) → (x1 )) vertikal? 36 Kapitel 2 Eingangs/Ausgangslinearisierung Die Methode der Eingangs/Ausgangslinearisierung ist die einfachste differentialgeometrische Methode. Um eine besonders einfache Darstellung zu erhalten, wird der Eingrößenfall zuerst betrachtet. 2.1 Der Eingrößenfall Gegeben sei das System ẋi = f i (t, x, u) , i = 1, . . . , n ṫ = 1 y = c (t, x) (2.1) mit einem Eingang u und einem Ausgang y. Man wählt nun die Bündel (E, π, B) mit lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E) mit lokalen Koordinaten (t, x, u) für Z. Mit dem Vektorfeld f ∈ ρ∗ (T (E)), f = ∂t + f i ∂i hat man nun eine Abbildung f : C ∞ (E) → C ∞ (Z) der Art, dass f (g) für g ∈ C ∞ (E) die Änderung von g entlang von Lösungen von f misst. Für die wiederholte Anwendung von f schreibt man (f )k (g) mit (f )0 (g) = g , (f )k+1 (g) = f f k (g) . Es gelte nun (f )i (c) = hi ∈ C ∞ (E) , i = 0, . . . , r − 1 (f )r (c) = hr ∈ C ∞ (Z) , hr ∈ / C ∞ (E) , und gilt in der Umgebung eines Punktes (t, x, u) noch ∂u hr 6= 0 , dann kann man eine Funktion w (t, x, v) so finden, dass die Gleichung hr (t, x, w (t, x, v)) = v 37 2.1. Der Eingrößenfall 2. Eingangs/Ausgangslinearisierung erfüllt ist. In diesem Fall nennt man r den relativen Grad des Systems (2.1). Mit dem Kartenwechsel ((t, z) , v) = (ϕ (t, x) , ψ (t, x, u)), z i = hi−1 , i = 1, . . . , r j j z = h̄ , j = r + 1, . . . , n v = hr (t, x, u) , (2.2) wobei die Funktionen h̄j ∈ C ∞ (E) so gewählt werden, dass ϕ ein Diffeomorphismus ist, folgt sofort ż i = f (hi−1 ) ◦ ϕ−1 = hi ◦ ϕ−1 = z i+1 , i = 1, . . . , r − 1 ż r = f (hr−1 ) ◦ ϕ−1 = hr ◦ ϕ−1 = v (2.3) j j −1 ż = f h̄ ◦ ϕ . Es muss noch gezeigt werden, dass tatsächlich diese Transformation ein Diffeomorphismus ist. Das System (2.3) kann nun sehr einfach geregelt werden, z.B. mit dem Gesetz r X v=− αi−1 z i + v̄ , (2.4) i=1 Pr i wobei p (s) = i=0 αi s , αr = 1 ein Hurwitz Polynom ist, und v̄ einen zusätzlichen Eingang bezeichnet. Allerdings ist die Regelung nur brauchbar, wenn das System ż j = f h̄j ◦ ϕ−1 t, z, −αi−1 z i + v̄ , j = r + 1, . . . , n (2.5) mit den Eingängen z i , i = 1, . . . , r und v̄ stabil ist. Man könnte nun glauben, dass das Gesetz (2.4) die Stabilität des Systems (2.5) beeinflusst. Betrachte man nun das System ẋi = f i (t, x, u) , i = 1, . . . , n v = hr (t, x, u) , dann folgt für das inverse System ẋi = f i (t, x, w (t, x, v)) , i = 1, . . . , n u = w (t, x, v) . Der Kartenwechsel ((t, z) , v) = (ϕ (t, x) , v) z i = hi−1 , i = 1, . . . , r z j = h̄j , j = r + 1, . . . , n führt zu Das System ż i = f (hi−1 ) ◦ ϕ−1 = hi ◦ ϕ−1 = z i+1 , i = 1, . . . , r − 1 ż r = f (hr−1 ϕ−1 = hr ◦ ϕ−1 = v ) ◦ −1 j j ż = f h̄ ◦ ϕ . ż j = f h̄j ◦ ϕ−1 heißt auch die Nulldynamik des Systems (2.3), und sie ist natürlich unabhängig von (2.4), die ja nur den Eingang betrifft. Ein wichtiger Sonderfall ist, wenn der relative Grad r die Bedingung r = n erfüllt, da es in diesem Fall keine Nulldynamik gibt. In diesem Fall wird das System (2.1) mit dem Kartenwechsel (2.2) in ein lineares und zeitinvariantes übergeführt. Im Fall r ≤ n−1 spricht man von der (exakten) Eingangs-Ausgangs-Linearisierung eines nichtlinearen Systems, im Fall r = n vom Spezialfall der Eingangs-Zustands-Linearsierung. 38 2.2. Tensor Bündel 2.2 2. Eingangs/Ausgangslinearisierung Tensor Bündel Es sei M eine glatte m-dimensionale Mannigfaltigkeit und T (M), T ∗ (M) das Tangentialbzw. das Kotangentialbündel. Die Schnitte v ∈ Γ (T (M)), ω ∈ Γ (T ∗ (M)) erzeugen nun mit der Vorschrift hω, ·i h·, vi : T (M) × T ∗ (M) → C ∞ (M) eine bilineare Abbildung. Man führt nun das neue Symbol ⊗, das Tensorprodukt gemäß der Beziehung (ω ⊗ v) (·, ·) = hω, ·i h·, vi ein. Diese Konstruktion kann direkt auf multilineare Funktionen (T (M))k ×(T ∗ (M))l → C ∞ (M) erweitert werden. Satz 2.1 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Die Menge l Tl k (M) = ∪p∈M (Tp (M))k × Tp∗ (M) k ist das Bündel Tl k (M) , τl,M , M , genannt das Tensorbündel von M mit der Projektion k τl,M . Die typische Faser F ist ein mk+l -dimensionaler Vektorraum. Ein Schnitt von T0k (M) heißt kovariantes Tensorfeld, ein Schnitt von Tl 0 (M) heißt kontravariantes Tensorfeld. Außerdem gilt T01 (M) ∼ = T ∗ (M) und T10 (M) ∼ = T (M). k k Ein Schnitt Φ ∈ Γ T0 (M) , man könnte aber genauso gut T0 (M) wählen, Φ = ⊗ki=1 ω i , kann gemäß der Beziehung S (Φ) = 1 X k ⊗j=1 ω σ(j) k! σ symmetrisch gemacht werden, wobei σ die Permutation von (1, . . . , k) mit (1, . . . , k) → (σ (1) , . . . , σ (k)) bezeichnet. Bezeichnet sgn (σ) das Vorzeichen der Permutation σ, dann ist der zugehörige alternierende Tensor durch 1 X A (Φ) = sgn (σ) ⊗kj=1 ω σ(j) k! σ gegeben. Offensichtlich ist die multilineare Abbildung A (Φ) alternierend. Die symmetrischen und die alternierenden Tensoren bilden ein Unterbündel von T0k (M), die mit S k (T ∗ (M)) bzw. mit ∧k (T ∗ (M)) bezeichnet werden. Vollkommen analoge Überlegungen gelten für Schnitte Φ ∈ Γ (Tk0 (M)), wobei für das zugehörige Bündel ∧k (T (M)) geschrieben wird. Es gelte ϕ ∈ Γ T0k (M) , ψ ∈ Γ T0l (M) , dann kann wieder das Tensorprodukt ⊗ gemäß der Vorschrift ϕ ⊗ ψ (v1 , . . . , vk , vk+1, . . . , vk+l ) = ϕ (v1 , . . . , vk ) ψ (vk+1 , . . . , vk+l ) mit ϕ ⊗ ψ ∈ T0k+l (M) und vi ∈ Γ (T (M)), i = 1, . . . , k + l gebildet werden. Man kann einfach zeigen, dass die Abbildung ⊗ : T0k (M) × T0l (M) → T0k+l (M) bilinear und assoziativ ist. Auch die folgende Definition gilt nun für alternierende Bündel ∧k (T ∗ (M)) oder ∧k (T (M)). 39 2.2. Tensor Bündel 2. Eingangs/Ausgangslinearisierung Definition 2.1 Die Abbildung ∧ : ∧k (T ∗ (M)) × ∧l (T ∗ (M)) → ∧k+l (T ∗ (M)) mit (k + l)! A (ϕ ⊗ ψ) k!l! für ϕ ∈ Γ ∧k (T ∗ (M)) , ψ ∈ Γ ∧l (T ∗ (M)) , heißt das äußere Produkt (oder Grassmann Produkt) von ϕ und ψ. ϕ∧ψ = Das Grassmann Produkt oder äußere Produkt hat nun die folgenden Eigenschaften, wovon man sich durch nachrechnen überzeugt. Satz 2.2 Das Grassmann Produkt, siehe Definition 2.1 ist bilinear and assoziativ. Man benutzt oft die Konvention ∧0 (T ∗ (M)) ∼ = C ∞ (M). Man beachte auch, dass die Bündel ∧k (T ∗ (M)) mit k > m nur den Null-Schnitt als einzigen Schnitt besitzen. Man nennt Schnitte von ∧r (T ∗ (M)) auch r-Formen. Schnitte von ∧r (T (M)) heißen auch r-Vektoren. Wegen ∧1 (T ∗ (M)) ∼ = T ∗ (M) sind Kovektoren 1-Formen. Die Menge aller p-Formen mit p = 1, . . . , m wird auch mit ∧ (T ∗ (M)) bezeichnet. Auf dieser Menge gibt es nun zwei Verknüpfungen +, ∧ : ∧ (T ∗ (M)) × ∧ (T ∗ (M)) → ∧ (T ∗ (M)) so, dass damit eine Algebra definiert wird. Man nennt diese Algebra auch äußere Algebra. Da nun für eine glatte Abbildung f : M → N mit den Mannigfaltigkeiten M, N gilt f ∗ (α ∧ β) = f ∗ (α) ∧ f ∗ (β) für alle α, β ∈ Γ (∧ (T ∗ (N ))) (Bitte nachrechnen!!) folgt, dass f ∗ ein Homomorphismus der äußeren Algebra ist. 2.2.1 Lie-Ableitungen und die Lie-Klammer Es sei M eine glatte m-dimensionale Mannigfaltigkeit mit lokalen Koordinaten (x). Die Lie-Ableitung einer Funktion g ∈ C ∞ (M) entlang eines Feldes v ∈ Γ (T (M)) ist Lv (g) = v (g) . (2.6) Da v der infinitesimale Generator des Flusses ϕε ist, gilt Lv (g) (p) = ∂ε g ◦ ϕε (p)|ε=0 . (2.7) Der Ausdruck Lv (g) (p) misst die Änderung von g an der Stelle p. Dieses geometrische Bild erlaubt nun die Lie-Ableitung eines Feldes w ∈ Γ (T (M)) entlang eines Feldes v ∈ Γ (T (M)) mit Lv (w) (p) = v (w) (p) = ∂ε (w ◦ ϕε (p) − ϕε,∗ (p) (w (p)))|ε=0 (2.8) zu definieren. Man beachte den Term ϕε,∗ (p). Obwohl die Fasern Ep = π −1 (p) von T (M) diffeomorph zur typischen Faser sind, darf man Vektoren die in verschiedenen Fasern liegen nicht vergleichen, wie man es im Rm tut. Dies erklärt nun diesen Term. Darüber hinaus zeigt diese Betrachtung, wie Lie-Ableitungen von Kovektoren oder Tensoren im Prinzip zu bilden sind. 40 2.2. Tensor Bündel 2. Eingangs/Ausgangslinearisierung Es sei f : M → N ein Diffeomorphismus zwischen M und N , dann gelten für g ∈ C ∞ (N ), v, w ∈ Γ (T (M)) die Beziehungen v (f ∗ (g)) = f ∗ (ṽ (g)) bzw. Lv (f ∗ (g)) = f ∗ (Lṽ (g)) v] (w) = ṽ (w̃) bzw. L^ v (w) = Lṽ (w̃) (2.9) mit f ∗ (g) = g ◦ f und ṽ = (f∗ v) ◦ f −1 . Offensichtlich ist diese Lie-Ableitung unabhängig von den speziellen Koordinaten. Der Kommutator oder die Lie-Klammer zweier Felder v, w ∈ Γ (T (M)) ist durch [v, w] (g) = Lv (Lw (g)) − Lw (Lv (g)) (2.10) mit g ∈ C ∞ (M) gegeben. Da der Fluss ϕε mit dem infinitesimalen Generator v ein lokaler Diffeomorphismus ist, folgt Lv (Lw (g)) − Lw (Lv (g)) = ∂ε ((w (g)) ◦ ϕε − (ϕε,∗ w) (g ◦ ϕε ))|ε=0 = ∂ε ((w ◦ ϕε ) − (ϕε,∗ w))|ε=0 (g) = (v (w)) (g) wegen der Gleichungen (2.7, 2.8) und damit [v, w] = Lv (w) (2.11) wegen (2.10). Die Gleichung (2.11) zeigt, dass der Kommutator (2.10) wieder ein Vektorfeld auf M ist. Aus (2.10) und (2.11) folgt, dass die Lie-Klammer eine Abbildung Γ (T (M)) × Γ (T (M)) → Γ (T (M)) ist, die die Beziehungen a) b) c) [λv, µw] = λµ [v, w] + λv (µ) w − µw (λ) v [v, w] = − [w, v] [u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0 (2.12) für alle u, v, w ∈ Γ (T (M)) und λ, µ ∈ C ∞ (M) erfüllt. Die Beziehung c) heißt auch Jacobi Identität. Offensichtlich gibt Gleichung (2.11) eine neue Interpretation der Lie-Ableitung (2.8). Zusätzlich findet man nun eine Darstellung von [v, w] in lokalen Koordinaten. Aus v = v i (x) ∂i , und (2.11) folgt w = w i (x) ∂i (2.13) [v, w] = v w i − w v i ∂i . (2.14) v (g) = w (g) = 0 (2.15) Tangentialvektorfelder sind nun auch Differentialoperatoren. So beschreiben die Felder v, w von (2.13) die beiden linearen partiellen Differentialgleichungen in der gesuchten Funktion g ∈ C ∞ (M). Da nun auch Lw (Lv (g)) = Lv (Lw (g)) = 0 41 2.2. Tensor Bündel 2. Eingangs/Ausgangslinearisierung gelten muss, folgt [v, w] (g) = 0 . (2.16) Man muss nun zwei Fälle unterscheiden. Gilt [v, w] = λv + µw (2.17) mit λ, µ ∈ C ∞ (M), dann implizieren (2.15) die Gleichung (2.16). Ansonsten muss g noch zusätzlich (2.16) erfüllen. Man nennt die Bedingung (2.16) auch eine Integrabilitätsbedingung für (2.15). Ist jedoch (2.17) nicht erfüllt, dann muss man weiter Integrabilitätsbedingungen suchen, indem man alle weiteren Lie-Klammern der Felder v, w, [v, w] usw. bildet. Ein einfaches Dimensionsargument zeigt, dass Integrabilitätsbedingungen nur für dim (M) > 2 auftreten. Man beachte, dass die Lie-Klammer als Lie-Ableitung eines Vektorfeldes (2.8), als Kommutator zweier Differentialoperatoren (2.11), und als Integrabilitätsbedingungen bei Systemen von Differentialgleichungen (2.16) auftritt. Betrachtet man noch die Flüsse ϕε1 , ψε2 erzeugt von den Feldern v, w auf M, dann kann man untersuchen, ob ϕε1 ◦ ψε2 = ψε2 ◦ ϕε1 (2.18) gilt (ε1 , ε2 ) ∈ E ⊂ R2 , (0, 0) ∈ E. Berechnet man die Ableitungen nach ε1 , ε2 , dann folgt die infinitesimale Bedingung [v, w] = 0 . (2.19) Die Flüsse ϕε1 , ψε2 kommutieren genau dann, wenn die Lie-Klammer ihrer Generatoren v, w verschwindet. Nun verfügen wir über die Lie-Ableitung einer Funktion und eines Tangentialvektors. Die Lie-Ableitung eines Kovektors folgt aus der Forderung Lv (hω, wi) = hLv (ω) , wi + hω, Lv (w)i (2.20) für alle w ∈ Γ (T (M)). Den Ausdruck in Koordinaten erhält man mit v = v i ∂i , w = w i ∂i und ω = ωi dxi sowie v (ωi ) w i + ωi v w i = Lv ωi dxi , w + ωi v w i − w v i als Lv ωi dxi = v (ωi ) dxi + ωj ∂i v j dxi . (2.21) Die Definition der Lie-Ableitung einer 1-Form analog zu (2.8) wäre Lv (ω) (p) = v (ω) (p) = ∂ε (ϕ∗ε (ϕε (p)) (ω ◦ ϕε (p)) − ω (p))|ε=0 . Natürlich führen beide Ansätze zum selben Ergebnis. Die Erweiterung der Lie-Ableitung auf Tensoren höherer Stufe erhält man mit der Forderung, dass die Produktregel erfüllt ist. Z.B. für ω ∈ T01 (M), v ∈ T10 (M) folgt Lw (ω ⊗ v) = Lw (ω) ⊗ v + ω ⊗ Lw (v) . Diese Technik kann man natürlich geradlinig erweitern. 42 (2.22) 2.2. Tensor Bündel 2.2.2 2. Eingangs/Ausgangslinearisierung Die äußere Ableitung Wieder sei M eine glatte m-dimensionale Mannigfaltigkeit mit dem Tangentialbündel T (M) und dem Kotangentialbündel T ∗ (M). Für ein Feld v ∈ Γ (T (M)) gilt offensichtlich h·, vi : ∧1 (T ∗ (M)) → ∧0 (T ∗ (M)) = C ∞ (M) . Die Lie-Ableitung einer p-Form ist nun eine Abbildung Lv : ∧p (T ∗ (M)) → ∧p (T ∗ (M)) . Zusätzlich kann man in adaptierten Koordinaten (x, ẋ) mit v = v i ∂i und f ∈ C ∞ (M) die Lie-Ableitung in der Form v (f ) = ∂i f v i = ∂i f dxi , v i ∂i (2.23) mit dem Differential, der 1-Form, ω = ∂i f dxi schreiben. Da nun gilt d : ∧0 (T ∗ (M)) → ∧1 (T ∗ (M)), kann man sich fragen, wie man die Abbildung d von 0-Formen auf p-Formen, p > 1, erweitert. Mit dem speziellen I = i1 , . . . , ip , i1 < i2 < · · · < ip kann man nun jede p-Form ω in Koordinaten in der Form ω = ωI dxI , dxI = dxi1 ∧ dxi2 ∧ · · · ∧ dxip mit ωI ∈ C ∞ (M) schreiben, wobei die Summe über alle möglichen Indizes I zu nehmen ist. Wir erweitern nun die Abbildung d in den speziellen Koordinaten in folgender Form dω = dωI ∧ dxI . Dies ist bereits die gewünschte Erweiterung von d zu p-Formen, und der nachstehende Satz zeigt, dass diese Konstruktion unabhänging von der Wahl der Koordinaten ist. Satz 2.3 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Dann existiert eine wohlbestimmte Abbildung d, die äußere Ableitung, d : ∧p (T ∗ (M)) → ∧p+1 (T ∗ (M)) , p = 0, 1, . . . so, dass folgende Regeln für alle α ∈ Γ (∧p (T ∗ (M))), β ∈ Γ (∧q (T ∗ (M))) gelten. 1. d (α + β) = dα + dβ. 2. d (f ), f ∈ ∧0 (T ∗ (M)) = C ∞ (M) ist das gewöhnliche Differential. 3. d (α ∧ β) = dα ∧ β + (−1)p α ∧ dβ. 4. d2 (α) = d (dα) = 0. 43 2.2. Tensor Bündel 2. Eingangs/Ausgangslinearisierung Der Beweis erfolgt durch Überprüfung mittels eines Kartenwechsels. Die äußere Ableitung ist nun auch mit einer Abbildung f : M → N zwischen zwei Mannigfaltigkeiten M, N in folgender Art df ∗ (ω) = f ∗ (dω) für ω ∈ ∧ (T ∗ (N )) vertauschbar, wobei zu beachten ist, dass dasselbe Symbol d für die äußere Ableitung von ∧ (T ∗ (M)) und von ∧ (T ∗ (N )) verwendet wird. Es verbleibt also noch die Erweiterung der Abbildung h·, vi auf allgemeine p-Formen. Satz 2.4 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Dann existiert genau eine Abbildung iv , das innere Produkt, i : T (M) × ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M)) bzw. iv : ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M)) mit v ∈ Γ (T (M)) und p = 1, 2, . . ., die die nachstehenden Regeln erfüllt. 1. iv+w = iv + iw für v, w ∈ Γ (T (M)). 2. if v = f iv für f ∈ Γ (∧0 (T ∗ (M))). 3. iv (f ) = 0, für f ∈ Γ (∧0 (T ∗ (M))). 4. iv (ω) = hω, vi für ω ∈ Γ (∧1 (T ∗ (M))). 5. iv (ω) = ω (v, ·, . . . , ·) für ω ∈ Γ (∧p (T ∗ (M))), p > 1. Man kann nun einfach zeigen, dass das innere Produkt noch folgendem Satz genügt. Satz 2.5 Es sei M eine glatte m-dimensionale Mannigfaltigkeit und v ∈ Γ (T (M)). Das innere Produkt iv : ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M)) genügt der Beziehung iv (α ∧ β) = iv (α) ∧ β + (−1)p α ∧ iv (β) für alle α ∈ Γ (∧p (T ∗ (M))), β ∈ Γ (∧q (T ∗ (M))). Oft wird für das innere Produkt auch das Symbol ⌋ gemäß der Vereinbarung iv (α) = v⌋α (2.24) geschrieben. Darüberhinaus kann man nun die Erweiterung von (2.23) auf allgemeine p-Formen gemäß der Beziehung v (ω) = d (iv (ω)) + iv (dω) = d (v⌋ω) + v⌋dω . (2.25) angeben, die auch Cartan’s magic formula heißt. Man könnte aus dieser Beziehung zusammen mit der Lie-Ableitung und dem inneren Produkt eine Definition der äußeren Ableitung gewinnen (Wie könnte man das machen ?). 44 2.3. Der Eingrößenfall II 2.3 2. Eingangs/Ausgangslinearisierung Der Eingrößenfall II Für die Eingangs/Ausganglinearisierung im Eingrößenfall bleibt noch zu klären, wann die Transformation Gl. 2.2 ein Diffeomorphismus ist. Es kann nun genau dann ein Diffeomorphismus der Transformation Gl. 2.2 aufgebaut werden, wenn dt ∧ ^r−1 i=0 dhi = dt ∧ ^r−1 i=0 df i (c) = dt ∧ ^r−1 i=0 f i (dc) 6= 0 (2.26) in der Umgebung eines Punktes (t, x) ∈ E gilt. In diesem Fall kann man immer Funktionen h̄j so finden, dass ^n ^r−1 dh̄j 6= 0 df i (c) ∧ dt ∧ j=r+1 i=0 erfüllt ist. Findet man andererseits ein s < r so, dass gilt dt ∧ ^s−1 i=0 df i (c) 6= 0, dt ∧ ^s i=0 df i (c) = 0 , in einer offenen Umgebung U ⊂ E eines Punktes (t, x) ∈ U, dann folgt ^s ^s−1 f dt ∧ df i (c) ∧ df s+1 (c) = 0 . df i (c) = dt ∧ i=0 i=0 In diesem Fall existiert kein Regelgesetz, das zu einem linearen Eingangs/Ausgangsverhalten führt. Verschwindet der Ausdruck auf einer Untermannigfaltigkeit S ⊂ E mit (t, x) ∈ E und dim (S) < dim (E), dann existiert kein relativer Grad. Man kann einfach das Regelgesetz (2.4) in den alten Koordinaten ausdrücken. Da das System (2.1) relativen Grad r besitzt, folgt mit (2.2) lokal die Existenz einer Funktion w, u = w (t, x, v) mit hr (t, x, w (t, x, v)) = v . Damit erhält man sofort aber das (nichtlineare) Regelgesetz ! r−1 X i u = w t, x, − αi h + v̄ i=0 in den ursprünglichen Koordinaten. 2.4 Der Mehrgrößenfall Nun wird das System ẋi = f i (t, x, u) , i = 1, . . . , n y α = cα (t, x) , α = 1, . . . , m (2.27) mit einem Eingang u ∈ Rm und einem Ausgang y ∈ Rm betrachtet. Man wählt nun die Bündel (E, π, B) mit lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E) 45 2.4. Der Mehrgrößenfall 2. Eingangs/Ausgangslinearisierung mit lokalen Koordinaten (t, xi , uα ) für Z. Analog zum Eingrößenfall führt man noch das Vektorfeld f ∈ ρ∗ (T (E)), f = ∂t + f i ∂i ein. Es gelte nun sowie f iα (cα ) = hα,iα ∈ C ∞ (E) , iα = 0, . . . , rα − 1 f rα (cα ) = hα,rα ∈ C ∞ (Z) , hα,rα ∈ / C ∞ (E) , ∂ (2.28) ∂uα in der Umgebung eines Punktes (t, x, u). Dann nennt man (rα ) den vektoriellen relativen Grad und m X r= rα det ([∂β hα,rα ]) 6= 0 , ∂α = α=1 den relativen Grad des Systems (2.27). Wegen obiger Bedingung existieren lokal Funktionen w α so, dass hα,rα ((t, x, w (t, x, v))) = v α gilt. Mit dem Kartenwechsel (t, z iα , v α ) = ϕ (t, x, u) = (t, ϕi (t, x) , ϕu (t, x, u)), z α,iα = hα,iα −1 , iα = 1, . . . , rα j j z = h̄ , j = r + 1, . . . , n v α = hα,rα (t, x, u) (2.29) wobei die Funktionen h̄j , so gewählt werden, dass ϕ ein Diffeomorphismus ist, folgt sofort ż α,iα = hα,iα ◦ ϕ−1 = z α,iα +1 , iα = 1, . . . , rα − 1 ż α,rα = hα,rα ◦ ϕ−1 = v α ż j = f h̄j ◦ ϕ−1 . (2.30) Das System (2.27) kann nun wieder sehr einfach geregelt werden, zB. mit dem Gesetz rα X α αiαα −1 z α,iα + v̄ α , v =− (2.31) iα =1 Pr wobei die Polynome pα (s) = i=0 αiα si , αrα = 1 Hurwitz Polynome sind, und v̄ α zusätzliche Eingänge bezeichnet. Die Untersuchungen betreffend die Existenz der Transformation (2.30) unterscheiden sich nicht vom Eingrößenfall. Auch die Analyse der Nulldynamik kann geradlinig übertragen werden. Sie ist natürlich wieder durch das Regelgesetz (2.31) nicht beeinflussbar. Neu im Mehrgrößenfall ist, dass die Matrix (2.28), bei AI-Systemen wird sie als Entkopplungsmatrix bezeichnet, im Allgemeinen nicht regulär ist. Dies kann oftmals durch Vorschalten eines geeigneten dynamischen Systems erreicht werden. Da hier dieser Fall nicht weiter untersucht wird, sei auf die Literatur verwiesen. Ein wichtiger Sonderfall ist, wenn der relative Grad r die Bedingung r = n erfüllt, da es in diesem Fall keine Nulldynamik gibt. In diesem Fall wird das System (2.27) mit dem Kartenwechsel (2.29) in ein lineares und zeitinvariantes übergeführt. Man nennt dann das System (2.30) mit verschwindender Nulldynamik auch Brunovsky Normalform. 46 2.5. Schlussbemerkungen 2.5 2. Eingangs/Ausgangslinearisierung Schlussbemerkungen Die Methode der Eingangs/Ausgangslinearsierung findet man z.B. in [8, 13, 17] ausführlich, wobei aber vornehmlich AI-Systeme betrachtet werden. Da sich aber die theoretischen Überlegungen im allgemeineren Fall nicht von jenen des spezielleren unterscheiden, ist in diesem Kapitel gleich der allgemeinere Fall behandelt worden. In der oben zitierten Literatur findet man auch den Fall einer singulären Entkopplungsmatrix und Algorithmen, diesen Defekt zu beheben, falls dies möglich ist. 47 Kapitel 3 Erreichbarkeit und Beobachtbarkeit Gegeben sei das System ẋi = f i (t, x, u) , i = 1, . . . , n ṫ = 1 y α = cα (t, x, u) , α = 1, . . . , ny (3.1) mit dem Eingang (uς ), ς = 1, . . . , nu und einem Ausgang y. Man wählt nun wieder die Bündel (E, π, B) mit lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E) mit lokalen Koordinaten (t, x, u) für Z. Ebenso gilt f ∈ ρ∗ (T (E)) mit f = ∂t + f i ∂i . Betrachtet man nun die beiden Systeme x̄˙ i x̄˙ j ṫ yα sowie = = = = x̄˙ j x̄˙ i ṫ yα f i (t, x̄1 , . . . , x̄n , u) , f j (t, x̄m+1 , . . . , x̄n ) , 1 cα (t, x̄1 , . . . , x̄n , u) = = = = i = 1, . . . , m j = m + 1, . . . , n (3.2) α = 1, . . . , ny f j (t, x̄1 , . . . , x̄m , u) , j = 1, . . . , m f i (t, x̄1 , . . . , x̄n , u) , i = m + 1, . . . , n 1 cα (t, x̄1 , . . . , x̄m , u) , α = 1, . . . , ny , (3.3) dann ist einfach zu sehen, dass das System (3.2) nicht erreichbar, und dass das System (3.3) nicht beobachtbar ist. Es bleibt also das Problem zu lösen, ob man das System (3.1) mit der Transformation x̄ = ϕ (t, x) , die weder die Zeit, Eingang oder Ausgang verändert, auf die Formen (3.2) oder (3.3) überführen kann. Dazu werden noch einige Ergebnisse aus der Theorie der partiellen Differentialgleichungen benötigt. 48 3.1. Distributionen und die Sätze von Frobenius 3.1 3. Erreichbarkeit und Beobachtbarkeit Distributionen und die Sätze von Frobenius Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M sowie ein Tangentialvektorfeld v ∈ Γ (T (M)), das den lokalen Fluss ϕε (p) erzeugt. In der Umgebung Up von p und für ε ∈ I = (ε1 , ε2), ε1 < 0 < ε2 ist ϕε (p) ∩ Up = Sp eine reguläre 1-dimensionale Untermannigfaltigkeit, die der Bedingung Tϕε (p) (Sp ) = span {v (ϕε (p))} (3.4) genügt, wobei span {v (p)} ⊂ Tp (M) den durch v am Punkt p aufgespannten linearen Unterraum bezeichnet. Man nennt ϕε (p) auch Integralkurve und Sp auch Integralmannigfaltigkeit von v. Man beachte, dass man ein und dieselbe Integralmannigfaltigkeit mit verschiedenen Integralkurven beschreiben kann. Diese Betrachtung kann nun folgendermaßen auf höher dimensionale Untermannigfaltigkeiten übertragen werden. Definition 3.1 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Tangentialbündel T (M). Eine Vorschrift, die jedem Punkt x ∈ Up ⊂ M einer offenen Umgebung Up des Punktes p einen linearen Vektorraum ∆x ⊂ Tx (M) zuweist, heißt (lokale) Distribution ∆. Die Distribution ∆ heißt regulär am Punkt p, falls dim (∆p ) = dim (∆x ) für alle x ∈ Up gilt. Die Distribution ∆ heißt glatt, wenn glatteVektorfelder vk ∈ Γ (T (M)) so existieren, dass ∆p = span {vk } , k = 1, . . . , n gilt. Die Übertragung des eindimensionalen Problems auf den mehrdimensionalen Fall gelingt dann folgendermaßen: Gegeben sei eine (reguläre) und (glatte) Distribution ∆, dim (∆) = n gemäß Definition 3.1. Nun stellt man sich die Frage, ob dazu eine ndimensionale Untermannigfaltigkeit Sp so existiert, dass Tx (Sp ) = ∆x , ∀x ∈ Up ∩ Sp (3.5) gilt. Falls Sp existiert, nennt man Sp eine Integralmannigfaltigkeit. Für das Weitere wird nachfolgende Definition benötigt. Definition 3.2 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Tangentialbündel T (M). Eine glatte Distribution ∆ heißt involutiv, falls [vi , vj ] ∈ ∆ für alle vi , vj ∈ ∆ gilt. Involutive und glatte Distributionen besitzen nun lokale Integralmannigfaltigkeiten. 49 3.1. Distributionen und die Sätze von Frobenius 3. Erreichbarkeit und Beobachtbarkeit Satz 3.1 Es sei M eine glatte m-dimensionale Mannigfaltigkeit und ∆ = span {v1 , . . . , vn } eine involutive glatte Distribution, die auf Up regulär mit dim (∆) = n ist. Dann existiert eine n-dimensionale Integralmannigfaltigkeit Sp so, dass die Beziehung 3.5 erfüllt ist. Weiters kann man m − n Funktionen f i+n mit f i+n (x) = 0 , und i = 1, . . . , m − n m−n ^ i=1 finden. df i+n 6= 0 Der Beweis dieses Satzes, er heißt auch Satz von Frobenius, erfolgt nun in zwei Schritten. Die Distribution ∆ erfülle zusätzlich noch die Bedingung [vi , vj ] = 0 , (3.6) dann kommutieren alle Flüsse ϕiεi , oder es gilt ϕi ◦ ϕj = ϕj ◦ ϕi , i, j = 1, . . . , n . Die Abbildung U n → M, U ⊂ R, x = ϕ1ε1 ◦ · · · ◦ ϕnεn (p) beschreibt damit bereits die Integralmannigfaltigkeit wegen j+1 n n 1 ∂εj ϕjεj ◦ ϕ1ε1 ◦ · · · ϕεj−1 j−1 ◦ ϕεj+1 ◦ · · · ◦ ϕεn (p) = vj ϕε1 ◦ · · · ◦ ϕεn (p) = vj (x) in parametrisierter Form. Ist nun die Beziehung (3.6) nicht erfüllt, sondern es gilt [vi , vj ] = λkij vk , k = 1, . . . , n , dann existiert eine lineare Transformation wi = aji vj so, dass wij = δji gilt. Nun gilt aber δll̄ [wi , wj ]l = δll̄ λkij wkl 0 = λkij , und die Distribution span {w1 , . . . , wn } erfüllt (3.6). Damit ist aber bereits der erste Teil des Satzes 3.1 gezeigt. Der Beweis des zweiten Teils erfolgt später. Das folgende Theorem ist noch die Verallgemeinerung des Flow Box Theorems. 50 3.1. Distributionen und die Sätze von Frobenius 3. Erreichbarkeit und Beobachtbarkeit Satz 3.2 Es seien ϕiεi : I × M → M, i = 1, . . . , n (lokale) glatte Flüsse auf einer mdimensionalen glatten Mannigfaltigkeit M. Die Umgebung Up von p ∈ M gehöre zur Definitionsmenge von ϕi , und es gelte ϕi ◦ ϕj = ϕj ◦ ϕi , i, j = 1, . . . , n. Dann existieren Koordinaten (x) = (x1 , . . . , xn ) nahe p so, dass ϕε = ϕ1ε1 ◦ · · · ◦ ϕnεn , ε = ε1 , . . . , εn in diesen Koordinaten durch ϕ̄ε = x1 + ε1 , . . . , xn + εn , xn+1 , . . . , xm gegeben ist. Zum Beweis des Satzes 3.2 wähle man Koordinaten (y) so, dass die Darstellung ϕ̃ε von ϕε der Bedingungen ! ∂ 0 = ψ (p) , rank ϕ̃ε (y) =n ∂ε ε=0,y=0 genügt, was immer möglich ist. Man überzeugt sich nun wieder leicht, dass die Abbildung f, y = f (x) = ϕ̃x1 ,...,xn 0, . . . , 0, xn+1, . . . , xm ein Diffeomorphismus ist, und dass ϕε in diesen Koordinaten das Aussehen ϕε (x) = f −1 ◦ ϕ̃ε ◦ f (x) = f −1 ◦ ϕ̃ε1 +x1 ,...,εn+xn 0, . . . , 0, xn+1 , . . . , xm = ε1 + x1 , . . . , εn + xn , xn+1 , . . . , xm hat. Falls eine Distribution ∆ nicht involutiv ist, kann man einfach die involutive Hülle ¯ ∆ von ∆, die bezüglich der Dimension kleinste involutive Distribution, konstruieren, die ¯ erfüllt. Mit der Abkürzung ∆⊂∆ [∆, ∆] = span {[vi , vj ]} , vi , vj ∈ ∆ liefert die Vorschrift ∆0 = ∆ , ∆k+1 = ∆k + [∆k , ∆k ] (3.7) ¯ = ∆k , falls k der Bedingung die involutive Hülle ∆ ∆k−1 ⊂ ∆k , ∆k = ∆k+1 genügt. Es gibt nun auch eine sogenannte duale Version der Definition 3.1. Dazu nachstehende Definition. Definition 3.3 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Kotangentialbündel T ∗ (M). Eine Vorschrift, die jedem Punkt x ∈ Up ⊂ M einer offenen Umgebung Up des Punktes p einen linearen Vektorraum ∆∗x ⊂ Tx∗ (M) 51 3.1. Distributionen und die Sätze von Frobenius 3. Erreichbarkeit und Beobachtbarkeit zuweist, heißt (lokale) Kodistribution ∆∗ . Die Kodistribution ∆∗ heißt regulär am Punkt p, falls dim ∆∗p = dim (∆∗x ) für alle x ∈ Up gilt. Die Kodistribution ∆∗ heißt glatt, wenn Kovektorfelder ω k ∈ Γ (T ∗ (M)) so existieren, dass ∆∗p = span ω k , k = 1, . . . , n gilt. Für das Weitere von Bedeutung sind Distributionen und Kodistributionen, wie sie nachstehend definiert werden. Definition 3.4 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Tangential- und Kotangentialbündel T (M), T ∗ (M). Der Annihilator einer regulären Distribution ∆ (Kodistribution ∆∗ ) ist jene bezüglich der Dimension maximale Kodistribution ∆∗ (maximale Distribution ∆), die für alle ω ∈ ∆∗ , (v ∈ ∆) die Bedingung hω, vi = 0 , ∀v ∈ ∆, erfüllt. Da nun ∆p = span {v1 (p) , . . . , vn (p)}, (∆∗p = span {ω 1 (p) , . . . , ω n (p)}) mit dim (∆p ) = n (dim ∆∗p = n) gilt, dann folgt für ∆∗ = span {ω n+1, . . . , ω m } (∆ = span {vn+1 , . . . , vm }) mit dim ∆∗p = m − n, (dim (∆p ) = m − n). Der Annihilator einer Distribution ∆ (Kodistribution ∆∗ ) wird oftmals mit ∆⊥ , (∆∗,⊥ = (∆∗ )⊥ ) bezeichnet. Von besonderem Interesse sind involutive Kodistributionen. Definition 3.5 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Kotangentialbündel T ∗ (M). Eine reguläre Kodistribution ∆∗ heißt involutiv, falls ihr Annihilator (∆∗ )⊥ involutiv ist. Mit Hilfe der Beziehung dω (v, w) = v (hω, wi) − w (hω, vi) − hω, [v, w]i (3.8) zeigt man nun einfach den nachstehenden Satz. Satz 3.3 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit kih ∗ ∗ rem Kotangentialbündel T (M). Eine glatte und reguläre Kodistribution ∆ = span ω , k = n + 1, . . . , m mit dim (∆∗ ) = m − n ist genau dann involutiv, wenn 1-Formen αji so existieren, dass dω i = αji ∧ ω j , i, j = n + 1, . . . , m gilt. 52 3.2. Beobachtbarkeit 3. Erreichbarkeit und Beobachtbarkeit Wegen Definition 3.5 und Gl. 3.8 folgt dω (v, w) = 0 , ∀v, w ∈ (∆∗ )⊥ . Damit folgt aber schon Satz 3.3, da eine Basis des linearen Teilraums aller 2-Formen Ω ∈ ∧2 Tp∗ (M) , für den gilt Ω (v, w) = 0 , ∀v, w ∈ ∆∗p ⊥ , durch αji ∧ ω j mit beliebigen 1-Formen gegeben ist. Naheliegend, aber wert zu zeigen, ist der folgende Satz. Satz 3.4 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Kotangentialbündel T ∗ (M) und eine involutive und reguläre Kodistribution ∆∗ = k span ω , k = n + 1, . . . , m mit dim ∆∗p = m − n. Dann existieren m − n Funktionen f i in der Nähe von p so, dass ∆∗ = span df n+1 , . . . , df m gilt. Wegen Satz 3.2 hat der Annihilator (∆∗ )⊥ von ∆∗ in den speziellen Koordinaten die Form (∆∗ )⊥ = span {∂i } , i = 1, . . . , n . ⊥ ∗ ⊥ Mit (∆ ) = ∆∗ und ⊥ (∆∗ )⊥ = span dy i , i = n + 1, . . . , m folgt sofort Satz 3.4. Dieser Satz heißt ebenfalls Satz von Frobenius. Damit ist auch der zweite Teil von Satz 3.1 gezeigt. Abschließend soll noch die duale Version zu Gl. 3.7 hergeleitet werden. Mit ∆⊥ k folgt aus ⊥ ∆⊥ k+1 = (∆k + [∆k , ∆k ]) wegen Gl. 3.8 sofort ⊥ j 1 ∗ ∆⊥ . k+1 = span ω ∈ ∆k | dω = αj ∧ ω , αj ∈ Γ ∧ (T (M)) Mit dieser Vorschrift kann man ebenfalls die involutive Hülle zu einer Kodistribution berechnen. 3.2 Beobachtbarkeit Betrachtet wird wieder das System ẋi = f i (t, x, u) ṫ = 1 α y = cα (t, x, u) 53 (3.9) 3.2. Beobachtbarkeit 3. Erreichbarkeit und Beobachtbarkeit π definiert auf dem Bündel E → B mit den Koordinaten (t), (t, xi ), i = 1, . . . , n für B, ρ E und t, xi , ṫ, ẋi , für T (E). Ein Regelgesetz ist dann ein Schnitt σ von Z → E mit den Koordinaten (t, xi , uς ), ς = 1, . . . , m für Z. Für die Funktionen cα der Ausgänge (y α ), α = 1, . . . , ny gelte ohne Einschränkung der Allgemeinheit, dass sie funktional unabhängig sind. Man wählt nun einen Zeitpunkt t1 ∈ R, ein hinreichend kleines Intervall T = [t1 , t2 ), t2 > t1 und einen Schnitt σ ∈ Γ (Z), wobei γ ∈ Γ (E) eine Lösung von (3.9) für u = σ ◦ γ ist, bzw. es gilt ∂t x ◦ γ (t) = f ◦ σ ◦ γ (t) (3.10) y (t) = c ◦ σ ◦ γ (t) . Definition 3.6 Das System (3.9) heißt (lokal) beobachtbar entlang einer Trajektorie γ, siehe (3.10), falls man x ◦ γ (t1 ) aus der Kenntnis des Systems (3.9) und von y (t) = c ◦ σ ◦ γ (t), u (t) = σ ◦ γ (t), t ∈ T eindeutig bestimmen kann. Mit f = ∂t + (f i ◦ σ) ∂i ∈ T (E) gilt nun y α (t) = cα ◦ σ ◦ γ ∂t y α (t) = f (cα ◦ σ) ◦ γ .. . ∂tlα −1 y α (t) = f lα −1 (cα ◦ σ) ◦ γ . Gelingt es, ein Gleichungssystem y 1 (t) = .. . l1 −1 1 ∂t y (t) = .. . ny y (t) = .. . lny −1 ny ∂t y (t) = c1 ◦ σ (t, x) f l1 −1 c1 ◦ σ (t, x) cny ◦ σ (t, x) f lny −1 (cny ◦ σ (t, x)) P y lα = n funktional unabhängigen rechten Seiten zu konstruieren, dann ist wegen mit nα=1 Satz 4.10 der Zustand x lokal bestimmbar. Zur weiteren Untersuchung werden die Kodistributionen kα α ∆∗,k = span df i (cα ◦ σ) i=0 , α ny M kα i α ∗ (3.11) span df (c ◦ σ) i=0 ∆ k1 , . . . , kny = span ({dt}) ⊕ α=1 und die daraus abgeleiteten Formen Ωα (kα ) = k^ α −1 l=0 Ω k1 , . . . , kny = dt ∧ 54 df l (cα ◦ σ) ny ^ α=1 Ωα 3.2. Beobachtbarkeit 3. Erreichbarkeit und Beobachtbarkeit eingeführt. Wieder gelte, dass die Funktionen cα ◦ σ funktional unabhängig sind. Sind die Beziehungen Ω k1 , . . . , kny ∧ df kα (cα ◦ σ) = 0 , α = 1, . . . , ny auf einer offenen Umgebung von (t, x) erfüllt, dann sind die Funktionen f kα (cα ◦ σ), α = 1, . . . , ny funktional abhängig. Die Rechnung f Ω ∧ df kα (cα ◦ σ) = f (Ω) ∧ df kα (cα ◦ σ) +Ω ∧ df kα +1 (cα ◦ σ) | {z } =0 (warum?) zeigt dann die funktionale Abhängigkeit der Funktionen f kα +k (cα ◦ σ), k ≥ 0. Damit bringt das weitere Differenzieren der Ausgänge keine neue Information mehr. Es ∗ bezeichne von nun an ∆ l1 , . . . , lny obige Kodistribution maximaler Dimension. Gilt nun dim ∆∗ l1 , . . . , lny = n + 1, dann ist obiges Gleichungssystem lokal nach x auflösbar. Aus diesen Überlegungen folgt nun unmittelbar der folgende Satz. entlang der Trajektorie γ, wenn es ein Satz 3.5 Das System (3.9) ist lokal beobachtbar ∗ t ∈ T so gibt, dass dim ∆ l1 , . . . , lny = n + 1 am Punkt γ (t) gilt. Dieser Satz kann noch verschärft werden. Satz 3.6 Für das System (3.9) gelte, die Kodistribution ∆∗ l1 , . . . , lny sei regulär entlang der Trajektorie γ. Das System (3.9) ist genau dann lokal beobachtbar entlang der Trajektorie γ, wenn dim ∆∗ l1 , . . . , lny = n + 1 auf γ gilt. = s+ Um diesen Satz zu zeigen, muss man nur mehr den Fall dim ∆∗ l1 , . . . , lny ∗ 1 < n + 1 betrachten. Die Kodistribution ∆ l1 , . . . , lny ist definitionsgemäß regulär und involutiv. Daher existiert eine Basis des (n − s)-dimensionalen Annihilators ∆ = ⊥ = span ({vi }), i = s + 1, . . . , n so, dass für deren Elemente [vi , vj ] = 0 ∆∗ l1 , . . . , lny gilt. Nun betrachte man die Koordinatentransformation (t, x) = φ (t, x̄), (t, x) = ϕx̄s+1 ◦ · · · ◦ ϕx̄n ◦ ψ t, x̄1 , . . . , x̄s . Der vom Feld vi , i = s + 1, . . . , n erzeugte (vertikale) Fluss wird mit ϕx̄i bezeichnet. Die Menge ψ (t, x̄1 , . . . , x̄s ) sei eine reguläre Untermannigfaltigkeit U ⊂ X mit vi 6∈ T (U). j ∗ Man beachte, dass für ω ∈ ∆ l1 , . . . , lny gilt vi ω j ∈ ∆∗ , und zusätzlich vi (ω j ) = 0, falls dω = 0 gilt. Aus der Beziehung 0 = f vi ⌋ω j = [f, vi ]⌋ω j + vi ⌋f ω j , folgt [f, vi ] ∈ ∆ . Offensichtlich erfüllen die Funktionen f l (cα ◦ σ) ◦ φ, l = 0, 1 . . . die Beziehungen ∂ī f l (cα ◦ σ) ◦ φ = φ∗ (vi ⌋df (cα ◦ σ)) = 0 . 55 3.2. Beobachtbarkeit 3. Erreichbarkeit und Beobachtbarkeit Das transformierte System hat die Gestalt ˙x̄ī = ∂t φ̄ī ◦ σ + ∂k φ̄ī f k ◦ σ ◦ φ ṫ = 1 y = φ∗ (cα ◦ σ) , α wobei (t, x̄) = φ̄ (t,x) die zu φ inverse Transformation bezeichnet. Weiters existiert ein ω j ∈ ∆∗ l1 , . . . , lny , dω = 0 so, dass j̄ j̄ k j ¯ ∂ī f = ∂ī ∂t φ̄ ◦ σ + ∂k φ̄ f ◦ σ ◦ φ = φ∗ vi f ⌋ω j gilt (warum?). Damit folgt aber ∂ī f¯j = φ∗ [vi , f ]⌋ω j + f ⌋vi ω j =0 wegen oben. Also hat das transformierte System die Gestalt x̄˙ j = f¯j t, x̄1 , . . . , x̄s , j = 1, . . . , s x̄˙ i = f¯i t, x̄1 , . . . , x̄s , x̄s+1 , . . . , x̄n , i = s + 1, . . . , n ṫ = 1 α y = c̄α t, x̄1 , . . . , x̄s . Da dieses System aber sicher nicht beobachtbar ist, ist damit Satz 3.6 gezeigt. Der Begriff der Beobachtbarkeit entlang einer Trajektorie bezieht sich auf Eigenschaften des Systems (3.1) und einer speziellen Lösung γ und σ. Als nächstes wird nun die lokale Beobachtbarkeit an einem Punkt untersucht. Definition 3.7 Das System (3.9) heißt (lokal) beobachtbar in der Umgebung von (t, x), falls es ein σ ∈ Γ (Z) so gibt, dass zu jedem ε > 0 eine Trajektorie γ (τ ), τ ∈ [t, t + ε) existiert, entlang der das System (3.9) lokal beobachtbar ist. Da nun der Schnitt σ nicht bekannt ist, führen wir das erweiterte Feld fe = ∂t +f i ∂i +uςi ∂ςi ein, wobei dann alle weiteren Rechnungen auf einer Mannigfaltigkeit mit den Koordinaten (t, xi , uςk ), i, k = 1, . . . , n erfolgen. Die Bedeutung der Koordinaten uςi zeigt die nachfolgende Rechnung uς (t) = σ ς ◦ γ (t) ∂t uς (t) = uς1 (t) = fe (σ ς ) ◦ (γ (t) , u (t)) .. . ς ς ∂t uk−1 (t) = uk (t) = fek (σ ς ) ◦ (γ (t) , u (t) , . . . , uk−1 (t)) . 56 3.2. Beobachtbarkeit 3. Erreichbarkeit und Beobachtbarkeit Mit der Abkürzung γe (t) = (γ (t) , u (t) , . . . , uk−1 (t)) folgt noch y α (t) = cα ◦ γe ∂t y α (t) = f (cα ) ◦ γe .. . lα −1 α ∂t y (t) = f lα −1 (cα ) ◦ γe . Im Prinzip kann man nun fast so vorgehen wie vorher, man muss jedoch berücksichtigen, dass die Funktionen uςk (t) nicht bekannt sind. Dazu betrachte man die Kodistributionen kα α ∆∗,k = span dfei (cα ) i=0 α ∆∗e k1 , . . . , kny = span ({dt}) ⊕ span {duςk }ς=1,...,m, k=0,...,n−1 ⊕ ∗ ny M span α=1 dfei (cα ) i=0,...,kα (3.12) Wieder bezeichne ∆ l1 , . . . , l ny obige Distribution maximaler Dimension. Ist nun die ∗ Beziehung dim ∆ l1 , . . . , lny = n + 1 + m · n erfüllt, dann gibt es Werte uςk = uςk (t) zum Zeitpunkt t so, dass das Gleichungssystem y 1 (t) = .. . l1 −1 1 ∂t y (t) = .. . y ny (t) = .. . lny −1 ny ∂t y (t) = c1 (t, x, u) fel1 −1 c1 (t, x, u) cny (t, x, u) lny −1 fe (cny (t, x, u)) wegen des Satzes 4.10 lokal nach x auflösbar ist. Aus diesen Überlegungen folgt nun unmittelbar der folgende Satz. Satz 3.7 Das System (3.9) ist lokal beobachtbar am Punkt (t, x), wenn dort die Beziehung ∗ dim ∆e k1 , . . . , kny = n + 1 + m · n, siehe (3.12), erfüllt ist. Auch dieser Satz kann noch verschärft werden. Man beachte, dass hier für den Annihilator ⊥ ∆ = ∆∗e l1 , . . . , lny = span ({vi }) im Allgemeinen vi 6∈ T (E) gilt, da die Komponenten der Felder auch von uςk abhängen können. Will man das vermeiden, dann beachte man, dass wegen der Bedingung 0 = ∂ςk vi ⌋ω j = ∂ςk (vi )⌋ω j + vi ⌋∂ςk ω j , | {z } =0 r für ein ω j ∈ ∆∗e l1 , . . . , lny auch noch vi ⌋ ∂ςk (ω j ) = 0, r = 1, . . . gelten muss, damit ∂ςk (vi ) = 0 gilt. Mit dieser Überlegung und der Bezeichnung ∆∗e,u l1 , . . . , l n y = m X n X σ=1 k=0 57 ∂ςk ∆∗e,u l1 , . . . , lny 3.3. Erreichbarkeit 3. Erreichbarkeit und Beobachtbarkeit gelangt man unmittelbar zu nachfolgendem Satz. Satz 3.8 Für das System (3.9) gelte, die Kodistribution ∆∗e,u l1 , . . . , lny ist regulär am ⊥ = n − s > 0, dann ist das System (3.9) dort Punkt (t, x). Gilt dim ∆∗e,u l1 , . . . , lny nicht lokal beobachtbar. Anderenfalls ist es in der Umgebung von (t, x) lokal beobachtbar. Auf den Beweis dieses Satzes kann hier verzichtet werden, da er fast identisch mit dem des Satzes 3.6 ist. Schlussendlich findet man dann für das System (3.9) die Darstellung x̄˙ j = f¯j t, x̄1 , . . . , x̄s , u x̄˙ i = f¯i t, x̄1 , . . . , x̄s , x̄s+1 , . . . , x̄n , u ṫ = 1 α y = c̄α t, x̄1 , . . . , x̄s , u . 3.3 Erreichbarkeit Die Erreichbarkeit des Systems (3.1) wird analog zur Beobachtbarkeit behandelt. Man wählt wieder einen Zeitpunkt t1 ∈ R, ein hinreichend kleines Intervall T = [t1 , t2 ], t2 > t1 und einen Schnitt σ ∈ Γ (Z), der Gl. (3.10) erfüllt, und definiert nun die lokale Erreichbarkeit folgendermaßen. Definition 3.8 Das System (3.9) heißt (lokal) erreichbar entlang einer Trajektorie γ, siehe (3.10), wenn zu x ◦ γ (t2 ) eine offene Umgebung U so existiert, dass zu jedem x̂ ∈ U eine Trajektorie γ̂ so existiert, dass x ◦ γ (t1 ) = x ◦ γ̂ (t1 ), x̂ = x ◦ γ̂ (t2 ) gilt. Für das Weitere benötigt man nun eine Regularitätsannahme. Es wird angenommen, dass um γ (t), t ∈ (t1 , t2 ) eine offene Umgebung Uγ so existiert, dass bei beschränktem Eingang durch jeden Punkt dieser Menge eine Trajektorie verläuft und in dieser Menge verbleibt. Will man nun überprüfen, ob das System (3.1) obige Eigenschaft hat, muss man ein nichtlineares Zweipunkt-Randwertproblem lösen. Mit Hilfe des Satzes 4.12 könnte man nun einen Test für das linearisierte System konstruieren. Der Nachteil dieser Vorgehensweise ist aber, dass Satz 4.12 nur hinreichend ist. Daher wird eine andere Methode benötigt, und wir deformieren die Trajektorie γ mittels einer Abbildung, einem Fluss ϕ, t=t xi = ϕiε (t, x, u) uς = ϕςε (t, x, u) , (3.13) für dessen infinitesimalen Generator v = v i ∂i + v ς ∂ς gilt v ∈ T (Z). Nun betrachte man die Menge aller Abbildungen ϕ. Da ϕ Trajektorien auf Trajektorien abbildet, muss ϕiε unabhängig von u sein. Zwei Trajektorien γ, γ̂ werden nun als äquivalent angesehen, wenn γ̂ i = ϕiε ◦ γ für ein ϕε gilt. Dadurch wird eine Äquivalenzrelation R auf Uγ ⊂ E eingeführt, wobei [γ] die Äquivalenzklasse von γ und E/R den Quotienten bezeichnen. Offensichtlich ist das System (3.9) genau dann lokal erreichbar entlang γ, wenn [γ] (t2 ) eine offene Umgebung von x̂ beinhaltet. Wir nehmen nun an, dass die Äquivalenzklassen 58 3.3. Erreichbarkeit 3. Erreichbarkeit und Beobachtbarkeit [γ] lokal reguläre Untermannigfaltigkeiten von Uγ bilden (Dies muss nachgewiesen werden, siehe den Abschnitt Aufgaben). In diesem Fall gibt es aber Funktionen g ∈ C ∞ (E) so, dass bzw. lokal g ◦ ρ ◦ ϕε = 0 (3.14) v i ∂i g = 0 ∂ς g = 0 (3.15) gilt. Es verbleibt nun die Aufgabe, diese Funktionen zu bestimmen. Da die Abbildung (3.13) Trajektorien auf Trajektorien abbilden muss, gilt ∂t ϕiε ◦ σ ◦ γ (t) = f i ◦ ϕε ◦ σ ◦ γ (t) bzw. und für ε → 0 ∂ε ∂t ϕiε ◦ σ ◦ γ (t) = ∂ε f i ◦ ϕε ◦ σ ◦ γ (t) ∂t v i ◦ ϕε ◦ σ ◦ γ (t) = ∂j f i v j + ∂ς f i v ς ◦ ϕε ◦ σ ◦ γ (t) f v i = ∂j f i v j + ∂ς f i v ς mit f = ∂t + f i ∂i , wobei diese Beziehung wieder entlang von (beliebigen) Trajektorien γ auszuwerten ist. Aus (∂i g) f v i = ∂i g ∂j f i v j + ∂ς f i v ς f ∂i gv i −v i f (∂i g) = ∂i g∂j f i v j + ∂i g∂ς f i v ς | {z } =0 folgt nun wegen (3.15) v i f (∂i g) + (∂j g) ∂i f j + v ς ∂i g∂ς f i = 0 . Weil diese Gleichung aber für beliebige Trajektorien und deren Deformationen und damit für beliebige v i , v τ halten muss, folgt ∂i g∂ς f i = 0 f (∂i g) = −∂j g∂i f j . Da (3.16) nun ebenfalls entlang beliebiger Trajektorien gilt, folgt f ∂i g∂ς f i = 0 f (∂i g) ∂ς f i + ∂i gf ∂ς f i = 0 ∂i g f ∂ς f i − ∂ς f k ∂k f i = 0 ∂i g [f, [∂ς , f ]]i = 0 , 59 (3.16) (3.17) 3.3. Erreichbarkeit 3. Erreichbarkeit und Beobachtbarkeit wobei (3.17) und die Beziehung [∂ς , f ] = ∂ς f k ∂k benutzt wurden. Mit der Abkürzung folgt nun ad0v (w) = w l adl+1 v (w) = v, adv (w) dg, ad0f (∂ς ) = 0 dg, ad1f (∂ς ) = 0 . Da nun diese Beziehungen wieder entlang von Trajektorien halten müssen, folgt dg, adkf (∂τ ) = 0 , k = 0, 1, . . . . Da eine Funktion g nur existieren kann, wenn die Distribution ∆l = l X span k=0 m adkf (∂ς ) ς=1 involutiv ist, wird mit f, ∆l ⊂ ∆l (3.18) der bezüglich l kleinste involutive Abschluss der Distribution ∆l bezeichnet, die obiger Bedingung genügt. Damit kommt man direkt zum nachstehenden Satz. Satz 3.9 Das System (3.9) ist (lokal) erreichbar entlang einer Trajektorie γ, wenn ein t ∈ T so existiert, dass gilt dim ∆l ◦ σ ◦ γ (t) = n + m. Zum Beweis diese Satzes beachte man nur, dass ein ε > 0 so existiert, dass die Menge [γ] (τ ), t − ε < τ < t + ε eine offene Teilmenge von E ist. Damit kann man aber auf dieser Menge die Trajektorie entsprechend deformieren. Durch geeignetes Zusammensetzten von Trajektorien erhält man dann die gewünschte Eigenschaft. Satz 3.10 Für das System (3.9) gelte, die Distribution ∆l sei regulär entlang der Trajektorie γ. Das System (3.9) ist genau dann (lokal) erreichbar entlang einer Trajektorie γ, wenn dim ∆l ◦ σ ◦ γ (t) = n + m gilt. Um diesen Satz zu zeigen, muss man nur mehr den Fall dim ∆l ◦σ◦γ (t) = s+m < n+m untersuchen. Wir führen nun die Koordinatentransformation x = φ (t, x), t = t mit xi = φi (t, x) , i = 1, . . . , s xj = φj (t, x) , j̄ = s + 1, . . . , n durch, wobei dφj̄ , dt ein Annihilator von ∆l ist. Mit D E j ẋ = dφj , f ◦ φ−1 60 3.4. Eingangs/Zustandslinearisierung 3. Erreichbarkeit und Beobachtbarkeit und D E D E ∂ς dφj , f = dφj , [∂ς , f ] =0 sowie ∂i E D E D ◦ φ−1 dφj , f ◦ φ−1 = vī dφj , f =0 wegen vi ∈ ∆l folgt aber, dass man das System (3.9) in der Form i i j j ẋ = f ẋ = f ṫ = 1 t, x, u , i = 1, . . . , s t, xs+1 , . . . , xn , j̄ = s + 1, . . . , n (3.19) schreiben kann. Damit ist der Satz 3.10 aber gezeigt. Als direkte Konsequenz dieser Überlegungen erhält man noch den folgenden Satz. Satz 3.11 Für das System (3.9) gelte, die Distribution ∆l sei am Punkt (t, x) regulär, dann kann es in der Form (3.19) geschrieben werden. Der Beweis folgt nun direkt mit obiger Transformation. 3.4 Eingangs/Zustandslinearisierung mit statischer Rückführung Gegeben sei wieder das System ṫ = 1 ẋi = f i (t, x, u) , i = 1, . . . , n (3.20) mit n-dimensionalem Zustand x und m-dimensionalem Eingang (uς ), ς = 1, . . . , m. Es stellt sich nun die Frage, ob man dieses System durch Zustands- und Stellgrößentransformationen t=t xi = ϕi (t, x) uς = φς (t, x, u) (3.21) ṫ = 1 ī ẋ = Aij xj + Bςi uς (3.22) in ein lineares System überführen kann. Um die Anzahl der Fallunterscheidungen möglichst gering zu halten, wird angenommen, dass alle im Weiteren vorkommenden Distributionen an den betrachteten Punkten regulär sind. Als Erstes wird nun der Eingrößenfall untersucht. 61 3.4. Eingangs/Zustandslinearisierung 3.4.1 3. Erreichbarkeit und Beobachtbarkeit Der Eingrößenfall Ohne Einschränkung der Allgemeinheit wird angenommen, dass das lineare System (3.22) in Brunovsky Normalform ṫ = 1 i ī ẋ = f = xi+1 , n n ẋ = f = u i = 1, . . . , n − 1 (3.23) mit n = n vorliegt. Nun folgt x1 = ϕ1 (t, x) f x1 = x2̄ = ϕ2 (t, x) = f ϕ1 (t, x) .. . n−1 1 n̄ f x = x = ϕn (t, x) = f n−1 ϕ1 (t, x) i mit f = ∂t + f i ∂i , f = ∂t + f ∂i . Weiters muss gelten ∂u f j ϕ1 = 0 , j = 0, . . . , n − 1 (3.24) für ϕ1 ∈ C ∞ (E). Man ist am Ziel, wenn man ϕ1 als Lösung obiger partieller Differentialgleichungen bestimmt hat. Offensichtlich gilt der nachfolgende Satz. Satz 3.12 Das Eingrößensystem (3.20) ist genau dann mittels einer Transformation (3.21) in die Brunovsky Normalform (3.23) überführbar, wenn eine Ausgangsfunktion ϕ1 ∈ C ∞ (E) mit relativem Grad n existiert. Im Weiteren wird nun versucht, das System partieller Differentialgleichungen (3.24) so zu vereinfachen, dass nur mehr Differentialgleichungen ersten Grades auftreten. Die Funktionen ϕj̄ , j̄ = 1, . . . , n genügen offensichtlich den Bedingungen ∂u ϕj̄ = 0 . Folglich muss die Distribution ∆0 = span ({∂u }) involutiv sein, was offensichtlich der Fall ist. Die Funktionen ϕj̄ , j̄ = 1, . . . , n − 1 genügen noch den Bedingungen ∂u f ϕj̄ = 0 . Kombiniert man nun diese in der Art (f ◦ ∂u − ∂u ◦ f ) ϕj = 0 , dann folgt [f, ∂u ] ϕj = adf (∂u ) ϕj = 0 62 3.4. Eingangs/Zustandslinearisierung 3. Erreichbarkeit und Beobachtbarkeit wegen ∂u ϕj = f ◦ ∂u ϕj = 0. Dieses System von partiellen Differentialgleichungen hat jedoch nur dann n − 1 Lösungen, wenn die Distribution ∆1 = span ({∂u , adf (∂u )}) involutiv ist. Die Funktionen ϕj̄ , j̄ = 1, . . . , n − 2 genügen noch den Bedingungen 2 ∂u f ϕj̄ = 0 . Kombiniert man nun diese wieder in der Art j f ◦ (f ◦ ∂u − ∂u ◦ f ) − (f ◦ ∂u − ∂u ◦ f ) ◦f ϕ = 0 , {z } | {z } | [f,∂u ] dann folgt [f,∂u ] [f, [f, ∂u ]] ϕ1 = ad2f (∂u ) ϕj = 0 wegen [f, ∂u ] ϕj = f ◦ [f, ∂u ] ϕj = 0. Dieses System von partiellen Differentialgleichung hat jedoch nur dann n − 2 Lösungen, wenn die Distribution ∆1 = span ∂u , adf (∂u ) , ad2f (∂u ) involutiv ist. Durch Wiederholung dieses Verfahrens kommt man nun einfach zum Ziel, wobei es zweckmäßig ist nachfolgende Abkürzung einzuführen ∆l = l X i adf (∂u ) . span i=0 (3.25) Damit aber auch die entsprechende Stellgrößentransformation existiert, muss das System (3.20) lokal erreichbar sein, d.h. es gilt dim ∆n = n + 1. Damit kommt man aber zum nachstehenden Satz. Satz 3.13 Das Eingrößensystem (3.20) ist genau dann mittels einer Transformation (3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen ∆l , l = 0, . . . , n − 1 mit dim (∆l ) = l + 1 involutiv sind, und dim (∆n ) = n + 1 gilt. Zum Beweis dieses Satzes beachte man vorerst, dass er trivialer Weise notwendig für die Existenz einer Lösung ϕ1 des Systems (3.24) ist. Ist nun ϕ1 eine Lösung des Systems g ϕ1 = 0 , g ∈ ∆n−1 , i 1 dann folgt sofort, dass die Funktionen f ϕ wegen der Konstruktion auch Lösungen der Systeme g f i ϕ1 = 0 , g ∈ ∆n−1−i , j = 0, . . . , i , i = 0, . . . , n − 1 sind. Damit ist aber ϕ1 auch Lösung von (3.24). Die Bedingung dim (∆n ) = n+1 garantiert dann noch die Erreichbarkeit, und gleichzeitig den relativen Grad n von ϕ1 (Warum?). 63 3.4. Eingangs/Zustandslinearisierung 3.4.2 3. Erreichbarkeit und Beobachtbarkeit Der Mehrgrößenfall Die Untersuchung des Mehrgrößenfalles erfolgt nun analog zum Eingrößenfall. Das lineare System (3.22) habe nun die Brunovsky Normalform ṫ =1 = xς¯,iς +1 = uς ς¯,īς ẋ ς¯,n̄ς̄ ẋ (3.26) P mit ς¯ = 1, . . . , m̄ = m, m̄ ς¯=1 n̄ς¯ = n̄ = n. Um unnötige Fallunterscheidungen zu vermeiden, wir angenommen, dass n̄ς¯ > 0 gilt. Nun folgt xς¯,1 = ϕς¯,1 (t, x) f xς¯,1 = xς¯,2̄ = ϕς¯,2 (t, x) = f ϕς¯,1 (t, x) .. . nς̄ −1 ς¯,1 ς¯,n¯ς̄ =x f x = ϕς¯,nς̄ (t, x) = f n̄ς̄ −1 ϕς¯,1 (t, x) i mit f = ∂t + f i ∂i , f = ∂t + f ∂i . Folglich muss wieder gelten = 0 , j = 0, . . . , n̄ς − 1 , τ̄ = 1, . . . , m̄ ∂τ̄ f j ϕς¯,1 (3.27) ¯ ∈ C ∞ (E). Man ist wieder am Ziel, wenn man die m̄ Funktionen ϕς¯,1 als Lösung für ϕς,1 obiger partieller Differentialgleichungen bestimmt hat. Offensichtlich gilt der nachfolgende Satz. Satz 3.14 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation (3.21) in die Brunovsky Normalform (3.25) überführbar, wenn m funktional unabhängige Ausgangsfunktionen ϕς¯,1 ∈ C ∞ (E), ς¯ = 1, . . . , m mit vektoriellen relativen Grad (n̄ς¯), Pm n = ς¯=1 n̄ς¯ existieren. Im Weiteren wird man wieder versuchen, das System partieller Differentialgleichungen (3.28) so zu vereinfachen, dass nur mehr Differentialgleichungen ersten Grades auftreten. Man beachte aber, dass nun die Folge der Indizes (n̄ς¯) eine bedeutenden Rolle spielen wird. Dazu führen wir die Funktion1 q, q (l) = m X ς¯=1 σ (l − n̄ς¯) ein, wobei q (l) die Anzahl der Elemente der Folge (n̄ς¯) ist, für die l > n̄ς¯ gilt. Analog zu (3.25) führen wir die Distributionen ∆l = l X i=0 1 span m adif (∂ς¯) ς¯=1 . σ bezeichnet hier die Sprungfunktion mit σ (x) = 1 für x > 0 und σ(x) = 0 für x ≤ 0. 64 (3.28) 3.4. Eingangs/Zustandslinearisierung 3. Erreichbarkeit und Beobachtbarkeit ein. Von (3.28) folgt nun, dass n Funktionen ψ j̄ , j̄ = 1, . . . , n existieren, die den Bedingungen ∂τ̄ ψ j̄ = 0 , τ̄ = 1, . . . , m̄ genügen. Folglich muss ∆0 involutiv sein, was offensichtlich der Fall ist. Man beachte, dass hier noch keine Zuordnung der Funktionen ψ j̄ zu den Funktionen ϕς¯,i getroffen wird. Weiters erfüllen die Funktionen ψ j̄ , j̄ = 1, . . . , q (1) noch die Bedingungen ∂τ̄ f ψ j̄ = 0 , τ̄ = 1, . . . , m̄ . Analog zum Eingrößenfall erhält man nun die Bedingung, dass die Distribution ∆1 mit dim (∆1 ) = m + n − q (1) involutiv sein muss. Setzt man nun dieses Verfahren fort, und verlangt noch die offensichtliche Bedingung, das System (3.20) ist lokal erreichbar, dann gelangt man zum nachfolgenden Satz. Satz 3.15 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation (3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen ∆l , l = 0, . . . , κ − 1 mit dim (∆l ) = m + n − q (l) involutiv sind, und dim ∆κ = m + n gilt. Der Beweis dieses Satzes ist nun ein wenig aufwendiger als der im Eingrößenfall, da man jetzt die Zuordnung der Funktionen ψ j̄ zu den Funktionen ϕς¯,i konstruieren muss. Vorerst beachte man wieder, dass der Satz wieder trivialer Weise notwendig für die Existenz von ς¯,i ⊥ Lösungen ϕ des Systems (3.28) ist. Es gelte dim ∆s1 = r1 mit s1 = κ − 1, dann gibt es r1 funktional unabhängige Lösungen ϕςs¯11,1 , ς¯1 = 1, . . . , r1 des Systems ς¯1 ,1 g ϕs1 = 0 , g ∈ ∆s1 . Weiters folgt sofort, dass die Funktionen f i ϕςs¯11,1 wegen der Konstruktion auch Lösungen der Systeme g f j ϕςs¯11,1 = 0 , g ∈ ∆s1 −i , j = 0, . . . , i , i = 0, . . . , s1 sind. Offensichtlich gilt bereits für den relativen Grad n̄ς¯1 = s1 und man erhält die Zuordς¯1 ,i i−1 nung ϕ = f ϕςs¯11,1 , i = 1, . . . , s1 . Nun suche man die Distribution ∆s2 mit größtem Index s2 , die der Bedingung dim ∆⊥ s2 = r2 + r1 (s1 − s2 + 1), r2 > 0 genügt, denn dann gibt es r2 funktional unabhängige Lösungen ϕςs¯22,1 des Systems g ϕsς¯22,1 = 0 , g ∈ ∆s2 , s2 −s1 ς¯1 ,1 ϕs1 sind. Gemäß der Kon- die auch funktional unabhängig von den Funktionen f struktion folgt wieder, dass die Funktionen f i ϕςs¯22,1 auch Lösungen der Systeme =0, g f j ϕsς¯22,1 g ∈ ∆s2 −i , 65 j = 0, . . . , i , i = 0, . . . , s2 3.5. Bemerkungen 3. Erreichbarkeit und Beobachtbarkeit sind. Für den relativen Grad folgt noch n̄r1 +¯ς2 = s2 , und man erhält die Zuordnung r2 +¯ ς2 ,i i−1 ς¯1 ,1 ϕ =f ϕs1 , i = 1, . . . , s2 . Führt man dieses Verfahren fort, dann erkennt man sofort, wie man die Zuordnung der Funktionen ψ j̄ , ϕς¯,i zueinander allgemein konstruieren muss. Damit ist aber nicht nur der Satz 3.15 gezeigt, sondern man verfügt auch über ein Verfahren, mit dem man aus den Distributionen ∆l den relativen Grad (nς¯) erhält. Der folgenden Satz ist somit eine unmittelbare Konsequenz dieser Tatsache. Satz 3.16 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation (3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen ∆l , l = 0, . . . , κ − 1 involutiv sind, und dim (∆κ ) = m + n gilt. Den relative Grad (n̄ς¯) und die Funktionen ϕς¯,i erhält man mittels des oben beschriebenen Verfahrens. 3.5 Bemerkungen Für weiterführende Literatur im Bereich der nichtlinearen Regelung wird, z.B., auf [7], [8], [9], [13], [17] verwiesen. 66 Kapitel 4 Mathematische Grundlagen Im Kapitel werden einige Grundlagen aus der Topologie und der Differentialrechnung im Rn sowie der Differentialgeometrie benötigt. Die folgenden Unterabschnitte sollen einige der benötigten Grundlagen zusammengefassen. 4.1 Topologie Hier werden einige wichtige Grundkonzepte der Topologie zusammengefasst, wie sie für finit dimensionale Mannigfaltigkeiten von Bedeutung sind. Im Wesentlichen sind diese Konzepte Verallgemeinerungen von offenen Mengen des Rn , sodass sie auch in anderen Mengen von Bedeutung sind. Auf Beweise oder Herleitungen wird hier verzichtet. Diese findet man z.B. in [11, 10, 12]. Im Weiteren werden vor Allem Notation und Begriffe der elementaren Mengenlehre benötigt. 4.1.1 Topologische Räume Definition 4.1 Eine Topologie T (X) auf einer Menge X ist eine Teilmenge der Potenzmenge (T (X) ⊂ P (X)) für die gilt: 1. {} , X ∈ T (X) 2. U1 , U2 ∈ T (X) ⇒ U1 ∩ U2 ∈ T (X) 3. Uα ∈ T (X) , α ∈ I für jede Indexmenge I 6= {} impliziert Die Elemente von T (X) heißen die offenen Mengen von T (X). S α∈I Uα ⊂ T (X). Die Standardtopologie auf R ist durch die offenen Intervalle (a, b) mit a, b ∈ R, a < b gegeben. Es wird noch gezeigt, dass die offenen Boxen eine Topologie des Rn bilden. Diese Topologie ist die Standardtopologie des Rn . Zu jeder Menge X 6= {} kann man einfach die triviale Topologie T (X) = {{} , X} und die diskrete Topologie T (X) = P (X) bilden. Man überzeugt sich auch einfach durch vollständige Induktion, dass der Schnitt endlich vieler offener Mengen eine offene Menge ist. 67 4.1. Topologie 4. Mathematische Grundlagen Definition 4.2 Sind T (X), S (X) zwei Topologien auf X, dann heißen S (X) feiner als T (X) und T (X) gröber als S (X), wenn T (X) ⊂ S (X) gilt. Offensichtlich ist die triviale Topologie die gröbste und die diskrete Topologie die feinste Topologie einer Menge X. Analog zu offenen Mengen kann man abgeschlossene Mengen einführen. Definition 4.3 T (X) sei eine Topologie auf X. Eine Menge A ⊂ X heißt abgeschlossen, wenn A = X\U, U ∈ T (X) gilt. Die Menge aller abgeschlossenen Mengen wird mit C (X) bezeichnet. Als Beispiel betrachte man auf R die abgeschlossenen Intervalle [a, b], a, b ∈ R, a < b. Man beachte auch, dass eine Menge sowohl offen als auch abgeschlossen sein kann. Dies trifft z.B. immer auf {} = X\X und X = X\ {} zu. Feststellung 4.1 Die abgeschlossenen Mengen C (X) einer Topologie T (X) auf einer Menge X genügen den Bedingungen: 1. {} , X ∈ C (X) 2. U1 , U2 ∈ T (X) ⇒ U1 ∪ U2 ∈ C (X) 3. Uα ∈ C (X) , α ∈ I für jede Indexmenge I 6= {} impliziert T α∈I Uα ⊂ T (X). Auf einer Menge können sehr viele Topologien existieren. Oftmals kann man eine Topologie auch mit einer viel kleineren Menge offener Mengen, nämlich einer Basis, konstruieren. Definition 4.4 T (X) sei eine Topologie auf X. Eine Teilmenge B (X) heißt Basis von T (X), wenn gilt: S 1. U ∈B(X) U = X. S 2. U1 , U2 ∈ B (X) ⇒ U1 ∩ U2 = α∈I Uα mit Uα ∈ B (X) für eine Indexmenge I. Ist B(X) abzählbar, dann heißt B (X) eine abzählbare Basis. Wenn T (X) eine abzählbare Basis besitzt, dann sagt man T (X) erfüllt das zweite Abzählbarkeitsaxiom. Eine Teilmenge der Potenzmenge P (X), die diese beiden Eigenschaften erfüllt erzeugt nun genau eine Topologie auf X. Dies zeigt der folgende Satz. Satz 4.1 Für B(X) ⊂ P (X) seien die Bedingungen von Definition 4.4 erfüllt, dann existiert genau eine Topologie T (X), für die B (X) eine Basis ist. Die offenen Intervalle des R bilden eine Basis der Standardtopologie. Ein zentraler Begriff ist nun der Umgebungsbegriff, mit dem man die Beziehung von Punkten zueinander ausdrücken kann. Definition 4.5 T (X) sei eine Topologie auf X. Eine offene Umgebung eines Punktes x ∈ X ist eine Menge U, für die gilt U ⊂ T (X). Eine Umgebung von x ist eine Menge M ⊂ X, die eine offene Umgebung von x enthält. Die Menge der Umgebungen von x heißt Umgebungssystem, sie wird mit Ux bezeichnet. 68 4.1. Topologie 4. Mathematische Grundlagen Die Mengen (x − ε, x + ε), ε ∈ R+ sind offene Umgebungen von x ∈ R. Die Mengen [x−1, x+3) wären Umgebungen zu x. In der trivialen Topologie gibt es nur eine Umgebung, nämlich X, während {x} eine offene Umgebung von x in der diskreten Topologie ist. Feststellung 4.2 T (X) sei eine Topologie auf X, dann existiert eine Funktion U : X → P (P (X)), die jedem Punkt x ∈ X sein Umgebungssystem Ux zuordnet. Es gilt: 1. V ∈ Ux ⇒ x ∈ V . 2. V1 , V2 ∈ Ux ⇒ V1 ∩ V2 ∈ Ux . 3. V ∈ Ux ⇒ ∀W, V ⊂ W ⊂ X ⇒ W ∈ Ux 4. V ∈ Ux ⇒ ∃W, W ∈ Ux ∧ y ∈ W ⇒ V ⊂ Uy . Die offenen Mengen einer Topologie T (X) lassen sich nun einfach folgendermaßen charakterisieren. Die Menge V ⊂ X ist genau dann offen, wenn V ∈ Ux für alle x ∈ V gilt. Man kann nun zeigen, dass nachfolgender Satz gilt: Satz 4.2 Für eine Menge X sei eine Funktion U : X → P (P (X)) gegeben, die die Eigenschaften 1-4 von Feststellung 4.2 erfüllt. Dann gibt es genau eine Topologie T (X) so auf X, dass für jedes x ∈ X genau Ux das Umgebungssystem in T (X) ist. Analog zu einer Basis für eine Topologie kann man eine Basis für ein Umgebungssystem einführen. Definition 4.6 T (X) sei eine Topologie auf X. Eine Menge Bx ⊂ Ux heißt Umgebungsbasis von x ∈ X, wenn zu jedem U ∈ Ux eine Menge B ∈ Bx so existiert, dass B ⊂ U gilt. Ist Bx abzählbar, dann heißt Bx eine abzählbare Umgebungsbasis. Ist Bx abzählbar für alle x ∈ X, dann sagt man T (X) erfüllt das erste Abzählbarkeitsaxiom. Mit Hilfe des Umgebungsbegriffes lassen sich nun Begriffe wie innerer Punkt, Randpunkt, etc. vom Rn für allgemein topologische Räume einführen. Definition 4.7 T (X) sei eine Topologie auf X mit M ⊂ X und x ∈ X. Der Punkt x heißt innerer Punkt von M, wenn gilt M ⊂ Ux . Die Menge der inneren Punkte von M, heißt offener Kern int (M). Der Punkt x heißt äußerer Punkt von M, wenn x ein innerer Punkt von X\M ist. Man kann sich nun leicht überzeugen, dass nachfolgende Eigenschaften äquivalent sind. Satz 4.3 T (X) sei eine Topologie auf X mit M, N ⊂ X. Es gilt: 1. M ∈ T (X) ⇔ M = int (M). 2. int (M) ist die größte Menge von T (X) für die gilt int (M) ⊂ M. 3. int (M) ∩ int (N) = int (M ∩ N), int (M) ∪ int (N) ⊂ int (M ∪ N). Mit Hilfe des Umgebungsbegriffes gelangt man auch zu den nachfolgenden Verallgemeinerungen. 69 4.1. Topologie 4. Mathematische Grundlagen Definition 4.8 T (X) sei eine Topologie auf X mit M ⊂ X und x ∈ X. Der Punkt x heißt Berührungspunkt (Häufungspunkt), wenn für alle U ∈ Ux gilt U ∩ M 6= {} ((U ∩ M) \ {x} 6= {}). Die Menge der Berührungspunkte heißt die abgeschlossene Hülle cl (M) von M. Die Menge der Häufungspunkte wird mit der (M) bezeichnet. Der Punkt x heißt Randpunkt von M, wenn x Berührungspunkt von M und M\X ist. Die Menge der Randpunkte von M wird mit bd (M) bezeichnet. Offensichtlich gilt cl (M) = M ∪ der (M). Man überzeugt sich nun einfach, dass wieder die folgenden Eigenschaften gelten. Feststellung 4.3 Zwischen abgeschlossener Hülle und offenem Kern gilt X\int (M) = cl (X\M) , X\cl (M) = int (X\M) . Obige Beziehungen erlauben nun direkt aus Satz 4.3 den nachfolgenden herzuleiten. Satz 4.4 C (X) sei eine Topologie auf X mit M, N ⊂ X. Es gilt: 1. M ∈ C (X) ⇔ M ⊂ cl (M). 2. cl (M) ist die kleinste Menge von C (X) für die gilt M ⊂ cl (M). 3. cl (M) ∪ cl (N) = cl (M ∪ N), cl (M ∩ N) ⊂ cl (M) ∩ cl (N). Für den Rand gelten dann insbesondere die folgenden Beziehungen. Feststellung 4.4 T (X) sei eine Topologie auf X mit M ⊂ X, dann gilt: 1. int (M) ⊂ M ⊂ cl (M) 2. bd (M) = cl (M) ∩ cl (X\M) = cl (M) ∩ (X\int (M) = cl (M) \int (M) Insbesondere gilt bd (M) ∈ C (M). Betrachtet man R mit der Standardtopologie, dann gilt offensichtlich cl (Q) = R sowie der (Z) = {}. Die entsprechende Verallgemeinerung liefert die nachfolgende Definition. Definition 4.9 T (X) sei eine Topologie auf X mit M ⊂ X. Die Menge M heißt dicht in X, wenn gilt cl (M) = X. Gilt int (cl (M)) = {} bzw. X\cl (M) ist dicht in X, dann heißt M nirgends dicht in X. 4.1.2 Stetigkeit Untersucht man Abbildungen zwischen topologischen Räumen, dann wird sich die Klasse der stetigen Abbildungen als besonders wichtige Klasse herausstellen. Definition 4.10 T (X), T (Y ) seien Topologien auf X und Y und f : X → Y sei eine Abbildung. Diese heißt stetig in x ∈ X, wenn gilt ∀V ∈ Uf (x) ⇒ ∃U ∈ Ux mit f (U) ⊂ V . Die Abbildung heißt stetig, wenn f für jedes x ∈ X stetig ist. 70 4.1. Topologie 4. Mathematische Grundlagen Von Stetigkeit kann man also nur bei Abbildungen zwischen topologischen Räumen sprechen. Da die Topologien aber oft aus dem Zusammenhang her klar sind, werden sie oft nicht zusätzlich angegeben. Man beachte aber, dass jede Abbildung von einem diskreten Raum in einen Raum mit beliebiger Topologie oder von einem Raum mit beliebiger Topologie in einen mit trivialer Topologie stetig ist. Man überzeugt sich ebenfalls leicht vom nachstehenden Satz. Satz 4.5 T (X), T (Y ), T (Z) seien Topologien auf X, Y und Z, f, g seien Abbildungen f : X → Y , g : Y → Z. Ist f stetig in x ∈ X und g in f (x), dann ist g ◦ f stetig in x. Für stetige Funktionen sind nachfolgende Eigenschaften äquivalent. Satz 4.6 T (X), T (Y ) seien Topologien auf X, Y und f : X → Y sei eine stetige Abbildung. 1. f ist stetig. 2. Für alle M ⊂ X gilt f (cl (M)) ⊂ cl (f (M)). 3. Für alle N ⊂ C (Y ) gilt f −1 (N) ∈ C (X). 4. Für alle N ⊂ T (Y ) gilt f −1 (N) ∈ T (X). Man beachte, dass für stetige Abbildungen das Urbild einer offenen (abgeschlossenen) Menge offen (abgeschlossen) ist, für die Bilder offener (abgeschlossener) Mengen gilt dies jedoch keinesfalls. Satz 4.7 T (X), T (Y ) seien Topologien auf X, Y . Die Abbildung f : X → Y heißt offen (abgeschlossen), wenn das Bild jeder offenen (abgeschlossenen) Menge offen (abgeschlossen) ist. Von besonderer Bedeutung sind nun bijektive Abbildungen. Definition 4.11 T (X), T (Y ) seien Topologien auf X, Y . Die Abbildung f : X → Y heißt ein Homöomorphismus, wenn f bijektiv ist und sowohl f als auch f −1 stetig sind. Man nennt zwei topologische Räume homöomorph, oder topologisch äquivalent, wenn sie durch einen Homöomorphismus verbunden sind. Da Homöomorphie eine Äquivalenzrelation ist, kann man einen topologischen Raum als Repräsentanten aller zu ihm homöomorphen Räume auffassen. Es stellt sich also die Frage, wann zwei Räume homöomorph sind. Satz 4.8 T (X), T (Y ) seien Topologien auf X, Y . Die bijektive Abbildung f : X → Y ist genau dann ein Homöomorphismus, wenn f stetig und offen (abgeschlossen) ist. 71 4.1. Topologie 4.1.3 4. Mathematische Grundlagen Konvergenz und Hausdorff-Räume Als nächstes werden Folgen untersucht, wobei konvergente Folgen von besonderem Interesse sind. Definition 4.12 T (X) sei eine Topologie auf X. Die Folge (xn ) heißt konvergent, wenn es einen Punkt x ∈ X so gibt, dass zu jeder Menge U ∈ Ux eine Zahl N existiert, dass gilt xn ∈ U für n ≥ N. Man sagt auch xn konvergiert gegen den Grenzwert x. In allgemeinen topologischen Räumen sind nun Grenzwerte von Folgen nicht eindeutig bestimmt. Die entscheidenden Eigenschaften, dass Grenzwerte konvergenter Folgen eindeutig sind, zeigt die folgende Definition. Definition 4.13 T (X) sei eine Topologie auf X. Der Raum X heißt ein HausdorffRaum, wenn man für alle x, y ∈ X, x 6= y Mengen U ∈ Ux , V ∈ Uy so finden kann, dass U ∩ V = {} gilt. Der Raum X heißt regulär, wenn er ein Hausdorff-Raum ist, und es gilt, zu jeder Menge M ∈ C (X) und jedem Punkt x ∈ X\M gibt es eine Menge U ∈ Ux mit U ∩ M = {}. Der Raum X heißt normal, wenn er ein Hausdorff-Raum ist, und für alle M, N ∈ C (X), M ∩ N = {} existieren Mengen U, V ∈ T (X) mit M ⊂ U, N ⊂ V , U ∩ V = {}. Man kann nun einfach zeigen, dass ein normaler Raum regulär ist, sowie dass ein regulärer Raum ein Hausdorff-Raum ist. In Hausdorff-Räumen haben nun konvergente Folgen genau einen Grenzwert. 4.1.3.1 Teilräume, Produkt und Quotientenraum Von Bedeutung ist ebenfalls, wie man neue topologische Räume aus gegebenen erzeugt. Von besonderem Interesse sind hier Teilräume, Produkträume und Quotientenräume. Definition 4.14 T (X) sei eine Topologie auf X. Die relative Topologie auf M ⊂ X ist durch T (M) = {U ∩ M|U ∈ T (X)} gegeben. Man beachte, dass eine offene Menge von T (M) nicht offen in T (X) sein muss. Wenn f : X → Y eine stetige Abbildung zwischen zwei Räumen X, Y ist, dann ist die auf M ⊂ X eingeschränkte Abbildung f |M : M → Y auch stetig. Die Umkehrung gilt aber nicht. Man beachte auch, dass in der relativen Topologie die Inklusionsabbildung i : M → X, i (x) = x stetig ist. Als nächstes soll das Produkt topologischer Räume betrachtet werden. Definition 4.15 T (X), T (Y ) seien Topologien auf X, Y . Die Produkttopologie auf X × Y ist gegeben durch T (X × Y ) = {U × V |U ∈ T (X) , V ∈ T (Y )}. Die offenen Rechtecke bilden also eine Basis dieser Topologie. Feststellung 4.5 T (X), T (Y ) seien Topologien auf X, Y . Für die Produkttopologie auf X × Y und die Projektionen pr1 (x, y) = x, pr2 (x, y) = y gilt: 1. pr1 , pr2 sind offene Abbildungen. 72 4.1. Topologie 4. Mathematische Grundlagen 2. Z sei ein topologischer Raum. Eine Abbildung f : Z → X × Y ist genau dann stetig, wenn die Abbildungen pr1 ◦ f : Z → X, pr2 ◦ f : Z → Y stetig sind. Mit Hilfe der Produkttopologie kann man auch überprüfen, ob ein topologischer Raum ein Hausdorff-Raum ist. Feststellung 4.6 Ein topologischer Raum X ist genau dann ein Hausdorff-Raum, wenn die Diagonale ∆ = {(x, x) |x ∈ X} ⊂ X × X in der Produkttopologie eine abgeschlosse Teilmenge ist. Ist X ein Hausdorff-Raum, dann gibt es zu zwei Punkte x, y ∈ X, x 6= y zwei Mengen U ∈ Ux , V ∈ Uy so, dass U ∩ V = {} gilt. Woraus folgt (U × V ) ∩ ∆ = {}. Ist ∆ abgeschlossen, dann ist X\∆ offen und zu x, y gibt es offene Umgebungen U, V mit (U × V ) ∈ (X × X) \∆, oder es gilt U ∩ V = {}. Mit Hilfe von Äquivalenzrelationen können ebenfalls neue Topologien erzeugt werden. Hierzu dient die nachstehende Definition. Definition 4.16 Eine Äquivalenzrelation R ∈ X × X auf einer Menge X erfüllt für alle x, y, z ∈ X die Beziehungen: 1. (x, x) ∈ R, (Reflexivität) 2. (x, y) ∈ R ⇔ (y, x) ∈ R, (Symmetrie) 3. (x, y) , (y, z) ∈ R ⇒ (x, z) ∈ R, (Transitivität) Mit [x] = {v ∈ X| (x, v) ∈ R} wird die Äquivalenzklasse von x bezeichnet, und mit X/R die Menge aller Äquivalenzklassen. Die Abbildung π : X → X/R, x 7→ [x] heißt die kanonische Projektion. Man überzeugt sich leicht, dass X/R aus disjunkten Mengen besteht, deren Vereinigung gerade X ist. Mit der Quotiententopologie macht man nun die Projektion zu einer stetigen Abbildung. Definition 4.17 T (X) sei eine Topologie auf X und R eine Äquivalenzrelation. Die Quotiententopologie auf X/R ist gegeben durch {U ∈ X/R|π −1 (U) ∈ T (X)}. Es sei f : X → Y eine surjektive Abbildung. Man erzeugt nun mittels f (x) = f (y) sehr einfach eine Äquivalenzrelation R. Offensichtlich ist die Abbildung g : X/R → Y , [x] 7→ f (x) bijektiv. Wie schaut die feinste Topologie auf Y aus, in der f stetig ist? Es stellt sich nun die Frage, wie sich die Quotiententopologie mit der Hausdorff Eigenschaft vertragt. Dazu nachstehende Definition. Definition 4.18 Die Menge Γ = {(x, y) | (x, y) ∈ R} ⊂ X ×X eines topologischen Raumes X mit Topologie T (X) heißt der Graph von R. Die Äquivalenzrelation R heißt offen (abgeschlossen), wenn die kanonische Projektion π offen (abgeschlossen) ist. Es ist nun oft nötig, beurteilen zu können, ob ein Quotientenraum ein Hausdorff-Raum ist. Dazu das folgende Ergebnis. Feststellung 4.7 Ist X/R eine Hausdorff-Raum, dann ist der Graph Γ von R in X × X abgeschlossen. Ist noch R offen und Γ in X × X abgeschlossen, dann ist X/R ein Hausdorff-Raum. 73 4.1. Topologie 4.1.4 4. Mathematische Grundlagen Metrische Räume Auf dem Rn ist die Standardmetrik durch v u n uX d (x, y) = t (xi − yi )2 , i=1 x, y ∈ Rn gegeben. Die Erweiterung auf allgemeinere Räume ist der folgenden Definition zu entnehmen. Definition 4.19 Eine Metrik auf einer Menge X ist eine Abbildung d : X × X → R so, dass für alle x, y, z ∈ R+ gilt: 1. d (x, y) = 0 ⇔ x = y, (Definitheit) 2. d(x, y) = d (y, x), (Symmetrie) 3. d(x, z) ≤ d(x, y) + d(y, z), (Dreiecksungleichung) Mit Hilfe einer Metrik auf einer Menge kann man auf ihr eine Topologie einführen. Definition 4.20 X sei ein metrischer Raum mit Metrik d. Die ε-Scheibe um x ist die Menge Dε (x) = {y ∈ X|d (x, y) < ε}. Die metrische Topologie auf X ist durch alle Mengen gegeben, die sich als Vereinigung von ε-Scheiben darstellen lassen. Zwei Metriken heißen äquivalent, wenn sie dieselbe Topologie erzeugen. Man überzeugt sich leicht, dass eine Norm k·k auf einem linearen Raum X eine Metrik ist mit d (x, y) = kx − yk , x, y ∈ X Ein wichtiges Ergebnis ist nun, dass alle Normen auf dem Rn v u n uX p |xi |p , p ∈ [1, ∞) kxkp = t i=1 kxk∞ = max |xp | 1≤p≤n mit x ∈ Rn dieselbe Topologie erzeugen. Die nachfolgende Feststellung zeigt nun eine besondere Eigenschaft metrischer Räume. Feststellung 4.8 Jeder metrische Raum ist normal. Metrische Räume, die vollständig sind, haben eine besondere Bedeutung. Man überzeugt sich nämlich leicht, dass jede konvergente Folge eine Cauchy Folge ist, die Umkehrung ist jedoch im Allgemeinen falsch. Definition 4.21 X sei ein metrischer Raum mit Metrik d und (un ) eine Folge in X. Existiert zu jedem ε ∈ R+ eine Zahl N so, dass d (un , um ) < ε für alle n, m > N gilt, dann heißt (ui ) eine Cauchy Folge. Der Raum X heißt vollständig, wenn jede Cauchy Folge konvergiert. 74 4.1. Topologie 4. Mathematische Grundlagen Der Rn versehen mit einer Norm ist vollständig. Dies gilt auch für jeden Unterraum des Rn . Man beachte, dass diese Eigenschaft für nicht finit-dimensionale lineare Räume X im Allgemeinen auch nicht zutrifft. In einem vollständigen metrischen Raum kann man nun gewisse Gleichungen mittels Iteration einfach lösen. X sei ein metrischer Raum mit Metrik d mit einer Abbildung f : X → X. Gibt es eine Zahl k, 0 ≤ k < 1 so, dass für alle x, y ∈ X gilt, dann gibt es genau ein z ∈ X, dass f (z) = z gilt. Man nennt in diesem Fall f eine Kontraktion und z einen Fixpunkt von f . Auf den einfachen Beweis wird hier verzichtet, er basiert auf der Konstruktion einer geeigneten Cauchy Folge. In metrischen Räumen kann man die Stetigkeit auch auf nachfolgende Weise einführen. Definition 4.22 Es seien X, Y metrische Räume mit Metriken dX , dY . Die Abbildung f : X → Y heißt stetig in x, wenn zu jedem ε > 0 ein δx (ε) > 0 so existiert, dass dX (x, y) < ε ⇒ dY (f (x) , f (y)) < δ gilt. Von weiterem Interesse sind nun stetige Funktionen, bei denen die Funktion δ nicht vom betrachteten Punkt abhängt. Definition 4.23 Es seien X, Y metrische Räume mit Metriken dX , dY . Die Abbildung f : X → Y heißt gleichmäßig stetig in x, wenn zu jedem ε > 0 ein δ (ε) > 0 so existiert, dass dX (x, y) < ε ⇒ dY (f (x) , f (y)) < δ gilt. Es sei fi : S → X, i = 1, 2, . . . und f : S → X Abbildungen einer Menge S in einen metrischen Raum mit Metrik d.Die Folge fi → f konvergiert gleichmäßig gegen f , wenn zu jeden ε > 0 ein n so existiert, dass i ≥ n ⇒ d (fi (s) , f (s)) < ε, ∀s ∈ S. Es stellt sich nun heraus, dass gewisse Mengen stetiger Funktionen auf metrischen Räumen selbst wieder einen metrischen Raum bilden. Feststellung 4.9 Es sei X ein topologischer Raum und Y ein abgeschlossener metrischer Raum. Die Menge C (X, Y ) der beschränkten und stetigen Abbildungen X → Y ist ein metrischer Raum mit Metrik dX,Y (f, g) = sup d (f (x) , g (x)) x∈X mit f, g ∈ C (X, Y ). 4.1.5 Kompaktheit Eine stetige Funktion auf dem Intervall [0, 1] nimmt sowohl ihr Maximum als auch ihr Minimum an. Die dafür verantwortliche Eigenschaft ist die Kompaktheit des Intervalls [0, 1]. Definition 4.24 S X sei ein topologischer Raum. Der Raum X heißt kompakt, S wenn jede Überdeckung α Uα = X mit offenen Mengen Uα eine endliche Überdeckung α∈I Uα = X, |I| < ∞ enthält. Eine Teilmenge M ⊂ X heißt kompakt, wenn M in der relativen Topologie kompakt ist. Eine Teilmenge M ⊂ X heißt relativ kompakt, wenn cl (M) kompakt 75 4.1. Topologie 4. Mathematische Grundlagen ist. Eine Raum X heißt lokal kompakt, wenn er ein Hausdorff-Raum ist und jeder Punkt x ∈ X eine relativ kompakte Umgebung hat. S Es sei [0, 1] ⊂ α Uα eine offene Überdeckung. Zu jeden Punkt x ∈ [0, 1] muss es ein α so geben, dass x ∈ Uα gilt. Da Uα offen ist, muss gelten (x − εx , x + εx ) ⊂ Uα . Nun muss eine Zahl ε so existieren, dass 0 < ε ≤ εx gilt, denn andernfalls gäbe es einen Punkt x mit (x − ε, x + ε) 6⊂ Uα für alle α. Da dann auch (x − ε/n, x + ε/n) ⊂ Uα , n = 1, 2, . . . für alle α gilt, hätte x keine offene Umgebung in R. Die entsprechende Übertragung auf den Rn entnimmt man der folgenden Feststellung. Feststellung 4.10 Das Produkt X × Y zweier topologischer Räume X, Y ist genau dann kompakt, wenn X und Y kompakt sind. Noch einfacher zeigt man nachstehende Feststellung. Feststellung 4.11 Es gilt: 1. X sei eine kompakte Menge mit einer abgeschlossenen Teilmenge M ⊂ X, dann ist M kompakt. 2. Die Abbildung f : X → Y sei stetig. Ist X kompakt, dann ist f (X) kompakt. Die Umkehrung von Punkt 2 obiger Feststellung ist im Allgemeinen falsch. Dazu folgende Definition. Definition 4.25 Die Abbildung f : X → Y heißt eigentlich, wenn f stetig ist, und für jede kompakte Menge M ⊂ Y folgt, f −1 (M) ist kompakt. Nun kann man oftmals Kompaktheit auch an Hand der Konvergenz von Folgen beurteilen. Dazu der Satz von Bolzano, Weierstrass. Es sei X ein kompakter Hausdorff Raum, dann besitzt jede Folge eine konvergente Teilfolge. In einem metrischen Raum gilt die Umkehrung. Eine Eigenschaft metrischer Räume, die ebenfalls von Bedeutung ist, findet man in der folgenden Definition. Definition 4.26 X sei ein metrischer Raum. Eine Teilmenge M ⊂ X heißt total beschränkt, wenn zu jedem S ε > 0 eine endliche Menge I = {p1 , . . . , pn } von Punkten pi ∈ S so existiert, dass M ⊂ i∈I Dε (pi ) gilt. Man erhält nun einfach das nachstehende Ergebnis. Ein metrischer Raum ist kompakt, wenn er vollständig und total beschränkt ist. Eine Teilmenge eines metrischen Raumes ist relativ kompakt, wenn sie beschränkt ist. Auf den einfachen Beweis wird hier verzichtet. Ebenso einfach erhält man das folgende Ergebnis. Feststellung 4.12 In einem metrischen Raum sind die kompakten Mengen abgeschlossen und total beschränkt. Im Rn gilt noch die Umkehrung. Dies besagt der Satz von Heine und Borel. 76 4.1. Topologie 4. Mathematische Grundlagen Satz 4.9 Im Rn sind abgeschlossene und total beschränkte Mengen kompakt. In allgemeinen topologischen Räumen kann man bereits die Stetigkeit von Funktionen definieren. In metrischen Räumen existieren noch nachfolgende Verfeinerungen. Feststellung 4.13 Es seien X, Y metrische Räume, und X sei kompakt. Eine stetige Abbildung f : X → Y ist gleichmäßig stetig. Definition 4.27 Eine Teilmenge F ⊂ C (X, Y ) heißt gleichgradig stetig in x ∈ X, wenn gilt, zu jedem ε > 0 gibt es ein δ > 0 so, dass gilt dX (x, y) < δ ⇒ dY (f (x) , f (y)) < ε, ∀f ∈ F . F heißt gleichgradig stetig, wenn F in jedem Punkt x ∈ X gleichgradig stetig ist. Zu obiger Definition noch das folgende Ergebnis. X sei ein kompakter metrischer Raum. Die Menge F ⊂ C (X, Rn ) ist relativ kompakt, wenn sie gleichgradig stetig ist, und gleichmäßig beschränkt ist. 4.1.6 Zusammenhang Auf topologischen Räumen kann man auch beurteilen, ob Mengen zusammenhängend sind. Interessanterweise sind drei verschiedene Begriffe, Zusammenhang, wegweiser Zusammenhang und einfacher Zusammenhang von Bedeutung. Definition 4.28 X sei ein topologischer Raum. Ein Weg c in X ist eine stetige Abbildung c : [0, 1] → X. Gilt c (0) = x, c (1) = y, dann verbindet der Weg c die Punkte x, y. Der Raum heißt wegweise zusammenhängend, wenn für alle x, y ∈ X gilt, dass sie durch einen Weg verbunden werden können. Der Raum X heißt lokal wegweise zusammenhängend, wenn jeder Punkt eine wegweise zusammenhängende Umgebung hat. Ein einfaches Beispiel ist der Rn , er ist wegweise und lokal wegweise zusammenhängend. Es gibt jedoch noch eine weitere Definition des Zusammenhanges. Definition 4.29 Ein topologischer Raum X heißt zusammenhängend, wenn X und {} die einzigen offenen und abgeschlossenen Teilmengen von X sind. Eine Teilmenge von X heißt zusammenhängend, wenn sie in der relativen Topologie zusammenhängend ist. Eine Komponente M von X ist eine nicht leere zusammenhängende Teilmenge von X für die gilt, M ist die einzige zusammenhängende Teilmenge von X die M enthält. Der Raum X heißt lokal zusammenhängend, wenn jeder Punkt eine lokal zusammenhängende Umgebung hat. Man kann nun einfach zusammenhängende Mengen folgendermaßen charakterisieren. Definition 4.30 Ein topologischer Raum X ist genau dann nicht zusammenhängend, wenn eine der folgenden Eigenschaften zutrifft. 1. X besitzt eine echte, nicht leere Teilmenge, die offen und abgeschlossen ist. 2. X ist die disjunkte Vereinigung zweier nicht leerer offener Mengen. 77 4.1. Topologie 4. Mathematische Grundlagen 3. X ist die disjunkte Vereinigung zweier nicht leerer abgeschlossener Mengen. Stetige Abbildungen erhalten nun den Zusammenhang, denn es gilt. Feststellung 4.14 X, Y seien topologische Räume, und f sei eine stetige Abbildung f : X → Y . Ist X (wegweise) zusammenhängend, dann ist auch f (x) (wegweise) zusammenhängend. Das folgende Ergebnis ist zwar nahe liegend, es verlangt aber doch einen hier nicht gezeigten Beweis. Lemma 4.1 Die einzigen zusammenhängenden Mengen des R sind die Intervalle. Wegweiser Zusammenhang ist nun stärker als nur Zusammenhang. Feststellung 4.15 Ist der topologische Raum wegweise zusammenhängend, dann ist er zusammenhängend. Das Standardbeispiel einer zusammenhängenden aber nicht wegweise zusammenhängenden Menge ist: 1 2 (x, y) ∈ R |x > 0, −1 < y < 1, x, sin ∪ (0, y) x Eine partielle Umkehrung obiger Feststellung enthält das Nachfolgende. Feststellung 4.16 Ein topologischer Raum sei zusammenhängend und lokal wegweise zusammenhängend, dann ist er wegweise zusammenhängend. Im Besonderen gilt, dass jeder lokal zum Rn homöomorphe Raum wegweise zusammenhängend. Eine besonders wichtige Eigenschaft stetiger Funktionen auf zusammenhängenden Mengen zeigt der so genannte Zwischenwertsatz. Korollar 4.1 Es sei X ein zusammenhängender topologischer Raum und f eine stetige Abbildung f : X → R. Für alle x, y ∈ X, f (x) < f (y) gilt, dass zu jedem a ∈ [f (x) , f (y)] ein z ∈ X mit f (z) = a existiert. Abschließend sollen noch einfach zusammenhängende Mengen betrachtet werden. Dazu nachstehende Definition. Definition 4.31 X, Y seien topologische Räume, und f , g stetige Abbildungen X → Y . f und g heißen homotop, wenn es eine stetige Abbildung h : X × [0, 1] so gibt, dass f (x) = h (x, 0), g (x) = h (x, 1) gilt. Man überzeugt sich leicht, dass Homotopie eine Äquivalenzrelation ist. Zum Abschluss noch nachstehende Definition. Definition 4.32 Ein topologischer Raum X heißt einfach zusammenhängend, wenn jeder geschlossene Weg c mit c (0) = c (1) = x, homotop zur konstanten Abbildung f : [0, 1] → Y , f ([0, 1]) = {x} ist. 78 4.2. Inverse und implizite Funktion 4.2 4. Mathematische Grundlagen Inverse und implizite Funktion Im Folgenden werden Abbildungen vom Rn in den Rm betrachtet, wobei beide linearen Vektorräume immer mit der Standardtopologie versehen sind. Im Weiteren werden nur stetige Abbildungen betrachtet, dazu die nachstehende Definition. Auf Beweise oder Herleitungen der folgenden Sätze hier verzichtet, man findet diese man z.B. in [11]. Definition 4.33 Eine stetig Abbildung f : U → V (f ∈ C (U, V )) mit U ⊂ Rn und V ⊂ Rn heißt Homeomorphismus, wenn f auf U biijektiv ist, und f sowie f −1 stetige Abbildungen in den Standardtopologien sind. Stetige Zustandstransformationen sind für das Weitere zu allgemein. Wir verlangen, dass f zumindest einmal stetig differenzierbar ist. Es bezeichne Df : U × Rn → V × Rn die Abbildung x̄i = f i (x) , x̄˙ i = ∂j f i (x) ẋj , i = 1, . . . , n mit (xi ), (x̄i ) als Koordinaten für U, V und (xi , ẋi ), (x̄i , x̄˙ i ) für U × Rn , V × Rn . Ist Df ein Homeomorphismus, dann ist f offensichtlich stetig differenzierbar. Hier wird natürlich vorausgesetzt, dass die Elemente der Jacobi Matrix [∂j f i ], ∂1 f 1 (x) ∂2 f 1 (x) · · · ∂n f 1 (x) 2 · · · ∂n f 2 (x) i ∂1 f (x) ∂j f = .. .. .. . . . . . . n n n ∂1 f (x) ∂2 f (x) · · · ∂n f (x) existieren. Die nachfolgenden Sätze über die inverse und die implizite Funktion gehören zu den wichtigsten der nichtlinearen Analysis. Satz 4.10 Die Abbildung f : U → V (f ∈ C r (U, V )) mit offenen Teilmengen U ⊂ Rn , V ⊂ Rn sei r mal (r ≥ 1) stetig differenzierbar. Für ein x0 ∈ U gelte x̄0 = f (x0 ) sowie rank ∂j f i (x0 ) = n , dann existiert eine offene Umgebung U ′ ⊆ U von x0 so, dass Df auf U × Rn ein Homeomorphismus ist, und dass f −1 auf V ′ = f (U ′ ) mindestens r mal stetig differenzierbar ist (f −1 ∈ C r (V ′ , U ′ )). Man beachte, dass auf V ′ zwei Topologien exisitieren. Die erste ist die relative Topologie gegeben durch V . Die zweite Topologie wird durch f erzeugt, indem als offenen Mengen von V ′ die Bilder offener Mengen von U ′ einführt werden. Genügt f nun Satz 4.10, dann stimmen beide Topologien überein. Der folgende Satz ist nun eine Erweiterung der vorigen. Satz 4.11 Die Abbildung f : U × V → Rn (f ∈ C r (U × V, Rn )) mit offenen Mengen U ⊂ Rm , V ⊂ Rn sei r mal (r ≥ 1) stetig differenzierbar. Für ein x0 ∈ U, y0 ∈ V gelte f (x0 , y0 ) = 0 sowie rank ∂j f i (x0 , y0) = n , ∂j = ∂yj , i, j = 1, . . . , n, dann eine offene Umgebung U ′ ⊆ U von x0 so, dass auf jeder zusammenhängenden Umgebung U ′′ ⊂ U ′ genau eine g ∈ C r (U ′′ , V ) mit f (x, g (x)) = 0 . 79 4.2. Inverse und implizite Funktion q π 4. Mathematische Grundlagen θ x1 f x2 1 Abbildung 4.1: Eine lokal aber nicht global umkehrbar eindeutige Funktion. Man überzeugt sich leicht, dass man den Satz 4.10 aus Satz 4.11 erhält, wenn man f (x, y) = f (x) − y = 0 , y = x̄ setzt. In umgekehrter Richtung benutze man die Substitution f (x) = (x1 , f (x1 , x2 )) = y = (y1 , y2 ) und werte die Beziehung x = (x1 , x2 ) = f −1 (y1 , y2 ) für x1 = y1 , y2 = 0 aus. Man beachte, dass Satz 4.10 ausschließlich lokale Aussagen zulässt. Hiezu untersuche man lediglich die Abbildung x1 = r cos(θ) x2 = r sin(θ) mit der Jacobi Matrix cos(θ) −r sin(θ) M= sin(θ) r cos(θ) mit det(M) = r . Für 0 < r < ∞ und 0 < θ < a mit a ≤ 2π ist obige Abbildung umkehrbar eindeutig, für a > 2π ist dies nicht mehr der Fall, obwohl die Jacobi Matrix für r 6= 0 immer regulär ist. Bild 4.1 veranschaulicht diesen Sachverhalt. Weiters beachte man, dass Satz 4.10 die r malige Differenzierbarkeit der Umkehrfunktion garantiert. Mit i (x) = x als identischer Abbildung und g = f −1 folgt aus g ◦ f (x) = i (x) , und mit der Kettenregel ∂j g i ◦ f (x) = ∂j ii (x) ∂ī g i ◦ f (x) ∂j f ī (x) = δji erhält man schlussendlich h i−1 ī ∂ī g ◦ f (x) = ∂j f (x) . i 80 4.2. Inverse und implizite Funktion y 4. Mathematische Grundlagen x x3 √ 3 x y y Abbildung 4.2: Ein Homeomorphismus aber kein Diffeomorphismus. Dabei wurde von der Differenzierbarkeit von f und f −1 wesentlich Gebrauch gemacht. Die Umkehrfunktion f −1 muss jedoch nicht differenzierbar sein, selbst wenn f glatt und bijektiv ist. Dazu beachte man die spezielle Funktion y = x3 . Nun gilt ∂ y(0) = 0 . ∂x Man beachte, dass die Umkehrfunktion mit x = y 1/3 sehr wohl existiert. Sie ist sogar stetig, aber nicht stetig differenzierbar. Damit ist diese Funktion ein Homeomorphismus. Siehe auch Bild 4.2. Um Fallunterscheidungen wie oben zu vermeiden, wird oft verlangt, dass die Abbildung f wie ihre Inverse Ableitungen beliebiger Ordnung besitzt. Dazu folgende Definition. Definition 4.34 Eine Abbildung f : U → V mit U ⊂ Rn und V ⊂ Rn heißt Diffeomorphismus, wenn f die Bedingungen von Satz 4.10 für r = ∞ erfüllt. Es existieren nun auch Gegenstücke zu den Sätzen über inverse oder implizite Funktionen in nicht finiten Räumen. Für das Weitere wird noch der nachstehende Satz benötigt. Satz 4.12 Es seien E, F Banach Räume und die Abbildung f : U ⊂ E → F sei stetig differenzierbar, f ∈ C (U, F ). Ist nun Df (u), u ∈ U surjektiv, dann ist f lokal surjektiv. Somit existieren offene Umgebungen Ū von u und V̄ von f (u) so, dass f |Ū → V̄ surjektiv ist. Gilt noch, dass Df (u) für alle u ∈ U surjektiv ist, dass ist f dort eine offene Abbildung. Auf den Beweis dieses Satzes wird hier verzichtet. Satz 4.13 Es seien E, F Banach Räume und die Abbildung f : U ⊂ E → F sei stetig differenzierbar, f ∈ C (U, F ). Ist nun Df (u), u ∈ U surjektiv, dann ist f lokal surjektiv. Somit existieren offene Umgebungen Ū von u und V̄ von f (u) so, dass f |Ū → V̄ surjektiv ist. Gilt noch, dass Df (u) für alle u ∈ U surjektiv ist, dass ist f dort eine offene Abbildung. Auch auf den Beweis dieses Satzes wird hier verzichtet. 81 4.2. Inverse und implizite Funktion 4.2.1 4. Mathematische Grundlagen Mittelwertsätze Satz 4.14 Zur Abbildung f : U → V , (f ∈ C 1 (U, V )) mit U = [a, b] ⊂ R, V ⊂ Rn gibt es ein x ∈ Uso, dass kf (b) − f (a)k ≤ |b − a| kDf (x)k gilt. Zum Beweis betrachte man die Funktion ϕ (τ ) = (f (b) − f (a) , f (t)) mit dem Innenprodukt der trivialen Metrik. Mit Hilfe des Mittelwertsatzes der Integralrechnung folgt nun ϕ (b) − ϕ (a) = (b − a) (f (b) − f (a) , Df (x)) für ein x ∈ U. Der Rest folgt dann aus ϕ (b) − ϕ (a) = ((f (b) − f (a) , f (b) − f (a))) = kf (b) − f (a)k22 und der Beziehung kf (b) − f (a)k22 = (b − a) (f (b) − f (a) , Df (x)) ≤ (b − a) kf (b) − f (a)k2 kDf (x)k2 . Satz 4.15 Es gelte für die Abbildung f : U → V , (f ∈ C 1 (U, V )) mit einer offenen U ⊂ Rm , V ⊂ Rn die Beziehung kDf (x)k ≤ M ∈ R+ für alle x ∈ U, sowie für ein beliebiges Paar x1 , x2 ∈ U auch x1 (1 − t) + x2 t ∈ U für 0 ≤ t ≤ 1, dann folgt kf (x2 ) − f (x)k ≤ M kx2 − x1 k . Zum Beweis betrachte man nun die Funktion g, g (t) = f (x1 (1 − t) + x2 t) Dg (t) = Df (x1 (1 − t) + x2 t) (x2 − x1 ) Mit der Abschätzung kDg (t)k ≤ M kx2 − x1 k und des vorigen Satzes erhält man sa gewünschte Ergebnis 82 Literaturverzeichnis [1] W. M. Boothby. An Introduction to Differentiable Manifolds and Riemanmnian Geometry. Academic Press, Inc., Orlando, USA, 1986. [2] R. Bryant, S. Chern, R. Gardner, H. Goldschmidt, P. Griffith. Exterior Differential Systems. Springer, New York, USA, 1991. [3] Y. Choquet-Bruhat, C. DE Witt Morette. Analysis, Manifolds and Physics. North Holland, Amsterdam, NL, 1982. [4] A. Fitzgerald. Electric Machinery. McGraw-Hill, New York, USA, 1990. [5] T. Frankel. The Geometry of Physics, An Introduction. Cambridge University Press, Cambridge, UK, 1998. [6] G. Giachetta, L. Mangiarotti, G. Sardanashvily. New Lagrangian and Hamiltonian Methods in Field Theory. Springer, London, UK, 1997. [7] A. Isidori. Nonlinear Control Systems. Springer, London, UK, 1995. [8] A. Isidori. Nonlinear Control Systems II. Springer, London, UK, 1999. [9] H. Khalil. Nonlinear Systems 3rd Edition. Prentice Hall, New Jersey, US, 2002. [10] D. Luenberger. Optimization by Vector Space Methods. John Wiley & Sons, Inc., New York, USA, 1969. [11] R. Marsden, T. Ratiu. Manifolds, Tensor Analysis, and Applications. Springer, London, UK, 1988. [12] K. Mayer. Algebraische Topologie. Birkhäuser Verlag, 1989. [13] H. Nijmeijer, A. van der Schaft. Nonlinear Dynamical Control Systems. Springer, New York, USA, 1990. [14] P. J. Olver. Applications of Lie Groups to Differential Equations. Springer, New York, USA, 1993. [15] P. J. Olver. Equivalence, Invariants, and Symmetry. Cambridge University Press, Cambridge, UK, 1995. 83 LITERATURVERZEICHNIS LITERATURVERZEICHNIS [16] J. F. Pommaret. Systems of Partial Differential Equations and Lie Pseudogroups. Gordon and Breach Science Publishers, New York, USA, 1978. [17] S. Sastry. Nonlinear Systems Analysis, Stability and Control. Springer, New York, USA, 1999. [18] D. Saunders. The Geometry of Jet Bundels. Cambridge University Press, Cambridge, UK, 1989. [19] M. Spivak. Differential Geometry, Vol. 1 to 5. Publish or Perish, Inc., Houston, USA, 1979. 84