Vorlesungsskriptum Regelung nichtlinearer mechatronischer

Werbung
Vorlesungsskriptum
Regelung nichtlinearer mechatronischer Systeme 2
Kurt Schlacher
Institut für Regelungstechnik und Prozessautomatisierung
Johannes Kepler Universität Linz
WS 2016/2017
Inhaltsverzeichnis
1 Mathematische Grundlagen
1.1 Geometrische Methoden . . . . . . . . . . . . . .
1.2 Der Zustandsraum autonomer Systeme . . . . . .
1.3 AI-Systeme . . . . . . . . . . . . . . . . . . . . .
1.4 Beispiele zu AI Systemen . . . . . . . . . . . . . .
1.4.1 Einfache mechanische Systeme . . . . . . .
1.4.2 Die Kurzschlussläufer Asynchronmaschine
1.5 Abstrakte Mannigfaltigkeiten . . . . . . . . . . .
1.6 Bündel . . . . . . . . . . . . . . . . . . . . . . . .
1.6.1 Das Tangential- und Kotangentialbündel .
1.6.2 Freie und autonome Systeme . . . . . . . .
1.6.3 Systeme mit Eingang . . . . . . . . . . . .
1.7 Transformationen . . . . . . . . . . . . . . . . . .
1.8 Schlussbemerkungen . . . . . . . . . . . . . . . .
1.9 Aufgaben . . . . . . . . . . . . . . . . . . . . . .
1.9.1 AI-Systeme . . . . . . . . . . . . . . . . .
1.9.2 Mannigfaltigkeiten . . . . . . . . . . . . .
1.9.3 Bündel . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
4
5
7
7
8
11
19
22
27
29
31
33
34
34
34
35
2 Eingangs/Ausgangslinearisierung
2.1 Der Eingrößenfall . . . . . . . . . . . . . . . .
2.2 Tensor Bündel . . . . . . . . . . . . . . . . . .
2.2.1 Lie-Ableitungen und die Lie-Klammer
2.2.2 Die äußere Ableitung . . . . . . . . . .
2.3 Der Eingrößenfall II . . . . . . . . . . . . . . .
2.4 Der Mehrgrößenfall . . . . . . . . . . . . . . .
2.5 Schlussbemerkungen . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
40
43
45
45
47
3 Erreichbarkeit und Beobachtbarkeit
3.1 Distributionen und die Sätze von Frobenius
3.2 Beobachtbarkeit . . . . . . . . . . . . . . . .
3.3 Erreichbarkeit . . . . . . . . . . . . . . . . .
3.4 Eingangs/Zustandslinearisierung . . . . . . .
3.4.1 Der Eingrößenfall . . . . . . . . . . .
3.4.2 Der Mehrgrößenfall . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
48
49
53
58
61
62
64
i
.
.
.
.
.
.
INHALTSVERZEICHNIS
3.5
INHALTSVERZEICHNIS
Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4 Mathematische Grundlagen
4.1 Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Topologische Räume . . . . . . . . . . . . . . . . .
4.1.2 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Konvergenz und Hausdorff-Räume . . . . . . . . . .
4.1.3.1 Teilräume, Produkt und Quotientenraum
4.1.4 Metrische Räume . . . . . . . . . . . . . . . . . . .
4.1.5 Kompaktheit . . . . . . . . . . . . . . . . . . . . .
4.1.6 Zusammenhang . . . . . . . . . . . . . . . . . . . .
4.2 Inverse und implizite Funktion . . . . . . . . . . . . . . . .
4.2.1 Mittelwertsätze . . . . . . . . . . . . . . . . . . . .
ii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
67
67
67
70
72
72
74
75
77
79
82
Kapitel 1
Mathematische Grundlagen
Diese Vorlesung widmet sich dynamischen Systemen, der Art
ẋ = f (t, x, u)
y = c (t, x, u)
(1.1)
(1.2)
mit dem n-dimensionalen Zustand x, dem m-dimensionalen Eingang u und dem l-dimensionalen Ausgang y. Vorerst sind f und c nur Funktionen passender Dimension. So ein
System wird auch als nichtlineares Regelungssystem in Zustandsdarstellung genannt. Allerdings ist die Klasse der nichtlinearen Regelungssysteme zu allgemein, und es werden im
weiteren Einschränkungen für die Funktionen f und c so gesucht, dass die eingeschränkte
Klasse von Systemen leichter handhabbar wird, aber auch für die Anwendung interessant
bleibt. Die Wahl
f (t, x, u) = Ax + Bu
c (t, x, u) = Cx + Du
mit geeigneten Matrizen A, B, C, D führt z.B. auf die Klasse der linearen und zeitinvarianten Systeme. So ist die Wahl des Zustandsraumes Rn , siehe auch aut1, aut2, eine
natürliche für diese Klasse. Wie später gezeigt wird, trifft dies auf nichtlineare Systeme
nicht mehr zu. Ähnliche Überlegungen gelten für den Eingangs- und Ausgangsraum.
Im Rahmen dieser Vorlesung wird nun nicht mehr die Matrizenschreibweise, siehe
auch aut1, aut2, benutzt, sondern die weitaus flexiblere Tensorschreibweise. Beispielhaft
betrachte man den Rn mit einer Basis B = {e1 , . . . , en } und Koordinaten (x1 , . . . , xn ).
Ein Punkt p des Rn wird dann mittels der Koordinaten xi = xi (p), i = 1, . . . , n durch
p = xi (p) ei beschrieben. Man beachte, dass das Symbol xi sowohl eine Koordinate als
auch die Koordinatenfunktion xi : Rn → R bezeichnet, also jene Funktion, die dem Punkt
p die Koordinate xi bezüglich der Basis B zuordnet. Auch wurde bereits die Einsteinsche
Konvention für Summen mit der Abkürzung
n
X
ai bi = ai bi
i=1
verwendet, wobei der Indexbereich i = 1, . . . , n noch unterdrückt wird, wenn er vom
Zusammenhang her bekannt ist. Man betrachte nun eine stetig differenzierbare Funktion
1
1.1. Geometrische Methoden
1. Mathematische Grundlagen
f (x) : Rn → R, dann verwenden wir für die partiellen Ableitungen die Abkürzung
∂
f (x) = ∂i f (x) ,
∂xi
∂
= ∂i
∂xi
sofern keine Verwechslung möglich ist.
Die Wahl des Zustands-, Eingangs- und Ausgangsraumes war im linearen und zeitinvarianten Fall nun sehr einfach. Im nichtlinearen Fall muss nun ebenfalls für jede Systemklasse ein geeigneter Zustandsraum gewählt werden. Dies wird vorerst an Hand von
einigen Beispielen diskutiert.
1.1
Geometrische Methoden
Dynamische Systeme der Art
ẋ = f (x, u)
y = c (x, u)
(1.3)
(1.4)
mit dem n-dimensionalen Zustand x, m-dimensionalen Eingang u und l-dimensionalen
Ausgang y werden hier mit (differential-) geometrischen Methoden behandelt. Es bezeichne x (t), u (t), y (t) eine Lösung obigen Systems, es gilt also
∂t x (t) = f (x (t) , u (t))
y (t) = c (x (t) , u (t)) ,
(1.5)
(1.6)
dann sind durch t 7→ x (t), t 7→ u (t), t 7→ y (t) Abbildungen gegeben, wobei noch deren Bildbereich zu klären ist. Außerdem liegen diese Kurven in speziellen Flächen, siehe
(1.5), (1.6), die wieder in Räumen mit Koordinaten (ẋ, x, u) und (y, x, u) liegen. Also
muss vorerst die Beschaffenheit dieser Räume geklärt werden, damit man diese Flächen
untersuchen kann. Beides wird nun mit differentialgeometrischen Methoden geschehen.
Die Gleichungen dieser Flächen sind offensichtlich durch (1.3), (1.4) gegeben.
Man betrachte nun Transformationen der Art
x̄ = ϕ (x)
(x̄, ū) = ψ (x, u) = (ϕ (x) , υ (x, u))
ȳ = χ (x, u, y) ,
wobei die Abbildungen ϕ, ψ, χ umkehrbar eindeutig seien, dann hat das transformierte
System die Gestalt
x̄˙ i = ∂j ϕi ◦ ψ −1 (x̄, ū) f j ◦ ψ −1 (x̄, ū)
= ∂j ϕi f j ◦ ψ −1 (x̄, ū)
ȳ = χ (x, u, c (x, u)) ◦ ψ −1 (x̄, ū) .
Offensichtlich ist dieses System wieder ein Regelungssystem. Weiters ändern unter gewissen (einfachen) Bedingungen solche Transformationen nicht die geometrischen Eigenschaften obiger Flächen. Daher werden solche Transformationen ein wichtiges Hilfsmittel
2
1.1. Geometrische Methoden
1. Mathematische Grundlagen
sein, die Eigenschaften dieser Flächen zu klären. Zusammenfassend kann man festhalten,
dass wir hier mehr an den geometrischen Eigenschaften der durch (1.3), (1.4) definierten
Flächen als an den Lösungen (1.5), (1.6) interessiert sind.
10
9
70
8
60
7
6
ẋ
x̄˙
50
5
4
40
3
30
2
1
20
10
0
0.0
0.2
u
0.4
0.6
0.8
1.0
10
9
7
8
6
5
4
0
0
3
1
2
ū
x
3
4
5
5.0
4.5
4.0
3.5
3.0
2.5
2.0
x̄
1.5
1.0
0.5
0.0
Bild 1.1: Graph zu Glg. (1.7) links und Glg. (1.8) rechts.
Als einfaches Beispiel wird das System
ẋ = x ln (x) +
x
u
ln (x)
(1.7)
betrachtet. Den Graphen dazu zeigt die linke Seite von Bild 1.1. Die Transformation
x̄ = ln (x) ,
ū =
x
u
ln (x)
führt nun zu
1
x
x̄˙ = x ln (x) +
u
x
ln (x)
= (x̄ + ū) .
(1.8)
Der zugehörige Graph ist der rechten Seite von Bild 1.1 zu entnehmen. Die speziellen
Lösungen
u = et ,
x̄ = (t + 2) et ,
t
u = (t + 2) e2t−(t+2)e ,
t
x = e(t+2)e ,
x̄˙ = (t + 3) et
ẋ = (t + 3) et+(t+2)e
t
liegen nun in den jeweiligen Flächen. Das Problem, eine Transformation so zu finden,
dass das transformierte System linear ist, ist also äquivalent zur Bestimmung einer Transformation, die die Fläche der linken Seite von Bild 1.1 auf eine Ebene, siehe die rechte
Seite, abbildet. Man sieht also einfach, dass dieser Ansatz speziell für nichtlineare Systeme geeignet ist, da man mit diesem Zugang die Lösung des dynamischen Systems nicht
konstruieren muss.
3
1.2. Der Zustandsraum autonomer Systeme
1.2
1. Mathematische Grundlagen
Der Zustandsraum autonomer Systeme
Man betrachte vorerst das lineare und zeitinvariante System
ẋi = Aij xj
(1.9)
mit i, j = 1, . . . , n. Wählt man nun den linearen Vektorraum Rn als Zustandsraum X ,
dann sind die strukturerhaltenden Koordinatentransformation auf die Klasse
x̄i = Tji xj
(1.10)
mit invertierbarer Matrix Tji eingeschränkt. Ein Lösung des Systems (1.9) ist eine Abbildung γ : R → Rn oder eine Kurve mit Kurvenparamter τ ∈ R, die der Beziehung
∂τ γ i (τ ) = Aij γ j (τ )
genügt. Das Paar (γ i (τ ) , ∂τ γ i (τ )) ist nun Element eines neuen Raumes, des Tangentialraums T (Rn ) von Rn , für den wir die Koordinaten (xi , ẋi ) verwenden. Aus (1.10) folgt
nun
γ̄ i (τ ) = Tji γ j (τ )
∂τ γ̄ i (τ ) = Tji ∂τ γ j (τ )
oder
x̄˙ i = Tji ẋj .
(1.11)
Damit gilt aber auch T (Rn ) = Rn × Rn , eine besondere Eigenschaft, die den Rn auszeichnet.
Für nichtlineare Systeme ist es jedoch zweckmäßig, allgemeinere Transformationen
zuzulassen. Dazu betrachte man folgendes System
ẋ1 = x1 ln x2
ẋ2 = −x2 ln x1 ,
dessen Zustandsraum wegen x1 , x2 > 0 nicht der R2 sein kann. Die Transformation R+ ×
R+ → R2
x̄1 = ln x1
x̄2 = ln x2
mit
1 1
ẋ
x1
1
x̄˙ 2 = 2 ẋ2
x
x̄˙ 1 =
führt auf das lineare System
x̄˙ 1 = x̄2
x̄˙ 2 = −x̄1 ,
4
1.3. AI-Systeme
1. Mathematische Grundlagen
wobei man für den Zustandsraum hier den R2 wählen kann. Mit Hilfe von nichtlinearen Zustandstransformationen lassen sich also überraschende Ergebnisse erzielen. So wird
obiges System durch lineare Differentialgleichungen beschrieben.
Wenn nicht anders darauf hingewiesen wird, werden in dieser Vorlesung autonome
Systeme der Art
ẋi = f i (x) , i = 1, . . . , n
(1.12)
betrachtet, deren Zustandsraum X eine abstrakte, n-dimensionale, glatte Mannigfaltigkeit
mit Koordinaten (xi ), i = 1, . . . , n ist. Die zulässigen Koordinatentransformationen sind
nichtlineare Diffeomorphismen der Art
x̄i = ϕi (x) .
(1.13)
Nun folgen aus dieser Beziehung für eine Kurve γ : [0, ε) → X , ε ∈ R+ , die Lösung von
(1.12) ist, d.h. es gilt
∂τ γ i (τ ) = f i ◦ γ (τ )
aus (1.12), (1.13) die Beziehungen
γ̄ i (τ ) = ϕi ◦ γ (τ )
∂τ γ̄ i (τ ) = ∂j ϕi ◦ γ (τ ) ∂τ γ j (τ ) ,
j = 1, . . . , n
aus denen man die Transformationsvorschrift
x̄˙ i = ∂j ϕi (x) ẋj
(1.14)
gewinnt. Man beachte, dass im nichtlinearen Fall die Transformation für die Koordinaten
ẋi nicht mehr mit der für die Koordinaten xi zusammen fällt. Das Paar (γ i (τ ) , ∂τ γ i (τ ))
ist wieder Element eines neuen Raumes, des Tangentialraums T (X ) des Zustandsraumes
X . Um die Eigenschaften dieses Raumes zu klären, muss man wissen, wie T (X ) von X
abgeleitet wird. Abschließend ist noch zu bemerken, dass der Zustandsraum freier Systeme
n-ter Ordnung nicht eine abstrakte, n-dimensionale, glatte Mannigfaltigkeit, sondern ein
Bündel ist.
1.3
AI-Systeme
Ein zeitinvariantes, dynamisches System n-ter Ordnung mit m Eingängen und l Ausgängen der Form
ẋi = ai (x) + Bςi (x) uς
y ζ = cζ (x) + Dςζ (x) uς
(1.15)
(1.16)
und i = 1, . . . , n, ς = 1, . . . , m, ζ = 1, . . . , l wird AI-System (Affine Input) genannt. Diese
Bezeichnung bezieht sich ausschließlich auf die Form der rechten Seiten von (1.15, 1.16).
Die Elemente der Größen a(x), B(x), c(x) und D(x) werden als glatt vorausgesetzt. Man
5
1.3. AI-Systeme
1. Mathematische Grundlagen
beachte, dass diese Voraussetzung lediglich aus Gründen der Vermeidung von Fallunterscheidungen getroffen wird. Erfüllt ein System diese nicht, dann sind die Untersuchungen
entsprechend zu erweitern. Ein AI Eingrößensystem hat noch die Form
ẋi = ai (x) + bi (x) u
y = c (x) + d (x) u
Sehr viele technische Systeme haben nun die Form von AI Systemen. So sind lineare
Systeme der Form
ẋi = Aij xj + Bςi uς
y χ = Ciχ xi + Dςχ uς
wegen
ai (x) = Aij xj , Bςi (x) = Bςi , cζ (x) = Ciζ xi
und Dςζ (x) = Dςζ
natürlich AI-Systeme. Die bilinearen Systeme gehören ebenfalls zur Klasse der AI Systeme.
Sie haben die Form
i
ẋi = Aij xj + Nj,ς
xj + Bςi uς
y χ = Ciχ xi ,
wobei die Nichtlinearität nur beim Stelleingriff auftritt.
Man beachte nun eine Koordinatentransformation der Art
x̄ = ϕ (x)
(x̄, ū) = ψ (x, u) = (ϕ (x) , k (x) + M (x) u)
ȳ = l (x) + N (x) y ,
wobei die Abbildungen ϕ umkehrbar eindeutig und [Mτς (x)], [Nκχ (x)] regulär seien. Das
transformierte System hat nun die Gestalt
x̄˙ i = ∂j ϕi ◦ ϕ−1 (x̄) aj ◦ ϕ−1 (x̄) + ∂j ϕi Bςj ◦ ϕ−1 (x̄) M̄τς ◦ ϕ−1 (x̄) ūτ − k τ ◦ ϕ−1 (x̄)
= ∂j ϕi aj ◦ ϕ−1 (x̄) − ∂j ϕi Bςj M̄τς k τ ◦ ϕ−1 (x̄) + ∂j ϕi Bςj M̄τς ◦ ϕ−1 (x̄) ūτ
ȳ χ = lχ ◦ ϕ−1 (x̄) + Nκχ ◦ ϕ−1 (x̄) cκ ◦ ϕ−1 (x̄) +
+Dςκ ◦ ϕ−1 (x̄) M̄τς ◦ ϕ−1 (x̄) ūτ − k τ ◦ ϕ−1 (x̄)
= lχ + Nκχ cκ − Dςκ M̄τς k τ ◦ ϕ−1 (x̄) + Nκχ Dςκ M̄τς ◦ ϕ−1 (x̄) ūτ ,
es ist offensichtlich wieder ein AI System, wobei M̄τς die zu [Mτς ] inverse Matrix ist.
Als triviales Ergebnis erhält man, dass die Rückkopplung die AI Struktur erhält. Man
zeigt ebenfalls einfach, dass die Parallelschaltung, Hintereinanderschaltung und Inversion,
sofern möglich, von AI Systemen wieder auf AI Systeme führt.
Im Folgenden Abschnitt werden AI Systeme betrachtet, deren Zustandsraum eine ndimensionale, abstrakte und glatte Mannigfaltigkeit ist.
6
1.4. Beispiele zu AI Systemen
1.4
1. Mathematische Grundlagen
Beispiele zu AI Systemen
Differentialgeometrische Methoden haben viele Anwendungen in der Praxis. Dazu werden
zwei Beispiele, eines aus der Robotik und eines aus dem Gebiet der elektrischen Maschinen betrachtet. Kann man einen Roboter mit n Freiheitsgraden durch Gleichungen vom
Lagrange’schen Typ mit n Stellgrößen beschreiben, dann ist dieses System nämlich äquivalent zu n Doppelintegratoren. Auch eine Asynchronmaschine vom Käfigläufertyp ist
abgesehen von einem speziellen Zustand äquivalent zu einem linearen System. Daher ist
die Regelung so einer Maschine nur in der Nähe dieses singulären Punktes nicht trivial.
1.4.1
Einfache mechanische Systeme
Ein einfaches mechanisches System kann durch die Lagrange’schen Gleichungen beschrieben werden. Es seien x, i = 1, . . . , n die Koordinaten des Konfigurationsraumes K, dann
sind (xi , ẋi ) Koordinaten des Zustandsraumes X . Für den Zustandsraum X gilt hier offensichtlich X = T (K). Mit der Lagrange Funktion L : X → R folgt aus
d ˙
∂i L (x, ẋ) − ∂i L (x, ẋ) = ui ,
dt
für
∂
∂˙i = i ,
∂ ẋ
d
= ẍj ∂˙j + ẋj ∂j + ∂t
dt
1
L = ẋj Mjk (x) ẋk − V (x)
2
sofort
1
Mik (x) ẋk − ẋj ∂i Mjk (x) ẋk + ∂i V
2
1 j
1
k
j
j
l
Mik (x) ẋ + ẋ Mji (x) − ẋ ∂i Mjk (x) ẋk + ∂i V
Mij (x) ẍ + ẋ ∂l
2
2
1
j
Mij (x) ẍ + (∂j Mik (x) + ∂k Mji (x) − ∂i Mjk (x)) ẋj ẋk + ∂i V
2
Mij (x) ẍj + Γijk (x) ẋj ẋk + ∂i V
ẍ ∂˙l + ẋl ∂l + ∂t
l
(x) = ui
(x) = ui
(x) = ui
(x) = ui .
Um im Weiteren Fallunterscheidungen zu vermeiden, wird angenommen, dass die Massenmatrix [Mij ] regulär ist. Die Transformation
ui = ∂i V (x) + Γijk (x) ẋj ẋk + Mij (x) ūj
mit dem neuen Eingang ū führt nun auf
Mij (x) ẍj = Mij (x) ūj
ẍj = ūj .
Dieses System ist offensichtlich linear, es besteht aus n Doppelintegratoren.
7
1.4. Beispiele zu AI Systemen
1.4.2
1. Mathematische Grundlagen
Die Kurzschlussläufer Asynchronmaschine
Ein Prinzipbild für die Kurzschlussläuferasynchronmaschine ist in Abbildung 1.2 angegeben. Mit den Größen
us = u1s u2s u3s = ujs , j = 1, . . . , 3
is = i1s i2s i3s = ijs , j = 1, . . . , 3
(1.17)
1 2 3
j
Ψs = Ψs Ψs Ψs = Ψs , j = 1, . . . , 3
kann das elektrische Teilsystem des Statorkreises in der Form
ujs = Rs ijs +
d j
Ψ,
dt s
j = 1, . . . , 3
(1.18)
modelliert werden. Ψ1s , . . . ,Ψ3s bezeichnen hier die verketteten Flüsse der 3 Statorphasen,
i1s , . . . , i3s die zugehörigen Ströme und u1s , . . . , u3s die anliegenden externen Spannungen.
Der elektr. Widerstand der Ständerspulen ist symmetrisch mit Rs angenommen. Weiters
gilt für den verketteten Fluss
Ψjs = Ljs,k iks + Ljsr,k (φ) ikr
mit den Strömen der Rotorspulen
ir = i1r i2r i3r = ijr ,
j = 1, . . . , 3
der Induktivitätsmatrix des Stators


L0 + Lσ − L20
− L20


Ls = Ljs,k =  − L20 L0 + Lσ − L20  ,
− L20 L0 + Lσ
− L20
sowie der Koppelinduktivitätsmatrix zwischen Stator und Rotor


L0 cos (φ)
L0 cos φ + 2π
L0 cos φ − 2π
3
3

2π 
L
cos
(φ)
L
cos
φ
+
Lsr = Ljsr,k =  L0 cos φ − 2π
0
0
3 3  .
2π
2π
L0 cos φ + 3 L0 cos φ − 3
L0 cos (φ)
(1.19)
(1.20)
Das mathematische Modell des elektrischen Rotor-Teilsystems kann nun analog in der
Form
d
ujr = Rr ijr + Ψjr , j = 1, . . . , 3
dt
angegeben werden, wobei hier die Komponenten des verketteten Rotorflusses mit
Ψr = Ψ1r Ψ2r Ψ3r = Ψjr , j = 1, . . . , 3
bezeichnet werden und für den Widerstand in den Rotorspulen Rr gilt. Der verkettete
Rotorfluss genügt wieder der Beziehung
Ψjr = Ljr,k ikr + Ljsr,k (φ) iks ,
8
1.4. Beispiele zu AI Systemen
1. Mathematische Grundlagen
ab-System
b
d
dq-System
φ
q
s2
r1
s1
r2
a
r3
Stator
s3
Rotor
Bild 1.2: Prinzipbild einer Kurzschlussläuferasynchronmaschine.
wobei hier Ljr,k = Ljs,k angenommen wird. Für den Rotorkreis einer Kurzschlussläuferasynchronmaschine gilt nun
ujr = 0, j = 1, . . . , 3.
Mit der magnetischen Energie bzw. Koenergie
ko
Wmag = Wmag
=
1 i
is δi,k Ψks + iir δi,k Ψkr
2
kann das elektrisch erzeugte Drehmoment der Maschine zu
Mel = −
∂
1 ∂ i
ko
is δi,k Ψks + iir δi,k Ψkr
Wmag
=−
∂φ
2 ∂φ
angegeben werden. Mit den Abkürzungen für die Induktivitätsmatrix bzw. die Widerstandsmatrix
k
j
diag (Rs )
0
Ls Lsr (φ)
L (φ) = Ll =
, R = Rl =
0
diag (Rr )
LTsr (φ) Lr
kann das mathematische Modell mit Ψ = (Ψs , Ψr ) kompakt in der Form
l
d j
j m
us ,
Ψ = −Rlj L−1 (φ) k Ψk + gm
dt
mit gii = 1 und gji = 0 für i 6= j geschrieben werden.
Die Blondel-Park-Transformation (siehe z.B. [4]) erlaubt es nun, die beiden elektrischen
Teilsysteme 3. Ordnung als äquivalente Systeme 2. Ordnung darzustellen. Man benützt
die Transformation
Ψ̄i = Pi,j (φ) Ψj ,
(Pi,j ) = P = P0 exp (V φ)
9
1.4. Beispiele zu AI Systemen
1. Mathematische Grundlagen
mit
exp (V φ) =
I
0
,
0 exp (V22 φ)
V22
und
P0 =
P0,11 0
,
0 P0,22
P0,11 = P0,22


0 −1 1
1
= √  1 0 −1 
3 −1 1 0


1 − 12 − 21
√
√ 

=  0 21 3 − 12 3  .
1 1
1
und erhält ein System, in dem ein stabiles, autonomes Teilsystem für die Stator- bzw.
Rotorflüsse der Form
Rs
3
d Ψ̄3s
− Lσs 0
Ψ̄s
=
(1.21)
Rr
3
0 − Lσr
Ψ̄3r
dt Ψ̄r
entsteht, welches für die weiteren Untersuchungen vernachlässigt werden kann.
Die Kurzschlussläufer-Asynchronmaschine kann nun durch ein dynamisches System 5.
Ordnung der Form
d i
Ψ̄s = −a1 Ψ̄is + b1 Ψ̄ir + ūis , i = 1, 2
(1.22)
dt
d i
Ψ̄ = b2 Ψ̄is − a2 Ψ̄ir + ωJji Ψ̄js , i = 1, 2
(1.23)
dt r
1
d
(MEl − ML ) , MEl = 2d Ψ̄1s Ψ̄2r − Ψ̄2s Ψ̄1r
(1.24)
ω=
dt
θm
0 −1
i
mit J = Jj =
und geeigneten Konstanten a1 , b1 , c1 , a2 , b2 , c2 und d beschrieben
1 0
werden. Das duch die Maschine erzeugte elektrische Moment wird mit MEl bezeichnet und
das extern aufgebrachte
Lastmoment mit ML . Darin bezeichnen weiter Ψ̄s = Ψ̄1s , Ψ̄2s
und Ψ̄r = Ψ̄1r , Ψ̄2r die Komponenten des verketteten Stator- bzw. Rotorflusses in 2Achsen Darstellung. ω ist die Drehwinkelgeschwindigkeit des Rotors und die Stellgrößen
für dieses System sind durch die Statorspannungen ūs = (ū1s , ū2s ) in 2-Achsen Darstellung
gegeben. θm bezeichnet das Trägheitsmoment des Rotors. Das System (1.22)-(1.24) ist
nun offensichtlich ein Mehrgrößen-AI-System.
Für dieses System kann nun eine exakte Linearisierung, wie sie im Abschnitt 1.4.1
angewandt wurde, für ein Teilsystem so vorgenommen werden, dass die Ausgänge dieser
Teilsysteme die für den Betrieb der Maschine interessanten Größen elektrisches Moment
und Rotorflussnorm sind.
Wählt man als gedachte Ausgänge das elektrische Moment MEl und die Quadratnorm
des Rotorflusses kΨr k22 , so kann die folgende Zustandstransformation aufgebaut werden:
Man bildet die totale zeitliche Ableitung dieser beiden Größen und wertet das Ergebnis
entlang der Systemtrajektorien aus. Dies ergibt
d
˙ 2 Ψ̄1 − Ψ̄
˙ 1 Ψ̄2 + Ψ̄2 Ψ̄
˙ 1 − Ψ̇1 Ψ̄
˙ 2 = 2d Ψ̄
MEl s r
s r
s r
s r
ẋ=a(x)+B(x)u
dt
ẋ=a(x)+B(x)u
= α1 (x) + β11 (x) ū1s + β21 (x) ū2s ,
10
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
mit geeigneten Funktionen α1 (x), β11 (x) und β21 (x) (Bitte Nachrechnen!). Genauso verfährt man mit dem Quadrat der Rotorflussnorm. Hier ist dieser Vorgang zwei Mal zu
wiederholen, bis man ein System der Form
!
d
d
2
= α2 (x) + β12 (x) ū1s + β22 (x) ū2s
kΨr k2 dt dt
ẋ=a(x)+B(x)u
ẋ=a(x)+B(x)u
erhält. Beim vorliegenden System ist die Matrix β =
Stellgrößentransformation
ū1s
ū2s
=β
−1
β11 β21
β12 β22
invertierbar, sodass die
1 α
v1
2 −
α2
v
ein lineares Teilsystem der Form
ż 1 = v 1
ż 2 = z 3
ż 3 = v 2
mit einem weiteren Teilsystem, welches als Nulldynamik bezeichnet wird.
Im Rahmen der Rechenübungen wird dieses Beispiel ausführlich diskutiert und ein
Maple-Paket vorgestellt, welches den Benutzer bei den notwendigen Rechenschritten
unterstützt. Ziel der weiteren Überlegungen im Rahmen der Vorlesung soll es nun sein
eine Methodik zu erarbeiten, zu testen, ob durch Zustandsrückführung so ein lineares
Teilsystem erzeugt werden kann und wie die maximale Dimension dieses Teilsystems ist.
Weiters sollen die Bestimmungsgleichungen (wir werden sehen, es sind partielle Differentialgleichungen) für die im Weiteren entscheidenden “linearisierenden Ausgänge” hergeleitet
werden. Dazu werden aber einige Grundlagen der Differentialgeometrie benötigt.
1.5
Abstrakte Mannigfaltigkeiten
Mannigfaltigkeiten gehören zu den wichtigsten Begriffen bei der Untersuchung von nichtlinearen, dynamischen Systemen. Hiezu betrachte man die Bewegung eines Punktes entlang
der x Achse, es gilt
ẋ = v
(1.25)
mit der Geschwindigkeit v. Gilt nun v = v (t) ∈ C ∞ ([0, ∞)), dann kann man diese
Gleichung elementar lösen. Als Zustandsmenge kann R gewählt werden. Untersucht man
jedoch die Bewegung eines Punktes auf dem Einheitskreis, es gelte
ϕ̇ = ω ,
(1.26)
dann kann wieder für ω = ω(t) die Gleichung elementar gelöst werden. Aber die Wahl
von R für die Zustandsmenge ist nicht sinnvoll, da x + 2kπ, k ∈ N dieselbe physikalische
11
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
Position beschreibt. Natürlich ist hier der Einheitskreis S1 die adäquate Zustandsmenge.
Anstelle obiger Gleichung kann man auch die Beziehungen
ẋ1 = ωx2 ,
ẋ2 = −ωx1
(1.27)
2
2
untersuchen, wobei die Anfangsbedingungen der Restriktion (x1 (0)) + (x2 (0)) = 1 genügen müssen. Setzt man noch
x1 = sin(ϕ) , x2 = cos(ϕ) ,
(1.28)
dann folgt
cos(ϕ) (ϕ̇ − ω) = 0,
sin(ϕ) (ϕ̇ − ω) = 0 .
Offensichtlich ist also (1.26) die lokale Version von (1.27). Man beachte, dass die Abbildung
(1.28) für ϕ ∈ R nicht injektiv ist. Diese hier beschriebenen Probleme treten bei der
Gleichung (1.25) nicht auf.
Eine glatte Mannigfaltigkeit ist die Verallgemeinerung einer m-dimensionalen glatten
Fläche im Rn mit n ≥ m. Obwohl man jede m-dimensionale glatte Mannigfaltigkeit in den
R2m+1 einbetten kann, beschreiten wir hier einen anderen Weg. Wir geben eine abstraktere
Definition einer glatten Mannigfaltigkeit, die ohne Einbettung in den Rn , für ein geeignetes
n, auskommt.
M
p
φβ
φα
y
x
x = φα (p) = φα φ−1
β (y)
y = φβ (p) = φβ (φ−1
α (x))
Bild 1.3: Zu Trägern und Koordinatenfunktionen von Karten.
Definition 1.1 Eine glatte m-dimensionale Mannigfaltigkeit ist eine Menge M, zusammen mit einer abzählbaren Menge von Teilmengen Uα ⊂ M, den Trägern der Karten,
und bijektiven Abbildungen φα : Uα → Vα auf zusammenhängenden offenen Teilmengen
Vα ⊂ Rm , den Koordinatenfunktionen, die folgende Eigenschaften aufweist. Die Menge
der Paare (Uα , φα ) heißen Karten.
1. Die Träger der Karte überdecken M, oder M = ∪α Uα .
2. Es gelte Uα ∩ Uβ = U =
6 { }, dann ist die Abbildung φβ ◦ φ−1
α : φα (U) → φβ (U) glatt.
3. Für jedes Paar von Punkten p ∈ Uα , q ∈ Uβ , p 6= q existieren offene Teilmengen
Wα , Wβ ⊂ Rm so, dass gilt φα (p) ∈ Wα ⊂ Vα , φβ (q) ∈ Wβ ⊂ Vβ und φ−1
α (Wα ) ∩
−1
φβ (Wβ ) = {}.
12
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
Man beachte, dass Karten eine Topologie für M ermöglichen, wobei man die offenen
m
Mengen φ−1
festlegt. Mit dieser
α (W ) mittels der offenen Mengen W ⊂ φα (Uα ) ⊂ R
Topologie besagt Punkt 3 von Definition 1.1, dass M die Trennungseigenschaft von Hausdorff besitzt. Der Grad der Differenzierbarkeit der Funktion φβ ◦ φ−1
α bestimmt den von
M. Wir werden nur glatte Mannigfaltigkeiten betrachten. Neben der ursprünglichen Karte φα : Uα → Vα kann man weitere Karten hinzufügen φγ : Uγ → Vγ ⊂ Rm mit der
−1
Bedingung, dass die Funktionen φγ ◦ φ−1
α , φα ◦ φγ auf den Mengen φα (Uγ ∩ Uα ) 6= {}
glatt für alle α, γ sind. In diesem Fall heißt die Karte φγ : Uγ → Vγ kompatibel mit der
Basiskarte. Die größtmögliche Menge aller kompatiblen Karten heißt ein Atlas von M.
Diesen Sachverhalt veranschaulicht Bild 1.3.
Der einfachste Fall einer m-dimensionalen Mannigfaltigkeit ist der Rm . Das m-Tupel
x = (x1 , . . . , xm ) sei ein Koordinatensystem des Rm , und ϕi seien Koordinatenfunktionen, die jeden Punkt q ∈ Rm in den R mittels xi = ϕi (q) abbilden. Bitte beachten Sie
die Änderung in der Notation. Wir schreiben xi für die i-te Koordinate xi oder das i-te
Element des Tupels (x1 , . . . , xi , . . . , xm ). Für die k-te Potenz von xi wird die Bezeichnung
k
(xi ) verwendet. Für eine m-dimensionale Mannigfaltigkeit M, mit Trägern Uα und Koordinatenfunktionen φα kann die zusammengesetzte Abbildung ϕi ◦ φα : M → R durch
ϕi ◦ φα (p) eingeführt werden. Man nennt nun die Funktionen xi (p) = ϕi ◦ φα (p) ebenfalls
Koordinatenfunktionen. Obwohl verschiedene Dinge gleich bezeichnet werden, sollte keine
Gefahr der Verwechslung bestehen. Darüberhinaus werden wir oft x = (x1 , . . . , xm ) als
lokales Koordinatensystem für M bezeichnen. Dies bedeutet soviel wie, es existieren auf
dem Träger Uα mit p ∈ Uα Koordinatenfunktionen φα : Uα → Vα auf offenen Mengen
Vα ⊂ Rm des Rm so, dass xi = φiα (p) = ϕi ◦ φα (p) gilt. Kennt man die Koordinaten von
p in einer Karte, dann sind sie natürlich für alle anderen Karten festgelegt.
b = φ2 (p) = φ2 φ−1
1 (a)
b
y
a = φ1 (p) = φ1 φ−1
2 (b)
p
a
x
xxxxxxxxxx
Bild 1.4: Karten für den Einheitskreis S1 .
Beispiele von Mannigfaltigkeiten wären die Kugel, der Torus, eine Gerade oder eine
Fläche im R3 . Alle diese Mannigfaltigkeiten lassen sich natürlich im R3 einbetten. In vielen
13
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
Fällen reicht eine Karte nicht aus. Bild 1.4 ist der Einheitskreis S1 mit den vier Karten
y (p)
x (p)
x (p)
b=
y (p)
y (p)
c=−
x (p)
a=
d=−
x (p)
y (p)
für
x (p) > 0
für
y (p) > 0
für
x (p) < 0
für
y (p) < 0
zu entnehmen. Diese Karten überlappen sich jeweils. So stehen im Bereich x (p) > 0 und
y (p) > 0 die Koordinaten der Karten 1 und 2 in der Beziehung
a=
1
b
bzw.
b=
1
.
a
Ebenso Mannigfaltigkeiten sind die m-dimensionalen Einheitskugeln Sm . Sie folgen aus
der Beziehung
m+1
X
2
xi = 1 ,
i=1
deren Lösungen glatte Untermannigfaltigkeiten des Rm+1 sind. Die Träger
Ui = Sm ∩ x ∈ Rm+1 | xi > 0 , U1+m+i = Sm ∩ x ∈ Rm+1 | xi < 0
zusammen mit den Projektionen auf die Ebenen xi = 0 und den Kartenfunktionen φi ,
φ1+m+i , bilden eine Karte. Im Gegensatz dazu ist der 2-dimensionale Kegel
x1
2
− x2
2
− x3
2
=0,
eingebettet im R3 , keine Mannigfaltigkeit, denn für den Ursprung existiert kein Träger
Uα , der bijektiv auf eine offene Menge des R2 abgebildet werden kann. Weniger triviale
Beispiele einer m-dimensionalen Mannigfaltigkeit wären der projektive Raum Pm (R), die
Menge aller Geraden durch den Ursprung im Rm+1 , oder die Menge der Drehungen im
R3 .
Relativ einfache Objekte, die man auf Mannigfaltigkeiten studieren kann, sind Funktion. Es sei M eine m-dimensionale glatte Mannigfaltigkeit und f : M → R eine Funktion.
Für einen Träger Uα mit Koordinatenfunktionen φα erhält man dann die Darstellung
f : Uα → R ,
fα = f ◦ φ−1
α ,
y = fα (x) = f ◦ φ−1
α (x) ,
wobei x Koordinaten von M und y die Koordinaten von R bezeichnen. Siehe dazu auch
Bild 1.5. Man nennt f an der Stelle p ∈ Uα differenzierbar (glatt), wenn fα an der Stelle
x = φα (p) differenzierbar (glatt) ist. Man überzeugt sich leicht, dass diese Eigenschaft
unabhängig von der Wahl der Karte ist. Bitte überlegen Sie sich diese Konstruktion! Die
14
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
M
p
f
y = f (p)
φα
f◦
x
φα−1
y = fα (x) = f (φα−1 (x))
Bild 1.5: Zu den glatten Funktionen f = C ∞ (M).
Menge aller glatten Funktionen auf M wird mit C ∞ (M) bezeichnet. Unter der Einschränkung auf einen Träger kann man offensichtlich die Differential- und Integralrechnung wie
gewohnt betreiben, sofern man dafür sorgt, dass die Operationen in allen kompatiblen
Karten gültig bleiben.
Als nächstes werden Abbildungen zwischen Mannigfaltigkeiten betrachtet. Es seien M
und N zwei glatte m- und n-dimensionale Mannigfaltigkeiten und f eine Abbildung der
Form f : M → N , siehe Bild 1.6. Man sagt nun, f ist glatt in einer Umgebung von p,
M
N
f
p
q
φα
ϕβ
ϕβ ◦ f ◦ φα−1
y
x
Bild 1.6: Zur Abbildung f : M → N zwischen Mannigfaltigkeiten M, N .
wenn es Karten mit p ∈ Uα , f (p) ∈ Vβ und Koordinatenfunktionen φα , ϕβ so gibt, dass
die Funktion fαβ ,
fαβ = ϕβ ◦ f ◦ φ−1
α ,
fαβ : φα (Uα ) → ϕβ (Vβ ) ⊂ ϕβ ◦ f (Uα )
glatt in den gewählten Karten ist.
Die Darstellung dieser Zusammenhänge in der Form der Abbildungen 1.5 oder 1.6 ist
nun etwas schwerfällig, einen Ersatz liefern die nachstehenden Diagramme.
M
−1
φα ↑↓ φα
f
−→ R
k
f ◦φ−1
α
φα (Uα ) ⊂ Rm −→ R
M
φ−1
α ↑↓ φα
φα (Uα ) ⊂ Rm
15
f
−→
ϕβ ◦f ◦φ−1
α
−→
N
ϕ−1
β ↑↓ ϕβ
ϕβ (Vβ ) ⊂ Rn
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
Eine glatte Abbildung f : M → N erlaubt aus einer Funktion g ∈ C ∞ (N ) eine
Funktion f ∗ (g) ∈ C ∞ (M) mittels der Vorschrift
f ∗ (g) = g ◦ f : M → R
zu konstruieren. Dies veranschaulicht auch das nachstehende Diagramm.
f
M −→ N
k
↓g ,
g◦f
M −→
R
∗
f (g)
f
M −→ N
↓g
k
g◦f −1
R ←− N
Die Funktion f ∗ (g) heißt auch der pullback von g durch f . Nur wenn f : M → N
ein (lokaler) Diffeomorphismus ist, können Funktionen von M auch nach N übergeführt
werden.
Durch geschickte Wahl von Karten können Abbildungen eine besonders einfache Gestalt annehmen. Hierzu interpretiere man die Abbildung f : U → V mit U ⊂ Rn und
V ⊂ Rn von Satz 4.10 als Abbildungen zwischen Mannigfaltigkeiten M und N . Es gelte
f (p) = q, p ∈ Uα , q ∈ Vβ . Nun findet man offene Mengen Uα′ ⊂ Uα , Vβ′ ⊂ Vβ so, dass
f (Uα′ ) = Vβ′ gilt. x, y seien lokale Koordinaten für M und N mit Koordinatenfunktionen
φα , ϕβ . Wählt man nun φ′α = ϕβ ◦ f , ϕ′β = ϕβ auf Uα′ , Vβ′ , dann nimmt dort fαβ die simple
Form
−1
−1
fαβ = ϕ′β ◦ f ◦ (φ′α ) = ϕ′β ◦ f ◦ f −1 ◦ ϕ′β
= id
oder
xi = y i ,
i = 1, . . . , n ,
an. Eine andere Wahl wäre φ′α = φα , ϕ′β = φ′α ◦ f −1 . Das nachstehende Diagramm verdeutlicht diesen Sachverhalt für einen (lokalen) Diffeomorphismus f : M → N .
M
φ′α ↓
f
⇄
f −1
id
φα (Uα′ ) ⊂ Rn ⇄ ϕβ
N
↓ ϕ′β
Vβ′ ⊂ Rn
Auf Grund obiger Konstruktion kann man den Rang einer Abbildung f : M → N
einführen. Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten und f
eine Abbildung f : M → N , der Rang von f an der Stelle p ist dann einfach durch den
Rang der Jacobi Matrix in den speziellen Karten (Uα , φα ), (Vβ , ϕβ ) für M, N oder durch
∂ j
−1
rank (f ) (p) = dim
ϕ ◦ f ◦ (φα )
(φα (p)) , i = 1, . . . , m , j = 1, . . . , n
∂xi β
gegeben. Man sagt, f habe den Rang k auf einer Menge U ∈ M, falls der Rang von f auf
U konstant ist. Weiters sagt man, f habe maximalen Rang, falls rank (f ) = min (m, n)
gilt. Der Fall m = n ist bereits behandelt.
Es gelte m > n, dann existieren Karten (Uα , φα), (Vβ , ϕβ ) und Koordinaten x, y für
M, N so, dass f durch
y = fαβ (x) = ϕβ ◦ f ◦ φ−1
α (x)
16
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
gegeben ist. Nun existieren immer Funktionen g i so, dass die Abbildung g : Rm → Rm ,
i
x̄i = g i (x) = fαβ
(x) , i = 1, . . . , n
x̄j = g j (x) , j = n + 1, . . . , m
maximalen Rang hat und damit ein (lokaler) Diffeomorphismus ist. Die Abbildung x̄ =
g (x) ist also lokal umkehrbar, und es existieren offene Mengen
U1 ⊂ Rn , U2 ⊂ Rm−n und
V ⊂ Rn so, dass gilt g (φα (Uα′ )) = U1 × U2 , V = ϕβ Vβ′ für offene Mengen Uα′ ⊂ Uα ,
f (Uα′ ) = Vβ′ ⊂ Vβ . In den Koordinaten x̄ und y hat f nun die einfache Form
y i = y i fαβ ◦ g −1 (x̄) = x̄i , i = 1, . . . , n .
Dies veranschaulicht wieder das nachfolgende Diagramm.
f
M
φα ↓
−→
fαβ
φα (Uα′ ) ⊂ Rm −→ ϕβ
g↓
pr1
U1 × U2
−→
N
↓ ϕβ
′
Vβ ⊂ R n
k
V
Man nennt so ein f auch eine (lokale) Submersion.
Nun gelte m < n, dann existieren wieder Karten (Uα , φα ), (Vβ , ϕβ ) und Koordinaten
x, y für M, N so, dass f durch
y = fαβ (x) = ϕβ ◦ f ◦ φ−1
α (x)
gegeben ist und die Matrix
∂ i
f (x)
∂xj αβ
, i, j = 1, . . . , m
regulär ist. Damit existieren aber immer Funktionen hj so, dass die Abbildung h : Rn →
Rn
i
y i = hi (ȳ) = fαβ
ȳ 1 , . . . , ȳ m , i = 1, . . . , m
j
ȳ 1 , . . . , ȳ m + ȳ j , j = m + 1, . . . , n
y j = hj (ȳ) = fαβ
ein (lokaler) Diffeomorphismus ist. Die Abbildung y = h (ȳ) ist also lokal umkehrbar,
und es existieren
offene Mengen U ⊂ Rm und V1 ⊂ Rm , V2 ⊂ Rn−m so, dass gilt
−1
′
h
ϕβ Vβ = V1 × V2 , U = φα (Uα′ ), Vβ′ = f (Uα′ ) für offene Mengen Uα′ ⊂ Uα , Vβ′ ⊂ Vβ .
In den Koordinaten x, ȳ hat f nun die einfache Form
ȳ i = ȳ i h−1 ◦ fαβ (x) = xi , i = 1, . . . , m
ȳ j = ȳ j h−1 ◦ fαβ (x) = 0 , j = m + 1, . . . , n .
17
1.5. Abstrakte Mannigfaltigkeiten
1. Mathematische Grundlagen
Diesen Sachverhalt veranschaulicht wieder das nachfolgende Diagramm.
f
M
φα ↓
−→
φα (Uα′ ) ⊂ Rm
k
U
N
↓ ϕβ
fαβ
−→ ϕβ Vβ′ ⊂ Rn
h−1 ↓
i
−→
V1 × V2
In diesem Fall nennt man f auch eine (lokale) Immersion.
Als nächstes wollen wir den Begriff einer Untermannigfaltigkeit einführen. Grob gesprochen ist eine Untermannigfaltigkeit S einer Mannigfaltigkeit M eine Teilemenge S ⊂ M,
die selbst wieder eine Mannigfaltigkeit ist. Bis zu diesem Punkt stimmt die Literatur
weitgehend überein, allerdings werden für S verschiedene Topologien zugelassen. Zur Veranschaulichung der Probleme betrachte man zuerst die Beispiele.
f : R → R3 ,
f (t) = (cos(2πt) , sin(2πt) , t)
(1.29)
f : R → R2 , f (t) = (cos(2πt) , sin(2πt))
2
f : (1, ∞) → R , f (t) =
2
f : (1, ∞) → R , f (t) =
1
1
cos(2πt) , sin(2πt)
t
t
(1.30)
t+1
t+1
cos(2πt) ,
sin(2πt)
2t
2t
f : R → R2 , f (t) = (2 cos(t − π/2) , sin(2 (t − π/2)))
f : R → R2 , f (t) = (2 cos(2 arctan(t) + π/2) , sin(2 (2 arctan(t) + π/2)))
(1.31)
(1.32)
(1.33)
(1.34)
Diese Beispiele zeigen, dass eine Immersion nicht injektiv sein muss, siehe Gl. (1.30) und
Gl. (1.33). Dazu nachstehende Definition.
Definition 1.2 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten,
und f sei eine injektive Immersion f : M → N . Das Paar (f, M) heißt Untermannigfaltigkeit.
Eine Untermannigfaltigkeit kann eine sehr allgemeine Struktur haben, siehe dazu Gl.
(1.34). Die Menge S = f (R) entspricht der Figur 8, die sicher nicht homeomorph zu R
ist. Dazu nachstehende Definition.
Definition 1.3 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten,
und f sei eine injektive Immersion f : M → f (M). Ist f auch noch ein Homeomorphismus, dann heißt f eine Einbettung, und das Paar (f, M) heißt eine eingebettete
Untermannigfaltigkeit.
18
1.6. Bündel
1. Mathematische Grundlagen
Offensichtlich sind die Beispiele Gl. (1.29), Gl. (1.31) und Gl. (1.32) Einbettungen. Es sei
f : M → N eine Immersion, dann gibt es zu jedem Punkt p ∈ M eine offene Menge Up
mit p ∈ Up so, dass f eingeschränkt auf Up eine Einbettung ist.
Reguläre Untermannigfaltigkeiten haben nun in speziellen Koordinaten eine besonders
einfache Darstellung.
Definition 1.4 Es sei N eine glatte n-dimensionale Mannigfaltigkeit. Man sagt die Menge S ⊂ N habe die m-Untermannigfaltigkeitseigenschaft, wenn gilt: Für jedes p ∈ S existiert eine Karte (U, φ) mit lokalen Koordinaten x = (x1 , . . . , xn ) so, dass φ (p) = 0 und
für alle q ∈ U ∩ S gilt
xm+i = φm+i (q) = 0 ,
i = 1, . . . , n − m .
Eine reguläre m-dimensionale Untermannigfaltigkeit von N ist eine Menge S ⊂ N , die
die m-Untermannigfaltigkeitseigenschaft besitzt.
Die meisten Mannigfaltigkeiten in dieser Vorlesung sind regulär, sodass wir nicht immer
darauf hinweisen werden.
Man kann nun mit Abbildungen zwischen Mannigfaltigkeiten Untermannigfaltigkeiten
erzeugen. Dies zeigen die nachstehenden Sätze.
Satz 1.1 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f
sei eine Einbettung. Die Untermannigfaltigkeit (iN , f (M)) ist eine reguläre m-dimensionale Untermannigfaltigkeit.
Der nachstehende Satz besagt nun, wann die Untermannigfaltigkeit regulär ist.
Satz 1.2 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und
f sei eine injektive Immersion. Ist N oder M kompakt, dann ist (f, M) eine reguläre
m-dimensionale Untermannigfaltigkeit.
Der nachstehende Satz ist die Übertragung des Satzes 4.11 auf Mannigfaltigkeiten.
Satz 1.3 Es seien M, N zwei glatte m- und n-dimensionale Mannigfaltigkeiten, und f
sei eine Submersion. Die Untermannigfaltigkeit (iM , f −1 (p)), p ∈ f (M) ⊂ N ist eine
abgeschlossene, reguläre (m − n)-dimensionale Untermannigfaltigkeit.
1.6
Bündel
Bündel können auch als die Verallgemeinerung kartesischer Koordinatensysteme angesehen werden. Bild 1.7 zeigt auf der linken Seite den Graph einer Funktion f : R → R im R2 .
Der Graph von f ist nichts anderes als die Abbildung gr (f ) : R → R2 mit x → (x, f (x)),
die offensichtlich die Bedingung
pr1 (gr (f ) (x)) = x
erfüllt. Diese Konstruktion kann nun einfach auf Mannigfaltigkeiten übertragen werden.
M und N seien zwei Mannigfaltigkeiten, f : M → N eine Abbildung zwischen ihnen.
19
1.6. Bündel
1. Mathematische Grundlagen
Ex
u
E
(x, f (x))
σ (p)
π
p
pr1
x
x
B
Ep
Bild 1.7: Zu Graph und Bündel.
Der Graph von f ist die neue Abbildung gr (f ) : M → M × N , p ∈ M, die natürlich
wieder der Bedingung
pr1 (gr (f ) (p)) = p
genügt. Das Produkt M×N nennt man die totale Mannigfaltigkeit und M die Basismannigfaltigkeit oder Basis. Allerdings kann diese Konstruktion noch einfach verallgemeinert
werden, siehe dazu die Abbildung 1.7.
Definition 1.5 Eine gefaserte Mannigfaltigkeit ist das Tripel (E, π, B) mit den Mannigfaltigkeiten E, dim (E) = m + n, B, dim (B) = m und der Abbildung π : E → B, die
eine surjektive Submersion ist. Die Mannigfaltigkeit E heißt die totale Mannigfaltigkeit,
die Abbildung π die Projektion und die Mannigfaltigkeit B die Basismannigfaltigkeit. Die
Teilmenge Ep = π −1 (p) von E heißt die Faser über p ∈ B.
In vielen Fällen ist die Idee einer gefaserten Mannigfaltigkeit zu allgemein, da verschiedene
Fasern verschiedene topologische Strukturen besitzen können. Dieses Problem kann man
lösen, wenn man darauf besteht, dass verschiedene Fasern diffeomorph zur typischen Faser
sind. Diese Konstruktion führt dann auf ein Bündel.
Definition 1.6 Eine gefaserte Mannigfaltigkeit (E, π, B) ist genau dann ein Bündel, wenn
eine Mannigfaltigkeit F , die typische Faser, und eine Abbildung ψ : π −1 (Up ) → Up × F ,
definiert auf einer Umgebung Up von p ∈ B so existiert, dass pr1 ◦ ψ = π gilt, sowie dass
F , Ep für alle p diffeomorph sind.
Diesen Sachverhalt veranschaulicht das nachstehende Diagramm.
(x,u)
ψ
π −1 (Up ) −→ Rm × Rn
π↓
↓ pr1
π −1 (Up ) −→ Up × F
π↓
↓ pr1
Up
=
Up
Up
(x)
−→
Rm
Für ein Bündel kann man adaptierte Koordinaten (x, u) lokal einführen mit xi , i =
1, . . . , m als Koordinaten für die Basismannigfaltigkeit B und uα , α = 1, . . . , n als Koordinaten für die typische Faser. Dies veranschaulicht ebenfalls obiges Diagramm. Bitte
20
1.6. Bündel
1. Mathematische Grundlagen
beachten Sie, dass die Symbole x, u sowohl für die Koordinaten als auch für die Koordinatenfunktionen verwendet werden. Ein noch einfacheres Bild erhält man, wenn man x
als die unabhängigen und u als die abhängigen Koordinaten auffasst. Wir verwenden von
jetzt an lateinische Indizes für die unabhängigen und griechische Indizes für die abhängigen Variablen. Darüberhinaus wird die Indexmenge nicht mehr angeführt, wenn sie vom
Kontext her klar ist.
Definition 1.7 Eine gefaserte Mannigfaltigkeit (E, π, B) heißt trivial, wenn sie isomorph
zu einem Produkt (B × F , pr1 , B) ist. Das Möbiusband ist ein Bündel, das nicht trivial ist.
Wenn die typische Faser ein linearer Vektorraum ist, heißt das Bündel Vektorbündel.
Nun können wir den Begriff des Graphen einer Funktion f : R → Rn auf Mannigfaltigkeiten übertragen.
Definition 1.8 (E, π, B) sei eine gefaserte Mannigfaltigkeit. Eine Abbildung σ : B →
E heißt ein Schnitt von π, wenn sie π ◦ σ = idB auf ihrem Definitionsgebiet mit der
identischen Abbildung idB auf B erfüllt. Die Menge aller Schnitte von (E, π, B) wird mit
Γ (E) abgekürzt.
Eine Mannigfaltigkeit muss nicht einen global definierten Schnitt besitzen. Ein einfaches
Beispiel dazu ist die Kugel S2 ⊂ R3 , denn man kann sich einfach vorstellen, dass man
nicht jedem Punkt von S2 auf stetige Weise einen nicht verschwindenden Tangentialvektor
zuweisen kann.
So wie man Abbildungen zwischen Mannigfaltigkeiten studiert, kann man Abbildungen zwischen Bündeln studieren, wobei solche von besonderem Interesse sind, die die
Bündelstruktur erhalten.
¯ π̄, B̄ seien zwei Bündel. Ein Bündelhomomorphismus
Definition 1.9 (E, π, B) und E,
¯ welche die Bedingung
ist ein Paar f = (fB , fE ) von Abbildungen fB : B → B̄, fE : E → E,
π̄ ◦ fE = fB ◦ π
auf ihren Definitionsgebieten erfüllen.
Diesen Sachverhalt veranschaulicht das nachstehende Diagramm. Dort ist auch gezeigt,
dass ein Schnitt σ ∈ Γ (E) eine spezielle Bündelabbildung ist.
f
B
idB k
E
E −→
Ē
π↓
↓ π̄
f
B
B
B −→
B̄
σ
−→
idB
=
E
↓π
B
Wählt man adaptierte Koordinaten (x, u) und (x̄, ū) für die Bündel (E, π, B), Ē, π̄, B̄ ,
dann ist ein Bündelhomomorphismus f durch die lokale Darstellung
x̄ = f¯B (x) ,
(x̄, ū) = f¯E (x, u)
gegeben, wobei f¯B , f¯E die Abbildungen fB , fE in diesen Koordinaten repräsentieren. Von
obigem Diagramm erkennt man sofort, dass ein Bündelhomomorphismus f = (fB , fE ) die
Konstruktion der Abbildung
fE ◦ σ = f∗ (σ) : B → E¯ ,
21
1.6. Bündel
1. Mathematische Grundlagen
für einen beliebigen Schnitt σ ∈ Γ (E) erlaubt. Ist allerdings
fB ein Diffeomorphismus,
dann kann ein Schnitt σ ∈ Γ (E) zu einem Schnitt σ̄ ∈ Γ Ē übergeführt werden gemäß
der Beziehung
σ̄ = f∗ (σ) ◦ fB−1 = fE ◦ σ ◦ fB−1 .
Man nennt den Schnitt σ̄ auch pushforward von σ durch f . Diesen Sachverhalt veranschaulicht das nachfolgende Diagramm.
f
E
E −→
Ē
π ↓↑ σ
π̄ ↓↑ σ̄
B
1.6.1
fB
B̄
⇄
−1
fB
Das Tangential- und Kotangentialbündel
Wie bereits oben erwähnt, ist ein Vektorbündel ein Bündel, dessen typische Faser ein
linearer Vektorraum ist. Es sei (E, π, B) ein Bündel mit lokalen Koordinatensystemen
(x, u) und (y, v), dann besteht zwischen diesen Systemen folgende Beziehung
dim(E)−dim(B)
i
i
α
y = f (x) , v =
mαβ
β
(x) u =
X
mαβ (x) uβ
β=1
mit einem Diffeomorphismus f und einer regulären Matrix mαβ . Von jetzt ab wird immer die Einsteinsche Konvention für Summen verwendet, sofern die Indexmenge vom
Kontext her klar ist. Diese erlaubt die Gleichungen übersichtlich und kurz zu halten. Das
Tangential- und das Kotangentialbündel sind nun spezielle Vektorbündel. Die adaptierten
Koordinaten des Tangentialbündels T (M) einer Mannigfaltigkeit M werden üblicherweise mit (xi , ẋj ), i, j = 1, . . . , dim (M) bezeichnet und ein Schnitt σ ∈ Γ (T (M)),
ẋi = σ i (x) , σ = σ i ∂i ,
∂
= ∂i
∂xi
(1.35)
wird als Tangentialvektorfeld bezeichnet. Wieso die Notation als Differentialoperator für
ein Tangentialvektorfeld sinnvoll ist, wird noch gezeigt. Nun seien (xi , ẋj ), (y i , ẏ j ) zwei
Koordinatensysteme von T (M), dann gilt
y i = f i (x) , ẏ i = ∂j f i (x) ẋj
(1.36)
für einen Diffeomorphismus f . Zu einer Mannigfaltigkeit M werden üblicherweise die adaptierten Koordinaten des Kotangentialbündels T ∗ (M) mit (xi , ẋj ), i, j = 1, . . . , dim (M)
bezeichnet und ein Schnitt σ ∈ Γ (T ∗ (M)),
ẋi = σi (x) , σ = σi dxi
(1.37)
wird als Kotangentialvektorfeld bezeichnet. Wieso dies sinnvoll ist, wird noch gezeigt. Für
zwei Koordinatensysteme (xj , ẋj ), (y i , ẏi ) von T ∗ (M) gilt
y i = f i (x) , ẋi = ∂i f j (x) ẏj
22
(1.38)
1.6. Bündel
1. Mathematische Grundlagen
für einen Diffeomorphismus f . Dass die Notation als Differential für ein Kotangentialvektorfeld sinnvoll ist, muss ebenfalls noch gezeigt werden.
Ehe die Betrachtungen fortgeführt werden können, wird noch nachstehende Definition
benötigt.
Definition 1.10 Es sei I ⊂ R ein offenes reelles Intervall, das 0 beinhaltet, und M eine
m-dimensionale glatte Mannigfaltigkeit. Eine glatte Abbildung ϕ : I × M → M heißt ein
(lokaler) Fluss auf M, wenn ϕ die folgenden Beziehungen
ϕ0 (p) = p
ϕε1 +ε2 (p) = ϕε1 ◦ ϕε2 (p) = ϕε2 ◦ ϕε1 (p)
ϕ−1
ε (p) = ϕ−ε (p)
für alle ε, ε1, ε2 ∈ Ī ⊂ I mit einem geeigneten Unterintervall Ī und alle p ∈ Uq , q ∈ M
erfüllt.
Ein Fluss erlaubt zwei einfache Interpretationen. Hält man ε ∈ I fest, dann ist ϕε : M →
M ein Diffeomorphismus auf M. Für festes p ∈ M ist ϕε (p) : I → M eine Kurve in der
Umgebung von p. Ein Fluss ϕε unterteilt also die Mannigfaltigkeit M lokal in eine Menge
von 1-dimensionalen Untermannigfaltigkeiten ϕε (p) : I → M. Darüberhinaus zeigt der
folgende Satz, dass ein Fluss in speziellen Koordinaten eine sehr einfache Darstellung hat.
Satz 1.4 Es sei ϕε : I × M → M ein (lokaler) glatter Fluss auf einer m-dimensionalen
glatten Mannigfaltigkeit M. Die Umgebung Up von p ∈ M gehöre zur Definitionsmenge
von ϕ, dann existieren Koordinaten (x) = (x1 , . . . , xm ) nahe p so, dass ϕε in diesen
Koordinaten gegeben ist durch
ϕ̄ε = x1 + ε, x2 , . . . , xm .
Dieser Satz heißt auch Flow Box Theorem. Zum Beweis des Satzes 1.4 wähle man Koordinaten (y) so, dass die Darstellung ϕ̃ε von ϕε den Bedingungen,
∂ 1 0 = φ (p) ,
6= 0
ϕ̃ (y)
∂ε ε
ε=0,y=0
genügt. Man überzeugt sich nun leicht, dass die Abbildung f ,
y = f (x) = ϕ̃x1 0, x2 , . . . , xm ,
ein Diffeomorphismus ist, und dass ϕε in diesen Koordinaten das Aussehen
ϕ̄ε (x) = f −1 ◦ ϕ̃ε ◦ f (x) = f −1 ◦ ϕ̃ε+x1 0, x2 , . . . , xm = x1 + ε, x2 , . . . , xm
hat.
Es sei ϕε ein Fluss auf M mit der Darstellung ϕ̄ε in einem Koordinatensystem x.
Differenziert man nun ϕ̄ε nach ε, erhält man
∂ i ∂ i
i
i
= v̄ ◦ ϕ̄ε (x) ,
v̄ =
(1.39)
ϕ̄ (x)
ϕ̄
∂τ τ
∂ε ε ε=0
τ =ε
23
1.6. Bündel
1. Mathematische Grundlagen
mit den Funktionen v̄ i ∈ C ∞ (Rm ). Diese Beziehung ist aber nichts anderes als das folgende
System
∂ i
x (ε) = v̄ i (x (ε))
(1.40)
∂ε
von m gewöhnlichen Differentialgleichungen in der unabhängigen Variablen ε. Ein Fluss
ϕε erzeugt also ein System von m gewöhnlichen Differentialgleichungen. Ist die Lösung
des Systems (1.39) eindeutig, dann erzeugt ein System von m Differentialgleichungen
einen (lokalen) Fluss. Dies folgt aus dem Satz über die Existenz und Eindeutigkeit des
Anfangswertproblems für explizite gewöhnliche Differentialgleichungen. Das m-Tupel v̄ =
(v̄ 1 , . . . , v̄ m ) nennt man auch den infinitesimalen Generator von ϕ̄ε in den Koordinaten
x. Man überzeugt sich nun einfach, dass für v̄ die Transformationsregeln (1.36) gelten, v̄
ist also ein Tangentialvektor.
Der infinitesimale Generator eines Flusses ϕε ist vorläufig nur in einer Karte definiert.
Um eine koordinatenfreie Darstellung zu gewinnen, wählt man eine Funktion g ∈ C ∞ (M)
und einen Fluss ϕε . Bezeichnet man mit ḡ, ϕ̄ε die Größen g, ϕε in einem Koordinatensystem x, dann kann man einfach ḡ (ϕ̄ε ) nach ε differenzieren und für p ∈ U ⊂ M folgt
dann
∂
(1.41)
= v̄ i (x) ∂i ḡ (x) = v̄ i ◦ φ (p) (∂i ḡ) ◦ φ (p)
ḡ (ϕ̄ε )
| {z }
∂ε
ε=0
v̄
mit den Funktionen v̄ i von (1.39). Man überzeugt sich wieder leicht, dass v̄ = v̄ i (x) ∂i
gemäß (1.36) transformiert wird. Dazu beachte man lediglich
v̄ f i (x) = ∂j f i (x) v̄ j (x) .
Weiters sieht man sofort, dass nur die Größen v̄ i ◦ φ (p) in die Beziehung (1.39) eingehen.
Damit entspricht der infinitesimale Generator eines Flusses
v̄x = v̄ i (x) ∂i
(1.42)
einem Differentialoperator, der folgende Regeln
v̄x (α1 g1 + α2 g2 ) = α1 v̄x (g1 ) + α2 v̄x (g2 ) , Linearität über R
v̄x (g1 g2 ) = v̄x (g1 ) g2 + g1 v̄x (g2 ) , Leibniz Regel
für alle g1 , g2 ∈ C ∞ (M) und Zahlen α1 , α2 ∈ R erfüllt. Diese Eigenschaft erlaubt nun,
den Tangentialraum an einem Punkt p ∈ M einer Mannigfaltigkeit M zu definieren.
Definition 1.11 Der Tangentialraum Tp (M) an der Stelle p ∈ M einer glatten mdimensionalen Mannigfaltigkeit M wird durch die Menge aller linearen Abbildungen vp , wp :
C ∞ (M) → R, die linear über den reellen Zahlen sind, und die Leibniz Regel erfüllen, gebildet. Die Vektorraumoperationen sind
(vp + wp ) (f ) = vp (f ) + wp (f ) ,
(αvp ) (f ) = vp (αf )
für alle f ∈ C ∞ (M) und α ∈ R. Weiters gilt dim (Tp (M)) = m.
24
1.6. Bündel
1. Mathematische Grundlagen
Eine lineare Abbildung, die die Leibniz Regel erfüllt, heißt Ableitung. Man gelangt nun
zum Tangentialbündel T (M) der Mannigfaltigkeit M, indem man die Tangentialräume
Tp (M) zu einem Bündel zusammenfügt.
Satz 1.5 Es sei M eine glatte m-dimensionale Mannigfaltigkeit, dann ist die Menge
T (M) = ∪p∈M Tp (M)
ein Bündel (T (M) , τM , M) mit der Projektion τM . Man nennt dieses Bündel auch das
Tangentialbündel von M. Die typische Faser F dieses Bündels ist ein m-dimensionaler
R-Vektorraum.
Zum Beweis dieses Satzes sei auf die Literatur verwiesen. Die Menge aller glatten Tangentialvektorfelder, oder der glatten Schnitte von T (M), wird wieder mit Γ (T (M))
bezeichnet. Es wird aber nicht verlangt, dass ein Schnitt global existiert.
Es sei nun f : M → N eine glatte Abbildung zwischen zwei Mannigfaltigkeiten M,
N , dann kann man f zu einem Bündelhomomorphismus (fB , fE ) erweitern, indem man
fB = f setzt und verlangt, dass fE = fT (M) : T (M) → T (N ) der Bedingung
fT (M) (v) (g) = v (fB∗ (g))
für alle g ∈ C ∞ (N ), v ∈ Γ (T (M)) genügt. Die Darstellung von fE in adaptierten Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ), (y 1, . . . , y m, ẏ 1 , . . . , ẏ m ) für T (M), T (N ) lautet dann
y i = f¯i (x) ,
ẏ i = ∂j f¯i (x) ẋj ,
wobei f¯ die Darstellung von f in diesen Koordinaten bezeichnet. Ist f ein Diffeomorphismus, dann
kann man den sogenannten “pushforward” eines Feldes v ∈ Γ (T (M)) durch
f, fT (M) gemäß der Vorschrift
ṽ = fT (M) ◦ v ◦ f −1 = (f∗ (v)) ◦ f −1
(1.43)
bestimmen. Man vergleiche dazu die nachstehenden Diagramme
f∗
T (M) −→ T (N )
τM ↓↑ v
τN ↓↑ ṽ
f∗
T (M) −→ T (N )
τM ↓
τN ↓ ,
M
f
−→
M
N
f
⇄
f −1
.
N
Gegeben sei das Tangentialbündel (T (M) , τM , M) einer glatten m-dimensionalen
Mannigfaltigkeit M und ein Punkt p ∈ M, dann ist die typische Faser Tp (M) ein linearer Vektorraum über p. Wie in der linearen Algebra betrachtet man nun die linearen
Abbildungen ωp : Tp (M) → R. Wählt man nun Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) für
T (M), dann hat ein Schnitt v ∈ Γ (T (M)) die Form
v̄ = v̄ i (x) ∂i
(1.44)
mit glatten Funktionen v̄ i (x). Es bezeichne nun ω̄x die Abbildung ωp : Tp (M) → R in
diesen Koordinaten, dann gilt
ωp (vp ) = hωp , vp i = ω̄i (x) v̄ i (x) ,
25
x = φ (p)
1.6. Bündel
1. Mathematische Grundlagen
für glatte Funktionen ω̄i (x). Man beachte, dass diese Beziehung zusammen mit Gl. (1.36)
erzwingt, dass sich
ω̄x = ω̄i (x) dxi
(1.45)
gemäß (1.38) transformiert. Ein wohlbekannter Satz der linearen Algebra besagt nun, dass
der Raum aller linearen Funktionen (Linearformen, linearen Funktionale) Tp (M) → R
ein m-dimensionaler R-Vektorraum ist. Dieser Raum wird mit Tp∗ (M) bezeichnet, er wird
auch Dualraum genannt. Offensichtlich ist nun Tp∗ (M) punktweise konstruiert, und man
kann nun die Vorgehensweise beim Tangentialbündel übernehmen, indem man die Räume
Tp∗ (M) zu einem Bündel verschmilzt.
Satz 1.6 Es sei M eine glatte m-dimensionale Mannigfaltigkeit, dann ist die Menge
T ∗ (M) = ∪p∈M Tp∗ (M)
∗
∗
ein Bündel (T ∗ (M) , τM
, M) mit der Projektion τM
. Das Bündel heißt das Kotangentialbündel von M, seine typische Faser F ist ein m-dimensionaler R-Vektorraum.
Auch hier sei für den Beweis auf die Literatur verwiesen.
Die bilineare Abbildung h·, ·ip : Tp∗ (M) × Tp (M) → R lässt sich nun einfach zu einer
Abbildung h·, ·i : T ∗ (M) × T (M) → C ∞ (M) erweitern. In Koordinaten hat dieser
Ausdruck die Form ẋi ẋi oder
v⌋ω = hω, vi = ω̄i v̄ i
für Schnitte (1.35) und (1.37). Zusätzlich gilt
i dx , ∂j = δji
mit dem Kronecker Symbol δji .
Ist nun f : M → N eine glatte Abbildung zwischen den Mannigfaltigkeiten M, N ,
dann kann man den pull back eines Schnittes ω ∈ Γ (T ∗ (N )) berechnen. Man schreibt
nun für diese Abbildung f ∗ : T ∗ (N ) → T ∗ (M), und sie erfüllt natürlich die Regel
hf ∗ (ω) , vi = hω ◦ f, f∗ (v)i
für einen Schnitt v ∈ Γ (T (M)). Das folgende Diagramm
f∗
T ∗ (M)
⇄ T ∗ (N )
f∗
∗
τM
↓↑ f ∗ (ω)
M
f
−→
τN∗ ↓↑ ω
N
zeigt, dass f ∗ (ω) auch existiert, wenn f kein Diffeomorphismus ist. In den Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) und (y 1 , . . . , y n , ẏ1, . . . , ẏn ) für T ∗ (M) und T ∗ (N ) lautet die
Beziehung dann
ẋi = ∂i f¯j ẏj ◦ f¯ .
(1.46)
Ist f sogar ein Diffeomorphismus, dann kann ein Schnitt von T ∗ (M) in einen Schnitt
von T ∗ (N ) übergeführt werden. Man beachte hier diesen wesentlichen Unterschied bei
der Transformation von Tangentialvektoren und Kotangentialvektoren.
Von besonderem Interesse sind nun Kotangentialvektoren, die von Funktionen erzeugt
werden.
26
1.6. Bündel
1. Mathematische Grundlagen
Definition 1.12 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Das Differential
dg ∈ Γ (T ∗ (M)) zu g ∈ C ∞ (M) ist jener Kovektor, welcher der Bedingung
v⌋dg = hdg, vi = v (g)
für alle v ∈ Γ (T (M)) genügt.
Man überzeugt sich nun leicht, dass in Koordinaten (x1 , . . . , xm , ẋ1 , . . . , ẋm ) für T ∗ (M)
gilt
dḡ = ∂i ḡdxi oder ẋi = ∂i ḡ .
(1.47)
Mit dieser Beziehung folgt für (1.46) sofort
f¯∗ dy j = df¯j = ∂i f¯j dxi .
1.6.2
Freie und autonome Systeme
Betrachtet man nochmals das autonome System
ẋi = f i (x) , i = 1, . . . , n ,
(1.48)
dann erkennt man sofort, dass dieses System ein Vektorfeld
f = f i (x) ∂i
(1.49)
auf einer Mannigfaltigkeit M mit lokalen Koordinaten (x1 , . . . , xn ) beschreibt. Von jetzt
an wird auf das Symbol f¯ verzichtet, das auf die Beschreibung in einer speziellen Karte
hinweist. Wegen Satz 1.4 lassen sich lokal sogar Koordinaten so finden, dass gilt
ẋ1 = 1 , ẋi = 0 , i = 2, . . . , n .
Das Vektorfeld f von (1.48) ist natürlich auch ein Differentialoperator und damit eine
Abbildung f : C ∞ (M) → C ∞ (M).
Als nächstes wird das freie System
ẋi = f i (t, x) , i = 1, . . . , n
(1.50)
untersucht. Um ein geometrisches Bild zu erhalten, betrachte man das Bündel (E, π, B)
mit adaptierten Koordinaten (t) für B und (t, x1 , . . . , xn ) für E. Offensichtlich ist dann
f = f i (t, x) ∂i
ein Vektorfeld f ∈ Γ (T (E)). Aber f erfüllt noch die Bedingung
π∗ (f ) = 0 .
Man betrachte dazu wieder das nachstehende Diagramm
τ
E
E ←−
T (E)
π↓
π∗ ↓ .
τB
B ←− T (B)
27
(1.51)
1.6. Bündel
1. Mathematische Grundlagen
Ein Vektorfeld v ∈ Γ (T (E)) heißt nun projizierbar, wenn
π∗ (v) ∈ Γ (T (B))
gilt. Nun muss ein projizierbares Vektorfeld in adaptierten Koordinaten die Form
v = f t (t) ∂t + f i (t, x) ∂i
haben. Offensichtlich ist das Feld von (1.51) projizierbar. Es hat aber noch die spezielle
Eigenschaft f t = 0. Dazu nun folgende Definition.
Definition 1.13 (E, π, B) sei eine gefaserte Mannigfaltigkeit. Die Menge aller Schnitte
v ∈ Γ (T (E)) mit
π∗ (v) = 0
ist ein Unterbündel von T (E). Dieses Bündel heißt das vertikale Bündel, und es wird mit
V (E) bezeichnet.
Man könnte nun f von (1.51) als ein vertikales Vektorfeld auffassen, dann müsste aber
ṫ = 0 gelten. Man betrachte nun einen Schnitt σ ∈ Γ (E) zusammen mit dem Diagramm
τ
E
E ←−
T (E)
π ↓↑ σ
π∗ ↓↑ σ∗ .
τB
B ←−
T (B)
Die Abbildung σ∗ : T (B) → T (E) ist offensichtlich durch
  

t = t
ṫ
1
 ẋ1   ∂t σ 1 (t) 
x1 = σ 1 (t)
  

,
 ..  = 

..
..
 .  

.
.
xn = σ n (t)
ẋn
∂t σ n (t)
gegeben. Man schreibt nun dafür, das Produkt ⊗ wird später erklärt,
∂t ⌋dt ⊗ fe = fe , dt ⊗ fe ⌋dt ⊗ fe = dt ⊗ fe
mit dem speziellen Vektorfeld
fe = ∂t + f i (t, x) ∂i = ∂t + f .
(1.52)
Wählt man g ∈ C ∞ (E) und bezeichnet ϕτ den Fluss zum Feld von (1.52), dann gilt
d
.
fe (g) =
g ◦ ϕτ (t, x)
dτ
τ =0
Damit beschreibt fe die totale zeitliche Änderung von g entlang einer Lösung von Gl.
1.50. Das freie System erzeugt damit auch den Differentialoperator von (1.52).
28
1.6. Bündel
1. Mathematische Grundlagen
Eine weitere Darstellung des Systems (1.50) erhält man mittels den speziellen Kovektoren
ω i = dxi − f i (t, x) dt ∈ Γ (T ∗ (E)) .
(1.53)
Man betrachte nun einen Schnitt σ ∈ Γ (E) zusammen mit dem Diagramm
τ∗
E
E ←−
T ∗ (E)
π ↓↑ σ
π ∗ ↑↓ σ ∗ ,
B
τ∗
B
←−
T ∗ (B)
dann folgt mit
sofort
σ ∗ ω i = dσ i (t) − f i ◦ σ (t) dt = ∂t σ i (t) − f i ◦ σ (t) dt = 0
∂t σ i (t) = f i ◦ σ (t) , i = 1, . . . , n .
Zusätzlich beachte man noch die Beziehung
fe ⌋ω i = 0 , i = 1, . . . , n .
1.6.3
Systeme mit Eingang
Betrachtet man nun das System
ẋi = f i (x, u) , i = 1, . . . , n ,
(1.54)
auf einer Mannigfaltigkeit M mit lokalen Koordinaten (x1 , . . . , xn ), dann erkennt man
sofort, dass für das Vektorfeld f ,
f = f i (x, u) ∂i
(1.55)
gilt
f∈
/ Γ (T (M)) .
Das Feld f beschreibt vielmehr eine Untermannigfaltigkeit des T (M), mit den lokalen
Koordinaten (x, u). Gilt insbesondere
f i (x, u) = ai (x) + bir (x) ur ,
dann beschreibt das System sogar eine affine Untermannigfaltigkeit. Um ein besseres geometrisches Bild zu bekommen, führt man nun das Bündel (Z, ρ, M) ein. Siehe dazu das
folgende Diagramm.
Z
τZ
⇆ T (Z)
f
ρ ↓↑ σ
ρ∗ ↓
τM
M ←− T (M)
29
1.6. Bündel
1. Mathematische Grundlagen
Ein Schnitt σ ∈ Γ (Z) ist offensichtlich wegen
ur = σ r (x) , r = 1, . . . , m
eine Zustandsregelung. Man beachte, dass zwar f = f i (x, u) ∂i ∈ Γ (T (Z)) gilt, aber f
ist wegen
ρ∗ (f ) = f
nicht projizierbar. Allerdings wäre (f i ◦ σ) ∂i ∈ Γ (T (M)) gegeben. Dazu nun folgender
Satz.
Satz 1.7 Gegeben sei das Bündel (E, π, B) und eine Abbildung f : B̄ → B zwischen den
Mannigfaltigkeiten B̄, B. Die Menge
f ∗ (E) = (x̄, (x, u)) ∈ B̄ × E | π ((x, u)) = x = f (x̄)
ist eine gefaserte Mannigfaltigkeit mit der Projektion
pr1 : f ∗ (E) → B̄ ,
(x̄, (x, u)) 7→ (x̄) .
Diesen Sachverhalt veranschaulicht auch das Diagramm
pr
2
f ∗ (E) −→
E
pr1 ↓
π ↓↑ σ ,
f
B̄ −→ B
pr
2
π̄ ∗ (E) −→
E
pr1 ↓
↓π ,
π̄
¯
E −→ B
pr
2
Ē
π (E) −→
pr1 ↓
↓ π̄
π
E −→ B
Ist ein σ ∈ Γ (E) gegeben, dann ist offensichtlich
durch (x̄, σ ◦ f (x̄)) ein Schnitt von f ∗ (E)
¯ Ē, π, B , dann schreibt man auch
gegeben. Gilt noch B̄ = E,
E ×B Ē .
In diesem Fall sind π̄ ∗ (E), π ∗ (E) Bündel. Vergleicht man nun die Diagramme, dann erhält
man
pr2
ρ∗
T (M)
T (Z) −→ ρ∗ (T (M)) −→
τZ ↓
pr1 ↓
↓ τM
Z
=
Z
ρ
⇄
σ
M
und somit das Ergebnis f = f i (x, u) ∂i ∈ Γ (ρ∗ (T (M))). Man beachte, dass im Allgemeinen aber für g ∈ C ∞ (Z) gilt
f i (x, u) ∂i g ◦ σ 6= f i ◦ σ ∂i (g ◦ σ) .
Der zeitvariante Fall
ẋi = f i (t, x, u) , i = 1, . . . , n ,
(1.56)
kann nun fast analog zum invarianten behandelt werden. Man wählt nun ein Bündel
(E, π, B) mit lokalen Koordinaten (t, x) für E und (t) für B. Wieder gilt für das Vektorfeld
f,
f = ∂t + f i (t, x, u) ∂i
(1.57)
30
1.7. Transformationen
1. Mathematische Grundlagen
die Beziehung
f∈
/ Γ (T (E)) .
Analog zu oben führt nun das Bündel (Z, ρ, E) mit lokalen Koordinaten (t, x, u) für Z
ein. Ein Schnitt σ ∈ Γ (Z) ist offensichtlich wegen
ur = σ r (t, x) , r = 1, . . . , m
eine Zustandsregelung. Man beachte, dass zwar f = ∂t + f i (t, x, u) ∂i ∈ T (Z) gilt, aber f
nicht projizierbar ist, sowie dass ∂t + (f i ◦ σ) ∂i ∈ T (E) erfüllt ist. Damit folgt aber sofort
das gewünschte Resultat f = ∂t + f i (t, x, u) ∂i ∈ ρ∗ (T (E)). Das folgende Diagramm zeigt
dazu die Zusammenhänge.
pr
ρ∗
2
T (Z) −→ ρ∗ (T (E)) −→
T (E)
τZ ↓
pr1 ↓
↓ τE
Z
=
Z
ρ
⇄
σ
E
Eine weitere Darstellung des Systems (1.50) erhält man mittels der speziellen Kovektoren
ω i = dxi − f i (t, x, u) dt ∈ ρ∗ (T ∗ (E)) ,
(1.58)
wobei zur Vollständigkeit das zurückgezogene Bündel ρ∗ (T ∗ (E)) im folgenden Diagramm
dargestellt ist.
pr2
ρ∗
T ∗ (Z) ←− ρ∗ (T ∗ (E)) −→
T ∗ (E)
τZ∗ ↓
pr1 ↓
↓ τE∗
Z
1.7
=
Z
ρ
⇄
σ
E
Transformationen
Abschließend werden noch einmal die relevanten Transformationen zusammengefasst. Hier
bezeichnen (t, x, u) die Koordinaten des gegebenen und (τ, y, v) die des transformierten
Systems. Im autonomen Fall (1.50) gilt dann
ẋα = f α (x) , ẏ α = f¯α (y) = (∂β ϕα ) f β ◦ ϕ−1 (y)
y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ .
Für den freien Fall (1.52) folgt
ṫ = f t (t, x) = 1 , ẋα = f α (t, x)
τ̇ = f¯1 (τ, y) = (∂t φ) ◦ φ−1 (τ ) , ẏ α = f¯α (τ, y) = (∂β ϕα ) f β + ∂t ϕα ◦ ϕ−1 (τ, y)
τ = φ (t) ,
(τ, y) = ϕ (t, x) , τ̇ = ∂t φ (t) ṫ , ẏ α = ∂β ϕα (t, x) ẋβ + ∂t ϕα (t, x) ṫ .
Man beachte, dass im Allgemeinen τ̇ 6= 1 gilt. Man kann dies jedoch immer erreichen,
wenn man die nachstehende Transformation
τ̇ = 1 , ẏ α = f¯α (τ, y) = ∂β ϕα f β + ∂t ϕα ∂t φ−1 ◦ ϕ−1 (τ, y)
31
1.7. Transformationen
1. Mathematische Grundlagen
verwendet. Beachten Sie bitte aber den Bedeutungsunterschied.
Man beachte aber, dass für die Darstellung des Systems (1.53) sich die Transformation
folgendermaßen ändert
dxαx − f αx (t, x) dt
∂βy ϕαx (τ, y) dy βy + (∂τ ϕαx (τ, y) − f αx (t, x) ◦ ϕ (τ, y) ∂τ φ (τ )) dτ
t = φ (τ ) , (t, x) = ϕ (τ, y)
dt − ∂τ φ (τ ) dτ , dxαx − ∂βy ϕαx (τ, y) dy βy − ∂τ ϕαx (τ, y) dτ .
Für Systeme mit Eingang erhält man im zeitinvarianten Fall die Beziehungen
ẋα = f α (x, u) , ẏ α = f¯α (y, v) = (∂β ϕα ) f β ◦ ψ −1 (y, v)
y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ ,
(y, v) = (ϕ (x) , ϕ̄ (x, u)) = ψ (x, u) ,
die sich für AI-Systeme folgendermaßen vereinfachen
ẏ α = āα (y) + b̄ααu (y) v αu
ẋα = aα (x) + bααu (x) uαu
= (∂β ϕα ) aβ − bβαu ψ̄βαuu ψ0βu ◦ ϕ−1 (y) + bβαu ψ̄βαuu ◦ ϕ−1 (y) v βu
y = ϕ (x) , ẏ α = ∂β ϕα (x) ẋβ , v αu = ψ0αu (x) + ψβαuu (x) uβu , ψβαuu ψ̄γβuu = δγαuu .
Im zeitvarianten Fall werden obige Transformationen für Systeme mit Eingang nur ein
wenig aufwendiger, aber es ändert sich nichts Prinzipielles.
Als Anwendung betrachte man das PCH-System (Port Controlled Hamiltonian)
ẋi = J ij (x) − Rij (x) ∂j H (x) + Bτi (x) uτ
yς = ∂i H (x) Bςi (x)
mit Hamiltonfunktion H, schiefsymmetrischer Strukturmatrix [J ij ] = − [J ji ], positiv
semidefiniter Dissipationsmatrix [Rij ] = [Rji ], dem m-dimensionalen Eingang uγ , γ =
1, . . . , m und dem m-dimensionalen Ausgang yς , ς = 1, . . . , m. Man beachte, dass dieses
System die (Passivitäts) Ungleichung
ẋi ∂i H (x) = −∂i H (x) Rij (x) ∂j H (x) + ∂i H (x) Bγi (x) uγ
= −∂i H (x) Rij (x) ∂j H (x) + yγ uγ
erfüllt. Die Koordinatentransformation
x̄ī = ϕī (x) ,
ūγ̄ = Mγγ̄ (x) uγ ,
ȳς¯ = M̄ς¯ς (x) yς ,
wobei M̄γ̄γ die zu Mγγ̄ inverse Matrix bezeichnet, führt das System nun über in
x̄˙ ī = ∂i ϕī (x) J ij (x) − Rij (x) ∂j H (x) + Bγi (x) uγ
γ
−1
i
γ̄
ī
ij
ij
j̄
= ∂i ϕ (x) J (x) − R (x) ∂j ϕ (x) ∂j̄ H ◦ ϕ (x̄) + Bγ (x) M̄γ̄ (x) u
= J¯īj̄ (x̄) − R̄īj̄ (x̄) ∂j̄ H̄ (x̄) + B̄γ̄ī (x̄) uγ̄
32
1.8. Schlussbemerkungen
1. Mathematische Grundlagen
bzw.
ȳς¯ = ∂i H̄ ◦ ϕ (x) Bςi (x) M̄ς¯ς (x)
= ∂ī H̄ ◦ ϕ (x) ∂i ϕī (x) Bςi (x) M̄ς¯ς (x)
= ∂ī H̄ (x̄) B̄ς¯ī (x̄)
mit
−1
H̄ (x̄) = H ◦ ϕ (x̄) ,
B̄ (x̄) = ∂i ϕī (x) Bγi (x) M̄γ̄γ (x) ,
īj̄
ī
ij
j̄
¯
J (x̄) = ∂i ϕ (x) J (x) ∂j ϕ (x) ◦ ϕ−1 (x̄) ,
R̄īj̄ (x̄) = ∂i ϕī (x) Rij (x) ∂j ϕj̄ (x) ◦ ϕ−1 (x̄) .
Es bezeichne X die Zustandsmannigfaltigkeit. Der Eingangsraum U ist ein Vektorbündel mit Koordinaten (xi , uγ ) und Basis X , dessen typische Faser der Rm ist. Der Ausgangsraum ist das Vektorbündel Y dual zu U mit Koordinaten (xi , uγ ) und Basis X ,
dessen typische Faser der (Rm )∗ ist. Die Matrix [Bτi ] repräsentiert eine lineare Abbildung
B : U → T (X ) wie auch deren duale Abbildung B ∗ : T ∗ (X ) → Y = U ∗ . Die Matrizen
[J ij ], [Rij ] repräsentieren eine schiefsymmetrische und eine positiv semidefinite Abbildung
vom Typ J, R : T ∗ (X ) → T (X ). Die obigen Transformationen drücken nun genau diese
Eigenschaften aus. Man beachte, dass noch gilt
ẋi ∂i H ◦ ϕ−1 (x̄) = − ∂i H (x) Rij (x) ∂j H (x) ◦ ϕ−1 (x̄) + yγ uγ
−∂ī H̄ (x̄) R̄īj̄ (x̄) ∂j̄ H̄ (x̄) + ȳγ̄ ūγ̄ .
Obige Transformation kann jedoch noch verallgemeinert werden. Dazu betrachte man den
Ansatz
x̄ī = ϕī (x)
ūγ̄ = k γ̄ (x) + Mγγ̄ (x) uγ ,
wobei k eine Lösung der Gleichungen
0 = J ij (x) − Rij (x) ∂j Ĥ (x) − Bγi (x) k γ (x)
für eine geeignete Funktion Ĥ ist. Man bestimme nun die Eigenschaften des Eingangsraums U und des Ausgangsraums Y , denn beide müssen hier affin sein. Weiters überlege
man, wie die Hamiltonfunktion H transformiert wird.
1.8
Schlussbemerkungen
Naturgemäß konnte in diesem Kapitel nur ein kleiner Ausschnitt aus der Differentialgeometrie und ihre Anwendungen auf regelungstechnische Probleme präsentiert werden.
Regelungstheoretische Untersuchungen von AI-Systemen findet man z.B. in [8, 13, 17]. Das
Buch [5] präsentiert zahlreiche Anwendungen von differentialgeometrischen Methoden auf
physikalische Probleme. Sucht man eine mathematische Einführung in die Differentialgeometrie, dann sind die Bücher [1, 3, 5, 19] zu empfehlen. Weiterführende Themen, die
sowohl für die Theorie dynamischer Systeme und die Regelungstheorie von Interesse sind
findet man z.B. in [2, 6, 14, 15, 16, 18], wobei zum Studium dieser Werke gute Kenntnisse
der Grundlagen der Differentialgeometrie erforderlich sind.
33
1.9. Aufgaben
1.9
1.9.1
1. Mathematische Grundlagen
Aufgaben
AI-Systeme
Aufgabe 1.1 Zeigen Sie, dass die Hintereinanderschaltung, Parallelschaltung und Inversion von AI–Systemen wieder zu AI–Systemen führt.
1.9.2
Mannigfaltigkeiten
Aufgabe 1.2 Gegeben sei die Einheitskugel im R3 (S2 ). Bestimmen Sie dazu eine Karte
(U, z). Wieviele Karten benötigt man für einen Atlas mindestens?
Aufgabe 1.3 Gegeben sei die Einheitskugel S2 im R3 (siehe obige Aufgabe). Bestimmen
Sie für einen Punkt x∈S2 und eine Karte (U, z) eine Basis für den Tangentialraum T (S2 ).
Aufgabe 1.4 Gegeben sei die Einheitskugel S2 im R3 (siehe obige Aufgabe). Zeigen Sie,
dass der Tangentialraum T (S2 ) unabhängig von der Wahl der speziellen Karte ist.
Aufgabe 1.5 Zeigen Sie, dass der Rn selbst eine n-dimensionale Mannigfaltigkeit ist.
Welche Gestalt hat der Tangentialraum des Rn an einer Stelle ?
Aufgabe 1.6 Der Zustand eines starren Körpers wird durch die Angabe seines Schwerpunktes, der Geschwindigkeit des Schwerpunktes, durch drei Winkel und drei Winkelgeschwindigkeiten festgelegt. Das sind also 12 Größen. Suchen Sie in der Literatur nach dem
geeigneten Zustandsraum. Hinweis: Für kleine Bewegung ist R12 sicher geeignet. Trifft dies
auch global zu ?
Aufgabe 1.7 Die Abbildung f : R2 → R2 sei gegeben durch die Beziehung
1
1
f (x1 , x2 ) = (ex cos(x2 ), ex sin(x2 )) .
Für welche (x1 , x2 ) ist diese Abbildung umkehrbar eindeutig ?
P
n
i=1
2
i
i 2
Aufgabe 1.8 Gegeben ist die Abbildung f : R → R mit f (x) =
(x ) xj .
P
Zeigen Sie, dass diese Abbildung C ∞ ist und dass die Einheitskugel ni=1 (x ) = 1 mittels
dieser Abbildung umkehrbar eindeutig auf sich selbst abgebildet wird.
n
n
j
Aufgabe 1.9 Ein bilineares System hat die Form
P
ẋ = Ax + m
j=1 (Nj x + bj ) uj
y = Cx .
bzw. mit der Einsteinschen Summenkonvention
ẋi = aij xj + nij,k xj + bik uk
y l = clj xj .
Führen Sie für obiges System eine reguläre Zustandstransformation der Form
34
1.9. Aufgaben
1. Mathematische Grundlagen
1. z = Tx bzw. z i = tij xj und
2. z = t(x) bzw. z i = ti (x)
durch und überprüfen Sie, ob das System im transformierten Zustand z wieder ein bilineares System ergibt.
Aufgabe 1.10 Die Funktion f : R2 → R3 ist durch die Gleichung
2 2 1 2
2 2
2 2
f (x1 , x2 ) = x1 x1 + x2
,x
x + x2
, x1 + x2
gegeben und M bezeichne das Bild von f . Ist mit M im Sinne der Definition 1.1 eine
Mannigfaltigkeit gegeben ? Hinweis: Zeichnen Sie diese Funktion.
Aufgabe 1.11 Gegeben ist eine unendlich oft stetig differenzierbare Funktion f : Rn →
Rm . Zeigen Sie, dass durch die Gleichung
f (x) = c ∈ Rm
eine Mannigfaltigkeit definiert ist, sofern die Jacobi-Matrix von f (x) für alle x ∈ Rn
regulär ist.
Aufgabe 1.12 Zeigen Sie, dass durch
z
−1
cos(2πt)
=
sin(2πt)
keine Karte für den gesamten Einheitskreis definiert wird.
1.9.3
Bündel
Aufgabe 1.13 Bei der Behandlung eines dynamischen Systems der Form
ẋi = f i (x, u)
mit differentialgeometrischen Methoden unterscheidet man zwischen zwei Beschreibungsformen: Der Beschreibung durch ein Vektorfeld (v = ∂t + f i ∂i ∈ Γ (T (E))) und der sogenannten dualen Beschreibung durch ein System von 1-Formen der Art
i
dx − f i (x, u) dt .
Diskutieren Sie, welche Transformationen der Art z = tz (x, u) , v = tv (x, u) die Struktur
der gewählten Darstellung nicht verändern. ( Hinweis: Berechnen Sie jeweils das transformierte System in den neuen Koordinaten)
Aufgabe 1.14 Begründen Sie die folgende Ungleichung für Schnitte σ ∈ Γ (E) der Form
f i (x, u) ∂i g ◦ σ 6= f i ◦ σ ∂i (g ◦ σ) .
35
1.9. Aufgaben
1. Mathematische Grundlagen
Aufgabe 1.15 Begründen Sie, wieso das Vektorfeld (v ∈ T (R3 ))
v = a x1 , x2 ∂1
im Bündel ((R3 , ρ31 , R1 )) mit (ρ31 : (x1 , x2 , x3 ) → (x1 )) nicht projizierbar ist, hingegen im
Bündel ((R3 , ρ32 , R2 )) mit (ρ32 : (x1 , x2 , x3 ) → (x1 , x2 )) schon.
Aufgabe 1.16 Welches der folgenden Vektorfelder
v1 = a (x1 , x2 ) ∂1
v2 = a (x1 , x2 ) ∂2 + ∂3
v3 = ∂1 + a (x1 , x2 ) ∂3
ist im Bündel ((R3 , ρ31 , R1 )) mit (ρ31 : (x1 , x2 , x3 ) → (x1 )) vertikal?
36
Kapitel 2
Eingangs/Ausgangslinearisierung
Die Methode der Eingangs/Ausgangslinearisierung ist die einfachste differentialgeometrische Methode. Um eine besonders einfache Darstellung zu erhalten, wird der Eingrößenfall
zuerst betrachtet.
2.1
Der Eingrößenfall
Gegeben sei das System
ẋi = f i (t, x, u) , i = 1, . . . , n
ṫ = 1
y = c (t, x)
(2.1)
mit einem Eingang u und einem Ausgang y. Man wählt nun die Bündel (E, π, B) mit
lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E) mit lokalen Koordinaten
(t, x, u) für Z. Mit dem Vektorfeld f ∈ ρ∗ (T (E)),
f = ∂t + f i ∂i
hat man nun eine Abbildung f : C ∞ (E) → C ∞ (Z) der Art, dass f (g) für g ∈ C ∞ (E)
die Änderung von g entlang von Lösungen von f misst. Für die wiederholte Anwendung
von f schreibt man (f )k (g) mit
(f )0 (g) = g , (f )k+1 (g) = f f k (g) .
Es gelte nun
(f )i (c) = hi ∈ C ∞ (E) , i = 0, . . . , r − 1
(f )r (c) = hr ∈ C ∞ (Z) , hr ∈
/ C ∞ (E) ,
und gilt in der Umgebung eines Punktes (t, x, u) noch
∂u hr 6= 0 ,
dann kann man eine Funktion w (t, x, v) so finden, dass die Gleichung
hr (t, x, w (t, x, v)) = v
37
2.1. Der Eingrößenfall
2. Eingangs/Ausgangslinearisierung
erfüllt ist. In diesem Fall nennt man r den relativen Grad des Systems (2.1).
Mit dem Kartenwechsel ((t, z) , v) = (ϕ (t, x) , ψ (t, x, u)),
z i = hi−1 ,
i = 1, . . . , r
j
j
z = h̄ ,
j = r + 1, . . . , n
v = hr (t, x, u) ,
(2.2)
wobei die Funktionen h̄j ∈ C ∞ (E) so gewählt werden, dass ϕ ein Diffeomorphismus ist,
folgt sofort
ż i = f (hi−1 ) ◦ ϕ−1 = hi ◦ ϕ−1 = z i+1 , i = 1, . . . , r − 1
ż r = f (hr−1
) ◦ ϕ−1 = hr ◦ ϕ−1 = v
(2.3)
j
j
−1
ż = f h̄ ◦ ϕ .
Es muss noch gezeigt werden, dass tatsächlich diese Transformation ein Diffeomorphismus
ist. Das System (2.3) kann nun sehr einfach geregelt werden, z.B. mit dem Gesetz
r
X
v=−
αi−1 z i + v̄ ,
(2.4)
i=1
Pr
i
wobei p (s) =
i=0 αi s , αr = 1 ein Hurwitz Polynom ist, und v̄ einen zusätzlichen
Eingang bezeichnet. Allerdings ist die Regelung nur brauchbar, wenn das System
ż j = f h̄j ◦ ϕ−1 t, z, −αi−1 z i + v̄ , j = r + 1, . . . , n
(2.5)
mit den Eingängen z i , i = 1, . . . , r und v̄ stabil ist. Man könnte nun glauben, dass das
Gesetz (2.4) die Stabilität des Systems (2.5) beeinflusst. Betrachte man nun das System
ẋi = f i (t, x, u) , i = 1, . . . , n
v = hr (t, x, u) ,
dann folgt für das inverse System
ẋi = f i (t, x, w (t, x, v)) , i = 1, . . . , n
u = w (t, x, v) .
Der Kartenwechsel ((t, z) , v) = (ϕ (t, x) , v)
z i = hi−1 , i = 1, . . . , r
z j = h̄j , j = r + 1, . . . , n
führt zu
Das System
ż i = f (hi−1 ) ◦ ϕ−1 = hi ◦ ϕ−1 = z i+1 , i = 1, . . . , r − 1
ż r = f (hr−1
ϕ−1 = hr ◦ ϕ−1 = v
) ◦ −1
j
j
ż = f h̄ ◦ ϕ .
ż j = f h̄j ◦ ϕ−1
heißt auch die Nulldynamik des Systems (2.3), und sie ist natürlich unabhängig von (2.4),
die ja nur den Eingang betrifft.
Ein wichtiger Sonderfall ist, wenn der relative Grad r die Bedingung r = n erfüllt,
da es in diesem Fall keine Nulldynamik gibt. In diesem Fall wird das System (2.1) mit
dem Kartenwechsel (2.2) in ein lineares und zeitinvariantes übergeführt. Im Fall r ≤
n−1 spricht man von der (exakten) Eingangs-Ausgangs-Linearisierung eines nichtlinearen
Systems, im Fall r = n vom Spezialfall der Eingangs-Zustands-Linearsierung.
38
2.2. Tensor Bündel
2.2
2. Eingangs/Ausgangslinearisierung
Tensor Bündel
Es sei M eine glatte m-dimensionale Mannigfaltigkeit und T (M), T ∗ (M) das Tangentialbzw. das Kotangentialbündel. Die Schnitte v ∈ Γ (T (M)), ω ∈ Γ (T ∗ (M)) erzeugen nun
mit der Vorschrift
hω, ·i h·, vi : T (M) × T ∗ (M) → C ∞ (M)
eine bilineare Abbildung. Man führt nun das neue Symbol ⊗, das Tensorprodukt gemäß
der Beziehung
(ω ⊗ v) (·, ·) = hω, ·i h·, vi
ein. Diese Konstruktion kann direkt auf multilineare Funktionen (T (M))k ×(T ∗ (M))l →
C ∞ (M) erweitert werden.
Satz 2.1 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Die Menge
l
Tl k (M) = ∪p∈M (Tp (M))k × Tp∗ (M)
k
ist das Bündel Tl k (M) , τl,M
, M , genannt das Tensorbündel von M mit der Projektion
k
τl,M
. Die typische Faser F ist ein mk+l -dimensionaler Vektorraum.
Ein Schnitt von T0k (M) heißt kovariantes Tensorfeld, ein Schnitt von Tl 0 (M) heißt kontravariantes Tensorfeld. Außerdem
gilt T01 (M) ∼
= T ∗ (M) und T10 (M) ∼
= T (M).
k
k
Ein Schnitt Φ ∈ Γ T0 (M) , man könnte aber genauso gut T0 (M) wählen,
Φ = ⊗ki=1 ω i ,
kann gemäß der Beziehung
S (Φ) =
1 X k
⊗j=1 ω σ(j)
k! σ
symmetrisch gemacht werden, wobei σ die Permutation von (1, . . . , k) mit (1, . . . , k) →
(σ (1) , . . . , σ (k)) bezeichnet. Bezeichnet sgn (σ) das Vorzeichen der Permutation σ, dann
ist der zugehörige alternierende Tensor durch
1 X
A (Φ) =
sgn (σ) ⊗kj=1 ω σ(j)
k! σ
gegeben. Offensichtlich ist die multilineare Abbildung A (Φ) alternierend. Die symmetrischen und die alternierenden Tensoren bilden ein Unterbündel von T0k (M), die mit
S k (T ∗ (M)) bzw. mit ∧k (T ∗ (M)) bezeichnet werden. Vollkommen analoge Überlegungen gelten für Schnitte Φ ∈ Γ (Tk0 (M)), wobei für das zugehörige Bündel ∧k (T (M))
geschrieben wird.
Es gelte ϕ ∈ Γ T0k (M) , ψ ∈ Γ T0l (M) , dann kann wieder das Tensorprodukt ⊗
gemäß der Vorschrift
ϕ ⊗ ψ (v1 , . . . , vk , vk+1, . . . , vk+l ) = ϕ (v1 , . . . , vk ) ψ (vk+1 , . . . , vk+l )
mit ϕ ⊗ ψ ∈ T0k+l (M) und vi ∈ Γ (T (M)), i = 1, . . . , k + l gebildet werden. Man
kann einfach zeigen, dass die Abbildung ⊗ : T0k (M) × T0l (M) → T0k+l (M) bilinear und
assoziativ ist. Auch die folgende Definition gilt nun für alternierende Bündel ∧k (T ∗ (M))
oder ∧k (T (M)).
39
2.2. Tensor Bündel
2. Eingangs/Ausgangslinearisierung
Definition 2.1 Die Abbildung ∧ : ∧k (T ∗ (M)) × ∧l (T ∗ (M)) → ∧k+l (T ∗ (M)) mit
(k + l)!
A (ϕ ⊗ ψ)
k!l!
für ϕ ∈ Γ ∧k (T ∗ (M)) , ψ ∈ Γ ∧l (T ∗ (M)) , heißt das äußere Produkt (oder Grassmann Produkt) von ϕ und ψ.
ϕ∧ψ =
Das Grassmann Produkt oder äußere Produkt hat nun die folgenden Eigenschaften, wovon
man sich durch nachrechnen überzeugt.
Satz 2.2 Das Grassmann Produkt, siehe Definition 2.1 ist bilinear and assoziativ.
Man benutzt oft die Konvention ∧0 (T ∗ (M)) ∼
= C ∞ (M). Man beachte auch, dass die
Bündel ∧k (T ∗ (M)) mit k > m nur den Null-Schnitt als einzigen Schnitt besitzen. Man
nennt Schnitte von ∧r (T ∗ (M)) auch r-Formen. Schnitte von ∧r (T (M)) heißen auch
r-Vektoren. Wegen ∧1 (T ∗ (M)) ∼
= T ∗ (M) sind Kovektoren 1-Formen.
Die Menge aller p-Formen mit p = 1, . . . , m wird auch mit ∧ (T ∗ (M)) bezeichnet.
Auf dieser Menge gibt es nun zwei Verknüpfungen +, ∧ : ∧ (T ∗ (M)) × ∧ (T ∗ (M)) →
∧ (T ∗ (M)) so, dass damit eine Algebra definiert wird. Man nennt diese Algebra auch
äußere Algebra. Da nun für eine glatte Abbildung f : M → N mit den Mannigfaltigkeiten
M, N gilt
f ∗ (α ∧ β) = f ∗ (α) ∧ f ∗ (β)
für alle α, β ∈ Γ (∧ (T ∗ (N ))) (Bitte nachrechnen!!) folgt, dass f ∗ ein Homomorphismus
der äußeren Algebra ist.
2.2.1
Lie-Ableitungen und die Lie-Klammer
Es sei M eine glatte m-dimensionale Mannigfaltigkeit mit lokalen Koordinaten (x). Die
Lie-Ableitung einer Funktion g ∈ C ∞ (M) entlang eines Feldes v ∈ Γ (T (M)) ist
Lv (g) = v (g) .
(2.6)
Da v der infinitesimale Generator des Flusses ϕε ist, gilt
Lv (g) (p) = ∂ε g ◦ ϕε (p)|ε=0 .
(2.7)
Der Ausdruck Lv (g) (p) misst die Änderung von g an der Stelle p. Dieses geometrische
Bild erlaubt nun die Lie-Ableitung eines Feldes w ∈ Γ (T (M)) entlang eines Feldes v ∈
Γ (T (M)) mit
Lv (w) (p) = v (w) (p) = ∂ε (w ◦ ϕε (p) − ϕε,∗ (p) (w (p)))|ε=0
(2.8)
zu definieren. Man beachte den Term ϕε,∗ (p). Obwohl die Fasern Ep = π −1 (p) von T (M)
diffeomorph zur typischen Faser sind, darf man Vektoren die in verschiedenen Fasern
liegen nicht vergleichen, wie man es im Rm tut. Dies erklärt nun diesen Term. Darüber
hinaus zeigt diese Betrachtung, wie Lie-Ableitungen von Kovektoren oder Tensoren im
Prinzip zu bilden sind.
40
2.2. Tensor Bündel
2. Eingangs/Ausgangslinearisierung
Es sei f : M → N ein Diffeomorphismus zwischen M und N , dann gelten für g ∈
C ∞ (N ), v, w ∈ Γ (T (M)) die Beziehungen
v (f ∗ (g)) = f ∗ (ṽ (g)) bzw. Lv (f ∗ (g)) = f ∗ (Lṽ (g))
v]
(w) = ṽ (w̃)
bzw.
L^
v (w) = Lṽ (w̃)
(2.9)
mit f ∗ (g) = g ◦ f und ṽ = (f∗ v) ◦ f −1 . Offensichtlich ist diese Lie-Ableitung unabhängig
von den speziellen Koordinaten.
Der Kommutator oder die Lie-Klammer zweier Felder v, w ∈ Γ (T (M)) ist durch
[v, w] (g) = Lv (Lw (g)) − Lw (Lv (g))
(2.10)
mit g ∈ C ∞ (M) gegeben. Da der Fluss ϕε mit dem infinitesimalen Generator v ein lokaler
Diffeomorphismus ist, folgt
Lv (Lw (g)) − Lw (Lv (g)) = ∂ε ((w (g)) ◦ ϕε − (ϕε,∗ w) (g ◦ ϕε ))|ε=0
= ∂ε ((w ◦ ϕε ) − (ϕε,∗ w))|ε=0 (g)
= (v (w)) (g)
wegen der Gleichungen (2.7, 2.8) und damit
[v, w] = Lv (w)
(2.11)
wegen (2.10). Die Gleichung (2.11) zeigt, dass der Kommutator (2.10) wieder ein Vektorfeld auf M ist. Aus (2.10) und (2.11) folgt, dass die Lie-Klammer eine Abbildung
Γ (T (M)) × Γ (T (M)) → Γ (T (M)) ist, die die Beziehungen
a)
b)
c)
[λv, µw] = λµ [v, w] + λv (µ) w − µw (λ) v
[v, w] = − [w, v]
[u, [v, w]] + [v, [w, u]] + [w, [u, v]] = 0
(2.12)
für alle u, v, w ∈ Γ (T (M)) und λ, µ ∈ C ∞ (M) erfüllt. Die Beziehung c) heißt auch
Jacobi Identität.
Offensichtlich gibt Gleichung (2.11) eine neue Interpretation der Lie-Ableitung (2.8).
Zusätzlich findet man nun eine Darstellung von [v, w] in lokalen Koordinaten. Aus
v = v i (x) ∂i ,
und (2.11) folgt
w = w i (x) ∂i
(2.13)
[v, w] = v w i − w v i ∂i .
(2.14)
v (g) = w (g) = 0
(2.15)
Tangentialvektorfelder sind nun auch Differentialoperatoren. So beschreiben die Felder
v, w von (2.13) die beiden linearen partiellen Differentialgleichungen
in der gesuchten Funktion g ∈ C ∞ (M). Da nun auch
Lw (Lv (g)) = Lv (Lw (g)) = 0
41
2.2. Tensor Bündel
2. Eingangs/Ausgangslinearisierung
gelten muss, folgt
[v, w] (g) = 0 .
(2.16)
Man muss nun zwei Fälle unterscheiden. Gilt
[v, w] = λv + µw
(2.17)
mit λ, µ ∈ C ∞ (M), dann implizieren (2.15) die Gleichung (2.16). Ansonsten muss g noch
zusätzlich (2.16) erfüllen. Man nennt die Bedingung (2.16) auch eine Integrabilitätsbedingung für (2.15). Ist jedoch (2.17) nicht erfüllt, dann muss man weiter Integrabilitätsbedingungen suchen, indem man alle weiteren Lie-Klammern der Felder v, w, [v, w] usw.
bildet. Ein einfaches Dimensionsargument zeigt, dass Integrabilitätsbedingungen nur für
dim (M) > 2 auftreten.
Man beachte, dass die Lie-Klammer als Lie-Ableitung eines Vektorfeldes (2.8), als
Kommutator zweier Differentialoperatoren (2.11), und als Integrabilitätsbedingungen bei
Systemen von Differentialgleichungen (2.16) auftritt. Betrachtet man noch die Flüsse ϕε1 ,
ψε2 erzeugt von den Feldern v, w auf M, dann kann man untersuchen, ob
ϕε1 ◦ ψε2 = ψε2 ◦ ϕε1
(2.18)
gilt (ε1 , ε2 ) ∈ E ⊂ R2 , (0, 0) ∈ E. Berechnet man die Ableitungen nach ε1 , ε2 , dann folgt
die infinitesimale Bedingung
[v, w] = 0 .
(2.19)
Die Flüsse ϕε1 , ψε2 kommutieren genau dann, wenn die Lie-Klammer ihrer Generatoren
v, w verschwindet.
Nun verfügen wir über die Lie-Ableitung einer Funktion und eines Tangentialvektors.
Die Lie-Ableitung eines Kovektors folgt aus der Forderung
Lv (hω, wi) = hLv (ω) , wi + hω, Lv (w)i
(2.20)
für alle w ∈ Γ (T (M)). Den Ausdruck in Koordinaten erhält man mit v = v i ∂i , w = w i ∂i
und ω = ωi dxi sowie
v (ωi ) w i + ωi v w i = Lv ωi dxi , w + ωi v w i − w v i
als
Lv ωi dxi = v (ωi ) dxi + ωj ∂i v j dxi .
(2.21)
Die Definition der Lie-Ableitung einer 1-Form analog zu (2.8) wäre
Lv (ω) (p) = v (ω) (p) = ∂ε (ϕ∗ε (ϕε (p)) (ω ◦ ϕε (p)) − ω (p))|ε=0 .
Natürlich führen beide Ansätze zum selben Ergebnis.
Die Erweiterung der Lie-Ableitung auf Tensoren höherer Stufe erhält man mit der
Forderung, dass die Produktregel erfüllt ist. Z.B. für ω ∈ T01 (M), v ∈ T10 (M) folgt
Lw (ω ⊗ v) = Lw (ω) ⊗ v + ω ⊗ Lw (v) .
Diese Technik kann man natürlich geradlinig erweitern.
42
(2.22)
2.2. Tensor Bündel
2.2.2
2. Eingangs/Ausgangslinearisierung
Die äußere Ableitung
Wieder sei M eine glatte m-dimensionale Mannigfaltigkeit mit dem Tangentialbündel
T (M) und dem Kotangentialbündel T ∗ (M). Für ein Feld v ∈ Γ (T (M)) gilt offensichtlich
h·, vi : ∧1 (T ∗ (M)) → ∧0 (T ∗ (M)) = C ∞ (M) .
Die Lie-Ableitung einer p-Form ist nun eine Abbildung
Lv : ∧p (T ∗ (M)) → ∧p (T ∗ (M)) .
Zusätzlich kann man in adaptierten Koordinaten (x, ẋ) mit v = v i ∂i und f ∈ C ∞ (M) die
Lie-Ableitung in der Form
v (f ) = ∂i f v i = ∂i f dxi , v i ∂i
(2.23)
mit dem Differential, der 1-Form,
ω = ∂i f dxi
schreiben. Da nun gilt d : ∧0 (T ∗ (M)) → ∧1 (T ∗ (M)), kann man sich fragen, wie man
die Abbildung d von 0-Formen auf p-Formen, p > 1, erweitert. Mit dem speziellen I =
i1 , . . . , ip , i1 < i2 < · · · < ip kann man nun jede p-Form ω in Koordinaten in der Form
ω = ωI dxI ,
dxI = dxi1 ∧ dxi2 ∧ · · · ∧ dxip
mit ωI ∈ C ∞ (M) schreiben, wobei die Summe über alle möglichen Indizes I zu nehmen
ist. Wir erweitern nun die Abbildung d in den speziellen Koordinaten in folgender Form
dω = dωI ∧ dxI .
Dies ist bereits die gewünschte Erweiterung von d zu p-Formen, und der nachstehende
Satz zeigt, dass diese Konstruktion unabhänging von der Wahl der Koordinaten ist.
Satz 2.3 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Dann existiert eine
wohlbestimmte Abbildung d, die äußere Ableitung,
d : ∧p (T ∗ (M)) → ∧p+1 (T ∗ (M)) ,
p = 0, 1, . . . so, dass folgende Regeln für alle α ∈ Γ (∧p (T ∗ (M))), β ∈ Γ (∧q (T ∗ (M)))
gelten.
1. d (α + β) = dα + dβ.
2. d (f ), f ∈ ∧0 (T ∗ (M)) = C ∞ (M) ist das gewöhnliche Differential.
3. d (α ∧ β) = dα ∧ β + (−1)p α ∧ dβ.
4. d2 (α) = d (dα) = 0.
43
2.2. Tensor Bündel
2. Eingangs/Ausgangslinearisierung
Der Beweis erfolgt durch Überprüfung mittels eines Kartenwechsels.
Die äußere Ableitung ist nun auch mit einer Abbildung f : M → N zwischen zwei
Mannigfaltigkeiten M, N in folgender Art
df ∗ (ω) = f ∗ (dω)
für ω ∈ ∧ (T ∗ (N )) vertauschbar, wobei zu beachten ist, dass dasselbe Symbol d für die
äußere Ableitung von ∧ (T ∗ (M)) und von ∧ (T ∗ (N )) verwendet wird. Es verbleibt also
noch die Erweiterung der Abbildung h·, vi auf allgemeine p-Formen.
Satz 2.4 Es sei M eine glatte m-dimensionale Mannigfaltigkeit. Dann existiert genau
eine Abbildung iv , das innere Produkt,
i : T (M) × ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M))
bzw.
iv : ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M))
mit v ∈ Γ (T (M)) und p = 1, 2, . . ., die die nachstehenden Regeln erfüllt.
1. iv+w = iv + iw für v, w ∈ Γ (T (M)).
2. if v = f iv für f ∈ Γ (∧0 (T ∗ (M))).
3. iv (f ) = 0, für f ∈ Γ (∧0 (T ∗ (M))).
4. iv (ω) = hω, vi für ω ∈ Γ (∧1 (T ∗ (M))).
5. iv (ω) = ω (v, ·, . . . , ·) für ω ∈ Γ (∧p (T ∗ (M))), p > 1.
Man kann nun einfach zeigen, dass das innere Produkt noch folgendem Satz genügt.
Satz 2.5 Es sei M eine glatte m-dimensionale Mannigfaltigkeit und v ∈ Γ (T (M)). Das
innere Produkt iv : ∧p (T ∗ (M)) → ∧p−1 (T ∗ (M)) genügt der Beziehung
iv (α ∧ β) = iv (α) ∧ β + (−1)p α ∧ iv (β)
für alle α ∈ Γ (∧p (T ∗ (M))), β ∈ Γ (∧q (T ∗ (M))).
Oft wird für das innere Produkt auch das Symbol ⌋ gemäß der Vereinbarung
iv (α) = v⌋α
(2.24)
geschrieben. Darüberhinaus kann man nun die Erweiterung von (2.23) auf allgemeine
p-Formen gemäß der Beziehung
v (ω) = d (iv (ω)) + iv (dω) = d (v⌋ω) + v⌋dω .
(2.25)
angeben, die auch Cartan’s magic formula heißt. Man könnte aus dieser Beziehung zusammen mit der Lie-Ableitung und dem inneren Produkt eine Definition der äußeren
Ableitung gewinnen (Wie könnte man das machen ?).
44
2.3. Der Eingrößenfall II
2.3
2. Eingangs/Ausgangslinearisierung
Der Eingrößenfall II
Für die Eingangs/Ausganglinearisierung im Eingrößenfall bleibt noch zu klären, wann die
Transformation Gl. 2.2 ein Diffeomorphismus ist. Es kann nun genau dann ein Diffeomorphismus der Transformation Gl. 2.2 aufgebaut werden, wenn
dt ∧
^r−1
i=0
dhi = dt ∧
^r−1
i=0
df i (c) = dt ∧
^r−1
i=0
f i (dc) 6= 0
(2.26)
in der Umgebung eines Punktes (t, x) ∈ E gilt. In diesem Fall kann man immer Funktionen
h̄j so finden, dass
^n
^r−1
dh̄j 6= 0
df i (c) ∧
dt ∧
j=r+1
i=0
erfüllt ist. Findet man andererseits ein s < r so, dass gilt
dt ∧
^s−1
i=0
df i (c) 6= 0, dt ∧
^s
i=0
df i (c) = 0 ,
in einer offenen Umgebung U ⊂ E eines Punktes (t, x) ∈ U, dann folgt
^s
^s−1
f dt ∧
df i (c) ∧ df s+1 (c) = 0 .
df i (c) = dt ∧
i=0
i=0
In diesem Fall existiert kein Regelgesetz, das zu einem linearen Eingangs/Ausgangsverhalten führt. Verschwindet der Ausdruck auf einer Untermannigfaltigkeit S ⊂ E mit (t, x) ∈ E
und dim (S) < dim (E), dann existiert kein relativer Grad.
Man kann einfach das Regelgesetz (2.4) in den alten Koordinaten ausdrücken. Da das
System (2.1) relativen Grad r besitzt, folgt mit (2.2) lokal die Existenz einer Funktion w,
u = w (t, x, v)
mit
hr (t, x, w (t, x, v)) = v .
Damit erhält man sofort aber das (nichtlineare) Regelgesetz
!
r−1
X
i
u = w t, x, −
αi h + v̄
i=0
in den ursprünglichen Koordinaten.
2.4
Der Mehrgrößenfall
Nun wird das System
ẋi = f i (t, x, u) , i = 1, . . . , n
y α = cα (t, x) ,
α = 1, . . . , m
(2.27)
mit einem Eingang u ∈ Rm und einem Ausgang y ∈ Rm betrachtet. Man wählt nun
die Bündel (E, π, B) mit lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E)
45
2.4. Der Mehrgrößenfall
2. Eingangs/Ausgangslinearisierung
mit lokalen Koordinaten (t, xi , uα ) für Z. Analog zum Eingrößenfall führt man noch das
Vektorfeld f ∈ ρ∗ (T (E)),
f = ∂t + f i ∂i
ein.
Es gelte nun
sowie
f iα (cα ) = hα,iα ∈ C ∞ (E) , iα = 0, . . . , rα − 1
f rα (cα ) = hα,rα ∈ C ∞ (Z) , hα,rα ∈
/ C ∞ (E) ,
∂
(2.28)
∂uα
in der Umgebung eines Punktes (t, x, u). Dann nennt man (rα ) den vektoriellen relativen
Grad und
m
X
r=
rα
det ([∂β hα,rα ]) 6= 0 , ∂α =
α=1
den relativen Grad des Systems (2.27). Wegen obiger Bedingung existieren lokal Funktionen w α so, dass
hα,rα ((t, x, w (t, x, v))) = v α
gilt.
Mit dem Kartenwechsel (t, z iα , v α ) = ϕ (t, x, u) = (t, ϕi (t, x) , ϕu (t, x, u)),
z α,iα = hα,iα −1 ,
iα = 1, . . . , rα
j
j
z = h̄ ,
j = r + 1, . . . , n
v α = hα,rα (t, x, u)
(2.29)
wobei die Funktionen h̄j , so gewählt werden, dass ϕ ein Diffeomorphismus ist, folgt sofort
ż α,iα = hα,iα ◦ ϕ−1 = z α,iα +1 , iα = 1, . . . , rα − 1
ż α,rα = hα,rα ◦ ϕ−1 = v α
ż j = f h̄j ◦ ϕ−1 .
(2.30)
Das System (2.27) kann nun wieder sehr einfach geregelt werden, zB. mit dem Gesetz
rα
X
α
αiαα −1 z α,iα + v̄ α ,
v =−
(2.31)
iα =1
Pr
wobei die Polynome pα (s) = i=0 αiα si , αrα = 1 Hurwitz Polynome sind, und v̄ α zusätzliche Eingänge bezeichnet. Die Untersuchungen betreffend die Existenz der Transformation
(2.30) unterscheiden sich nicht vom Eingrößenfall. Auch die Analyse der Nulldynamik
kann geradlinig übertragen werden. Sie ist natürlich wieder durch das Regelgesetz (2.31)
nicht beeinflussbar. Neu im Mehrgrößenfall ist, dass die Matrix (2.28), bei AI-Systemen
wird sie als Entkopplungsmatrix bezeichnet, im Allgemeinen nicht regulär ist. Dies kann
oftmals durch Vorschalten eines geeigneten dynamischen Systems erreicht werden. Da hier
dieser Fall nicht weiter untersucht wird, sei auf die Literatur verwiesen.
Ein wichtiger Sonderfall ist, wenn der relative Grad r die Bedingung r = n erfüllt, da
es in diesem Fall keine Nulldynamik gibt. In diesem Fall wird das System (2.27) mit dem
Kartenwechsel (2.29) in ein lineares und zeitinvariantes übergeführt. Man nennt dann das
System (2.30) mit verschwindender Nulldynamik auch Brunovsky Normalform.
46
2.5. Schlussbemerkungen
2.5
2. Eingangs/Ausgangslinearisierung
Schlussbemerkungen
Die Methode der Eingangs/Ausgangslinearsierung findet man z.B. in [8, 13, 17] ausführlich, wobei aber vornehmlich AI-Systeme betrachtet werden. Da sich aber die theoretischen
Überlegungen im allgemeineren Fall nicht von jenen des spezielleren unterscheiden, ist in
diesem Kapitel gleich der allgemeinere Fall behandelt worden. In der oben zitierten Literatur findet man auch den Fall einer singulären Entkopplungsmatrix und Algorithmen,
diesen Defekt zu beheben, falls dies möglich ist.
47
Kapitel 3
Erreichbarkeit und Beobachtbarkeit
Gegeben sei das System
ẋi = f i (t, x, u) , i = 1, . . . , n
ṫ = 1
y α = cα (t, x, u) , α = 1, . . . , ny
(3.1)
mit dem Eingang (uς ), ς = 1, . . . , nu und einem Ausgang y. Man wählt nun wieder die
Bündel (E, π, B) mit lokalen Koordinaten (t, xi ) für E und (t) für B, sowie (Z, ρ, E) mit
lokalen Koordinaten (t, x, u) für Z. Ebenso gilt f ∈ ρ∗ (T (E)) mit
f = ∂t + f i ∂i .
Betrachtet man nun die beiden Systeme
x̄˙ i
x̄˙ j
ṫ
yα
sowie
=
=
=
=
x̄˙ j
x̄˙ i
ṫ
yα
f i (t, x̄1 , . . . , x̄n , u) ,
f j (t, x̄m+1 , . . . , x̄n ) ,
1
cα (t, x̄1 , . . . , x̄n , u)
=
=
=
=
i = 1, . . . , m
j = m + 1, . . . , n
(3.2)
α = 1, . . . , ny
f j (t, x̄1 , . . . , x̄m , u) , j = 1, . . . , m
f i (t, x̄1 , . . . , x̄n , u) , i = m + 1, . . . , n
1
cα (t, x̄1 , . . . , x̄m , u) , α = 1, . . . , ny ,
(3.3)
dann ist einfach zu sehen, dass das System (3.2) nicht erreichbar, und dass das System
(3.3) nicht beobachtbar ist.
Es bleibt also das Problem zu lösen, ob man das System (3.1) mit der Transformation
x̄ = ϕ (t, x) ,
die weder die Zeit, Eingang oder Ausgang verändert, auf die Formen (3.2) oder (3.3)
überführen kann. Dazu werden noch einige Ergebnisse aus der Theorie der partiellen
Differentialgleichungen benötigt.
48
3.1. Distributionen und die Sätze von Frobenius
3.1
3. Erreichbarkeit und Beobachtbarkeit
Distributionen und die Sätze von Frobenius
Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M sowie ein Tangentialvektorfeld v ∈ Γ (T (M)), das den lokalen Fluss ϕε (p) erzeugt. In der Umgebung Up von p
und für ε ∈ I = (ε1 , ε2), ε1 < 0 < ε2 ist ϕε (p) ∩ Up = Sp eine reguläre 1-dimensionale
Untermannigfaltigkeit, die der Bedingung
Tϕε (p) (Sp ) = span {v (ϕε (p))}
(3.4)
genügt, wobei span {v (p)} ⊂ Tp (M) den durch v am Punkt p aufgespannten linearen
Unterraum bezeichnet. Man nennt ϕε (p) auch Integralkurve und Sp auch Integralmannigfaltigkeit von v. Man beachte, dass man ein und dieselbe Integralmannigfaltigkeit mit
verschiedenen Integralkurven beschreiben kann.
Diese Betrachtung kann nun folgendermaßen auf höher dimensionale Untermannigfaltigkeiten übertragen werden.
Definition 3.1 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen
mit ihrem Tangentialbündel T (M). Eine Vorschrift, die jedem Punkt x ∈ Up ⊂ M einer
offenen Umgebung Up des Punktes p einen linearen Vektorraum ∆x ⊂ Tx (M) zuweist,
heißt (lokale) Distribution ∆. Die Distribution ∆ heißt regulär am Punkt p, falls
dim (∆p ) = dim (∆x )
für alle x ∈ Up gilt. Die Distribution ∆ heißt glatt, wenn glatteVektorfelder vk ∈ Γ (T (M))
so existieren, dass
∆p = span {vk } , k = 1, . . . , n
gilt.
Die Übertragung des eindimensionalen Problems auf den mehrdimensionalen Fall gelingt dann folgendermaßen: Gegeben sei eine (reguläre) und (glatte) Distribution ∆,
dim (∆) = n gemäß Definition 3.1. Nun stellt man sich die Frage, ob dazu eine ndimensionale Untermannigfaltigkeit Sp so existiert, dass
Tx (Sp ) = ∆x , ∀x ∈ Up ∩ Sp
(3.5)
gilt. Falls Sp existiert, nennt man Sp eine Integralmannigfaltigkeit. Für das Weitere wird
nachfolgende Definition benötigt.
Definition 3.2 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen
mit ihrem Tangentialbündel T (M). Eine glatte Distribution ∆ heißt involutiv, falls
[vi , vj ] ∈ ∆
für alle vi , vj ∈ ∆ gilt.
Involutive und glatte Distributionen besitzen nun lokale Integralmannigfaltigkeiten.
49
3.1. Distributionen und die Sätze von Frobenius
3. Erreichbarkeit und Beobachtbarkeit
Satz 3.1 Es sei M eine glatte m-dimensionale Mannigfaltigkeit und ∆ = span {v1 , . . . , vn }
eine involutive glatte Distribution, die auf Up regulär mit dim (∆) = n ist. Dann existiert
eine n-dimensionale Integralmannigfaltigkeit Sp so, dass die Beziehung 3.5 erfüllt ist.
Weiters kann man m − n Funktionen f i+n mit
f i+n (x) = 0 ,
und
i = 1, . . . , m − n
m−n
^
i=1
finden.
df i+n 6= 0
Der Beweis dieses Satzes, er heißt auch Satz von Frobenius, erfolgt nun in zwei Schritten.
Die Distribution ∆ erfülle zusätzlich noch die Bedingung
[vi , vj ] = 0 ,
(3.6)
dann kommutieren alle Flüsse ϕiεi , oder es gilt
ϕi ◦ ϕj = ϕj ◦ ϕi , i, j = 1, . . . , n .
Die Abbildung U n → M, U ⊂ R,
x = ϕ1ε1 ◦ · · · ◦ ϕnεn (p)
beschreibt damit bereits die Integralmannigfaltigkeit wegen
j+1
n
n
1
∂εj ϕjεj ◦ ϕ1ε1 ◦ · · · ϕεj−1
j−1 ◦ ϕεj+1 ◦ · · · ◦ ϕεn (p) = vj ϕε1 ◦ · · · ◦ ϕεn (p) = vj (x)
in parametrisierter Form. Ist nun die Beziehung (3.6) nicht erfüllt, sondern es gilt
[vi , vj ] = λkij vk , k = 1, . . . , n ,
dann existiert eine lineare Transformation
wi = aji vj
so, dass
wij = δji
gilt. Nun gilt aber
δll̄ [wi , wj ]l = δll̄ λkij wkl
0 = λkij ,
und die Distribution span {w1 , . . . , wn } erfüllt (3.6). Damit ist aber bereits der erste Teil
des Satzes 3.1 gezeigt. Der Beweis des zweiten Teils erfolgt später.
Das folgende Theorem ist noch die Verallgemeinerung des Flow Box Theorems.
50
3.1. Distributionen und die Sätze von Frobenius
3. Erreichbarkeit und Beobachtbarkeit
Satz 3.2 Es seien ϕiεi : I × M → M, i = 1, . . . , n (lokale) glatte Flüsse auf einer mdimensionalen glatten Mannigfaltigkeit M. Die Umgebung Up von p ∈ M gehöre zur
Definitionsmenge von ϕi , und es gelte ϕi ◦ ϕj = ϕj ◦ ϕi , i, j = 1, . . . , n. Dann existieren
Koordinaten (x) = (x1 , . . . , xn ) nahe p so, dass ϕε = ϕ1ε1 ◦ · · · ◦ ϕnεn , ε = ε1 , . . . , εn in
diesen Koordinaten durch
ϕ̄ε = x1 + ε1 , . . . , xn + εn , xn+1 , . . . , xm
gegeben ist.
Zum Beweis des Satzes 3.2 wähle man Koordinaten (y) so, dass die Darstellung ϕ̃ε von
ϕε der Bedingungen
!
∂
0 = ψ (p) , rank
ϕ̃ε (y)
=n
∂ε
ε=0,y=0
genügt, was immer möglich ist. Man überzeugt sich nun wieder leicht, dass die Abbildung
f,
y = f (x) = ϕ̃x1 ,...,xn 0, . . . , 0, xn+1, . . . , xm
ein Diffeomorphismus ist, und dass ϕε in diesen Koordinaten das Aussehen
ϕε (x) = f −1 ◦ ϕ̃ε ◦ f (x)
= f −1 ◦ ϕ̃ε1 +x1 ,...,εn+xn 0, . . . , 0, xn+1 , . . . , xm
= ε1 + x1 , . . . , εn + xn , xn+1 , . . . , xm
hat.
Falls eine Distribution ∆ nicht involutiv ist, kann man einfach die involutive Hülle
¯
∆ von ∆, die bezüglich der Dimension kleinste involutive Distribution, konstruieren, die
¯ erfüllt. Mit der Abkürzung
∆⊂∆
[∆, ∆] = span {[vi , vj ]} , vi , vj ∈ ∆
liefert die Vorschrift
∆0 = ∆ , ∆k+1 = ∆k + [∆k , ∆k ]
(3.7)
¯ = ∆k , falls k der Bedingung
die involutive Hülle ∆
∆k−1 ⊂ ∆k , ∆k = ∆k+1
genügt.
Es gibt nun auch eine sogenannte duale Version der Definition 3.1. Dazu nachstehende
Definition.
Definition 3.3 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen
mit ihrem Kotangentialbündel T ∗ (M). Eine Vorschrift, die jedem Punkt x ∈ Up ⊂ M
einer offenen Umgebung Up des Punktes p einen linearen Vektorraum ∆∗x ⊂ Tx∗ (M)
51
3.1. Distributionen und die Sätze von Frobenius
3. Erreichbarkeit und Beobachtbarkeit
zuweist, heißt (lokale) Kodistribution ∆∗ . Die Kodistribution ∆∗ heißt regulär am Punkt
p, falls
dim ∆∗p = dim (∆∗x )
für alle x ∈ Up gilt. Die Kodistribution ∆∗ heißt glatt, wenn Kovektorfelder ω k ∈
Γ (T ∗ (M)) so existieren, dass
∆∗p = span ω k , k = 1, . . . , n
gilt.
Für das Weitere von Bedeutung sind Distributionen und Kodistributionen, wie sie nachstehend definiert werden.
Definition 3.4 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen
mit ihrem Tangential- und Kotangentialbündel T (M), T ∗ (M). Der Annihilator einer
regulären Distribution ∆ (Kodistribution ∆∗ ) ist jene bezüglich der Dimension maximale
Kodistribution ∆∗ (maximale Distribution ∆), die für alle ω ∈ ∆∗ , (v ∈ ∆) die Bedingung
hω, vi = 0 , ∀v ∈ ∆,
erfüllt.
Da nun ∆p = span {v1 (p) , . . . , vn (p)}, (∆∗p = span {ω 1 (p) , . . . , ω n (p)}) mit dim (∆p ) = n
(dim ∆∗p = n) gilt, dann folgt für ∆∗ = span {ω n+1, . . . , ω m } (∆ = span {vn+1 , . . . , vm })
mit dim ∆∗p = m − n, (dim (∆p ) = m − n). Der Annihilator einer Distribution ∆
(Kodistribution ∆∗ ) wird oftmals mit ∆⊥ , (∆∗,⊥ = (∆∗ )⊥ ) bezeichnet. Von besonderem
Interesse sind involutive Kodistributionen.
Definition 3.5 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen
mit ihrem Kotangentialbündel T ∗ (M). Eine reguläre Kodistribution ∆∗ heißt involutiv,
falls ihr Annihilator (∆∗ )⊥ involutiv ist.
Mit Hilfe der Beziehung
dω (v, w) = v (hω, wi) − w (hω, vi) − hω, [v, w]i
(3.8)
zeigt man nun einfach den nachstehenden Satz.
Satz 3.3 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit
kih
∗
∗
rem Kotangentialbündel T (M). Eine glatte und reguläre Kodistribution ∆ = span ω ,
k = n + 1, . . . , m mit dim (∆∗ ) = m − n ist genau dann involutiv, wenn 1-Formen αji so
existieren, dass
dω i = αji ∧ ω j , i, j = n + 1, . . . , m
gilt.
52
3.2. Beobachtbarkeit
3. Erreichbarkeit und Beobachtbarkeit
Wegen Definition 3.5 und Gl. 3.8 folgt
dω (v, w) = 0 , ∀v, w ∈ (∆∗ )⊥ .
Damit folgt aber schon Satz 3.3, da eine Basis des linearen Teilraums aller 2-Formen
Ω ∈ ∧2 Tp∗ (M) , für den gilt
Ω (v, w) = 0 , ∀v, w ∈ ∆∗p
⊥
,
durch αji ∧ ω j mit beliebigen 1-Formen gegeben ist. Naheliegend, aber wert zu zeigen, ist
der folgende Satz.
Satz 3.4 Gegeben sei eine m-dimensionale glatte Mannigfaltigkeit M zusammen mit ihrem Kotangentialbündel
T ∗ (M) und eine involutive und reguläre Kodistribution ∆∗ =
k
span ω , k = n + 1, . . . , m mit dim ∆∗p = m − n. Dann existieren m − n Funktionen
f i in der Nähe von p so, dass
∆∗ = span df n+1 , . . . , df m
gilt.
Wegen Satz 3.2 hat der Annihilator (∆∗ )⊥ von ∆∗ in den speziellen Koordinaten die Form
(∆∗ )⊥ = span {∂i } , i = 1, . . . , n .
⊥
∗ ⊥
Mit (∆ )
= ∆∗ und
⊥
(∆∗ )⊥
= span dy i , i = n + 1, . . . , m
folgt sofort Satz 3.4. Dieser Satz heißt ebenfalls Satz von Frobenius. Damit ist auch der
zweite Teil von Satz 3.1 gezeigt.
Abschließend soll noch die duale Version zu Gl. 3.7 hergeleitet werden. Mit ∆⊥
k folgt
aus
⊥
∆⊥
k+1 = (∆k + [∆k , ∆k ])
wegen Gl. 3.8 sofort
⊥
j
1
∗
∆⊥
.
k+1 = span ω ∈ ∆k | dω = αj ∧ ω , αj ∈ Γ ∧ (T (M))
Mit dieser Vorschrift kann man ebenfalls die involutive Hülle zu einer Kodistribution
berechnen.
3.2
Beobachtbarkeit
Betrachtet wird wieder das System
ẋi = f i (t, x, u)
ṫ = 1
α
y = cα (t, x, u)
53
(3.9)
3.2. Beobachtbarkeit
3. Erreichbarkeit und Beobachtbarkeit
π
definiert auf dem Bündel E → B mit den Koordinaten (t), (t, xi ), i = 1, . . . , n für B,
ρ
E und t, xi , ṫ, ẋi , für T (E). Ein Regelgesetz ist dann ein Schnitt σ von Z → E mit
den Koordinaten (t, xi , uς ), ς = 1, . . . , m für Z. Für die Funktionen cα der Ausgänge (y α ),
α = 1, . . . , ny gelte ohne Einschränkung der Allgemeinheit, dass sie funktional unabhängig
sind. Man wählt nun einen Zeitpunkt t1 ∈ R, ein hinreichend kleines Intervall T = [t1 , t2 ),
t2 > t1 und einen Schnitt σ ∈ Γ (Z), wobei γ ∈ Γ (E) eine Lösung von (3.9) für u = σ ◦ γ
ist, bzw. es gilt
∂t x ◦ γ (t) = f ◦ σ ◦ γ (t)
(3.10)
y (t)
= c ◦ σ ◦ γ (t) .
Definition 3.6 Das System (3.9) heißt (lokal) beobachtbar entlang einer Trajektorie γ,
siehe (3.10), falls man x ◦ γ (t1 ) aus der Kenntnis des Systems (3.9) und von y (t) =
c ◦ σ ◦ γ (t), u (t) = σ ◦ γ (t), t ∈ T eindeutig bestimmen kann.
Mit f = ∂t + (f i ◦ σ) ∂i ∈ T (E) gilt nun
y α (t) = cα ◦ σ ◦ γ
∂t y α (t) = f (cα ◦ σ) ◦ γ
..
.
∂tlα −1 y α (t) = f lα −1 (cα ◦ σ) ◦ γ .
Gelingt es, ein Gleichungssystem
y 1 (t) =
..
.
l1 −1 1
∂t y (t) =
..
.
ny
y (t) =
..
.
lny −1 ny
∂t
y (t) =
c1 ◦ σ (t, x)
f l1 −1 c1 ◦ σ (t, x)
cny ◦ σ (t, x)
f lny −1 (cny ◦ σ (t, x))
P y
lα = n funktional unabhängigen rechten Seiten zu konstruieren, dann ist wegen
mit nα=1
Satz 4.10 der Zustand x lokal bestimmbar.
Zur weiteren Untersuchung werden die Kodistributionen
kα
α
∆∗,k
= span df i (cα ◦ σ) i=0 ,
α
ny
M
kα i
α
∗
(3.11)
span df (c ◦ σ) i=0
∆ k1 , . . . , kny = span ({dt}) ⊕
α=1
und die daraus abgeleiteten Formen
Ωα (kα ) =
k^
α −1
l=0
Ω k1 , . . . , kny = dt ∧
54
df l (cα ◦ σ)
ny
^
α=1
Ωα
3.2. Beobachtbarkeit
3. Erreichbarkeit und Beobachtbarkeit
eingeführt. Wieder gelte, dass die Funktionen cα ◦ σ funktional unabhängig sind. Sind die
Beziehungen
Ω k1 , . . . , kny ∧ df kα (cα ◦ σ) = 0 , α = 1, . . . , ny
auf einer offenen Umgebung von (t, x) erfüllt, dann sind die Funktionen f kα (cα ◦ σ), α =
1, . . . , ny funktional abhängig. Die Rechnung
f Ω ∧ df kα (cα ◦ σ) = f (Ω) ∧ df kα (cα ◦ σ) +Ω ∧ df kα +1 (cα ◦ σ)
|
{z
}
=0
(warum?) zeigt dann die funktionale Abhängigkeit der Funktionen f kα +k (cα ◦ σ), k ≥ 0.
Damit bringt das weitere Differenzieren
der Ausgänge keine neue Information mehr. Es
∗
bezeichne von nun an
∆ l1 , . . . , lny obige Kodistribution maximaler Dimension. Gilt nun
dim ∆∗ l1 , . . . , lny = n + 1, dann ist obiges Gleichungssystem lokal nach x auflösbar.
Aus diesen Überlegungen folgt nun unmittelbar der folgende Satz.
entlang der Trajektorie γ, wenn es ein
Satz 3.5 Das System (3.9) ist lokal beobachtbar
∗
t ∈ T so gibt, dass dim ∆ l1 , . . . , lny = n + 1 am Punkt γ (t) gilt.
Dieser Satz kann noch verschärft werden.
Satz 3.6 Für das System (3.9) gelte, die Kodistribution ∆∗ l1 , . . . , lny sei regulär entlang der Trajektorie γ. Das System (3.9)
ist genau dann lokal beobachtbar entlang der
Trajektorie γ, wenn dim ∆∗ l1 , . . . , lny = n + 1 auf γ gilt.
= s+
Um diesen Satz zu zeigen, muss man nur mehr den Fall dim ∆∗ l1 , . . . , lny
∗
1 < n + 1 betrachten. Die Kodistribution ∆ l1 , . . . , lny ist definitionsgemäß regulär
und involutiv. Daher existiert eine Basis des (n − s)-dimensionalen Annihilators ∆ =
⊥
= span ({vi }), i = s + 1, . . . , n so, dass für deren Elemente [vi , vj ] = 0
∆∗ l1 , . . . , lny
gilt. Nun betrachte man die Koordinatentransformation (t, x) = φ (t, x̄),
(t, x) = ϕx̄s+1 ◦ · · · ◦ ϕx̄n ◦ ψ t, x̄1 , . . . , x̄s .
Der vom Feld vi , i = s + 1, . . . , n erzeugte (vertikale) Fluss wird mit ϕx̄i bezeichnet. Die
Menge ψ (t, x̄1 , . . . , x̄s ) sei eine reguläre Untermannigfaltigkeit
U ⊂ X mit vi 6∈ T (U).
j
∗
Man beachte, dass für ω ∈ ∆ l1 , . . . , lny gilt
vi ω j ∈ ∆∗ ,
und zusätzlich vi (ω j ) = 0, falls dω = 0 gilt. Aus der Beziehung
0 = f vi ⌋ω j = [f, vi ]⌋ω j + vi ⌋f ω j ,
folgt
[f, vi ] ∈ ∆ .
Offensichtlich erfüllen die Funktionen f l (cα ◦ σ) ◦ φ, l = 0, 1 . . . die Beziehungen
∂ī f l (cα ◦ σ) ◦ φ = φ∗ (vi ⌋df (cα ◦ σ)) = 0 .
55
3.2. Beobachtbarkeit
3. Erreichbarkeit und Beobachtbarkeit
Das transformierte System hat die Gestalt
˙x̄ī = ∂t φ̄ī ◦ σ + ∂k φ̄ī f k ◦ σ ◦ φ
ṫ = 1
y = φ∗ (cα ◦ σ) ,
α
wobei (t, x̄) = φ̄ (t,x) die zu φ inverse Transformation bezeichnet. Weiters existiert ein
ω j ∈ ∆∗ l1 , . . . , lny , dω = 0 so, dass
j̄
j̄ k
j
¯
∂ī f = ∂ī ∂t φ̄ ◦ σ + ∂k φ̄ f ◦ σ ◦ φ
= φ∗ vi f ⌋ω j
gilt (warum?). Damit folgt aber
∂ī f¯j = φ∗ [vi , f ]⌋ω j + f ⌋vi ω j
=0
wegen oben. Also hat das transformierte System die Gestalt
x̄˙ j = f¯j t, x̄1 , . . . , x̄s , j = 1, . . . , s
x̄˙ i = f¯i t, x̄1 , . . . , x̄s , x̄s+1 , . . . , x̄n , i = s + 1, . . . , n
ṫ = 1
α
y = c̄α t, x̄1 , . . . , x̄s .
Da dieses System aber sicher nicht beobachtbar ist, ist damit Satz 3.6 gezeigt.
Der Begriff der Beobachtbarkeit entlang einer Trajektorie bezieht sich auf Eigenschaften des Systems (3.1) und einer speziellen Lösung γ und σ. Als nächstes wird nun die
lokale Beobachtbarkeit an einem Punkt untersucht.
Definition 3.7 Das System (3.9) heißt (lokal) beobachtbar in der Umgebung von (t, x),
falls es ein σ ∈ Γ (Z) so gibt, dass zu jedem ε > 0 eine Trajektorie γ (τ ), τ ∈ [t, t + ε)
existiert, entlang der das System (3.9) lokal beobachtbar ist.
Da nun der Schnitt σ nicht bekannt ist, führen wir das erweiterte Feld fe = ∂t +f i ∂i +uςi ∂ςi
ein, wobei dann alle weiteren Rechnungen auf einer Mannigfaltigkeit mit den Koordinaten
(t, xi , uςk ), i, k = 1, . . . , n erfolgen. Die Bedeutung der Koordinaten uςi zeigt die nachfolgende Rechnung
uς (t) = σ ς ◦ γ (t)
∂t uς (t) = uς1 (t) = fe (σ ς ) ◦ (γ (t) , u (t))
..
.
ς
ς
∂t uk−1 (t) = uk (t) = fek (σ ς ) ◦ (γ (t) , u (t) , . . . , uk−1 (t)) .
56
3.2. Beobachtbarkeit
3. Erreichbarkeit und Beobachtbarkeit
Mit der Abkürzung γe (t) = (γ (t) , u (t) , . . . , uk−1 (t)) folgt noch
y α (t) = cα ◦ γe
∂t y α (t) = f (cα ) ◦ γe
..
.
lα −1 α
∂t y (t) = f lα −1 (cα ) ◦ γe .
Im Prinzip kann man nun fast so vorgehen wie vorher, man muss jedoch berücksichtigen,
dass die Funktionen uςk (t) nicht bekannt sind. Dazu betrachte man die Kodistributionen
kα
α
∆∗,k
= span dfei (cα ) i=0
α
∆∗e k1 , . . . , kny = span ({dt}) ⊕ span {duςk }ς=1,...,m, k=0,...,n−1
⊕
∗
ny
M
span
α=1
dfei (cα ) i=0,...,kα
(3.12)
Wieder bezeichne ∆ l1 , . . . , l
ny obige Distribution maximaler Dimension. Ist nun die
∗
Beziehung dim ∆ l1 , . . . , lny = n + 1 + m · n erfüllt, dann gibt es Werte uςk = uςk (t)
zum Zeitpunkt t so, dass das Gleichungssystem
y 1 (t) =
..
.
l1 −1 1
∂t y (t) =
..
.
y ny (t) =
..
.
lny −1 ny
∂t
y (t) =
c1 (t, x, u)
fel1 −1 c1 (t, x, u)
cny (t, x, u)
lny −1
fe
(cny (t, x, u))
wegen des Satzes 4.10 lokal nach x auflösbar ist. Aus diesen Überlegungen folgt nun
unmittelbar der folgende Satz.
Satz 3.7 Das System
(3.9) ist lokal beobachtbar am Punkt (t, x), wenn dort die Beziehung
∗
dim ∆e k1 , . . . , kny = n + 1 + m · n, siehe (3.12), erfüllt ist.
Auch dieser Satz kann noch verschärft werden. Man beachte, dass hier für den Annihilator
⊥
∆ = ∆∗e l1 , . . . , lny
= span ({vi }) im Allgemeinen vi 6∈ T (E) gilt, da die Komponenten der Felder auch von uςk abhängen können. Will man das vermeiden, dann beachte
man, dass wegen der Bedingung
0 = ∂ςk vi ⌋ω j = ∂ςk (vi )⌋ω j + vi ⌋∂ςk ω j ,
| {z }
=0
r
für ein ω j ∈ ∆∗e l1 , . . . , lny auch noch vi ⌋ ∂ςk (ω j ) = 0, r = 1, . . . gelten muss, damit
∂ςk (vi ) = 0 gilt. Mit dieser Überlegung und der Bezeichnung
∆∗e,u
l1 , . . . , l n y =
m X
n
X
σ=1 k=0
57
∂ςk ∆∗e,u l1 , . . . , lny
3.3. Erreichbarkeit
3. Erreichbarkeit und Beobachtbarkeit
gelangt man unmittelbar zu nachfolgendem Satz.
Satz 3.8 Für das System (3.9) gelte, die Kodistribution ∆∗e,u l1 , . . . , lny ist regulär am
⊥ = n − s > 0, dann ist das System (3.9) dort
Punkt (t, x). Gilt dim ∆∗e,u l1 , . . . , lny
nicht lokal beobachtbar. Anderenfalls ist es in der Umgebung von (t, x) lokal beobachtbar.
Auf den Beweis dieses Satzes kann hier verzichtet werden, da er fast identisch mit dem
des Satzes 3.6 ist. Schlussendlich findet man dann für das System (3.9) die Darstellung
x̄˙ j = f¯j t, x̄1 , . . . , x̄s , u
x̄˙ i = f¯i t, x̄1 , . . . , x̄s , x̄s+1 , . . . , x̄n , u
ṫ = 1
α
y = c̄α t, x̄1 , . . . , x̄s , u .
3.3
Erreichbarkeit
Die Erreichbarkeit des Systems (3.1) wird analog zur Beobachtbarkeit behandelt. Man
wählt wieder einen Zeitpunkt t1 ∈ R, ein hinreichend kleines Intervall T = [t1 , t2 ], t2 > t1
und einen Schnitt σ ∈ Γ (Z), der Gl. (3.10) erfüllt, und definiert nun die lokale Erreichbarkeit folgendermaßen.
Definition 3.8 Das System (3.9) heißt (lokal) erreichbar entlang einer Trajektorie γ,
siehe (3.10), wenn zu x ◦ γ (t2 ) eine offene Umgebung U so existiert, dass zu jedem x̂ ∈ U
eine Trajektorie γ̂ so existiert, dass x ◦ γ (t1 ) = x ◦ γ̂ (t1 ), x̂ = x ◦ γ̂ (t2 ) gilt.
Für das Weitere benötigt man nun eine Regularitätsannahme. Es wird angenommen, dass
um γ (t), t ∈ (t1 , t2 ) eine offene Umgebung Uγ so existiert, dass bei beschränktem Eingang
durch jeden Punkt dieser Menge eine Trajektorie verläuft und in dieser Menge verbleibt.
Will man nun überprüfen, ob das System (3.1) obige Eigenschaft hat, muss man ein nichtlineares Zweipunkt-Randwertproblem lösen. Mit Hilfe des Satzes 4.12 könnte man nun
einen Test für das linearisierte System konstruieren. Der Nachteil dieser Vorgehensweise
ist aber, dass Satz 4.12 nur hinreichend ist. Daher wird eine andere Methode benötigt,
und wir deformieren die Trajektorie γ mittels einer Abbildung, einem Fluss ϕ,
t=t
xi = ϕiε (t, x, u)
uς = ϕςε (t, x, u) ,
(3.13)
für dessen infinitesimalen Generator v = v i ∂i + v ς ∂ς gilt v ∈ T (Z). Nun betrachte man
die Menge aller Abbildungen ϕ. Da ϕ Trajektorien auf Trajektorien abbildet, muss ϕiε
unabhängig von u sein. Zwei Trajektorien γ, γ̂ werden nun als äquivalent angesehen,
wenn γ̂ i = ϕiε ◦ γ für ein ϕε gilt. Dadurch wird eine Äquivalenzrelation R auf Uγ ⊂ E
eingeführt, wobei [γ] die Äquivalenzklasse von γ und E/R den Quotienten bezeichnen.
Offensichtlich ist das System (3.9) genau dann lokal erreichbar entlang γ, wenn [γ] (t2 )
eine offene Umgebung von x̂ beinhaltet. Wir nehmen nun an, dass die Äquivalenzklassen
58
3.3. Erreichbarkeit
3. Erreichbarkeit und Beobachtbarkeit
[γ] lokal reguläre Untermannigfaltigkeiten von Uγ bilden (Dies muss nachgewiesen werden,
siehe den Abschnitt Aufgaben). In diesem Fall gibt es aber Funktionen g ∈ C ∞ (E) so,
dass
bzw. lokal
g ◦ ρ ◦ ϕε = 0
(3.14)
v i ∂i g = 0
∂ς g = 0
(3.15)
gilt. Es verbleibt nun die Aufgabe, diese Funktionen zu bestimmen.
Da die Abbildung (3.13) Trajektorien auf Trajektorien abbilden muss, gilt
∂t ϕiε ◦ σ ◦ γ (t) = f i ◦ ϕε ◦ σ ◦ γ (t)
bzw.
und für ε → 0
∂ε ∂t ϕiε ◦ σ ◦ γ (t) = ∂ε f i ◦ ϕε ◦ σ ◦ γ (t)
∂t v i ◦ ϕε ◦ σ ◦ γ (t) = ∂j f i v j + ∂ς f i v ς ◦ ϕε ◦ σ ◦ γ (t)
f v i = ∂j f i v j + ∂ς f i v ς
mit f = ∂t + f i ∂i , wobei diese Beziehung wieder entlang von (beliebigen) Trajektorien γ
auszuwerten ist. Aus
(∂i g) f v i = ∂i g ∂j f i v j + ∂ς f i v ς
f ∂i gv i −v i f (∂i g) = ∂i g∂j f i v j + ∂i g∂ς f i v ς
| {z }
=0
folgt nun wegen (3.15)
v i f (∂i g) + (∂j g) ∂i f j + v ς ∂i g∂ς f i = 0 .
Weil diese Gleichung aber für beliebige Trajektorien und deren Deformationen und damit
für beliebige v i , v τ halten muss, folgt
∂i g∂ς f i = 0
f (∂i g) = −∂j g∂i f j .
Da (3.16) nun ebenfalls entlang beliebiger Trajektorien gilt, folgt
f ∂i g∂ς f i = 0
f (∂i g) ∂ς f i + ∂i gf ∂ς f i = 0
∂i g f ∂ς f i − ∂ς f k ∂k f i = 0
∂i g [f, [∂ς , f ]]i = 0 ,
59
(3.16)
(3.17)
3.3. Erreichbarkeit
3. Erreichbarkeit und Beobachtbarkeit
wobei (3.17) und die Beziehung [∂ς , f ] = ∂ς f k ∂k benutzt wurden. Mit der Abkürzung
folgt nun
ad0v (w) = w
l
adl+1
v (w) = v, adv (w)
dg, ad0f (∂ς ) = 0
dg, ad1f (∂ς ) = 0 .
Da nun diese Beziehungen wieder entlang von Trajektorien halten müssen, folgt
dg, adkf (∂τ ) = 0 , k = 0, 1, . . . .
Da eine Funktion g nur existieren kann, wenn die Distribution
∆l =
l
X
span
k=0
m adkf (∂ς ) ς=1
involutiv ist, wird mit
f, ∆l ⊂ ∆l
(3.18)
der bezüglich l kleinste involutive Abschluss der Distribution ∆l bezeichnet, die obiger
Bedingung genügt. Damit kommt man direkt zum nachstehenden Satz.
Satz 3.9 Das System (3.9) ist (lokal)
erreichbar entlang einer Trajektorie γ, wenn ein
t ∈ T so existiert, dass gilt dim ∆l ◦ σ ◦ γ (t) = n + m.
Zum Beweis diese Satzes beachte man nur, dass ein ε > 0 so existiert, dass die Menge
[γ] (τ ), t − ε < τ < t + ε eine offene Teilmenge von E ist. Damit kann man aber auf dieser
Menge die Trajektorie entsprechend deformieren. Durch geeignetes Zusammensetzten von
Trajektorien erhält man dann die gewünschte Eigenschaft.
Satz 3.10 Für das System (3.9) gelte, die Distribution ∆l sei regulär entlang der Trajektorie γ. Das System
(3.9) ist genau dann (lokal) erreichbar entlang einer Trajektorie
γ, wenn dim ∆l ◦ σ ◦ γ (t) = n + m gilt.
Um diesen Satz zu zeigen, muss man nur mehr den Fall dim ∆l ◦σ◦γ (t) = s+m < n+m
untersuchen. Wir führen nun die Koordinatentransformation x = φ (t, x), t = t mit
xi = φi (t, x) ,
i = 1, . . . , s
xj = φj (t, x) ,
j̄ = s + 1, . . . , n
durch, wobei dφj̄ , dt ein Annihilator von ∆l ist. Mit
D
E
j
ẋ = dφj , f ◦ φ−1
60
3.4. Eingangs/Zustandslinearisierung
3. Erreichbarkeit und Beobachtbarkeit
und
D
E D
E
∂ς dφj , f = dφj , [∂ς , f ]
=0
sowie
∂i
E
D
E
D
◦ φ−1
dφj , f ◦ φ−1 = vī dφj , f
=0
wegen vi ∈ ∆l folgt aber, dass man das System (3.9) in der Form
i
i
j
j
ẋ = f
ẋ = f
ṫ = 1
t, x, u ,
i = 1, . . . , s
t, xs+1 , . . . , xn , j̄ = s + 1, . . . , n
(3.19)
schreiben kann. Damit ist der Satz 3.10 aber gezeigt. Als direkte Konsequenz dieser Überlegungen erhält man noch den folgenden Satz.
Satz 3.11 Für das System (3.9) gelte, die Distribution ∆l sei am Punkt (t, x) regulär,
dann kann es in der Form (3.19) geschrieben werden.
Der Beweis folgt nun direkt mit obiger Transformation.
3.4
Eingangs/Zustandslinearisierung mit statischer Rückführung
Gegeben sei wieder das System
ṫ = 1
ẋi = f i (t, x, u) ,
i = 1, . . . , n
(3.20)
mit n-dimensionalem Zustand x und m-dimensionalem Eingang (uς ), ς = 1, . . . , m. Es
stellt sich nun die Frage, ob man dieses System durch Zustands- und Stellgrößentransformationen
t=t
xi = ϕi (t, x)
uς = φς (t, x, u)
(3.21)
ṫ = 1
ī
ẋ = Aij xj + Bςi uς
(3.22)
in ein lineares System
überführen kann. Um die Anzahl der Fallunterscheidungen möglichst gering zu halten,
wird angenommen, dass alle im Weiteren vorkommenden Distributionen an den betrachteten Punkten regulär sind. Als Erstes wird nun der Eingrößenfall untersucht.
61
3.4. Eingangs/Zustandslinearisierung
3.4.1
3. Erreichbarkeit und Beobachtbarkeit
Der Eingrößenfall
Ohne Einschränkung der Allgemeinheit wird angenommen, dass das lineare System (3.22)
in Brunovsky Normalform
ṫ = 1
i
ī
ẋ = f = xi+1 ,
n
n
ẋ = f = u
i = 1, . . . , n − 1
(3.23)
mit n = n vorliegt. Nun folgt
x1 = ϕ1 (t, x)
f x1 = x2̄ = ϕ2 (t, x) = f ϕ1 (t, x)
..
.
n−1
1
n̄
f
x = x = ϕn (t, x) = f n−1 ϕ1 (t, x)
i
mit f = ∂t + f i ∂i , f = ∂t + f ∂i . Weiters muss gelten
∂u f j ϕ1
= 0 , j = 0, . . . , n − 1
(3.24)
für ϕ1 ∈ C ∞ (E). Man ist am Ziel, wenn man ϕ1 als Lösung obiger partieller Differentialgleichungen bestimmt hat. Offensichtlich gilt der nachfolgende Satz.
Satz 3.12 Das Eingrößensystem (3.20) ist genau dann mittels einer Transformation
(3.21) in die Brunovsky Normalform (3.23) überführbar, wenn eine Ausgangsfunktion
ϕ1 ∈ C ∞ (E) mit relativem Grad n existiert.
Im Weiteren wird nun versucht, das System partieller Differentialgleichungen (3.24) so zu
vereinfachen, dass nur mehr Differentialgleichungen ersten Grades auftreten. Die Funktionen ϕj̄ , j̄ = 1, . . . , n genügen offensichtlich den Bedingungen
∂u ϕj̄ = 0 .
Folglich muss die Distribution ∆0 = span ({∂u }) involutiv sein, was offensichtlich der Fall
ist. Die Funktionen ϕj̄ , j̄ = 1, . . . , n − 1 genügen noch den Bedingungen
∂u f ϕj̄ = 0 .
Kombiniert man nun diese in der Art
(f ◦ ∂u − ∂u ◦ f ) ϕj = 0 ,
dann folgt
[f, ∂u ] ϕj = adf (∂u ) ϕj = 0
62
3.4. Eingangs/Zustandslinearisierung
3. Erreichbarkeit und Beobachtbarkeit
wegen ∂u ϕj = f ◦ ∂u ϕj = 0. Dieses System von partiellen Differentialgleichungen
hat jedoch nur dann n − 1 Lösungen, wenn die Distribution ∆1 = span ({∂u , adf (∂u )})
involutiv ist. Die Funktionen ϕj̄ , j̄ = 1, . . . , n − 2 genügen noch den Bedingungen
2
∂u f ϕj̄ = 0 .
Kombiniert man nun diese wieder in der Art


 j

f ◦ (f ◦ ∂u − ∂u ◦ f ) − (f ◦ ∂u − ∂u ◦ f ) ◦f  ϕ = 0 ,
{z
} |
{z
}
|
[f,∂u ]
dann folgt
[f,∂u ]
[f, [f, ∂u ]] ϕ1 = ad2f (∂u ) ϕj = 0
wegen [f, ∂u ] ϕj = f ◦ [f, ∂u ] ϕj = 0. Dieses System von partiellen Differentialgleichung hat jedoch nur dann n − 2 Lösungen, wenn die Distribution
∆1 = span ∂u , adf (∂u ) , ad2f (∂u )
involutiv ist. Durch Wiederholung dieses Verfahrens kommt man nun einfach zum Ziel,
wobei es zweckmäßig ist nachfolgende Abkürzung einzuführen
∆l =
l
X
i
adf (∂u ) .
span
i=0
(3.25)
Damit aber auch die entsprechende Stellgrößentransformation
existiert, muss das System
(3.20) lokal erreichbar sein, d.h. es gilt dim ∆n = n + 1. Damit kommt man aber zum
nachstehenden Satz.
Satz 3.13 Das Eingrößensystem (3.20) ist genau dann mittels einer Transformation
(3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen ∆l , l =
0, . . . , n − 1 mit dim (∆l ) = l + 1 involutiv sind, und dim (∆n ) = n + 1 gilt.
Zum Beweis dieses Satzes beachte man vorerst, dass er trivialer Weise notwendig für die
Existenz einer Lösung ϕ1 des Systems (3.24) ist. Ist nun ϕ1 eine Lösung des Systems
g ϕ1 = 0 , g ∈ ∆n−1 ,
i
1
dann folgt sofort, dass die Funktionen f ϕ wegen der Konstruktion auch Lösungen
der Systeme
g f i ϕ1
= 0 , g ∈ ∆n−1−i , j = 0, . . . , i , i = 0, . . . , n − 1
sind. Damit ist aber ϕ1 auch Lösung von (3.24). Die Bedingung dim (∆n ) = n+1 garantiert
dann noch die Erreichbarkeit, und gleichzeitig den relativen Grad n von ϕ1 (Warum?).
63
3.4. Eingangs/Zustandslinearisierung
3.4.2
3. Erreichbarkeit und Beobachtbarkeit
Der Mehrgrößenfall
Die Untersuchung des Mehrgrößenfalles erfolgt nun analog zum Eingrößenfall. Das lineare
System (3.22) habe nun die Brunovsky Normalform
ṫ
=1
= xς¯,iς +1
= uς
ς¯,īς
ẋ
ς¯,n̄ς̄
ẋ
(3.26)
P
mit ς¯ = 1, . . . , m̄ = m, m̄
ς¯=1 n̄ς¯ = n̄ = n. Um unnötige Fallunterscheidungen zu vermeiden, wir angenommen, dass n̄ς¯ > 0 gilt. Nun folgt
xς¯,1 = ϕς¯,1 (t, x)
f xς¯,1 = xς¯,2̄ = ϕς¯,2 (t, x) = f ϕς¯,1 (t, x)
..
.
nς̄ −1
ς¯,1
ς¯,n¯ς̄
=x
f
x
= ϕς¯,nς̄ (t, x) = f n̄ς̄ −1 ϕς¯,1 (t, x)
i
mit f = ∂t + f i ∂i , f = ∂t + f ∂i . Folglich muss wieder gelten
= 0 , j = 0, . . . , n̄ς − 1 , τ̄ = 1, . . . , m̄
∂τ̄ f j ϕς¯,1
(3.27)
¯
∈ C ∞ (E). Man ist wieder am Ziel, wenn man die m̄ Funktionen ϕς¯,1 als Lösung
für ϕς,1
obiger partieller Differentialgleichungen bestimmt hat. Offensichtlich gilt der nachfolgende
Satz.
Satz 3.14 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation
(3.21) in die Brunovsky Normalform (3.25) überführbar, wenn m funktional unabhängige
Ausgangsfunktionen
ϕς¯,1 ∈ C ∞ (E), ς¯ = 1, . . . , m mit vektoriellen relativen Grad (n̄ς¯),
Pm
n = ς¯=1 n̄ς¯ existieren.
Im Weiteren wird man wieder versuchen, das System partieller Differentialgleichungen
(3.28) so zu vereinfachen, dass nur mehr Differentialgleichungen ersten Grades auftreten.
Man beachte aber, dass nun die Folge der Indizes (n̄ς¯) eine bedeutenden Rolle spielen
wird. Dazu führen wir die Funktion1 q,
q (l) =
m
X
ς¯=1
σ (l − n̄ς¯)
ein, wobei q (l) die Anzahl der Elemente der Folge (n̄ς¯) ist, für die l > n̄ς¯ gilt. Analog zu
(3.25) führen wir die Distributionen
∆l =
l
X
i=0
1
span
m adif (∂ς¯) ς¯=1 .
σ bezeichnet hier die Sprungfunktion mit σ (x) = 1 für x > 0 und σ(x) = 0 für x ≤ 0.
64
(3.28)
3.4. Eingangs/Zustandslinearisierung
3. Erreichbarkeit und Beobachtbarkeit
ein. Von (3.28) folgt nun, dass n Funktionen ψ j̄ , j̄ = 1, . . . , n existieren, die den Bedingungen
∂τ̄ ψ j̄ = 0 , τ̄ = 1, . . . , m̄
genügen. Folglich muss ∆0 involutiv sein, was offensichtlich der Fall ist. Man beachte,
dass hier noch keine Zuordnung der Funktionen ψ j̄ zu den Funktionen ϕς¯,i getroffen wird.
Weiters erfüllen die Funktionen ψ j̄ , j̄ = 1, . . . , q (1) noch die Bedingungen
∂τ̄ f ψ j̄ = 0 , τ̄ = 1, . . . , m̄ .
Analog zum Eingrößenfall erhält man nun die Bedingung, dass die Distribution ∆1 mit
dim (∆1 ) = m + n − q (1) involutiv sein muss. Setzt man nun dieses Verfahren fort, und
verlangt noch die offensichtliche Bedingung, das System (3.20) ist lokal erreichbar, dann
gelangt man zum nachfolgenden Satz.
Satz 3.15 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation
(3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen
∆l , l =
0, . . . , κ − 1 mit dim (∆l ) = m + n − q (l) involutiv sind, und dim ∆κ = m + n gilt.
Der Beweis dieses Satzes ist nun ein wenig aufwendiger als der im Eingrößenfall, da man
jetzt die Zuordnung der Funktionen ψ j̄ zu den Funktionen ϕς¯,i konstruieren muss. Vorerst
beachte man wieder, dass der Satz wieder trivialer Weise
notwendig für die Existenz von
ς¯,i
⊥
Lösungen ϕ des Systems (3.28) ist. Es gelte dim ∆s1 = r1 mit s1 = κ − 1, dann gibt
es r1 funktional unabhängige Lösungen ϕςs¯11,1 , ς¯1 = 1, . . . , r1 des Systems
ς¯1 ,1
g ϕs1 = 0 , g ∈ ∆s1 .
Weiters folgt sofort, dass die Funktionen f i ϕςs¯11,1 wegen der Konstruktion auch Lösungen
der Systeme
g f j ϕςs¯11,1
= 0 , g ∈ ∆s1 −i , j = 0, . . . , i , i = 0, . . . , s1
sind. Offensichtlich
gilt bereits für den relativen Grad n̄ς¯1 = s1 und man erhält die Zuordς¯1 ,i
i−1
nung ϕ = f
ϕςs¯11,1 , i = 1, . . . , s1 . Nun suche man die Distribution ∆s2 mit größtem
Index s2 , die der Bedingung dim ∆⊥
s2 = r2 + r1 (s1 − s2 + 1), r2 > 0 genügt, denn dann
gibt es r2 funktional unabhängige Lösungen ϕςs¯22,1 des Systems
g ϕsς¯22,1 = 0 , g ∈ ∆s2 ,
s2 −s1
ς¯1 ,1
ϕs1 sind. Gemäß der Kon-
die auch funktional unabhängig von den Funktionen f
struktion folgt wieder, dass die Funktionen f i ϕςs¯22,1 auch Lösungen der Systeme
=0,
g f j ϕsς¯22,1
g ∈ ∆s2 −i ,
65
j = 0, . . . , i ,
i = 0, . . . , s2
3.5. Bemerkungen
3. Erreichbarkeit und Beobachtbarkeit
sind. Für den relativen
Grad folgt noch n̄r1 +¯ς2 = s2 , und man erhält die Zuordnung
r2 +¯
ς2 ,i
i−1
ς¯1 ,1
ϕ
=f
ϕs1 , i = 1, . . . , s2 . Führt man dieses Verfahren fort, dann erkennt man
sofort, wie man die Zuordnung der Funktionen ψ j̄ , ϕς¯,i zueinander allgemein konstruieren
muss. Damit ist aber nicht nur der Satz 3.15 gezeigt, sondern man verfügt auch über ein
Verfahren, mit dem man aus den Distributionen ∆l den relativen Grad (nς¯) erhält. Der
folgenden Satz ist somit eine unmittelbare Konsequenz dieser Tatsache.
Satz 3.16 Das Mehrgrößensystem (3.20) ist genau dann mittels einer Transformation
(3.21) in Brunovsky Normalform (3.23) überführbar, wenn die Distributionen ∆l , l =
0, . . . , κ − 1 involutiv sind, und dim (∆κ ) = m + n gilt. Den relative Grad (n̄ς¯) und die
Funktionen ϕς¯,i erhält man mittels des oben beschriebenen Verfahrens.
3.5
Bemerkungen
Für weiterführende Literatur im Bereich der nichtlinearen Regelung wird, z.B., auf [7],
[8], [9], [13], [17] verwiesen.
66
Kapitel 4
Mathematische Grundlagen
Im Kapitel werden einige Grundlagen aus der Topologie und der Differentialrechnung im
Rn sowie der Differentialgeometrie benötigt. Die folgenden Unterabschnitte sollen einige
der benötigten Grundlagen zusammengefassen.
4.1
Topologie
Hier werden einige wichtige Grundkonzepte der Topologie zusammengefasst, wie sie für
finit dimensionale Mannigfaltigkeiten von Bedeutung sind. Im Wesentlichen sind diese
Konzepte Verallgemeinerungen von offenen Mengen des Rn , sodass sie auch in anderen
Mengen von Bedeutung sind. Auf Beweise oder Herleitungen wird hier verzichtet. Diese
findet man z.B. in [11, 10, 12]. Im Weiteren werden vor Allem Notation und Begriffe der
elementaren Mengenlehre benötigt.
4.1.1
Topologische Räume
Definition 4.1 Eine Topologie T (X) auf einer Menge X ist eine Teilmenge der Potenzmenge (T (X) ⊂ P (X)) für die gilt:
1. {} , X ∈ T (X)
2. U1 , U2 ∈ T (X) ⇒ U1 ∩ U2 ∈ T (X)
3. Uα ∈ T (X) , α ∈ I für jede Indexmenge I 6= {} impliziert
Die Elemente von T (X) heißen die offenen Mengen von T (X).
S
α∈I
Uα ⊂ T (X).
Die Standardtopologie auf R ist durch die offenen Intervalle (a, b) mit a, b ∈ R, a < b
gegeben. Es wird noch gezeigt, dass die offenen Boxen eine Topologie des Rn bilden. Diese
Topologie ist die Standardtopologie des Rn . Zu jeder Menge X 6= {} kann man einfach
die triviale Topologie T (X) = {{} , X} und die diskrete Topologie T (X) = P (X) bilden.
Man überzeugt sich auch einfach durch vollständige Induktion, dass der Schnitt endlich
vieler offener Mengen eine offene Menge ist.
67
4.1. Topologie
4. Mathematische Grundlagen
Definition 4.2 Sind T (X), S (X) zwei Topologien auf X, dann heißen S (X) feiner als
T (X) und T (X) gröber als S (X), wenn T (X) ⊂ S (X) gilt.
Offensichtlich ist die triviale Topologie die gröbste und die diskrete Topologie die feinste
Topologie einer Menge X. Analog zu offenen Mengen kann man abgeschlossene Mengen
einführen.
Definition 4.3 T (X) sei eine Topologie auf X. Eine Menge A ⊂ X heißt abgeschlossen,
wenn A = X\U, U ∈ T (X) gilt. Die Menge aller abgeschlossenen Mengen wird mit C (X)
bezeichnet.
Als Beispiel betrachte man auf R die abgeschlossenen Intervalle [a, b], a, b ∈ R, a < b.
Man beachte auch, dass eine Menge sowohl offen als auch abgeschlossen sein kann. Dies
trifft z.B. immer auf {} = X\X und X = X\ {} zu.
Feststellung 4.1 Die abgeschlossenen Mengen C (X) einer Topologie T (X) auf einer
Menge X genügen den Bedingungen:
1. {} , X ∈ C (X)
2. U1 , U2 ∈ T (X) ⇒ U1 ∪ U2 ∈ C (X)
3. Uα ∈ C (X) , α ∈ I für jede Indexmenge I 6= {} impliziert
T
α∈I
Uα ⊂ T (X).
Auf einer Menge können sehr viele Topologien existieren. Oftmals kann man eine Topologie
auch mit einer viel kleineren Menge offener Mengen, nämlich einer Basis, konstruieren.
Definition 4.4 T (X) sei eine Topologie auf X. Eine Teilmenge B (X) heißt Basis von
T (X), wenn gilt:
S
1. U ∈B(X) U = X.
S
2. U1 , U2 ∈ B (X) ⇒ U1 ∩ U2 = α∈I Uα mit Uα ∈ B (X) für eine Indexmenge I.
Ist B(X) abzählbar, dann heißt B (X) eine abzählbare Basis. Wenn T (X) eine abzählbare Basis besitzt, dann sagt man T (X) erfüllt das zweite Abzählbarkeitsaxiom. Eine
Teilmenge der Potenzmenge P (X), die diese beiden Eigenschaften erfüllt erzeugt nun
genau eine Topologie auf X. Dies zeigt der folgende Satz.
Satz 4.1 Für B(X) ⊂ P (X) seien die Bedingungen von Definition 4.4 erfüllt, dann
existiert genau eine Topologie T (X), für die B (X) eine Basis ist.
Die offenen Intervalle des R bilden eine Basis der Standardtopologie. Ein zentraler Begriff ist nun der Umgebungsbegriff, mit dem man die Beziehung von Punkten zueinander
ausdrücken kann.
Definition 4.5 T (X) sei eine Topologie auf X. Eine offene Umgebung eines Punktes
x ∈ X ist eine Menge U, für die gilt U ⊂ T (X). Eine Umgebung von x ist eine Menge
M ⊂ X, die eine offene Umgebung von x enthält. Die Menge der Umgebungen von x
heißt Umgebungssystem, sie wird mit Ux bezeichnet.
68
4.1. Topologie
4. Mathematische Grundlagen
Die Mengen (x − ε, x + ε), ε ∈ R+ sind offene Umgebungen von x ∈ R. Die Mengen
[x−1, x+3) wären Umgebungen zu x. In der trivialen Topologie gibt es nur eine Umgebung,
nämlich X, während {x} eine offene Umgebung von x in der diskreten Topologie ist.
Feststellung 4.2 T (X) sei eine Topologie auf X, dann existiert eine Funktion U : X →
P (P (X)), die jedem Punkt x ∈ X sein Umgebungssystem Ux zuordnet. Es gilt:
1. V ∈ Ux ⇒ x ∈ V .
2. V1 , V2 ∈ Ux ⇒ V1 ∩ V2 ∈ Ux .
3. V ∈ Ux ⇒ ∀W, V ⊂ W ⊂ X ⇒ W ∈ Ux
4. V ∈ Ux ⇒ ∃W, W ∈ Ux ∧ y ∈ W ⇒ V ⊂ Uy .
Die offenen Mengen einer Topologie T (X) lassen sich nun einfach folgendermaßen charakterisieren. Die Menge V ⊂ X ist genau dann offen, wenn V ∈ Ux für alle x ∈ V gilt.
Man kann nun zeigen, dass nachfolgender Satz gilt:
Satz 4.2 Für eine Menge X sei eine Funktion U : X → P (P (X)) gegeben, die die
Eigenschaften 1-4 von Feststellung 4.2 erfüllt. Dann gibt es genau eine Topologie T (X)
so auf X, dass für jedes x ∈ X genau Ux das Umgebungssystem in T (X) ist.
Analog zu einer Basis für eine Topologie kann man eine Basis für ein Umgebungssystem
einführen.
Definition 4.6 T (X) sei eine Topologie auf X. Eine Menge Bx ⊂ Ux heißt Umgebungsbasis von x ∈ X, wenn zu jedem U ∈ Ux eine Menge B ∈ Bx so existiert, dass B ⊂ U
gilt. Ist Bx abzählbar, dann heißt Bx eine abzählbare Umgebungsbasis. Ist Bx abzählbar
für alle x ∈ X, dann sagt man T (X) erfüllt das erste Abzählbarkeitsaxiom.
Mit Hilfe des Umgebungsbegriffes lassen sich nun Begriffe wie innerer Punkt, Randpunkt,
etc. vom Rn für allgemein topologische Räume einführen.
Definition 4.7 T (X) sei eine Topologie auf X mit M ⊂ X und x ∈ X. Der Punkt x
heißt innerer Punkt von M, wenn gilt M ⊂ Ux . Die Menge der inneren Punkte von M,
heißt offener Kern int (M). Der Punkt x heißt äußerer Punkt von M, wenn x ein innerer
Punkt von X\M ist.
Man kann sich nun leicht überzeugen, dass nachfolgende Eigenschaften äquivalent sind.
Satz 4.3 T (X) sei eine Topologie auf X mit M, N ⊂ X. Es gilt:
1. M ∈ T (X) ⇔ M = int (M).
2. int (M) ist die größte Menge von T (X) für die gilt int (M) ⊂ M.
3. int (M) ∩ int (N) = int (M ∩ N), int (M) ∪ int (N) ⊂ int (M ∪ N).
Mit Hilfe des Umgebungsbegriffes gelangt man auch zu den nachfolgenden Verallgemeinerungen.
69
4.1. Topologie
4. Mathematische Grundlagen
Definition 4.8 T (X) sei eine Topologie auf X mit M ⊂ X und x ∈ X. Der Punkt
x heißt Berührungspunkt (Häufungspunkt), wenn für alle U ∈ Ux gilt U ∩ M 6= {}
((U ∩ M) \ {x} 6= {}). Die Menge der Berührungspunkte heißt die abgeschlossene Hülle
cl (M) von M. Die Menge der Häufungspunkte wird mit der (M) bezeichnet. Der Punkt x
heißt Randpunkt von M, wenn x Berührungspunkt von M und M\X ist. Die Menge der
Randpunkte von M wird mit bd (M) bezeichnet.
Offensichtlich gilt cl (M) = M ∪ der (M). Man überzeugt sich nun einfach, dass wieder
die folgenden Eigenschaften gelten.
Feststellung 4.3 Zwischen abgeschlossener Hülle und offenem Kern gilt
X\int (M) = cl (X\M) ,
X\cl (M) = int (X\M) .
Obige Beziehungen erlauben nun direkt aus Satz 4.3 den nachfolgenden herzuleiten.
Satz 4.4 C (X) sei eine Topologie auf X mit M, N ⊂ X. Es gilt:
1. M ∈ C (X) ⇔ M ⊂ cl (M).
2. cl (M) ist die kleinste Menge von C (X) für die gilt M ⊂ cl (M).
3. cl (M) ∪ cl (N) = cl (M ∪ N), cl (M ∩ N) ⊂ cl (M) ∩ cl (N).
Für den Rand gelten dann insbesondere die folgenden Beziehungen.
Feststellung 4.4 T (X) sei eine Topologie auf X mit M ⊂ X, dann gilt:
1. int (M) ⊂ M ⊂ cl (M)
2. bd (M) = cl (M) ∩ cl (X\M) = cl (M) ∩ (X\int (M) = cl (M) \int (M)
Insbesondere gilt bd (M) ∈ C (M).
Betrachtet man R mit der Standardtopologie, dann gilt offensichtlich cl (Q) = R sowie
der (Z) = {}. Die entsprechende Verallgemeinerung liefert die nachfolgende Definition.
Definition 4.9 T (X) sei eine Topologie auf X mit M ⊂ X. Die Menge M heißt dicht
in X, wenn gilt cl (M) = X. Gilt int (cl (M)) = {} bzw. X\cl (M) ist dicht in X, dann
heißt M nirgends dicht in X.
4.1.2
Stetigkeit
Untersucht man Abbildungen zwischen topologischen Räumen, dann wird sich die Klasse
der stetigen Abbildungen als besonders wichtige Klasse herausstellen.
Definition 4.10 T (X), T (Y ) seien Topologien auf X und Y und f : X → Y sei eine
Abbildung. Diese heißt stetig in x ∈ X, wenn gilt ∀V ∈ Uf (x) ⇒ ∃U ∈ Ux mit f (U) ⊂ V .
Die Abbildung heißt stetig, wenn f für jedes x ∈ X stetig ist.
70
4.1. Topologie
4. Mathematische Grundlagen
Von Stetigkeit kann man also nur bei Abbildungen zwischen topologischen Räumen sprechen. Da die Topologien aber oft aus dem Zusammenhang her klar sind, werden sie oft
nicht zusätzlich angegeben. Man beachte aber, dass jede Abbildung von einem diskreten
Raum in einen Raum mit beliebiger Topologie oder von einem Raum mit beliebiger Topologie in einen mit trivialer Topologie stetig ist. Man überzeugt sich ebenfalls leicht vom
nachstehenden Satz.
Satz 4.5 T (X), T (Y ), T (Z) seien Topologien auf X, Y und Z, f, g seien Abbildungen
f : X → Y , g : Y → Z. Ist f stetig in x ∈ X und g in f (x), dann ist g ◦ f stetig in x.
Für stetige Funktionen sind nachfolgende Eigenschaften äquivalent.
Satz 4.6 T (X), T (Y ) seien Topologien auf X, Y und f : X → Y sei eine stetige
Abbildung.
1. f ist stetig.
2. Für alle M ⊂ X gilt f (cl (M)) ⊂ cl (f (M)).
3. Für alle N ⊂ C (Y ) gilt f −1 (N) ∈ C (X).
4. Für alle N ⊂ T (Y ) gilt f −1 (N) ∈ T (X).
Man beachte, dass für stetige Abbildungen das Urbild einer offenen (abgeschlossenen)
Menge offen (abgeschlossen) ist, für die Bilder offener (abgeschlossener) Mengen gilt dies
jedoch keinesfalls.
Satz 4.7 T (X), T (Y ) seien Topologien auf X, Y . Die Abbildung f : X → Y heißt offen
(abgeschlossen), wenn das Bild jeder offenen (abgeschlossenen) Menge offen (abgeschlossen) ist.
Von besonderer Bedeutung sind nun bijektive Abbildungen.
Definition 4.11 T (X), T (Y ) seien Topologien auf X, Y . Die Abbildung f : X → Y
heißt ein Homöomorphismus, wenn f bijektiv ist und sowohl f als auch f −1 stetig sind.
Man nennt zwei topologische Räume homöomorph, oder topologisch äquivalent, wenn sie
durch einen Homöomorphismus verbunden sind. Da Homöomorphie eine Äquivalenzrelation ist, kann man einen topologischen Raum als Repräsentanten aller zu ihm homöomorphen Räume auffassen. Es stellt sich also die Frage, wann zwei Räume homöomorph sind.
Satz 4.8 T (X), T (Y ) seien Topologien auf X, Y . Die bijektive Abbildung f : X → Y
ist genau dann ein Homöomorphismus, wenn f stetig und offen (abgeschlossen) ist.
71
4.1. Topologie
4.1.3
4. Mathematische Grundlagen
Konvergenz und Hausdorff-Räume
Als nächstes werden Folgen untersucht, wobei konvergente Folgen von besonderem Interesse sind.
Definition 4.12 T (X) sei eine Topologie auf X. Die Folge (xn ) heißt konvergent, wenn
es einen Punkt x ∈ X so gibt, dass zu jeder Menge U ∈ Ux eine Zahl N existiert, dass
gilt xn ∈ U für n ≥ N. Man sagt auch xn konvergiert gegen den Grenzwert x.
In allgemeinen topologischen Räumen sind nun Grenzwerte von Folgen nicht eindeutig
bestimmt. Die entscheidenden Eigenschaften, dass Grenzwerte konvergenter Folgen eindeutig sind, zeigt die folgende Definition.
Definition 4.13 T (X) sei eine Topologie auf X. Der Raum X heißt ein HausdorffRaum, wenn man für alle x, y ∈ X, x 6= y Mengen U ∈ Ux , V ∈ Uy so finden kann, dass
U ∩ V = {} gilt. Der Raum X heißt regulär, wenn er ein Hausdorff-Raum ist, und es
gilt, zu jeder Menge M ∈ C (X) und jedem Punkt x ∈ X\M gibt es eine Menge U ∈ Ux
mit U ∩ M = {}. Der Raum X heißt normal, wenn er ein Hausdorff-Raum ist, und für
alle M, N ∈ C (X), M ∩ N = {} existieren Mengen U, V ∈ T (X) mit M ⊂ U, N ⊂ V ,
U ∩ V = {}.
Man kann nun einfach zeigen, dass ein normaler Raum regulär ist, sowie dass ein regulärer
Raum ein Hausdorff-Raum ist. In Hausdorff-Räumen haben nun konvergente Folgen genau
einen Grenzwert.
4.1.3.1
Teilräume, Produkt und Quotientenraum
Von Bedeutung ist ebenfalls, wie man neue topologische Räume aus gegebenen erzeugt.
Von besonderem Interesse sind hier Teilräume, Produkträume und Quotientenräume.
Definition 4.14 T (X) sei eine Topologie auf X. Die relative Topologie auf M ⊂ X ist
durch T (M) = {U ∩ M|U ∈ T (X)} gegeben.
Man beachte, dass eine offene Menge von T (M) nicht offen in T (X) sein muss. Wenn
f : X → Y eine stetige Abbildung zwischen zwei Räumen X, Y ist, dann ist die auf M ⊂
X eingeschränkte Abbildung f |M : M → Y auch stetig. Die Umkehrung gilt aber nicht.
Man beachte auch, dass in der relativen Topologie die Inklusionsabbildung i : M → X,
i (x) = x stetig ist.
Als nächstes soll das Produkt topologischer Räume betrachtet werden.
Definition 4.15 T (X), T (Y ) seien Topologien auf X, Y . Die Produkttopologie auf X ×
Y ist gegeben durch T (X × Y ) = {U × V |U ∈ T (X) , V ∈ T (Y )}. Die offenen Rechtecke
bilden also eine Basis dieser Topologie.
Feststellung 4.5 T (X), T (Y ) seien Topologien auf X, Y . Für die Produkttopologie auf
X × Y und die Projektionen pr1 (x, y) = x, pr2 (x, y) = y gilt:
1. pr1 , pr2 sind offene Abbildungen.
72
4.1. Topologie
4. Mathematische Grundlagen
2. Z sei ein topologischer Raum. Eine Abbildung f : Z → X × Y ist genau dann stetig,
wenn die Abbildungen pr1 ◦ f : Z → X, pr2 ◦ f : Z → Y stetig sind.
Mit Hilfe der Produkttopologie kann man auch überprüfen, ob ein topologischer Raum
ein Hausdorff-Raum ist.
Feststellung 4.6 Ein topologischer Raum X ist genau dann ein Hausdorff-Raum, wenn
die Diagonale ∆ = {(x, x) |x ∈ X} ⊂ X × X in der Produkttopologie eine abgeschlosse
Teilmenge ist.
Ist X ein Hausdorff-Raum, dann gibt es zu zwei Punkte x, y ∈ X, x 6= y zwei Mengen
U ∈ Ux , V ∈ Uy so, dass U ∩ V = {} gilt. Woraus folgt (U × V ) ∩ ∆ = {}. Ist ∆
abgeschlossen, dann ist X\∆ offen und zu x, y gibt es offene Umgebungen U, V mit
(U × V ) ∈ (X × X) \∆, oder es gilt U ∩ V = {}.
Mit Hilfe von Äquivalenzrelationen können ebenfalls neue Topologien erzeugt werden.
Hierzu dient die nachstehende Definition.
Definition 4.16 Eine Äquivalenzrelation R ∈ X × X auf einer Menge X erfüllt für alle
x, y, z ∈ X die Beziehungen:
1. (x, x) ∈ R, (Reflexivität)
2. (x, y) ∈ R ⇔ (y, x) ∈ R, (Symmetrie)
3. (x, y) , (y, z) ∈ R ⇒ (x, z) ∈ R, (Transitivität)
Mit [x] = {v ∈ X| (x, v) ∈ R} wird die Äquivalenzklasse von x bezeichnet, und mit X/R
die Menge aller Äquivalenzklassen. Die Abbildung π : X → X/R, x 7→ [x] heißt die
kanonische Projektion.
Man überzeugt sich leicht, dass X/R aus disjunkten Mengen besteht, deren Vereinigung
gerade X ist. Mit der Quotiententopologie macht man nun die Projektion zu einer stetigen
Abbildung.
Definition 4.17 T (X) sei eine Topologie auf X und R eine Äquivalenzrelation. Die
Quotiententopologie auf X/R ist gegeben durch {U ∈ X/R|π −1 (U) ∈ T (X)}.
Es sei f : X → Y eine surjektive Abbildung. Man erzeugt nun mittels f (x) = f (y)
sehr einfach eine Äquivalenzrelation R. Offensichtlich ist die Abbildung g : X/R → Y ,
[x] 7→ f (x) bijektiv. Wie schaut die feinste Topologie auf Y aus, in der f stetig ist?
Es stellt sich nun die Frage, wie sich die Quotiententopologie mit der Hausdorff Eigenschaft vertragt. Dazu nachstehende Definition.
Definition 4.18 Die Menge Γ = {(x, y) | (x, y) ∈ R} ⊂ X ×X eines topologischen Raumes X mit Topologie T (X) heißt der Graph von R. Die Äquivalenzrelation R heißt offen
(abgeschlossen), wenn die kanonische Projektion π offen (abgeschlossen) ist.
Es ist nun oft nötig, beurteilen zu können, ob ein Quotientenraum ein Hausdorff-Raum
ist. Dazu das folgende Ergebnis.
Feststellung 4.7 Ist X/R eine Hausdorff-Raum, dann ist der Graph Γ von R in X ×
X abgeschlossen. Ist noch R offen und Γ in X × X abgeschlossen, dann ist X/R ein
Hausdorff-Raum.
73
4.1. Topologie
4.1.4
4. Mathematische Grundlagen
Metrische Räume
Auf dem Rn ist die Standardmetrik durch
v
u n
uX
d (x, y) = t
(xi − yi )2 ,
i=1
x, y ∈ Rn
gegeben. Die Erweiterung auf allgemeinere Räume ist der folgenden Definition zu entnehmen.
Definition 4.19 Eine Metrik auf einer Menge X ist eine Abbildung d : X × X → R so,
dass für alle x, y, z ∈ R+ gilt:
1. d (x, y) = 0 ⇔ x = y, (Definitheit)
2. d(x, y) = d (y, x), (Symmetrie)
3. d(x, z) ≤ d(x, y) + d(y, z), (Dreiecksungleichung)
Mit Hilfe einer Metrik auf einer Menge kann man auf ihr eine Topologie einführen.
Definition 4.20 X sei ein metrischer Raum mit Metrik d. Die ε-Scheibe um x ist die
Menge Dε (x) = {y ∈ X|d (x, y) < ε}. Die metrische Topologie auf X ist durch alle Mengen gegeben, die sich als Vereinigung von ε-Scheiben darstellen lassen. Zwei Metriken
heißen äquivalent, wenn sie dieselbe Topologie erzeugen.
Man überzeugt sich leicht, dass eine Norm k·k auf einem linearen Raum X eine Metrik
ist mit
d (x, y) = kx − yk , x, y ∈ X
Ein wichtiges Ergebnis ist nun, dass alle Normen auf dem Rn
v
u n
uX
p
|xi |p , p ∈ [1, ∞)
kxkp = t
i=1
kxk∞ = max |xp |
1≤p≤n
mit x ∈ Rn dieselbe Topologie erzeugen.
Die nachfolgende Feststellung zeigt nun eine besondere Eigenschaft metrischer Räume.
Feststellung 4.8 Jeder metrische Raum ist normal.
Metrische Räume, die vollständig sind, haben eine besondere Bedeutung. Man überzeugt
sich nämlich leicht, dass jede konvergente Folge eine Cauchy Folge ist, die Umkehrung ist
jedoch im Allgemeinen falsch.
Definition 4.21 X sei ein metrischer Raum mit Metrik d und (un ) eine Folge in X.
Existiert zu jedem ε ∈ R+ eine Zahl N so, dass d (un , um ) < ε für alle n, m > N gilt,
dann heißt (ui ) eine Cauchy Folge. Der Raum X heißt vollständig, wenn jede Cauchy
Folge konvergiert.
74
4.1. Topologie
4. Mathematische Grundlagen
Der Rn versehen mit einer Norm ist vollständig. Dies gilt auch für jeden Unterraum des
Rn . Man beachte, dass diese Eigenschaft für nicht finit-dimensionale lineare Räume X im
Allgemeinen auch nicht zutrifft.
In einem vollständigen metrischen Raum kann man nun gewisse Gleichungen mittels
Iteration einfach lösen.
X sei ein metrischer Raum mit Metrik d mit einer Abbildung f : X → X. Gibt es
eine Zahl k, 0 ≤ k < 1 so, dass für alle x, y ∈ X gilt, dann gibt es genau ein z ∈ X, dass
f (z) = z gilt. Man nennt in diesem Fall f eine Kontraktion und z einen Fixpunkt von f .
Auf den einfachen Beweis wird hier verzichtet, er basiert auf der Konstruktion einer
geeigneten Cauchy Folge.
In metrischen Räumen kann man die Stetigkeit auch auf nachfolgende Weise einführen.
Definition 4.22 Es seien X, Y metrische Räume mit Metriken dX , dY . Die Abbildung
f : X → Y heißt stetig in x, wenn zu jedem ε > 0 ein δx (ε) > 0 so existiert, dass
dX (x, y) < ε ⇒ dY (f (x) , f (y)) < δ gilt.
Von weiterem Interesse sind nun stetige Funktionen, bei denen die Funktion δ nicht vom
betrachteten Punkt abhängt.
Definition 4.23 Es seien X, Y metrische Räume mit Metriken dX , dY . Die Abbildung
f : X → Y heißt gleichmäßig stetig in x, wenn zu jedem ε > 0 ein δ (ε) > 0 so existiert,
dass dX (x, y) < ε ⇒ dY (f (x) , f (y)) < δ gilt.
Es sei fi : S → X, i = 1, 2, . . . und f : S → X Abbildungen einer Menge S in einen
metrischen Raum mit Metrik d.Die Folge fi → f konvergiert gleichmäßig gegen f , wenn
zu jeden ε > 0 ein n so existiert, dass i ≥ n ⇒ d (fi (s) , f (s)) < ε, ∀s ∈ S.
Es stellt sich nun heraus, dass gewisse Mengen stetiger Funktionen auf metrischen Räumen
selbst wieder einen metrischen Raum bilden.
Feststellung 4.9 Es sei X ein topologischer Raum und Y ein abgeschlossener metrischer
Raum. Die Menge C (X, Y ) der beschränkten und stetigen Abbildungen X → Y ist ein
metrischer Raum mit Metrik
dX,Y (f, g) = sup d (f (x) , g (x))
x∈X
mit f, g ∈ C (X, Y ).
4.1.5
Kompaktheit
Eine stetige Funktion auf dem Intervall [0, 1] nimmt sowohl ihr Maximum als auch ihr
Minimum an. Die dafür verantwortliche Eigenschaft ist die Kompaktheit des Intervalls
[0, 1].
Definition 4.24
S X sei ein topologischer Raum. Der Raum X heißt kompakt,
S wenn jede
Überdeckung α Uα = X mit offenen Mengen Uα eine endliche Überdeckung α∈I Uα = X,
|I| < ∞ enthält. Eine Teilmenge M ⊂ X heißt kompakt, wenn M in der relativen Topologie kompakt ist. Eine Teilmenge M ⊂ X heißt relativ kompakt, wenn cl (M) kompakt
75
4.1. Topologie
4. Mathematische Grundlagen
ist. Eine Raum X heißt lokal kompakt, wenn er ein Hausdorff-Raum ist und jeder Punkt
x ∈ X eine relativ kompakte Umgebung hat.
S
Es sei [0, 1] ⊂ α Uα eine offene Überdeckung. Zu jeden Punkt x ∈ [0, 1] muss es ein α
so geben, dass x ∈ Uα gilt. Da Uα offen ist, muss gelten (x − εx , x + εx ) ⊂ Uα . Nun muss
eine Zahl ε so existieren, dass 0 < ε ≤ εx gilt, denn andernfalls gäbe es einen Punkt x
mit (x − ε, x + ε) 6⊂ Uα für alle α. Da dann auch (x − ε/n, x + ε/n) ⊂ Uα , n = 1, 2, . . .
für alle α gilt, hätte x keine offene Umgebung in R. Die entsprechende Übertragung auf
den Rn entnimmt man der folgenden Feststellung.
Feststellung 4.10 Das Produkt X × Y zweier topologischer Räume X, Y ist genau dann
kompakt, wenn X und Y kompakt sind.
Noch einfacher zeigt man nachstehende Feststellung.
Feststellung 4.11 Es gilt:
1. X sei eine kompakte Menge mit einer abgeschlossenen Teilmenge M ⊂ X, dann ist
M kompakt.
2. Die Abbildung f : X → Y sei stetig. Ist X kompakt, dann ist f (X) kompakt.
Die Umkehrung von Punkt 2 obiger Feststellung ist im Allgemeinen falsch. Dazu folgende
Definition.
Definition 4.25 Die Abbildung f : X → Y heißt eigentlich, wenn f stetig ist, und für
jede kompakte Menge M ⊂ Y folgt, f −1 (M) ist kompakt.
Nun kann man oftmals Kompaktheit auch an Hand der Konvergenz von Folgen beurteilen.
Dazu der Satz von Bolzano, Weierstrass.
Es sei X ein kompakter Hausdorff Raum, dann besitzt jede Folge eine konvergente
Teilfolge. In einem metrischen Raum gilt die Umkehrung.
Eine Eigenschaft metrischer Räume, die ebenfalls von Bedeutung ist, findet man in
der folgenden Definition.
Definition 4.26 X sei ein metrischer Raum. Eine Teilmenge M ⊂ X heißt total beschränkt, wenn zu jedem
S ε > 0 eine endliche Menge I = {p1 , . . . , pn } von Punkten pi ∈ S
so existiert, dass M ⊂ i∈I Dε (pi ) gilt.
Man erhält nun einfach das nachstehende Ergebnis.
Ein metrischer Raum ist kompakt, wenn er vollständig und total beschränkt ist. Eine
Teilmenge eines metrischen Raumes ist relativ kompakt, wenn sie beschränkt ist.
Auf den einfachen Beweis wird hier verzichtet. Ebenso einfach erhält man das folgende
Ergebnis.
Feststellung 4.12 In einem metrischen Raum sind die kompakten Mengen abgeschlossen
und total beschränkt.
Im Rn gilt noch die Umkehrung. Dies besagt der Satz von Heine und Borel.
76
4.1. Topologie
4. Mathematische Grundlagen
Satz 4.9 Im Rn sind abgeschlossene und total beschränkte Mengen kompakt.
In allgemeinen topologischen Räumen kann man bereits die Stetigkeit von Funktionen
definieren. In metrischen Räumen existieren noch nachfolgende Verfeinerungen.
Feststellung 4.13 Es seien X, Y metrische Räume, und X sei kompakt. Eine stetige
Abbildung f : X → Y ist gleichmäßig stetig.
Definition 4.27 Eine Teilmenge F ⊂ C (X, Y ) heißt gleichgradig stetig in x ∈ X, wenn
gilt, zu jedem ε > 0 gibt es ein δ > 0 so, dass gilt dX (x, y) < δ ⇒ dY (f (x) , f (y)) <
ε, ∀f ∈ F . F heißt gleichgradig stetig, wenn F in jedem Punkt x ∈ X gleichgradig stetig
ist.
Zu obiger Definition noch das folgende Ergebnis.
X sei ein kompakter metrischer Raum. Die Menge F ⊂ C (X, Rn ) ist relativ kompakt,
wenn sie gleichgradig stetig ist, und gleichmäßig beschränkt ist.
4.1.6
Zusammenhang
Auf topologischen Räumen kann man auch beurteilen, ob Mengen zusammenhängend
sind. Interessanterweise sind drei verschiedene Begriffe, Zusammenhang, wegweiser Zusammenhang und einfacher Zusammenhang von Bedeutung.
Definition 4.28 X sei ein topologischer Raum. Ein Weg c in X ist eine stetige Abbildung
c : [0, 1] → X. Gilt c (0) = x, c (1) = y, dann verbindet der Weg c die Punkte x, y. Der
Raum heißt wegweise zusammenhängend, wenn für alle x, y ∈ X gilt, dass sie durch einen
Weg verbunden werden können. Der Raum X heißt lokal wegweise zusammenhängend,
wenn jeder Punkt eine wegweise zusammenhängende Umgebung hat.
Ein einfaches Beispiel ist der Rn , er ist wegweise und lokal wegweise zusammenhängend.
Es gibt jedoch noch eine weitere Definition des Zusammenhanges.
Definition 4.29 Ein topologischer Raum X heißt zusammenhängend, wenn X und {}
die einzigen offenen und abgeschlossenen Teilmengen von X sind. Eine Teilmenge von
X heißt zusammenhängend, wenn sie in der relativen Topologie zusammenhängend ist.
Eine Komponente M von X ist eine nicht leere zusammenhängende Teilmenge von X
für die gilt, M ist die einzige zusammenhängende Teilmenge von X die M enthält. Der
Raum X heißt lokal zusammenhängend, wenn jeder Punkt eine lokal zusammenhängende
Umgebung hat.
Man kann nun einfach zusammenhängende Mengen folgendermaßen charakterisieren.
Definition 4.30 Ein topologischer Raum X ist genau dann nicht zusammenhängend,
wenn eine der folgenden Eigenschaften zutrifft.
1. X besitzt eine echte, nicht leere Teilmenge, die offen und abgeschlossen ist.
2. X ist die disjunkte Vereinigung zweier nicht leerer offener Mengen.
77
4.1. Topologie
4. Mathematische Grundlagen
3. X ist die disjunkte Vereinigung zweier nicht leerer abgeschlossener Mengen.
Stetige Abbildungen erhalten nun den Zusammenhang, denn es gilt.
Feststellung 4.14 X, Y seien topologische Räume, und f sei eine stetige Abbildung
f : X → Y . Ist X (wegweise) zusammenhängend, dann ist auch f (x) (wegweise) zusammenhängend.
Das folgende Ergebnis ist zwar nahe liegend, es verlangt aber doch einen hier nicht gezeigten Beweis.
Lemma 4.1 Die einzigen zusammenhängenden Mengen des R sind die Intervalle.
Wegweiser Zusammenhang ist nun stärker als nur Zusammenhang.
Feststellung 4.15 Ist der topologische Raum wegweise zusammenhängend, dann ist er
zusammenhängend.
Das Standardbeispiel einer zusammenhängenden aber nicht wegweise zusammenhängenden Menge ist:
1
2
(x, y) ∈ R |x > 0, −1 < y < 1, x, sin
∪ (0, y)
x
Eine partielle Umkehrung obiger Feststellung enthält das Nachfolgende.
Feststellung 4.16 Ein topologischer Raum sei zusammenhängend und lokal wegweise
zusammenhängend, dann ist er wegweise zusammenhängend. Im Besonderen gilt, dass
jeder lokal zum Rn homöomorphe Raum wegweise zusammenhängend.
Eine besonders wichtige Eigenschaft stetiger Funktionen auf zusammenhängenden Mengen
zeigt der so genannte Zwischenwertsatz.
Korollar 4.1 Es sei X ein zusammenhängender topologischer Raum und f eine stetige
Abbildung f : X → R. Für alle x, y ∈ X, f (x) < f (y) gilt, dass zu jedem a ∈ [f (x) , f (y)]
ein z ∈ X mit f (z) = a existiert.
Abschließend sollen noch einfach zusammenhängende Mengen betrachtet werden. Dazu
nachstehende Definition.
Definition 4.31 X, Y seien topologische Räume, und f , g stetige Abbildungen X → Y .
f und g heißen homotop, wenn es eine stetige Abbildung h : X × [0, 1] so gibt, dass
f (x) = h (x, 0), g (x) = h (x, 1) gilt.
Man überzeugt sich leicht, dass Homotopie eine Äquivalenzrelation ist. Zum Abschluss
noch nachstehende Definition.
Definition 4.32 Ein topologischer Raum X heißt einfach zusammenhängend, wenn jeder
geschlossene Weg c mit c (0) = c (1) = x, homotop zur konstanten Abbildung f : [0, 1] →
Y , f ([0, 1]) = {x} ist.
78
4.2. Inverse und implizite Funktion
4.2
4. Mathematische Grundlagen
Inverse und implizite Funktion
Im Folgenden werden Abbildungen vom Rn in den Rm betrachtet, wobei beide linearen
Vektorräume immer mit der Standardtopologie versehen sind. Im Weiteren werden nur
stetige Abbildungen betrachtet, dazu die nachstehende Definition. Auf Beweise oder Herleitungen der folgenden Sätze hier verzichtet, man findet diese man z.B. in [11].
Definition 4.33 Eine stetig Abbildung f : U → V (f ∈ C (U, V )) mit U ⊂ Rn und
V ⊂ Rn heißt Homeomorphismus, wenn f auf U biijektiv ist, und f sowie f −1 stetige
Abbildungen in den Standardtopologien sind.
Stetige Zustandstransformationen sind für das Weitere zu allgemein. Wir verlangen, dass
f zumindest einmal stetig differenzierbar ist. Es bezeichne Df : U × Rn → V × Rn die
Abbildung
x̄i = f i (x) , x̄˙ i = ∂j f i (x) ẋj , i = 1, . . . , n
mit (xi ), (x̄i ) als Koordinaten für U, V und (xi , ẋi ), (x̄i , x̄˙ i ) für U × Rn , V × Rn . Ist Df
ein Homeomorphismus, dann ist f offensichtlich stetig differenzierbar. Hier wird natürlich
vorausgesetzt, dass die Elemente der Jacobi Matrix [∂j f i ],


∂1 f 1 (x) ∂2 f 1 (x) · · · ∂n f 1 (x)
2
· · · ∂n f 2 (x) 
i 
 ∂1 f (x)

∂j f = 

..
..
..
.
.


.
.
.
.
n
n
n
∂1 f (x) ∂2 f (x) · · · ∂n f (x)
existieren. Die nachfolgenden Sätze über die inverse und die implizite Funktion gehören
zu den wichtigsten der nichtlinearen Analysis.
Satz 4.10 Die Abbildung f : U → V (f ∈ C r (U, V )) mit offenen Teilmengen U ⊂ Rn ,
V ⊂ Rn sei r mal (r ≥ 1) stetig differenzierbar. Für ein x0 ∈ U gelte
x̄0 = f (x0 )
sowie
rank ∂j f i (x0 ) = n ,
dann existiert eine offene Umgebung U ′ ⊆ U von x0 so, dass Df auf U × Rn ein Homeomorphismus ist, und dass f −1 auf V ′ = f (U ′ ) mindestens r mal stetig differenzierbar ist
(f −1 ∈ C r (V ′ , U ′ )).
Man beachte, dass auf V ′ zwei Topologien exisitieren. Die erste ist die relative Topologie
gegeben durch V . Die zweite Topologie wird durch f erzeugt, indem als offenen Mengen
von V ′ die Bilder offener Mengen von U ′ einführt werden. Genügt f nun Satz 4.10, dann
stimmen beide Topologien überein. Der folgende Satz ist nun eine Erweiterung der vorigen.
Satz 4.11 Die Abbildung f : U × V → Rn (f ∈ C r (U × V, Rn )) mit offenen Mengen
U ⊂ Rm , V ⊂ Rn sei r mal (r ≥ 1) stetig differenzierbar. Für ein x0 ∈ U, y0 ∈ V gelte
f (x0 , y0 ) = 0
sowie
rank ∂j f i (x0 , y0) = n , ∂j = ∂yj ,
i, j = 1, . . . , n, dann eine offene Umgebung U ′ ⊆ U von x0 so, dass auf jeder zusammenhängenden Umgebung U ′′ ⊂ U ′ genau eine g ∈ C r (U ′′ , V ) mit
f (x, g (x)) = 0 .
79
4.2. Inverse und implizite Funktion
q
π
4. Mathematische Grundlagen
θ
x1
f
x2
1
Abbildung 4.1: Eine lokal aber nicht global umkehrbar eindeutige Funktion.
Man überzeugt sich leicht, dass man den Satz 4.10 aus Satz 4.11 erhält, wenn man
f (x, y) = f (x) − y = 0 ,
y = x̄
setzt. In umgekehrter Richtung benutze man die Substitution
f (x) = (x1 , f (x1 , x2 )) = y = (y1 , y2 )
und werte die Beziehung
x = (x1 , x2 ) = f −1 (y1 , y2 )
für x1 = y1 , y2 = 0 aus.
Man beachte, dass Satz 4.10 ausschließlich lokale Aussagen zulässt. Hiezu untersuche man
lediglich die Abbildung
x1 = r cos(θ)
x2 = r sin(θ)
mit der Jacobi Matrix
cos(θ) −r sin(θ)
M=
sin(θ) r cos(θ)
mit
det(M) = r .
Für 0 < r < ∞ und 0 < θ < a mit a ≤ 2π ist obige Abbildung umkehrbar eindeutig, für
a > 2π ist dies nicht mehr der Fall, obwohl die Jacobi Matrix für r 6= 0 immer regulär ist.
Bild 4.1 veranschaulicht diesen Sachverhalt.
Weiters beachte man, dass Satz 4.10 die r malige Differenzierbarkeit der Umkehrfunktion garantiert. Mit i (x) = x als identischer Abbildung und g = f −1 folgt aus
g ◦ f (x) = i (x) ,
und mit der Kettenregel
∂j g i ◦ f (x) = ∂j ii (x)
∂ī g i ◦ f (x) ∂j f ī (x) = δji
erhält man schlussendlich
h
i−1
ī
∂ī g ◦ f (x) = ∂j f (x)
.
i
80
4.2. Inverse und implizite Funktion
y
4. Mathematische Grundlagen
x
x3
√
3
x
y
y
Abbildung 4.2: Ein Homeomorphismus aber kein Diffeomorphismus.
Dabei wurde von der Differenzierbarkeit von f und f −1 wesentlich Gebrauch gemacht.
Die Umkehrfunktion f −1 muss jedoch nicht differenzierbar sein, selbst wenn f glatt und
bijektiv ist.
Dazu beachte man die spezielle Funktion
y = x3 .
Nun gilt
∂
y(0) = 0 .
∂x
Man beachte, dass die Umkehrfunktion mit
x = y 1/3
sehr wohl existiert. Sie ist sogar stetig, aber nicht stetig differenzierbar. Damit ist diese
Funktion ein Homeomorphismus. Siehe auch Bild 4.2.
Um Fallunterscheidungen wie oben zu vermeiden, wird oft verlangt, dass die Abbildung
f wie ihre Inverse Ableitungen beliebiger Ordnung besitzt. Dazu folgende Definition.
Definition 4.34 Eine Abbildung f : U → V mit U ⊂ Rn und V ⊂ Rn heißt Diffeomorphismus, wenn f die Bedingungen von Satz 4.10 für r = ∞ erfüllt.
Es existieren nun auch Gegenstücke zu den Sätzen über inverse oder implizite Funktionen
in nicht finiten Räumen. Für das Weitere wird noch der nachstehende Satz benötigt.
Satz 4.12 Es seien E, F Banach Räume und die Abbildung f : U ⊂ E → F sei stetig
differenzierbar, f ∈ C (U, F ). Ist nun Df (u), u ∈ U surjektiv, dann ist f lokal surjektiv.
Somit existieren offene Umgebungen Ū von u und V̄ von f (u) so, dass f |Ū → V̄ surjektiv ist. Gilt noch, dass Df (u) für alle u ∈ U surjektiv ist, dass ist f dort eine offene
Abbildung.
Auf den Beweis dieses Satzes wird hier verzichtet.
Satz 4.13 Es seien E, F Banach Räume und die Abbildung f : U ⊂ E → F sei stetig
differenzierbar, f ∈ C (U, F ). Ist nun Df (u), u ∈ U surjektiv, dann ist f lokal surjektiv.
Somit existieren offene Umgebungen Ū von u und V̄ von f (u) so, dass f |Ū → V̄ surjektiv ist. Gilt noch, dass Df (u) für alle u ∈ U surjektiv ist, dass ist f dort eine offene
Abbildung.
Auch auf den Beweis dieses Satzes wird hier verzichtet.
81
4.2. Inverse und implizite Funktion
4.2.1
4. Mathematische Grundlagen
Mittelwertsätze
Satz 4.14 Zur Abbildung f : U → V , (f ∈ C 1 (U, V )) mit U = [a, b] ⊂ R, V ⊂ Rn gibt
es ein x ∈ Uso, dass
kf (b) − f (a)k ≤ |b − a| kDf (x)k
gilt.
Zum Beweis betrachte man die Funktion ϕ (τ ) = (f (b) − f (a) , f (t)) mit dem Innenprodukt der trivialen Metrik. Mit Hilfe des Mittelwertsatzes der Integralrechnung folgt
nun
ϕ (b) − ϕ (a) = (b − a) (f (b) − f (a) , Df (x))
für ein x ∈ U. Der Rest folgt dann aus ϕ (b) − ϕ (a) = ((f (b) − f (a) , f (b) − f (a))) =
kf (b) − f (a)k22 und der Beziehung
kf (b) − f (a)k22 = (b − a) (f (b) − f (a) , Df (x)) ≤ (b − a) kf (b) − f (a)k2 kDf (x)k2 .
Satz 4.15 Es gelte für die Abbildung f : U → V , (f ∈ C 1 (U, V )) mit einer offenen
U ⊂ Rm , V ⊂ Rn die Beziehung
kDf (x)k ≤ M ∈ R+
für alle x ∈ U, sowie für ein beliebiges Paar x1 , x2 ∈ U auch x1 (1 − t) + x2 t ∈ U für
0 ≤ t ≤ 1, dann folgt
kf (x2 ) − f (x)k ≤ M kx2 − x1 k .
Zum Beweis betrachte man nun die Funktion g,
g (t) = f (x1 (1 − t) + x2 t)
Dg (t) = Df (x1 (1 − t) + x2 t) (x2 − x1 )
Mit der Abschätzung kDg (t)k ≤ M kx2 − x1 k und des vorigen Satzes erhält man sa
gewünschte Ergebnis
82
Literaturverzeichnis
[1] W. M. Boothby. An Introduction to Differentiable Manifolds and Riemanmnian Geometry. Academic Press, Inc., Orlando, USA, 1986.
[2] R. Bryant, S. Chern, R. Gardner, H. Goldschmidt, P. Griffith. Exterior Differential
Systems. Springer, New York, USA, 1991.
[3] Y. Choquet-Bruhat, C. DE Witt Morette. Analysis, Manifolds and Physics. North
Holland, Amsterdam, NL, 1982.
[4] A. Fitzgerald. Electric Machinery. McGraw-Hill, New York, USA, 1990.
[5] T. Frankel. The Geometry of Physics, An Introduction. Cambridge University Press,
Cambridge, UK, 1998.
[6] G. Giachetta, L. Mangiarotti, G. Sardanashvily. New Lagrangian and Hamiltonian
Methods in Field Theory. Springer, London, UK, 1997.
[7] A. Isidori. Nonlinear Control Systems. Springer, London, UK, 1995.
[8] A. Isidori. Nonlinear Control Systems II. Springer, London, UK, 1999.
[9] H. Khalil. Nonlinear Systems 3rd Edition. Prentice Hall, New Jersey, US, 2002.
[10] D. Luenberger. Optimization by Vector Space Methods. John Wiley & Sons, Inc.,
New York, USA, 1969.
[11] R. Marsden, T. Ratiu. Manifolds, Tensor Analysis, and Applications. Springer,
London, UK, 1988.
[12] K. Mayer. Algebraische Topologie. Birkhäuser Verlag, 1989.
[13] H. Nijmeijer, A. van der Schaft. Nonlinear Dynamical Control Systems. Springer,
New York, USA, 1990.
[14] P. J. Olver. Applications of Lie Groups to Differential Equations. Springer, New
York, USA, 1993.
[15] P. J. Olver. Equivalence, Invariants, and Symmetry. Cambridge University Press,
Cambridge, UK, 1995.
83
LITERATURVERZEICHNIS
LITERATURVERZEICHNIS
[16] J. F. Pommaret. Systems of Partial Differential Equations and Lie Pseudogroups.
Gordon and Breach Science Publishers, New York, USA, 1978.
[17] S. Sastry. Nonlinear Systems Analysis, Stability and Control. Springer, New York,
USA, 1999.
[18] D. Saunders. The Geometry of Jet Bundels. Cambridge University Press, Cambridge,
UK, 1989.
[19] M. Spivak. Differential Geometry, Vol. 1 to 5. Publish or Perish, Inc., Houston, USA,
1979.
84
Herunterladen