Zur optimalen Kontrolle von Verbunden starrer Körper

Werbung
Zur optimalen Kontrolle von
Verbunden starrer Körper
Sina Ober-Blöbaum
Diplomarbeit
Universität Paderborn
Fakultät für Elektrotechnik, Informatik und Mathematik
Institut für Mathematik
31.03.2004
0.0
Betreuer: Dr. Oliver Junge
Danksagung
Ich danke Herrn Dr. Oliver Junge und Herrn Prof. Dr. Michael Dellnitz für die
Vergabe des Themas. Insbesondere bedanke ich mich für die intensive Betreuung
bei Herrn Dr. Oliver Junge und für die Beantwortung zahlreicher Fragen und Korrekturlesungen bei den Mitgliedern des Lehrstuhls für Angewandte Mathematik an
der Universität Paderborn.
Besonderen Dank gilt auch meinen Eltern, die mich während meines Studiums immer unterstützt haben.
Sina Ober-Blöbaum
Erklärung
Hiermit versichere ich, dass ich die folgende Arbeit selbstständig und ohne unerlaubte fremde Hilfe angefertigt, keine anderen als die angegebenen Quellen und
Hilfsmittel benutzt und den benutzten Quellen wörtlich oder inhaltlich entnommene Stellen als solche kenntlich gemacht habe.
Paderborn, den 31.03.2004
(Sina Ober-Blöbaum)
ii
Inhaltsverzeichnis
1. Einleitung
1
1.1.
Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2.
Dierentialgeometrische Sichtweise
. . . . . . . . . . . . . . . . . . .
3
1.3.
Methoden und Struktur
. . . . . . . . . . . . . . . . . . . . . . . . .
5
1.4.
Übersicht der einzelnen Kapitel
. . . . . . . . . . . . . . . . . . . . .
2. Grundlagen zur Dierentialgeometrie
6
8
2.1.
Mannigfaltigkeit und Abbildungen zwischen Mannigfaltigkeiten . . . .
8
2.2.
Tangentialvektor und Tangentialbündel . . . . . . . . . . . . . . . . .
11
2.3.
Kovektor und Kotangentialbündel . . . . . . . . . . . . . . . . . . . .
15
2.4.
Vektorfeld und Lie Klammer . . . . . . . . . . . . . . . . . . . . . . .
17
2.5.
Tensor und Tensorfeld
21
2.6.
Theorie des Anen Zusammenhangs
2.7.
Riemannsche Geometrie
. . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
22
. . . . . . . . . . . . . . . . . . . . . . . . .
28
3. Variationsrechung und Euler-Lagrange Gleichungen
31
3.1.
Begrie und Denitionen . . . . . . . . . . . . . . . . . . . . . . . . .
31
3.2.
Minimierung mit Variationsrechnung
. . . . . . . . . . . . . . . . . .
32
3.3.
Minimierung mit Nebenbedingungen
. . . . . . . . . . . . . . . . . .
35
3.4.
Variationsrechnung in der anen Zusammenhangstheorie . . . . . . .
37
4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode
39
4.1.
Was sind Randwertprobleme?
. . . . . . . . . . . . . . . . . . . . . .
39
4.2.
Die Kollokationsmethode . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.3.
Umsetzung der Kollokationsmethode in der MATLAB-Funktion
iii
bvp4c
41
Inhaltsverzeichnis
0.0
5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
43
5.1.
Optimale Kontrolle . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
5.2.
Zusammenhangs-Kontrollsystem . . . . . . . . . . . . . . . . . . . . .
46
5.3.
Steuerbarkeit
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
52
5.4.
Kostenfunktion
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
5.5.
Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
5.6.
Problemlösung: Lagrange-Multiplikatoren und Variationsrechnung . .
59
5.7.
Endpunktbedingungen
63
. . . . . . . . . . . . . . . . . . . . . . . . . .
6. Optimale Kontrolle eines starren Körpers
65
6.1.
Bewegungsgleichungen eines freien starren Körpers in der Ebene . . .
65
6.2.
Steuerbarkeit
67
6.3.
Kostenfunktion und Lösung
. . . . . . . . . . . . . . . . . . . . . . .
69
6.4.
Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.1.
Bewegungsgleichungen
7.2.
Steuerbarkeit
7.3.
Kostenfunktion und Lösung
7.4.
Endbedingungen
74
. . . . . . . . . . . . . . . . . . . . . . . . . .
74
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
. . . . . . . . . . . . . . . . . . . . . . .
76
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
7.5.
Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
7.6.
Drei Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
8. Fazit und Ausbilck
85
8.1.
Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
8.2.
Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
Literaturverzeichnis
87
iv
Abbildungsverzeichnis
1.1.
Ein ebener starrer Körper
. . . . . . . . . . . . . . . . . . . . . . . .
4
2.1.
Koordinatenkarten auf einer dierenzierbaren Mannigfaltigkeit . . . .
9
2.2.
Die
2.3.
Stereographische Koordinaten für
. . . . . . . . . . . . . . . . . .
11
2.4.
Dierenzierbare Abbildung . . . . . . . . . . . . . . . . . . . . . . . .
12
S2
Sphäre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
S
2.5.
Der Tangentialraum von
2.6.
Das Tangentialbündel von
2
S1
im Punkt
p.
10
. . . . . . . . . . . . . . . .
14
. . . . . . . . . . . . . . . . . . . . . .
15
2.7.
Das Dierential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.8.
Das Gravitationskraftfeld . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.9.
Die Fluss-Interpretation der Lie Klammer
. . . . . . . . . . . . . . .
20
3.1.
Variation und innitesimale Variation . . . . . . . . . . . . . . . . . .
32
5.1.
Erreichbarkeit und Steuerbarkeit
55
6.1.
Der Tangentialraum von
6.2.
Simulation für einen Körper
S1
S2
. . . . . . . . . . . . . . . . . . . .
im Punkt
p.
. . . . . . . . . . . . . . . .
66
. . . . . . . . . . . . . . . . . . . . . . .
73
7.1.
Zwei starre Körper in ihrer Endkonguration . . . . . . . . . . . . . .
77
7.2.
Simulation für Verbund zweier Körper
. . . . . . . . . . . . . . . . .
83
7.3.
Simulation für Verbund von drei Körpern . . . . . . . . . . . . . . . .
84
v
1. Einleitung
Zu Beginn wird in Abschnitt 1.1 das Thema motiviert. Schlüsselbegrie werden
erläutert und Anwendungsbeispiele vorgestellt. In dieser Arbeit wird das Thema
aufbauend auf Methoden der Dierentialgeometrie bearbeitet. Diese Sichtweise des
Problems wird in Abschnitt 1.2 diskutiert. Anschlieÿend werden in Abschnitt 1.3 die
verwendeten Methoden und die Struktur der Arbeit erläutert. Zur Übersicht bildet
der Abschluss der Einleitung eine Auistung der Inhalte der einzelnen Kapitel.
1.1. Motivation
Als erstes werden die Begrie im Titel der Diplomarbeit Zur optimalen Kontrolle
von Verbunden starrer Körper näher erläutert.
Was ist ein
Verbund starrer Körper?
Ein starrer Körper kann als System von unendlich vielen Massenpunkten aufgefasst werden, deren gegenseitige Abstände sich nicht ändern. Er ist demzufolge nicht
deformierbar. Eine beliebige Bewegung eines solchen starren Körpers kann zerlegt
werden in die Translation seines Schwerpunktes (Position) und in seine Rotationsbewegung um eine Achse, die durch den Schwerpunkt verläuft (Ausrichtung).
Ein Verbund starrer Körper besteht aus mindestens zwei Körpern, die hinsichtlich
der Gesamtgeometrie eine bestimmte Konguration (Positionen und Ausrichtungen
jedes Körpers) annehmen sollen.
Viele in Natur und Technik auftretende Objekte können physikalisch zunächst als
starre Körper modelliert werden. Somit ist es von groÿem Interesse, Verbunde starrer Körper (speziell in der Fahrzeugdynamik) zu betrachten. Eine Anwendung aus
der aktuellen Forschung sind Verbunde von Raumfahrzeugen, die durch ein Zusammenwirken der Einzelfahrzeuge ein deutlich leistungsfähigeres System darstellen. So
besteht beispielsweise das wesentliche Ziel der Missionen Darwin der ESA bzw. Ter-
restrial Planet Finder (TPF) der NASA darin, mit Hilfe eines durch den Verbund der
Raumfahrzeuge generierten Interferometers Planeten in anderen Sonnensystemen zu
detektieren. Weitere Anwendungen sind z.B.
1
Kapitel 1.
Einleitung
1.1
•
Verbunde von Satelliten zur Beobachtung der Erde und
•
Verbunde autonomer Unterwasserfahrzeuge für ozeanographische Forschungen.
In den meisten Fällen sind die Körper dynamisch entkoppelt, d.h. dass die Bewegung eines Körpers nicht direkt die Bewegung der anderen beeinusst. Stattdessen
sind die Körper über die gemeinsam zu erfüllende Aufgabe miteinander gekoppelt.
Beispielsweise sollen sie innerhalb des Verbundes eine relative Position zueinander
einnehmen.
Was bedeutet
optimale Kontrolle?
Eine Aufgabe bei der Betrachtung von Verbunden von Fahrzeugen ist die Rekon-
guration, d.h. die Umpositionierung der Körper relativ zueinander oder zu einem
Referenzpunkt. Eine Änderung des Formationszieles, Ausfall oder Beschädigung eines Fahrzeuges und eine äuÿere Störung sind Situationen, die eine Rekonguration
des Verbundes erfordern.
Steht die gewünschte Endkonguration fest, so müssen Trajektorien hergeleitet werden, um jedes Fahrzeug zu einer bestimmten Position zu bringen.
Im Modell der starren Körper sollen diese von einer vorgegebenen Anfangskongu-
ration zu einer vorgegebenen Endkonguration geführt werden. Dies geschieht durch
sogenannte Kontrollkräfte
F,
die an den starren Körpern angreifen.
Jedoch muss zunächst überprüft werden, ob der Verbund überhaupt steuerbar ist,
d.h. ob eine Überführung einer beliebigen Anfangskonguration des Verbundes in
jede beliebige Endkonguration in endlicher Zeit möglich ist. Ist dies gewährleistet,
so kann der Begri der Optimierung eingeführt werden:
Optimale Kontrolle beinhaltet die Denition einer von bestimmten Parametern abhängige Kostenfunktion, welche bei diesem Vorgang minimiert werden soll. Zu den
Parametern gehören beispielsweise die Zeit, die zur Durchführung der Formation
benötigt wird (zeitoptimal) oder die dazu benötigten Kontrollkräfte
F
(energiee-
zient).
Die Berechnung der Trajektorien erfolgt, indem das Problem als Optimierungsproblem mit der Systemdynamik als Nebenbedingungen formuliert wird. Eventuell müssen zusätzlich Beschränkungen an die Position und den Kontrollaufwand bzw. Beschränkungen an die Kontrollfunktionen erfüllt sein.
Die zu optimierende Gröÿe ist problemabhängig. Im Beispiel des Verbundes von
Raumfahrzeugen wird eine energieoptimale Trajektorie gefordert, um den Treibstoverbrauch zu minimieren und damit die Einsatzzeit des Verbundes zu maximieren.
Dabei kann bei jeder Steuerung nur eine begrenzte Schubkraft aufgebracht werden.
Im Rahmen dieser Arbeit wird diese optimale Kontrolle betrachtet, d.h. die während
der Formation auftretenden Kontrollkräfte sollen minimiert werden.
Die Lösung optimaler Kontrollprobleme ist oft ein schwieriges mathematisches Pro-
2
Kapitel 1.
Einleitung
1.2
blem. Numerische Ansätze protieren wesentlich von guten Anfangsschätzungen für
die optimale Lösung.
In dieser Arbeit wird die optimale Kontrolle der Körperdynamik aus der Perspektive
einer klassischen Formulierung des optimalen Kontrollproblems, der Euler-Lagrange
Gleichungen, untersucht.
1.2. Dierentialgeometrische Sichtweise
Um ein System optimal kontrollieren zu können, muss das System zunächst innerhalb
eines mathematischen Rahmens beschrieben werden. In der klassischen Mechanik
werden abhängig von dem betrachteten Problem eine bevorzugte Menge von Koordinaten im euklidischen Raum gewählt. Diese generalisierten Koordinaten geben
dabei die Geometrie des Problems wieder. Die Wahl von geeigneten Koordinaten für
eine möglichst elegante Darstellung der Bewegungsgleichungen ist bei vielen Systemen schwierig. Oft müssen zur Beschreibung des Systems bewegliche oder rotierende
Koordinaten eingeführt werden, so dass bei der Aufstellung der Systemgleichungen
Coriolis- oder andere Zwangskräfte berücksichtigt werden müssen. Dies führt oft zu
langen und komplizierten Ausdrücken für die Systemdynamik. Ein weiteres Problem
dabei ist die Abhängigkeit der Objekte von der Wahl der Koordinaten. Um diese
Probleme zu vermeiden, werden die Systeme nicht im euklidischen Raum, sondern
auf dierenzierbaren Mannigfaltigkeiten betrachtet. Die Objekte auf einer Mannigfaltigkeit sind koordinateninvariant, so dass eine koordinatenunabhängige Formulierung der Newtonschen Mechanik möglich ist. Anschlieÿend kann diese Formulierung
in beliebigen Koordinaten dargestellt werden. Koordinatenwechsel stellen dann im
Gegensatz zur klassischen Mechanik kein Problem dar.
Im Folgenden soll ein Beispiel zeigen, wie einem mechanischen System eine dierenzierbare Mannigfaltigkeit zugeordnet wird. Diese gibt dann die Kongurationen des
Systems wieder.
Beispiel 1.2.1
Betrachtet werden die Kongurationen eines starren Körpers in der
Ebene (siehe Abbildung 1.1). Um die Lage des starren Körpers zu identizieren, wird
ein Referenzpunkt benötigt, von dem aus Abstände und Winkel gemessen werden.
Dazu wird in der Ebene ein inertiales Referenzsystem
mit orthogonalen Vektoren
s1
und
s2
1
Σspatial = (Ospatial , {s1 , s2 })
festgelegt . Zur eindeutigen Festlegung der
Lage muss sowohl die Position als auch die Orientierung festgestellt werden. Es wird
somit ein körperfestes Koordinatensystem
Vektoren
b1
und
b2 ,
Σbody = (Obody , {b1 , b2 }) mit orthogonalen
das sich mit dem Körper bewegt, gewählt. Die Angabe der
Position des starren Körpers erfolgt über den Vektor
der relativ zur Basis
einer Matrix
1 Im
R
r = (x, y) = Obody − Ospatial ,
{s1 , s2 } angegeben wird. Die Orientierung des Körpers wird mit
i-te Spalte die Komponenten von bi in der Basis
bestimmt, deren
inertiales Referenzsystems gelten Newtons und Eulers Gesetze der Bewegung.
3
Kapitel 1.
Einleitung
1.3
Abbildung 1.1.: Ein ebener starrer Körper (vgl. [5])
{s1 , s2 }
beinhaltet. Sie ist von der Form
R(t) =
cos θ(t) sin θ(t)
− sin θ(t) cos θ(t)
,
θ der Winkel ist, um den der Körper und damit Σbody gegen den Uhrzeigersinn
rotiert. Ist r der Vektor zu einem Punkt auf dem Körper, so beschreibt r̃ = R · r
diesen Punkt nach einer Drehung um θ gegen den Uhrzeigersinn. R ist eine orthogonale Matrix mit det R(t) = 1 und gehört damit zu der speziellen orthogonalen
2×2
Gruppe SO(2) = {R ∈ R
| RRT = 1, det R(t) = 1}.
wobei
Demzufolge wird die Lage des starren Körpers eindeutig durch
cos θ(t) sin θ(t)
− sin θ(t) cos θ(t)
, (x, y) ∈ SO(2) × R2
beschrieben, und die Kongurationsmannigfaltigkeit des Systems ist Q = SO(2) ×
R2 . SO(2) kann dabei mit der Einheitssphäre S 1 = {x ∈ R2 | kxk = 1} identiziert
werden.
Bei der Behandlung von Systemen auf dierenzierbaren Mannigfaltigkeiten muss auf
Hilfsmittel auÿerhalb des Arbeitsgebietes der nichtlinearen Kontrolltheorie zurückgegrien werden. Dabei werden physikalische Objekte der Mechanik wie z.B. der
Kongurationsraum durch mathematische Objekte der Dierentialgeometrie - hier
einer dierenzierbaren Mannigfaltigkeit - repräsentiert. Die präzise Repräsentation
physikalischer durch dierentialgeometrischer Gröÿen wird in Abschnitt 5.2 behandelt.
Die Behandlung mechanischer Systeme im Rahmen der Dierentialgeometrie wird
auch geometrische Mechanik genannt.
4
Kapitel 1.
Einleitung
1.3
1.3. Methoden und Struktur
Für eine dierentialgeometrische Behandlung des Problems werden in Kapitel 2 die
wesentlichen Grundlagen zur Dierentialgeometrie beschrieben. Die Theorie des af-
nen Zusammenhanges ist bei der Modellierung mechanischer Kontrollsysteme von
besonderer Bedeutung. Sie ermöglicht die kovariante Ableitung tensorieller Gröÿen.
Aufbauend auf diese Theorie wird in Kapitel 3 ein spezielles Variationsprinzip für
dierentialgeometrische Berechnungen vorgestellt. Dabei werden mit Hilfe der kovarianten Ableitung Variationen der Positionen und Variationen der Geschwindigkeiten durch dem anen Zusammenhang zugehörige Tensoren in Relation gesetzt.
Dieses Variationsprinzip ist ein wichtiger Bestandteil für die Lösung des optimalen
Kontrollproblems.
Da die Lösung auf ein Randwertproblem führt, wird in Kapitel 4 eine numerische
Methode zur Lösung solcher Randwertprobleme erläutert.
Kapitel 2 bis 4 stellen die Grundlagen für die Behandlung der geometrischen Mechanik und der optimalen Kontrolltheorie aus Kapitel 5 bereit. Zunächst werden
zur Entwicklung des mathematischen Modells die dierentialgeometrischen Objekte
des Problems abgeleitet, welche den physikalischen Objekten entsprechen: Bestimmung der Kongurationsmannigfaltigkeit, Auswahl von Koordinaten, Bestimmung
einer aus der kinetischen Energie des Systems resultiernden Riemannschen Metrik
und Modellierung der das System angreifenden Kräfte. Darauf aufbauend werden
mit Hilfe eines Lagrangeprinzips die Bewegungsgleichungen des Systems aufgestellt.
Dabei besteht die Lagrange-Funktion aus der kinetischen Energie des Systems in
Form einer Riemannschen Metrik. In den resultierenden Euler-Lagrange Gleichun-
gen erscheint der ane Zusammenhang als Levi-Civita Zusammenhang. Diese Modellierung führt auf eine kovariante Formulierung von Newtons Gesetz
F = ma,
die
zudem koordinatenunabhängig ist.
Für das entwickelte mathematische Modell werden Steuerbarkeitskriterien mit Hilfe
eines symmetrischen Produktes und anschlieÿend ein Verfahren zur optimalen Kontrolle vorgestellt. Dazu wird das Variationsprinzip zusammen mit der Methode der
Lagrange-Multiplikatoren folgendermaÿen verwendet:
Das optimale Kontrollproblem stellt ein Optimierungsproblem einer geeignet gewählten Kostenfunktion mit Nebenbedingungen dar. Dabei entsprechen die Nebenbedingungen den Bewegungsgleichungen des mechanischen Systems. Diese sind meist
Dierentialgleichungen zweiter Ordnung. Anstatt die Bewegungsgleichungen als ein
System erster Ordnung darzustellen und dabei die Anzahl der Nebenbedingungen
zu verdoppeln, werden die Nebenbedingungen in ihrer natürlichen Form - als Nebenbedingung zweiter Ordnung - eingearbeitet. Es wird eine Formulierung der EulerLagrange Gleichungen abgeleitet, indem der passend auf diese Situation zugeschnittene Variationsansatz verwendet wird. Während der Optimierung wird untersucht,
wie Variationen der Position Variationen in der Geschwindigkeit induzieren anstatt
unabhängige Variationen der beiden zu betrachten. Die Bewegungsgleichungen für
die adjungierten Variablen sind dann Dierentialgleichungen zweiter Ordnung, die
5
Kapitel 1.
Einleitung
1.4
durch Verwendung der kovarianten Ableitung bestimmt werden. Auf diese Weise
erben die adjungierten Variablen die geometrische Struktur der Systemdynamik der
Körper. Dieser Ansatz hat rechnerische Vorteile, denn die Anzahl der adjungierten
Variablen wird halbiert.
Die erarbeitete Theorie wird anschlieÿend auf den Verbund starrer Körper angewandt.
Der Begri Verbund wird zunächst vernachlässigt, da mehr Bedeutung auf den Begri optimale Kontrolle gelegt wird. In Kapitel 6 liegt das Hauptaugenmerk auf
der optimalen Kontrolle eines einzelnen starren Körpers. Für dieses System werden
die in Kapitel 5 vorgestellten Schritte durchgeführt, so dass durch die Bestimmung
der dierentialgeometrischen Objekte ein mathematisches Modell erhalten wird. Die
Steuerbarkeitskriterien werden hier erstmals anschaulich auf dieses Modell angewandt. Weiterhin wird das Randwertproblem bestehend aus einem System gewöhnlicher Dierentialgleichungen aufgestellt. Dies wird mit der Theorie der LagrangeMultiplikatoren und der Variationsrechnung hergeleitet.
In Kapitel 7 erfolgt die Betrachtung des Verbundes der Starrkörper und dessen
optimale Kontrolle. Dabei wird sich auf einen Verbund von zwei bzw. drei Körpern
beschränkt. Analog zu Kapitel 6 werden nun die Aussagen für den Verbund beschrieben. Da die Körper nicht über ihre Dynamik miteinander gekoppelt sind, verlaufen
viele Schritte analog zu denen eines einzelnen starren Körpers. Die Rechnungen
beinhalten z.B. die Bestimmung der Objekte der Dierentialgeometrie, das Aufstellen der Bewegungsgleichungen, die Überprüfung auf Steuerbarkeit und die optimale
Kontrolle mit der Methode der Lagrange-Multiplikatoren. Allerdings sind die Körper des Verbundes über die Nebenbedingungen an die Endkonguration miteinander
gekoppelt, so dass völlig neue Endbedingungen für das resultierende Randwertproblem betrachtet werden müssen.
Das Bewegungsverhalten der Systeme aus Kapitel 6 und 7 wird mit Hilfe von MATLAB 6.1 simuliert. Die Ergebnisse sind jeweils am Ende des Kapitels dargestellt.
1.4. Übersicht der einzelnen Kapitel
•
Kapitel 2: Vorstellung der Terminologie der Dierentialgeometrie, die in der
gesamten Arbeit verwendet wird.
•
Kapitel 3: Einführung der Grundlagen zur Variationsrechnung, die zur Aufstellung der Systemgleichungen und zur optimalen Kontrolle notwendig sind.
•
Kapitel 4: Vorstellung der Kollokationsmethode - ein numerischer Ansatz zur
Lösung von Randwertproblemen.
•
Kapitel 5: Modellierung eines mechanischen Kontrollsystems, Überprüfung auf
Steuerbarkeit und Vorstellung einer Lösungsstrategie zur Generierung energieoptimaler Trajektorien.
6
Kapitel 1.
•
Einleitung
1.4
Kapitel 6: Anwendung der Theorie aus Kapitel 5 auf das System eines einzelnen
starren Körpers und Vorstellung der Ergebnisse.
•
Kapitel 7: Anwendung der Theorie aus Kapitel 5 auf einen Verbund mehrerer
starrer Körper und Vorstellung der Ergebnisse.
•
Kapitel 8: Zusammenfassung der Ergebnisse der Arbeit und Motivation möglicher zukünftiger Forschungsarbeiten.
7
2. Grundlagen zur
Dierentialgeometrie
Wie schon in der Einleitung beschrieben, werden die mechanischen Kontrollsysteme
dierentialgeometrisch behandelt. In diesem Kapitel wird eine Übersicht der wesentlichen Hilfsmittel der Dierentialgeometrie vorgestellt, die im Rahmen dieser Arbeit
benötigt werden.
Die Ausführungen hier beruhen im Wesentlichen auf [5] und [8]. Für eine ausführliche Behandlung dieses Themas wird auf [5], [8] und [12] verwiesen.
Zunächst wird noch einmal erläutert, warum eine dierentialgeometrische Behandlung mechanischer Systeme sinnvoll ist.
Eines der grundlegenden Objekte in der Dierentialgeometrie sind die dierenzierbaren Mannigfaltigkeiten. Anschaulich sehen sie lokal betrachtet wie oene Mengen im
euklidischen Raum aus. Ein wesentlicher Unterschied ist allerdings, dass alle Objekte, die verwendet werden, koordinatenunabhängig sind. Diese Koordinatenunabhängigkeit der Mannigfaltigkeiten ist vor allem aus physikalischen Gründen wichtig: Ein
physikalisches Problem wird typischerweise von physikalischen Daten begleitet und
normalerweise beinhalten diese Daten keine spezielle Menge von Koordinaten. Viele
Benutzer legen bestimmte Koordinaten fest, obwohl diese manchmal für die eigentliche physikalische Problemstellung ungeeignet sind. In dem betrachteten Beispiel
wird ebenfalls ein festgelegtes Koordinatensystem gewählt. Dies ist unkompliziert,
da aufgrund der koordinatenunabhängigen Formulierung auf Mannigfaltigkeiten nur
koordinateninvariante Objekte verwendet werden.
Zusammenfassend lässt sich sagen, dass bei der Wahl der Dierentialgeometrie als
Werkzeug die Koordinateninvarianz die Konsequenz ist. Dies ist eine der Hauptmotivationen für eine dierentialgeometrische Behandlung.
2.1. Mannigfaltigkeit und Abbildungen zwischen
Mannigfaltigkeiten
In diesem Abschnitt wird das grundlegende Objekt der Dierentialgeometrie, die
dierenzierbare Mannigfaltigkeit, eingeführt.
8
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Denition 2.1.1 (Dierenzierbare Mannigfaltigkeit)
2.1
Eine dierenzierbare
Mannigfaltigkeit der Dimension n ist eine Menge Q und eine Familie injektiver Abn
n
bildungen qα : Uα ⊂ Q → R von Mengen Uα von Q in den R , so dass:
1.
S
Uα = Q,
α
2. für jeden nichtleeren Durchschnitt Uα ∩ Uβ ist qi (Uα ∩ Uβ ), i = α, β , eine oene
−1
n
Teilmenge des R , und die Abbildung qα ◦ qβ : qβ (Uα ∩ Uβ ) → qα (Uα ∩ Uβ ) ist
eine glatte Funktion.
Abbildung 2.1.: Koordinatenkarten auf einer dierenzierbaren Mannigfaltigkeit (vgl.
[5])
Die Paare
(Uα , qα ) in der Denition werden Koordinatenkarten und die Abbildungen
qα
Koordinatenfunktionen oder lokale Koordinaten genannt. Eine Familie von Kar1. und 2. aus 2.1.1 erfüllen, heiÿt Atlas, und die Abbildungen qα ◦ qβ−1 sind
Koordinatentransformationen.
ten, die
V eines Punktes p in einer Mannigfaltigkeit Q ist eine
n
Teilmenge des Denitionsbereiches U einer Koordinatenkarte q : U ⊂ Q → R , so
n
dass q(V ) oen im R ist. Vereinigungen von Koordinatenumgebungen denieren
Eine Koordinatenumgebung
die oenen Mengen in
Q.
Diese oene Mengen bilden eine Topologie.
Ein nützlicher Gesichtspunkt ist es,
Q
als eine Menge zu betrachten, die durch eine
1
n
Ansammlung von Koordinatenkarten mit den lokalen Koordinaten (q , ..., q ) überdeckt ist. Sie besitzt die Eigenschaft, dass alle Koordinatentransformationen glatte
1
n
Abbildungen sind. (q , ..., q ) wird dann auch lokales Koordinatensystem genannt.
9
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Bemerkung 2.1.1
R3
2.1
Eine dierenzierbare Mannigfaltigkeit der Dimension zwei im
ist eine reguläre Fläche.
Der euklidische Raum
Rn
mit der Identität als Atlas ist ein triviales Beispiel für eine
dierenzierbare Mannigfaltigkeit. Ein nichttriviales Beispiel ist das folgende:
Beispiel 2.1.1 (Die Sphäre)
Betrachte die Sphäre
S 2 = {(x, y, z)T ∈ R3 | x2 + y 2 + z 2 = 1}.
S2
Abbildung 2.2.: Die
Sphäre
Setze nun
U1 := S 2 \{(0, 0, 1)}
und
U2 := S 2 \{(0, 0, −1)}
U1
ist die Sphäre ohne den Nordpol und
U2
ist die Sphäre ohne den Südpol.
Deniere
2
2
q1 : U1 ⊂ S → R ,
(x, y, z) 7→
x
y
,
1−z 1−z
und
2
2
q2 : U2 ⊂ S → R ,
Es gilt
qi (Ui ) = Rn \{0}, i ∈ 1, 2,
(x, y, z) 7→
T
.
und die Koordinatentransformation ist durch
(q2 ◦ q1−1 )(y) =
für
x
y
,
1+z 1+z
T
y
kyk2
y ∈ Rn \{0} gegeben. Diese Abbildung ist glatt, und mit S 2 = U1 ∪ U2
dierenzierbare Mannigfaltigkeit der Dimension zwei.
ist
S2
eine
10
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Abbildung 2.3.: Stereographische Koordinaten für
2.2
S1
(vgl. [5])
Als Konsequenz macht es Sinn, von dierenzierbaren Abbildungen auf dierenzierbaren Mannigfaltigkeiten zu sprechen.
Denition 2.1.2 (Dierenzierbarkeit von Abbildungen)
ferenzierbare Mannigfaltigkeiten. Eine Abbildung ϕ : Q1 →
m
falls zu einer gegebenen Karte y : V ⊂ Q2 → R
eine Karte
ϕ(U ) ⊂ V
Seien
Q1 und Q2 dif-
Q2 ist dierenzierbar,
x : U ⊂ Q1 → Rn mit
existiert, so dass die Abbildung
y ◦ ϕ ◦ x−1 : x(U ) → y(V )
dierenzierbar ist.
Aus Bedingung
2.
von Denition 2.1.1 folgt, dass die obige Denition unabhängig
von der Wahl der lokalen Koordinaten ist.
2.2. Tangentialvektor und Tangentialbündel
Als nächstes wird die Idee des Tangentialvektors auf dierenzierbaren Mannigfal3
tigkeiten behandelt. Wird eine Fläche im R betrachtet, so ist der Tangentialvektor
3
im Punkt p als die Geschwindigkeit einer Kurve im R durch p deniert. Es muss
also eine charakteristische Eigenschaft des Tangentialvektors gefunden werden, die
die Idee der Geschwindigkeit wiedergibt.
Die folgenden Betrachtungen sollen die Denition des Tangentialvektors motivieren:
n
n
Sei c : I ⊂ R → R mit 0 ∈ I eine dierenzierbare Kurve in R mit c(0) = p. In
11
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.2
Abbildung 2.4.: Dierenzierbare Abbildung (vgl. [8])
12
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.2
Koordinaten gelte
c(t) = (q 1 (t), ..., q n (t)), t ∈ I, (q 1 , ..., q n ) ∈ Rn .
c0 (0) = (q̇ 1 (0), ..., q̇ n (0)) = v ∈ Rn .
p denierte dierenzierbare Funktion. f kann
Dann gilt
f
Sei
eine auf einer Umgebung von
dann auf die Kurve c eingeschränkt
v ∈ Rn wird dann als
werden. Die Richtungsableitung bezüglich des Vektors
n
n
X
X ∂f dcj
◦ c)
(0) =
(0) =
dt
∂q i dt
i=1
d(f
v
ausgedrückt. Die Richtungsableitung bezüglich
v
ferenzierbaren Funktionen, der nur von
i=1
∂
q̇ (0) i
∂q
!
i
f
(2.1)
ist also ein Operator auf den dif-
abhängt. Dies ist die charakteristische
Eigenschaft des Tangentialvektors, die die Idee der Geschwindigkeit wiedergibt.
Denition 2.2.1 (Kurve in einer Mannigfaltigkeit)
Q eine dierenzierbac : I ⊂ R → Q wird (dieren-
re Mannigfaltigkeit. Eine dierenzierbare Funktion
zierbare) Kurve in
Q
Sei
genannt.
Während der gesamten Arbeit wird angenommen, dass
Denition 2.2.2 (Tangentialvektor)
gilt.
D(p) die Menge der dierenzierbaren Funktionen deniert auf einer Umgebung von p. Sei c : I → Q, t 7→ c(t)
eine dierenzierbare Kurve mit c(0) = p. Der Tangentialvektor an eine Kurve c in
t = 0 ist eine Funktion c0 (0) : D(p) → R deniert durch
c0 (0)f =
Der Tangentialvektor in
Q
mit
c(0) = p.
p
Sei
p∈Q
0∈I
◦ c)
(0),
dt
d(f
und
f ∈ D.
ist der Tangentialvektor in
t=0
Die Menge aller Tangentialvektoren von
c:I →
mit Tp Q
an eine Kurve
Q
in
p
wird
bezeichnet.
Seien
q 1 , ..., q n
die Koordinaten der Kurve
c0 (0)f =
=
d(f ◦c)
dt (0)
n
P
i
q̇ (0)
i=1
d.h. der Vektor
c0 (0)
=
c,
so gilt in Koordinaten
df (q 1 ,...,q n )
(0)
dt
∂f
∂q i
=
n
P
i
q̇ (0)
i=1
∂
∂q i
f,
p
kann in Koordinaten als
0
c (0) =
n
X
i=1
i
q̇ (0)
∂
∂q i
(2.2)
p
13
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.3
ausgedrückt werden. Der Ausdruck (2.2) zeigt, dass der Tangentialvektor an eine
c nur von der Ableitung von c in einem Koordinatensystem abhängt. Die
Menge Tp Q bildet mit den gewöhnlichen Operationen von Funktionen einen Vekn
torraum der Dimension
Wahl einer
Koordinatenfunktion q : U ⊂ Q → R
n. Die
∂
1
bestimmt eine Basis
, ..., ∂q∂n
in Tp Q. Die lineare Struktur in Tp Q
∂q 1
Kurve
p
p
q ab. Der Vektorraum Tp Q der Tanp wird Tangentialraum von Q in p genannt. Ein Beispiel für einen
Tangentialraum ist in Abbildung 2.5 zu sehen. Die n-Tupel bestehend
aus den Zahlen
Pn i ∂ 1
1
n
n
v = q̇ (0), ..., v = q̇ (0) heiÿen Komponenten des Vektors i=1 v ∂qi bezüglich
hängt dabei nicht von der Koordinatenfunktion
gentialvektoren in
p
des lokalen Koordinatensystems
q 1 , ..., q n .
Abbildung 2.5.: Der Tangentialraum von
S2
im Punkt
p
(vgl. [2])
(p, v), p ∈ Q, v ∈ Tp Q bildet eine 2n-dimensionale Man2
Tangentialbündel genannt und mit T Q bezeichnet. Das Tan-
Die Gesamtheit aller Paare
nigfaltigkeit, wird
gentialbündel ist der natürliche Raum, mit dem gearbeitet wird, wenn Fragen zu
Positionen und Geschwindigkeiten behandelt werden, wie es in der Mechanik meist
der Fall ist.
Beispiel 2.2.1 (n-Sphäre)
n
Das Tangentialbündel einer n-Sphäre S ist die GeP
P
n+1
n+1
samtheit aller Punkte (p, v) in R
× Rn+1 , so dass i=1 p2i = 1 und n+1
i=1 pi vi = 0
1
1
1
gelten. Für n = 1 entspricht T S dabei S × R (siehe Abbildung 2.6).
1 Der
Index p verdeutlicht, dass ein Koordinatensystem in einer Umgebung von p betrachtet wird.
Wenn keine Verwechslungsmöglichkeit besteht, kannSdieser entfallen.
2 In der Literatur wird auch oft die Denition T Q =
Tp Q angegeben.
p∈Q
14
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.3
Abbildung 2.6.: Das Tangentialbündel von
S1
(vgl. [11])
2.3. Kovektor und Kotangentialbündel
Ist
f : Q1 → Q2
eine glatte Abbildung, so ist sie in jedem Punkt
zierbar, und man erhält eine Abbildung
Tp f : Tp Q1 → Tf (p) Q2 .
p ∈ Q1
dieren-
Diese Konstruktion
führt auf die folgende Denition:
Denition 2.3.1 (Dierential)
: Tp Q1 →
Tf (p) Q2 ist das Dierential von f und ist folgendermaÿen deniert: Zu v ∈ Tp Q1
0
wird eine Kurve c : I → Q1 mit c(0) = p und c (0) = v deniert. Dann ist df (p) · v
der Geschwindigkeitsvektor in t = 0 der Kurve f ◦ c : R → Q2 mit
Die lineare Abbildung df mit df (p)
df (p)
Der Vektor df (p)
·v
·v =
◦ c)
(0).
dt
d(f
ist unabhängig von der Kurve
c
und hängt nur vom Vektor
v
ab.
v ∈ Tp Q1 wird eine Kurve c(t) in Q1 gewählt, so
c(t) in p = c(0) ist. Dann ist df (p) · v der
Vektor tangential an die Kurve f (c(t)) in f (p) = f (c(0)).
Ist q die Koordinatendarstellung der Kurve c, dann ist die Richtungsableitung df (q)·v
mit q ∈ Q und v ∈ Tq Q durch
Mit anderen Worten: Zu jedem
dass der Vektor
v
tangential zu der Kurve
df (q)
mit
v=
n
P
i=1
v i ∂q∂ i
·v =
n
X
∂f i
v
i
∂q
i=1
gegeben.
15
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.3
Abbildung 2.7.: Das Dierential (vgl. [10])
Beispiel 2.3.1 (Dierential)
A : R3 → R3 eine orthogonale lineare Abbil2
2
2
dung. Setze f : S → S , f := A|S 2 , und sei p ∈ S . Es wird nun das Dierential
2
von f in p berechnet. Sei dazu c : I → S eine dierenzierbare Kurve mit c(0) = p
0
2
und c (0) = v ∈ Tp S . Wegen der Linearität von A gilt
Sei
◦ c)
d(A ◦ c)
(0) =
(0)
dt
d
t
d
= A◦
c (0)
dt
= A(v).
d(f
Somit ist df (p)
Es gilt df (p)
= A|Tp S 2 : Tp S 2 → TAp S 2 .
∈ Tp∗ Q1 ,
wobei
Tp∗ Q1
der Dualraum des Vektorraums
wird auch der Raum der Kovektoren in
TAp S 2 .
Wird jeder Vektorraum
Tp Q
p
Tp Q1
ist. Dieser
Tp∗ S 2 =
genannt. Für Beispiel 2.3.1 gilt
durch seinen Dualraum
Tp∗ Q
ersetzt, so ergibt sich
2n-dimensionale Mannigfaltigkeit, die Kotangentialbündel genannt und mit T ∗ Q
∂
i
bezeichnet wird. Die duale Basis zu
wird mit dq bezeichnet. Zu der Wahl eines
∂q i
eine
Koordinatensystems ergibt sich dann die Basisformulierung
df (p)
=
X ∂f
i
dq
i
∂q
i
16
Kapitel 2.
Grundlagen zur Dierentialgeometrie
für jede glatte Abbildung
2.4
f : Q1 → Q2 .
bare Form vom Grad 1) genannt. Jede 1-Form
j
beschrieben werden, wobei die Funktionen
b
ω
p
wird 1-Form (oder dierenzierP j j
kann eindeutig durch ω =
j b dq
Eine Zuordnung eines Kovektors zu einem Punkt
die Komponenten von
ω
sind.
Das natürliche Skalarprodukt zwischen Vektoren und 1-Formen wird mit
zeichnet, und es gilt
D
∂
, dq j
∂q i
E
=
h·, ·i
be-
δji .
2.4. Vektorfeld und Lie Klammer
Mit Hilfe der Notation des Tangentialbündels kann der Begri des Vektorfeldes
deniert werden:
Denition 2.4.1 (Vektorfeld)
Ein Vektorfeld X auf einer dierenzierbaren Man-
Q ordnet jedem Punkt p ∈ Q einen Vektor X(p) ∈ Tp Q zu. X
eine Abbildung von Q in das Tangentialbündel T Q.
X ist dierenzierbar, falls die Abbildung X : Q → T Q dierenzierbar ist.
nigfaltigkeit
ist somit
Ein Vektorfeld ordnet also jedem Punkt auf der Mannigfaltigkeit einen Vektor zu,
der in diesem Punkt tangential an die Mannigfaltigkeit ist.
Beispiel 2.4.1 (Newtons Gravitationsgesetz)
Betrachtet wird ein Vektorfeld,
R3 die Mannig-
das durch Newtons Gesetz der Schwerkraft bestimmt ist. Hierbei ist
faltigkeit, und das Vektorfeld wird durch
F (x, y, z) = −
beschrieben, wobei
m
mM G
r
r3
die Masse des Testkörpers,
pG die Gravitationskonstante, r der Vektor
(x2 + y 2 + z 2 ) ist (siehe Abbildung 2.8).
pers,
r=
Sei
q : U ⊂ Q → Rn
M
die Masse des zentralen Kör-
vom Ursprung zu
(x, y, z)
und
ein lokales Koordinatensystem, so gilt
X(p) =
n
X
i=1
ai (p)
∂
,
∂q i
i
wobei
n
o die Funktionen a : U → R die Komponenten des Vektorfeldes X sind und
∂
, i = 1, ..., n, die zu q gehörige Basis ist. X ist genau dann dierenzierbar,
∂q i
wenn die Funktionen
ai
für irgendeine Karte dierenzierbar sind.
17
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.4
Abbildung 2.8.: Das Gravitationskraftfeld (vgl. [3])
X : D → F von
D der dierenzierbaren Funktionen auf Q in die Menge F der Funktionen
Gelegentlich ist es zweckmäÿig, das Vektorfeld als eine Abbildung
der Menge
auf
Q
zu betrachten. Sie ist durch
(Xf )(p) =
n
X
i=1
ai (p)
∂f
(p) = df (p) · X(p)
∂q i
deniert und heiÿt Richtungsableitung von f nach dem Vektorfeld X in Richtung p.
X
X
D
X zu
betrachten. Wenn z.B.
und Y dierenzierbare Felder auf Q sind und f : Q → R
eine dierenzierbare Funktion ist, so können die Funktionen X(Y f ) und Y (Xf )
Die Interpretation von
als ein Operator auf
erlaubt es, Iterationen von
betrachtet werden.
Diese Überlegung führt auf den Begri der Lie Klammer, welche später zum Nachweis der Steuerbarkeit mechanischer Systeme herangezogen wird.
Denition 2.4.2 (Lie Klammer)
Seien
X
und
Y
dierenzierbare Vektorfelder,
dann ist ihre Lie Klammer als
[X, Y ]f = XY f − Y Xf
deniert.
[X, Y ]
Das Vektorfeld
ist dann wieder ein dierenzierbares Vektorfeld.
[X, Y ]
ist eindeutig und in lokalen Koordinaten durch folgende Be-
ziehungen gegeben:
18
Kapitel 2.
Seien
Grundlagen zur Dierentialgeometrie
X(q) =
n
P
i=1
und
[X, Y ](q) =
ai (q 1 , ..., q n ) ∂q∂ i , Y (q) =
n
P
j=1
n
P
j=1
2.4
bj (q 1 , ..., q n ) ∂q∂ j
cj (q 1 , ..., q n ) ∂q∂ j .
Dann gilt
XY f = X
X
j
X
Y Xf = Y
i
Und somit folgt
j
c =
∂f
b
∂q j
!
∂f
ai i
∂q
!
j
n
X
i=1
ai
=
i=1
∂
und
∂q i
Y =
n
P
j=1
ai
2
X
∂bj ∂f
i j ∂ f
+
a
b
,
∂q i ∂q j
∂q i ∂q j
i,j
bj
∂ai ∂f X i j ∂ 2 f
+
ab
.
i ∂q j
∂q j ∂q i
∂q
i,j
i,j
=
X
i,j
j
∂bj
i ∂a
−
b
,
∂q i
∂q i
Beispiel 2.4.2 (Satz von Schwarz)
n
P
X
Sind
X
j = 1, 2, ..., n.
und
Y
Koordinatenfelder, d.h.
X=
∂
, so verschwindet die Lie Klammer, denn es gilt
∂q j
"
n
n
X
∂f X ∂f
[X, Y ]f =
,
∂q i j=1 ∂q j
i=1
#
= 0.
Dies ist nichts anderes als der Satz von Schwarz aus der Analysis.
Interpretation der Lie Klammer
Um die Bedeutung der Lie Klammer entsprechend zu [10] geeignet zu interpretieren,
muss zunächst der Begri des Flusses eines Vektorfeldes erläutert werden:
X ein dierenzierbares Vektorfeld auf einer dierenzierbaren Mannigfaltigkeit
Q und p ∈ Q. Dann existiert eine oene Umgebung U ⊂ Q von p, ein Intervall
I und eine dierenzierbare Abbildung ϕX : I × U → Q, so dass die Kurve t →
X
ϕX (t, q), t ∈ I, q ∈ Q, die einzige Kurve ist, die die Bedingung ∂ϕ∂t = X(ϕX (t, q))
X
0
mit ϕ (0, q) = q erfüllt. Eine Kurve c : I → Q, die den Bedingungen c (t) = X(c(t))
und c(0) = q genügt, wird Trajektorie des Vektorfeldes X genannt, die für t = 0
X
X
durch den Punkt q verläuft. Es ist üblich, die Notation ϕt (q) = ϕ (t, q) zu verwenX
den und ϕt : U → Q den lokalen Fluss von X zu nennen.
Seien nun X und Y glatte Vektorfelder auf Q und p ∈ Q. Eine Kurve c in Q sei
Seien
durch
◦ ϕ−X
◦ ϕYt ◦ ϕX
c(t) = ϕ−Y
t
t
t (p)
deniert. Dann gilt
c0 (0) = [X, Y ](p).
19
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.4
Abbildung 2.9.: Die Fluss-Interpretation der Lie Klammer (vgl. [5])
Ist
[X, Y ] nicht im Erzeugnis von X und Y ,
X und Y eine Bewegung in eine neue
von
so wird durch Verknüpfung der Flüsse
unabhängige Richtung erzeugt. Diese
Art der Interpretation der Lie Klammer spielt eine groÿe Rolle bei der Steuerbarkeit
nichtlinearer Kontrollsysteme. Dies wird in Kapitel 5.3 näher erläutert.
Das bisherige Konzept von Vektorfeldern reicht für nachfolgende Betrachtungen
nicht aus. Ist beispielsweise gewünscht, das Geschwindigkeitsfeld einer Kurve zu
betrachten, die in einer Fläche verläuft, so ist das bisherige Konzept von Vektorfeldern nicht passend. Zum einen ist das Geschwindigkeitsfeld nicht auf der ganzen Fläche, sondern nur längs der Kurve deniert. Zum anderen kann die Kurve
Selbstdurchdringungen besitzen, so dass der Geschwindigkeitsvektor in einem solchen Selbstschnittpunkt unterschiedliche Werte annimmt. Aufgefasst als Vektorfeld
auf der Fläche wäre dieses in solchen Punkten nicht eindeutig festgelegt. Daher wird
folgendes deniert:
Denition 2.4.3 (Vektorfeld entlang einer Kurve)
V entlang
t ∈ I einen
Ein Vektorfeld
c : I → Q ist eine dierenzierbare Abbildung, die jedem
V (t) ∈ Tc(t) Q zuordnet. V ist dierenzierbar, wenn für jede dierenzierbare Funktion f auf Q die Funktion t → V (t)f eine dierenzierbare Funktion
auf I ist.
einer Kurve
Tangentialvektor
20
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Beispiel 2.4.3 (Geschwindigkeitsvektorfeld)
dc
dt ist ein solches Vektorfeld längs
2.5
Das Geschwindigkeitsvektorfeld
c.
Für die Bestimmung der Ableitung von Vektorfelder wird das Konzept des anen
Zusammenhanges benötigt. Zuvor ist es allerdings notwendig, noch die Theorie von
Tensoren einzuführen. Eine gute Einführung dazu wird in [1] gegeben.
Von nun an bezeichne
re Dualmenge auf
X (Q)
die Menge aller glatten Vektorfelder und
X ∗ (Q)
ih-
Q.
2.5. Tensor und Tensorfeld
Die Notation des Tensors ist ein nützliches Objekt in der Dierentialgeometrie. Die
Idee eines Tensors ist die Verallgemeinerung der Idee von Vektorfeldern.
Denition 2.5.1 (Tensor der Ordnung (r, s))
auf einer
n-dimensinalen
Mannigfaltigkeit
Q
Ein Tensor
T
der Ordnung
(r, s)
ist eine multilineare Abbildung
T : X ∗ (Q) × ... × X ∗ (Q) × X (Q) × ... × X (Q) → R.
|
{z
} |
{z
}
r Faktoren
s Faktoren
Zu gegebenen
Y1 , ..., Yr ∈ X ∗ (Q)
und
X1 , ..., Xs ∈ X (Q) ist T (Y1 , ..., Yr , X1 , ..., Xs )
Q ist. Multilinear bedeutet, dass T linear
somit eine dierenzierbare Funktion auf
in allen
r+s
Argumenten ist.
Der Raum der Tensoren auf
Q
bildet einen Vektorraum und wird mit
Trs (Q)
be-
zeichnet.
Eine Basisoperation der Tensoren ist das Tensorprodukt zweier Tensoren
r1 +r2
r
und T2 ∈ Ts 2 . Dieses ergibt einen Tensor T1 ⊗ T2 ∈ Ts1 +s2 wie folgt:
T1 ∈ Tsr11
2
(T1 ⊗ T2 )(Y1 , ..., Yr1 , Ỹ1 , ..., Ỹr2 , X1 , ..., Xs1 , X̃1 , ..., X̃s2 )
= T1 (Y1 , ..., Yr1 , X1 , ..., Xs1 ) · T2 (Ỹ1 , ..., Ỹr2 , X̃1 , ..., X̃s2 ).
{ ∂q∂ i } von X (Q) und der Dualbasis {dq j } sind die Komponen,...,ir
nr+s Funktionen Tji11,...,j
s
Zur Koordinatenbasis
ten von
T
durch die
,...,ir
Tji11,...,j
= T (dq i1 , ..., dq ir ,
s
∂
∂
,
...,
)
j
∂q 1
∂q js
deniert. Die Koordinatendarstellung eines Tensors ist dann
T =
X
i1 ,...,ir ,j1 ,...,js
,...,ir
Tji11,...,j
s
∂
∂
⊗ ... ⊗ ir ⊗ dq j1 ⊗ ... ⊗ dq js .
i
1
∂q
∂q
21
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.6
Beispiel 2.5.1 ((0,2) Tensor)
Matrix mit den Komponenten
Jedes innere Produkt
h·, ·i
auf
Ist T ein (0, 2) Tensor auf Q, dann ist T
Tij ( ∂q∂ i , ∂q∂ j ).
Q ist ein (0, 2) Tensor.
eine
n×n
Analog zum Vektorfeld wird der Begri des Tensorfeldes eingeführt:
Denition 2.5.2 (Tensorfeld)
Ein Tensorfeld der Ordnung (r, s) ist eine Abbils
dung, die jedem q ∈ Q einen Tensor T (q) ∈ Tr (q) zuordnet, so dass die Tensorkomponenten bezüglich einer Karte um q beliebig oft stetig dierenzierbar sind.
Diese Denition wird hier auch für den Fall
r = s = 0
ausgeweitet: Unter einem
(0, 0) soll eine dierenzierbare Abbildung f : Q → R verR als Mannigfaltigkeit deniert ist, die mit der kanonischen
Dierenzierbarkeitsstruktur von R ausgestattet ist. Ein Tensorfeld vom Grad (0, 0)
Tensorfeld der Ordnung
standen werden, wobei
wird auch als Skalarfeld bezeichnet.
Ein sehr anschauliches Beispiel eines Skalarfeldes aus der Physik ist das eines Temperaturfeldes: Jedem Punkt im Raum (der durch eine Mannigfaltigkeit
Q
beschrieben
wird) wird die dort herrschende Temperatur zugeordnet.
Bemerkung 2.5.1
1-Form
1-Form ist auch klar, dass mit einem
(0, 1) gemeint ist. Ein Vektorfeld ist ein
Nach der Denition einer
Feld ein Tensorfeld der Ordnung
Tensorfeld der Ordnung
(1, 0).
2.6. Theorie des Anen Zusammenhangs
Nach dem Einschub über Tensoren wird sich der Frage gewidmet, wie Vektorfelder
entlang von Kurven dierenziert werden.
3
Seien S ⊂ R eine Fläche und c : I → S eine parametrisierte Kurve in S mit dem
3
Vektorfeld V : I → R entlang c tangential an S . Wird das dierenzierbare VekdV
3
torfeld V naiv abgeleitet, so ergibt sich die Abbildung
dt : I → R . Das Problem
dV
besteht nun darin, dass
dt im Allgemeinen nicht mehr tangential an die Fläche ist.
dV
dV
Dieses Problem wird dadurch gelöst, dass
dt durch die Projektion von dt auf die
Tangentialebene im entsprechenden Kurvenpunkt ersetzt wird. Dieser orthogonal
DV
projizierte Vektor ist die kovariante Ableitung und wird mit
dt bezeichnet.
Die Existenz einer kovarianten Ableitung basiert auf der Möglichkeit eines Vergleiches tensorieller Gröÿen aus verschiedenen Tangentialräumen. Dies erfordert eine
bestimmte Eigenschaft an die Tangentialräume. Die Eigenschaft ist der ane Zu-
sammenhang.
Denition 2.6.1 (Aner Zusammenhang)
ist eine Abbildung
Ein aner Zusammenhang auf
∇ : X (Q) × X (Q) → X (Q), die mit ∇ : X, Y 7→ ∇X Y
Q
bezeichnet
wird und folgende Bedingungen erfüllt:
22
Kapitel 2.
Grundlagen zur Dierentialgeometrie
1.
∇f X+gY Z = f ∇X Z + g∇Y Z ,
2.
∇X (Y + Z) = ∇X Y + ∇X Z ,
3.
∇X (f Y ) = f ∇X Y + X(f )Y ,
mit
X, Y, Z ∈ X (Q),
und
f, g
2.6
glatte Funktionen auf
Q.
Es werden im Folgenden einige Konstruktionen aus [5] vorgestellt, die mit Hilfe des
anen Zusammenhangs gemacht werden können.
Seien
X
vq ∈ Tq Q
und
Y ∈ T Q,
∇vq Y (q) = ∇X Y (q) ∈ Tq Q
Eigenschaft X(q) = vq ist.
dann wird
ein glattes Vektorfeld mit der
deniert, wobei
Eine wichtige Anwendung dieser Beobachtung ist die folgende: Seien
eine Kurve und
Y ∈ T Q.
Dann kann ein Vektorfeld entlang
c
c:I⊂R→Q
durch
I 3 t 7→ ∇c0 (t) Y (c(t)) ∈ Tc(t) Q
deniert werden. Diese Konstruktion macht auch dann Sinn, falls
Y
ein Vektor-
c anstatt auf ganz Q deniert ist. Ist also I 3 t 7→
V (t) ∈ Tc(t) Q ein solches Vektorfeld, so wird ein anderes Vektorfeld entlang c durch
∇c0 (t) V (t) = ∇c0 (t) Y (c(t)) deniert. Hierbei gilt für das Vektorfeld Y die Beziehung
Y (c(t)) = V (t) für alle t ∈ I .
Das Vektorfeld t 7→ ∇c0 (t) V (t) entlang c wird als die kovariante Ableitung von V
entlang c bezeichnet. Dies führt zu folgender Denition:
feld ist, welches nur entlang
Denition 2.6.2 (Kovariante Ableitung)
c(t) eine dierenzierbare Kurve in
Q. Dann existiert eine eindeutige Korrespondenz, die jedem entlang c(t) deniertem
DV
Vektorfeld V ein anderes Vektorfeld
dt , welches die kovariante Ableitung von V
Sei
entlang c genannt wird, zuordnet, so dass gilt:
D
1.
dt (V
2.
dt (f V
D
3. Ist
DV
dt
+ W) =
)=
df
dt V
DV
dt
+
DW
dt .
+ f DV
dt .
V durch ein Vektorfeld Y ∈ X (Q) induziert, d.h. V (t) = Y (c(t)), dann gilt
= ∇ dc Y .
dt
Diese Denition zeigt, dass die Wahl eines anen Zusammenhangs auf
Q
auf eine
Ableitung von Vektorfeldern entlang von Kurven führt. Im Speziellen ist es dann
möglich, über die Beschleunigung einer Kurve in
Beispiel 2.6.1 (Kovariante Ableitung)
Q
zu sprechen.
Gegeben sei die Sphäre
S 2.
Es wird die
kovariante Ableitung des Geschwindigkeitsfeldes der Kurve
c : R → S 2,
23
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.6
c(t) = (cos t, sin t, 0)T
2
beschreibt den Schnitt von S mit der x-y 2
Ebene, d.h. sie durchläuft gerade den Äquator von S . Die gewöhnliche Ableitung
0
T
der Kurve ist c (t) = (− sin t, cos t, 0) und
bestimmt. Die Denition der Kurve
c(t)
c00 (t) = (− cos t, − sin t, 0)T = −c(t).
Daraus ist ersichtlich, dass für jedes
t ∈ R der Vektor c00 (t) senkrecht auf Tc(t) S 2 steht.
Da die kovariante Ableitung die orthogonale Projektion auf den Tangentialraum
darstellt, folgt
Dc0 (t)
≡ 0.
dt
Der ane Zusammenhang und die kovariante Ableitung werden in der Literatur oft
austauschbar benutzt. Sind die Operanden Elemente von
X (Q),
so wird der ane
Zusammenhang benutzt. Sind dagegen die Operanden entlang von Kurven denierte
Vektorfelder, so spricht man von der kovarianten Ableitung.
Aufgrund der Tatsache, dass die kovariante Ableitung die Linearität und eine Produktregel erfüllt, ist sie eine Ableitung im algebraischen Sinne. Eine weitere Besonderheit ist, dass sie ein Element aus
TQ
anstatt aus
TTQ
wiedergibt, da die
Ableitung in den Tangentialraum projiziert wird.
Koordinatendarstellung
X, Y Vektorfelder mit den
P j ∂
Y = y ∂qj , wobei xi , y j glatte
Seien
Koordinatendarstellungen
X=
P
i
Funktionen auf
Q
xi ∂q∂ i
und
sind. Dann gilt
j
∇X Y =
X
i
xi ∇
X
∂
∂q i
j
∂
yj j
∂q
!
=
X
i,j
xi y j ∇
X ∂y j ∂
∂
+
xi i j .
∂q j
∂q ∂q
i,j
∂
∂q i
∇ ∂ i ∂q∂ j = Γkij ∂q∂k , so sind die Γkij dierenzierbare Funktionen, und mit
∂q
k
P
k
i ∂y k
X(y ) = x ∂qi folgt, dass der ane Zusammenhang die Koordinatendarstellung
Setzt man
P
i
!
∇X Y =
X X
k
hat. Dabei sind die Funktionen
Γkij
xi y j Γkij + X(y k )
i,j
auf
Q
∂
∂q k
die sogenannten Christoel-Symbole.
Die Christoel-Symbole bestimmen gerade die Korrekturterme, die den Unterschied
24
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.6
der gewöhnlichen Ableitungen der Koezientenfunktionen und der kovarianten Ableitung ausmachen.
Die Notation des anen Zusammenhangs führt zur Denition einer Geodätischen
eines anen Zusammenhangs
0
die die Gleichung ∇c0 (t) c (t) =
∇. Die Geodätische
0 erfüllt.
ist diejenige Kurve
c : I → Q,
Für viele Kontrollprobleme wird die Dynamik ohne äuÿere Kräfte durch die Geodätische für einen bestimmten anen Zusammenhang, der sich aus der Physik des
Problems ergibt, beschrieben. Diese Beziehung wird in Kapitel 5.2 erläutert.
Zugehörig zu dieser Diskussion ist die Bezeichnung des parallelen Transportes: Ist
c : I ⊂ R → Q eine Kurve, dann ist ein Vektorfeld Y : Q → T Q entlang c parallel,
falls ∇c0 (t) Y (t) = 0c(t) für alle t ∈ I gilt. Dabei bezeichnet 0c(t) den Nullvektor im
Tangentialraum Tc(t) Q.
Andersherum kann die Gleichung ∇c0 (t) Y (t) = 0 als Dierentialgleichung für das
Vektorfeld Y entlang c betrachtet werden. Ist c zweimal stetig dierenzierbar und
wird der Wert von Y in c(t0 ) für ein t0 ∈ I angegeben, so ist dadurch Y (t) eindeutig
für t nah genug an t0 bestimmt. Die Abbildung
τtc0 ,t : Tc(t0 ) Q → Tc(t) Q,
die
v ∈ Tc(t0 ) Q
auf den eindeutigen Vektor
Y (t) ∈ Tc(t) Q
abbildet, ist durch das
Anfangswertproblem
∇c0 (t) Y (t) = 0,
deniert. Die Abbildung
τtc0 ,t
Y (t0 ) = v
ist der parallele Transport entlang
c
und entspricht
einer Parallelverschiebung von Vektoren.
Zugeordnete Tensoren
Es werden nun zwei zu dem anen Zusammenhang
∇
gehörige Tensoren einge-
führt, die im späteren Verlauf verwendet werden.
1.
Der Krümmungstensor
R:
Es wird die zweite kovariante Ableitung betrachtet. Ihr Wert hängt von der Reihenfolge ab, in der dierenziert wird. Der Satz von Schwarz über die Vertauschbarkeit
der Richtungsableitungen gilt demzufolge für die kovariante Ableitung nicht. Der
Krümmungstensor misst gerade den Fehler, der beim Vertauschen der Ableitungen
auftritt, d.h. er beschreibt, in welchem Grade eine Mannigfaltigkeit davon abweicht,
euklidisch zu sein.
Um diese Abweichung zu bestimmen, wird zunächst eine Denition der zweiten kovariante Ableitung benötigt. Sind
X, Y
und
Z
Vektorfelder auf einer dierenzierbaren
25
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Mannigfaltigkeit
Q,
so kann natürlich das Vektorfeld
2.6
∇Y Z
noch einmal nach
variant dierenziert werden. Dabei treten jedoch auch Ableitungen von
Y
X
ko-
nach
X
auf. In der folgenden Denition wird dieser Eekt kompensiert und nur die zweite
Ableitung von
Z
in Richtung
X
Y
und
angegeben.
Denition 2.6.3 (Zweite kovariante Ableitung)
tung von
Z
nach
X
und
Y
Die zweite kovariante Ablei-
ist durch
∇2X,Y := ∇X ∇Y Z − ∇∇X Y Z
gegeben.
Nun kann der Krümmungstensor als der Fehlerterm, der die Nichtvertauschbarkeit
der beiden Argumente in der zweiten kovarianten Ableitung misst, deniert werden.
Es gilt:
R(X, Y )Z = ∇2X,Y − ∇2Y,X = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z.
2.
Der Torsionstensor
T:
Der Torsionstensor ist durch
T (X, Y ) = ∇X Y − ∇Y X − [X, Y ]
deniert.
Diese Tensoren haben die Koordinatendarstellung
Tijs = Γsij − Γsji ,
s
Rijk
=
∂Γsjk
∂q i
−
∂Γsik
∂q j
+ Γljk Γsil − Γlik Γsjl ,
wobei die Indexnotation durch
PP s i j ∂
( Tij x y ) ∂qs ,
s i,j
P P s i j k ∂
R(X, Y )Z =
( Rijk x y Z ) ∂qs
T (X, Y ) =
s
(2.3)
i,j,k
gegeben ist. Ist der Torsionstensor null, so wird der ane Zusammenhang als sym-
metrisch bezeichnet, und er erfüllt die Eigenschaft
[X, Y ] = ∇X Y − ∇Y X.
Dierentiation von Tensoren
Analog zu Vektorfeldern ist die kovariante Ableitung von Tensoren ein wichtiger
26
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.6
Punkt. Da dies im späteren Verlauf benötigt wird, werden nun die Formeln beruhend auf den Darstellungen aus [8] und [9] für kovariante Ableitungen beliebiger
Tensoren präsentiert.
Sei
A
ein Tensor der Ordnung
Tensor der Ordnung
(0, r + 1)
(0, r).
Dann ist das kovariante Dierential
∇A
ein
deniert durch
(∇A)(X1 , ..., Xr , Z) = Z[A(X1 , ..., Xr )] − A(∇Z X1 , ..., Xr ) − ... − A(X1 , ..., ∇Z Xr ),
und die kovariante Ableitung von
A in Richtung Z
ist ein
(0, r) Tensor ∇Z A deniert
durch
(∇Z A)(X1 , ..., Xr ) = (∇A)(X1 , ..., Xr , Z).
Soll speziell eine 1-Form
λ
dierenziert werden, so ergibt sich
hX, ∇Z λi = Z(hX, λi) − h∇Z X, λi.
Ist
Z
(2.4)
c(t), so kann (2.4) als
DX
Dλ
, λ + X,
dt
dt
ein Tangentialvektor an die Kurve
d
dt
hX, λi =
(2.5)
geschrieben werden. Die Denition für kovariante Dierentiation von Tensoren führt
also zu einer Produktregel. Die Gleichung (2.5) ist aus zwei Gründen wichtig:
1. Sie wird benutzt, um Ausdrücke mit kovarianten Ableitungen partiell zu integrieren.
2. Wird
t
durch
ersetzt, d.h. es wird eine örtliche anstatt einer zeitlichen Ab-
leitung betrachtet, so ist dieser Ausdruck hilfreich, um die Auswirkungen des
Variationsprinzips (Abschnitt 3.4) in Gleichungen mit kovarianten Ableitungen zu verstehen.
Beispiel 2.6.2 (Kovariante Ableitung eines Tensors)
X ∈ X (Q). X werde mit dem Tensor identiziert, der dem Vektorfeld Y ∈ X (Q) die Funktion hX, Y i
zuordnet. Die kovariante Ableitung des Tensors X nach dem Vektorfeld Z ∈ X (Q)
Sei
ist
∇Z X(Y ) = ∇X(Y, Z) = Z(X(Y )) − X(∇Z Y ) = ZhX, Y i − hX, ∇Z Y i = h∇Z X, Y i
für alle
Y ∈ X (Q).
Der Tensor
∇Z X
kann somit mit dem Vektorfeld
∇Z X
identi-
ziert werden. Dies zeigt, dass die kovariante Ableitung von Tensoren eine Verallgemeinerung der kovarianten Ableitung von Vektorfeldern ist.
Ergänzende Denitionen
Zum Abschluss dieses Abschnittes wird eine Terminologie aus [9] und [15] zur Umbenennung von Tensoren eingeführt, die in späteren Berechnungen im Umgang mit
Tensoren nützlich ist.
27
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.7
(1, r) Tensor A und eine 1-Form λ. Dem Tensor A
A∗ zugeordnet, der folgende Gleichung erfüllt:
1. Gegeben seien ein
(2, r − 1)
Tensor
wird ein
hA(X1 , ..., Xr ), λi = hX1 , A∗ (λ, X2 , ..., Xr )i.
2. Zu einem
(0, r)
Tensor
A
wird ein
(r, 2)
Tensor
Â
(2.6)
zugeordnet, so dass
A(X1 , ..., Xr−1 , Y ) = hY, Â(X1 , ..., Xr−1 )i.
(2.7)
gilt.
2.7. Riemannsche Geometrie
In diesem Abschnitt werden einige Grundlagen der Riemannschen Metrik eingeführt.
Historisch war die Riemannsche Geometrie eine natürliche Entwicklung der Die3
rentialgeometrie von Flächen im R .
3
Ist eine Fläche S ⊂ R gegeben, so gibt es einen natürlichen Weg, die Längen von
Vektoren tangential an
S
zu messen: Das innere Produkt
hv, wi zweier Vektoren tan-
gential an S in einem Punkt p ∈ S ist das innere Produkt dieser zwei Vektoren im
R3 . Beispielsweise werden nach Denition die Längen von Kurven durch Integration
h·, ·i erlaubt es
S , sondern auch Winkel zwischen Kurven
der Länge ihres Geschwindigkeitsvektors berechnet. Die Denition
auÿerdem, nicht nur Längen von Kurven in
und all die anderen metrischen Ideen zu messen, die in der Geometrie verwendet
werden.
Der Ausgangspunkt ist hier eine dierenzierbare Mannigfaltigkeit, auf der für jeden
Punkt ein Verfahren zum Messen der Länge von Tangentialvektoren eingeführt wird.
Denition 2.7.1 (Riemannsche Metrik)
mannsche Struktur)
Punkt
p∈Q
g
Eine Riemannsche Metrik (oder Rie-
auf einer dierenzierbaren Mannigfaltigkeit
ein inneres Produkt
hh·, ·iip
im Tangentialraum
Tp Q
Q
ordnet jedem
zu. Das Produkt
ist dabei eine symmetrische, bilineare, positiv-denite Form.
g ein Tensorfeld der Ordnung (0, 2).
q , ..., q n sind die Komponenten von g
Nach der Bezeichnung von Denition 2.5.2 ist
In Termen eines
lokalen
Koordinatensystems
durch
g
ij
gij = g
∂
, ∂
∂q i ∂q j
1
gegeben. Die Komponenten der inversen Matrix werden mit
bezeichnet. Die Denition 2.7.1 ist oensichtlich unabhängig von der Wahl des
Koordinatensystems.
gij wird lokale Repräsentation
q : U ⊂ Q → Rn genannt.
Die Funktion
natensystem
der Riemannschen Metrik im Koordi-
Eine dierenzierbare Mannigfaltigkeit mit einer Riemannschen Metrik ist eine Rie-
mannsche Mannigfaltigkeit.
28
Kapitel 2.
Grundlagen zur Dierentialgeometrie
Beispiel 2.7.1 (Euklidischer Raum)
Q = Rn
mit den natürlichen Koordina∂
. Für die Koordinaten im Tangentialraum gilt
= ei = (0, ..., 1, ..., 0).
∂q i
n
Die Metrik ist durch hhei , ej ii = δij gegeben. R wird euklidischer Raum der Dimenten
1
q , ..., q
sion
n
Sei
2.7
n
genannt, und die Riemannsche Geometrie dieses Raumes ist die metrische
euklidische Geometrie.
Ein charakteristisches Ergebnis in der Riemannschen Geometrie ist das folgende:
Satz 2.7.1 (Levi-Civita)
Eine Riemannsche Mannigfaltigkeit Q besitzt einen eing
deutigen anen Zusammenhang ∇, der die folgenden Bedingungen erfüllt:
g
1.
∇
ist symmetrisch.
2. Seien
c(t)
X und Y zwei Vektorfelder,
Q deniert sind, so gilt
die entlang einer dierenzierbaren Kurve
in
d
dt
hhX, Y ii =
DX
,Y
dt
+
DY
X,
dt
.
Dieser Levi-Civita Zusammenhang erfüllt die Produktregel bezüglich der Riemannschen Metrik. Die zugehörigen Christoel-Symbole sind in lokalen Koordinaten durch
Γkij
=
X1
m
2
g
mk
∂gmj ∂gmi ∂gij
+
− m
∂q i
∂q j
∂q
gegeben. Durch die Denition der Christoel-Symbole
Γkij
(2.8)
ist der anen Zusammen-
hang eindeutig bestimmt.
g
Die Beziehung zwischen dem anen Zusammenhang
∇ und der Lagrange-Mechanik
wird in Kapitel 5.2 dargelegt.
Beispiel 2.7.2 (Riemannsche Metrik und Christoel-Symbole)
mit den Koordinaten
(x, y).
Sei
Q = R2
Dann deniert
g = dx ⊗ dx + dy ⊗ dy
eine Riemannsche Metrik auf
Q. Seien X
X = x1
∂
∂
+ x2 ,
∂x
∂y
und
Y
Vektorfelder auf
Y = y1
Q bestimmt durch
∂
∂
+ y2 ,
∂x
∂y
29
Kapitel 2.
Grundlagen zur Dierentialgeometrie
2.7
dann gilt
g(X, Y ) =
=
dx(X)
· dx(Y ) + dy(X) · dy(Y )
∂
∂
∂
1 ∂
+ x2 ∂y
) · dx (y 1 ∂x
+ y 2 ∂y
)
∂x
1 ∂
2 ∂
1 ∂
2 ∂
(x ∂x + x ∂y ) · dy (y ∂x + y ∂y )
dx (x
+dy

 

 1
 1
∂ 
∂
∂ 
∂
2
2




+y dx
· y dx
+x dx
= x dx

∂y 
∂x
∂y
∂x
| {z }
| {z }
| {z }
| {z }
=0
=1
=0
=1
 


 1
 1
∂
∂ 
∂
∂ 
2
2




·
y
dy
+y
dy
+x dy
+  x dy
∂y  
∂x
∂y 
∂x
| {z }
| {z }
| {z }
| {z }
=0
=1
=0
=1
= x1 y 1 + x2 y 2 .
Da die Komponenten von
g
alle konstant sind, sind die Christoel-Symbole nach
Gleichung (2.8) in den gegebenen Koordinaten alle null.
30
3. Variationsrechung und
Euler-Lagrange Gleichungen
Viele wichtige Ideen in der Mechanik basieren auf einem Variationsprinzip, das auf
die sogenannten Euler-Lagrange Gleichungen führt. Die Variationsrechnung ist ein
weitreichendes komplexes Gebiet, das hier in den Grundzügen vorgestellt wird. Eine wichtige Erkenntnis ist, dass die Gesetze der Natur sich so verhalten, dass sie
bestimmte Funktionen optimieren. Deshalb wird die Variationsrechnung auch als
Theorie zur Optimierung von Integralen bezeichnet.
Zuerst werden in Abschnitt 3.1 Begrie und Denitionen der Variationsrechnung
eingeführt. In Abschnitt 3.2 wird eine notwendige Bedingung zur Minimierung von
Integralen mit Hilfe der Variationsrechnung hergeleitet. Die Darstellungen aus den
ersten beiden Abschnitten beruhen im Wesentlichen auf [5]. In Abschnitt 3.3 wird
ein Verfahren zur Minimierung mit Nebenbedingungen vorgestellt (vgl. [21]). Eine
ausführliche Behandlung der Variationsrechnung wird in [21] gegeben.
Abschlieÿend wird in Abschnitt 3.4 ein Variationsprinzip in der Dierentialgeometrie
mit Hilfe des anen Zusammenhanges eingeführt.
3.1. Begrie und Denitionen
Q eine dierenzierbare Mannigfaltigkeit. Eine Lagrange-Funktion L : R × T Q →
R ist eine C ∞ -Funktion auf R × T Q. Sie ist also von Zeit, Position und Geschwindigkeit abhängig. L ist zeitunabhängig, falls eine Funktion L0 : T Q → R mit
L(t, q, vq ) = L0 (q, vq ), q ∈ Q, vq ∈ Tq Q, existiert. In dieser Arbeit wird mit zeitunabhängigen Lagrange-Funktionen gearbeitet, die dann mit L anstatt mit L0 bezeichSei
net werden.
Q mit den Koordinaten (q 1 , ..., q n ), so wird bei der Berech1
n 1
n
nung in Koordinaten L(q , ..., q , v , ..., v ) oder kurz L(q, v) geschrieben. Dabei gilt
v i = q̇ i für i = 1, ..., n.
Ist
(U, q)
eine Karte für
Eine vorgegebene Funktion soll über einer Klasse von Kurven minimiert werden.
Dazu muss erklärt werden, wie eine Kurve variiert.
31
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
Denition 3.1.1 (Variation)
c
von
(i)
ist eine
C
2
Abbildung
3.2
c : [t0 , tf ] → Q eine C 2 Kurve. Eine Variation
σ : [t0 , tf ] × [−0 , 0 ] → Q mit den Eigenschaften
Sei
σ(t, 0) = c(t),
(ii)
σ(t0 , ) = c(t0 )
(iii)
σ(tf , ) = c(tf ).
und
Die innitesimale Variation für die Variation
durch
δσ(t) =
d
d
σ
ist das Vektorfeld entlang
c,
das
σ(t, ) ∈ Tc(t) Q
=0
gegeben ist.
Eine Variation von
c
ist eine Störung von
c.
Eine innitesimale Variation liefert
ein Maÿ der Störung für kleine Werte des Störungsparameters. (siehe Abbildung
3.1)
Abbildung 3.1.: Eine Variation (links) und eine innitesimale Variation (rechts)
(vgl. [5])
Es sei bemerkt, dass die Endpunkte der Variation nach Denition stationär bleiben,
so dass die innitesimalen Variationen in den Endpunkten verschwinden.
3.2. Minimierung mit Variationsrechnung
In diesem Abschnitt wird erläutert, wie mit Hilfe der Variationsrechnung gewisse
Integrale minimiert werden können, was auf die sogenannten Euler-Lagrange Glei-
chungen führt.
Sei
t0 < tf ∈ R
mit
q0 , qf ∈ Q.
Sei
C 2 ([t0 , tf ], q0 , qf ) = {c : [t0 , tf ] → Q | c(t0 ) = q0 , c(tf ) = qf ,
zweimal stetig dierenzierbar}
und
c ist
32
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
die Familie der zweimal stetig dierenzierbaren Kurven auf dem Intervall
q0
3.2
[t0 , tf ], die
qf
enden. Diese Menge wird als zulässige Menge bezeichnet.
2
Zu einer Lagrange-Funktion auf Q wird eine Funktion J : C ([t0 , tf ], q0 , qf ) →
in
starten und in
durch
Z
tf
J(c) =
R
L(c0 (t)) dt
t0
0
t 7→ c (t)
das Tangentialvektorfeld der Kurve c. Die Funktion
∗
2
heiÿt auch Gütemaÿ. Eine Kurve c ∈ C ([t0 , tf ], q0 , qf ) minimiert J , falls
deniert. Dabei ist
J(c∗ ) ≤ J(c)
für alle
c ∈ C 2 ([t0 , tf ], q0 , qf )
J
(3.1)
gilt.
c∗ (t) Lösung des Miwie c (t) gefunden werden
jedes mögliche c(t) getestet
Die Bedingung (3.1) ist notwendig und hinreichend, damit
nimierungsproblems ist. Allerdings sagt sie nicht aus,
∗
kann und verlangt, dass jeder Kandidat für c (t) gegen
∗
wird. Das Problem kann also nicht direkt durch Bedingung (3.1) gelöst werden, aber
aus ihr können nützliche Informationen über das Verhalten minimierender Kurven
hergeleitet werden. An dieser Stelle wird sich auf das Finden notwendiger Bedingungen konzentriert.
Bemerkung 3.2.1
t 7→ (q 1 (t), ..., q n (t)) die Koordinatendatstellung der Kurve
c in den Koordinaten (q 1 , ..., q n ), dann ist t 7→ (q 1 (t), ..., q n (t), q̇ 1 (t), ..., q̇ n (t)) die
0
Koordinatendarstellung von c (t).
Ist
Notwendige Bedingung für die Minimierung die Euler-Lagrange Gleichungen
Die Bedingung wird als notwendige Bedingung erster Ordnung dafür betrachtet,
2
dass eine Kurve c ∈ C ([t0 , tf ], q0 , qf ) die Funktion J minimiert. Sie entspricht der
Bedingung an die erste Ableitung einer zu minimierenden Funktion.
2
Seien σ eine Variation von c und σ ∈ C ([t0 , tf ], q0 , qf ) deniert durch
σ (t) = σ(t, ).
gσ , die auf dem Intervall [−0 , 0 ] durch gσ () = J(σ )
deniert ist. Minimiert c die Funktion J , so muss = 0 ein Minimum von gσ für jede
Variation σ von c sein. Sei q die Koordinatendarstellung von c und entsprechend q
die Koordinatendarstellung von σ . Dann gilt
Z tf
d d gσ () =
0=
L(q (t), q̇ (t)) dt
d =0
d =0 t0
Betrachtet wird eine Funktion
Z
tf
=
t0
∂L dqi (t) ∂L dq̇i (t) +
dt.
∂q i d =0 ∂ q̇ i d =0
33
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
3.2
Es ist zu beachten, dass
i
dq̇ (t) =
d
=0
d
i
dq (t)
d
dt
=0
i
d dq (t) =
dt
d
=0
gilt. Dann folgt
0=
d
tf
Z
d
∂L dqi (t) ∂L d dqi (t) +
dt
∂q i d =0 ∂ q̇ i dt d =0
d
∂L
−
i
∂q
dt
∂L
∂ q̇ i
i
dq (t) ∂L
d
−
∂q i dt
∂L
∂ q̇ i
i
dq (t) gσ () =
t0
=0
tf
Z
=
t0
Z
tf
=
t0
t=t
∂L dqi (t) f
dt +
d
∂ q̇ i d =0 t=t0
=0
dt.
d
=0
Dabei wurde partielle Integration verwendet und die Tatsache benutzt, dass eine
innitesimale Variation an den Endpunkten verschwindet. Da
Z
tf
t0
d
∂L
−
i
∂q
dt
∂L
∂ q̇ i
i
dq (t) dt = 0
d
=0
für jede Variation gelten soll, muss die Bedingung
d
dt
∂L
∂ q̇ i
−
∂L
= 0,
∂q i
i = 1, ..., n,
erfüllt sein. Diese Gleichungen werden die Euler-Lagrange Gleichungen für
L
ge-
nannt. Sie sind ebenfalls bei der Maximierung von Funktionen erfüllt.
2
Eine Kurve in C ([t0 , tf ], q0 , qf ) wird Extremal für das Gütemaÿ J genannt, wenn sie
die Euler-Lagrange Gleichungen für
L erfüllt. Dies spiegelt die Tatsache wieder, dass
die Euler-Lagrange Gleichungen sinngemäÿ der Bedingung an die erste Ableitung in
der Dierentialrechnung entsprechen.
Beispiel 3.2.1
Seien
Q = R2
und
L
die Funktion
1
L(x, y, vx , vy ) = (vx2 + vy2 ).
2
Angenommen die Kurve
t 7→ (x(t), y(t)) minimiere J
für ein gegebenes Intervall und
gegebene Endpunkte. Dann gilt nach den Euler-Lagrange Gleichungen
d
dt
d
dt
∂L
∂vx
∂L
∂vy
−
∂L
=
∂x
−
∂L
=
∂y
d
dt
d
dt
vx (t) = v̇x (t) = ẍ(t) = 0
vy (t) = v̇y (t) = ÿ(t) = 0.
34
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
3.3
Demzufolge sind die Euler-Lagrange-Gleichungen gewöhnliche Dierentialgleichungen zweiter Ordnung
ẍ(t) = 0,
ÿ(t) = 0,
x(t) = x(0) + ẋ(0) t und y(t) = y(0) + ẏ(0) t.
Q = R2 .
und diese haben die Lösung
Diese
Gleichungen beschreiben Geraden in der Ebene
3.3. Minimierung mit Nebenbedingungen
Ziel dieses Abschnittes ist das Aunden eine Kurve, die eine gegebene Funktion
minimiert, während sie einer anderen Funktion einen vorgegebenen Wert zuordnet.
Solche Probleme werden aus historischen Gründen isoperimetrische Probleme (aus
dem Griechischen: iso = gleich, peri = herum) genannt, denn das erste betrachtete
Problem sollte aus der Menge aller geschlossenener Kurven gleicher Länge die Kurve
nden, die die eingeschlossene Fläche maximiert.
Problem 3.3.1
Seien
niert. Gesucht ist eine
Rt
C 2 ([t0 , tf ], q0 , qf ) und J(c) = t0f L(c0 (t)) dt
∗
2
Kurve c ∈ C ([t0 , tf ], q0 , qf ), die J bezüglich
benbedingung
Z
tf
I(c) =
wie oben deder Integralne-
h(c0 (t)) dt = d
t0
minimiert, wobei
d
eine gegebene Konstante ist.
Die Lösung dieses Problems kann durch die direkte Substitution der Integralnebenbedingung in den Ausdruck für
J(c)
gefunden werden. Dies ist oft sehr schwierig
durchzuführen. Ein alternativer Ansatz ist die Betrachtung eines erweiterten Kos-
tenintegrals
JA
mit
Z
tf
JA (c, λ) = J(c) + λI(c) =
(L(c0 (t)) + λh(c0 (t))) dt,
t0
das bezüglich
c
minimiert werden soll. Die Nebenbedingung
nalen Kostenintegral
J(c)
I(c)
mit Hilfe des Lagrange-Multiplikators
wird zu dem origi-
λ
hinzuaddiert.
Der folgende Satz zeigt, dass die Lösung des Minimierungsproblems des Integrals
mit Nebenbedingung auch eine Lösung des Minimierungsproblems des erweiterten
Kostenintegrals ohne Nebenbedingung ist.
Satz 3.3.1
Damit
einer Konstante
λ
c = c∗ (t)
eine Lösung des Problems 3.3.1 ist, ist die Existenz
∗
notwendig, so dass c (t) ein Extremal von
Z
tf
JA (c, λ) =
(L(c0 (t)) + λh(c0 (t))) dt
t0
ist.
35
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
σ ∈ C 2 ([t0 , tf ], q0 , qf )
Beweis: Seien
σ
σ (t) = σ(t, ).
Es sind nur die Variationen der Kurven von Interesse, die durch die
eine Variation von
c
3.3
und
deniert durch
Endbedingungen verlaufen und die Nebenbedingung erfüllen. Zur Konstruktion einer
σ (t) in der Form σ (t) = αη (t) +
und η (t), ζ (t) an den Endpunken
Variation, die die Nebenbedingungen erfüllt, wird
βζ (t)
α, β
geschrieben, wobei
Konstanten sind
η (t) und ζ (t) sind unabhängig voneinander, d.h. es
η (t) = kζ (t) für alle t erfüllt.
Betrachtet wird nun eine Funktion h̃σ , die auf dem Intervall [−0 , 0 ] durch h̃σ () =
I(σ ) deniert ist. Erfüllt c die Gleichung I = d, dann muss für = 0 die Gleichung
h̃σ = d für jede Variation σ von c erfüllt sein. Da h̃σ für = 0 konstant ist, muss
d h̃σ ()
0=
d
verschwinden. Die Funktionen
existiert keine Konstante
k,
die
=0
q die Koordinatendarstellung von c, qη die Koordinatendarstellung von
entsprechend qζ die Koordinatendarstellung von ζ . Dann ergibt sich nach
gelten. Seien
η
und
analoger Rechnung zu Abschnitt 3.2:
Z
tf
t0
i
i
d(αqη (t) + βqζ (t)) ∂h
d
∂h
−
dt = 0.
∂q i dt ∂ q̇ i
d
=0
|
{z
}
= LG(h)
c∗ kein Extremal von I ist, gilt LG(h) 6= 0, und somit stehen für jedes
und ζ die Konstanten α und β durch Gleichung (3.2) in Beziehung.
Variationsrechnung für J ergibt analog
Z tf i
i
d
(αq
(t)
+
βq
(t))
d
∂L
∂L
η
ζ
−
dt = 0,
i
i
∂q
dt
∂ q̇
d
t0
=0
|
{z
}
= LG(L)
Da
(3.2)
Paar
η
(3.3)
c∗ eine minimierende Kurve ist. α und β müssen dabei (3.2) erfüllen. Elimination
von α und β zwischen (3.2) und (3.3) ergibt
R tf
R tf
dqζi (t) dqηi (t) LG(L)
dt
LG(L)
d
d =0 dt
t0
t0
=0
=
R tf
R tf
dqζi (t) dqηi (t) LG(h) d dt
LG(h) d dt
t0
t0
da
=0
für unabhängige Koordinaten
Seiten gleich einer Konstanten
c∗ so sein, dass
Z tf
=0
qη und qζ . Dies kann nur erfüllt sein, wenn beide
−λ sind. Somit muss wegen der Linearität von LG
LG(L + λh)
i
dq η
(t) dt = 0
d
=0
t0
für alle zulässigen
η (t) ist. Dann führt das gleiche Argument aus der Herleitung der
Euler-Lagrange Gleichungen zu der notwendigen Bedingung
d
dt
∂(L + λh)
∂ q̇ i
−
∂(L + λh)
= 0.
∂q i
36
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
Demzufolge ist
Beispiel 3.3.1
c∗
ein Extremal von
Seien
Q = R2 , L
Rb
a
3.4
(L + λh) dt.
die Funktion
L(x, y, vx , vy ) = vx2
und
h
die Funktion
h(x, y, vx , vy ) = x.
Angenommen die Kurve
t 7→ (x(t), y(t)) minimiere J
für ein gegebenes Intervall und
für gegebene Endpunkten und erfülle dabei die Integralnebenbedingung
I.
Dann
muss diese Kurve nach den Euler-Lagrange Gleichungen
d
dt
∂(L + λh)
∂vx
−
∂(L + λh)
d
= 2vx (t) − λ = 2v̇x (t) − λ = 2ẍ(t) − λ = 0
∂x
dt
erfüllen. Die Euler-Lagrange Gleichung ist eine gewöhnliche Dierentialgleichung
zweiter Ordnung
ẍ(t) =
welche die Lösung
x(t) =
λ
,
2
λ 2
t + vx (0) t + x(0)
4
hat.
3.4. Variationsrechnung in der anen
Zusammenhangstheorie
In diesem Abschnitt wird die Theorie des anen Zusammenhangs mit der Theorie
der Variationsrechnung verbunden. Es werden entsprechend den Ausführungen in
[9] Eigenschaften von Variationen abgeleitet, die später benutzt werden.
c(t, ) eine Familie von Trajektorien deniert auf einem Intervall [t0 , tf ] × [−0 , 0 ],
und c(t) stehe für c(t, 0). Genauso kann bei festem t einen Pfad abhängig von betrachtet werden. Hier ist zu beachten, dass für die Kurve c(t) und ihre Variation
σ(t, ) aus Denition 3.1.1 die gleiche Bezeichnung c verwendet wird. Die innitesimalen Variationen von c(t) werden standardmäÿig durch
∂c(t, ) δc(t) =
∈ Tc(t) Q
∂ =0
Sei
deniert. Das Geschwindigkeitsvektorfeld ist durch
V (t, ) =
∂c(t, )
∈ Tc(t,) Q
∂t
37
Kapitel 3.
Variationsrechung und Euler-Lagrange Gleichungen
3.4
= 0, so ist die Geschwindigkeit V (t).
δc(t) ein entlang des Pfades c(t) deniertes Vektorfeld, das in Abbildung 3.1 der innitesimalen Variation δσ entspricht. Dabei ist zu beachten, dass δc
nicht notwendigerweise in den Endpunkten verschwindet. Ist t fest, so kann V (t, )
als ein entlang des Pfades c(t, ) deniertes Vektorfeld werden, das durch paramegegeben. Ist
Anschaulich ist
DV
trisiert ist. Mit Hilfe dieser anschaulichen Bedeutung ist leicht einzusehen, dass
d
Dδq
in = 0 und
für alle t wohldeniert sind.
dt
Im Folgenden werden drei Behauptungen mit Hilfe der Koordinatendarstellung von
kovarianten Ableitungen bewiesen. Es sei q die Koordinatendarstellung von
i
i
entsprechend seien {q̇ } = {v } die Komponenten von V . Dann gilt:
Proposition 3.4.1
c(t), und
∂δq k
∂v k
=
.
∂
∂t
Beweis: Dies folgt sofort aus den Denitionen und der Gleichheit gemischter parti-
eller Ableitungen.
Proposition 3.4.2
T (δc(t), V (t)) =
DV
Dδc
−
.
d
dt
Beweis: Die Denition der kovarianten Dierentiation in Koordinaten ist
!
∂
∂q k
!
∂
.
∂q k
X
DV
=
d
k
∂v k X j i k
+
v δq Γij
∂
i,j
Dδc X
=
dt
k
∂δq k X j i k
+
δq v Γij
∂t
i,j
und
Subtraktion und Anwendung von Proposition 3.4.1 ergibt
∂
DV
Dδc X j i k
−
=
v δq Γij − Γkji
,
k
d
dt
∂q
i,j,k
was die Koordinatendarstellung von
Proposition 3.4.3
T (δc, V )
R(δc(t), V (t))Z =
in Gleichung (2.3) darstellt.
DD
DD
−
d dt
dt d
Z.
Beweis: Der Beweis verläuft analog zu dem von Proposition 3.4.2.
Anhand Proposition 3.4.2 und 3.4.3 wird deutlich, wie der Krümmungs- und der
Torsionstensor des anen Zusammenhanges die Variationen der Position und die
Variation der Geschwindigkeit zueinander in Relation setzen.
38
4. Numerische Lösung von
Randwertproblemen mit der
Kollokationsmethode
Wie in Kapitel 1 beschrieben, führt das optimale Kontrollproblem auf das Lösen
eines Randwertproblems gewöhnlicher Dierentialgleichungen. Aus diesem Grund
behandelt dieses Kapitel die numerische Lösung solcher Randwertprobleme.
Dazu wird in Abschnitt 4.1 zunächst ein Randwertproblem deniert. Zur numerischen Lösung dieser Probleme wird die Kollokationsmethode in Abschnitt 4.2 beschrieben. Im Programmpaket MATLAB ist diese Lösungsmethode in der Funktion
bvp4c implementiert, deren Beschreibung den Abschluss dieses Kapitels in Abschnitt
4.3 bildet.
4.1. Was sind Randwertprobleme?
Gewöhnliche Dierentialgleichungen oder Systeme gewöhnlicher Dierentialgleichungen beschreiben Phänomene, die sich kontinuierlich verändern. Sie tauchen in Modellen der Mathematik, der Wissenschaft und des Ingenieurwesens auf. Ein Dierentialgleichungssystem besitzt viele Lösungen. Beispielsweise wird eine interessierende
Lösung bestimmt, indem die Werte all ihrer Komponenten in einem einzigen Punkt
t = tf
festgelegt werden. Dies ist ein Anfangswertproblem (AWP). In vielen Anwen-
dungen sind allerdings Werte oder Gleichungen für die Komponenten der Lösung an
mehr als einem Punkt
t festgelegt. Dies führt auf Randwertprobleme
(RWP), welche
zur Lösung der in dieser Arbeit betrachteten Probleme herangezogen wird.
Der einfachsten Form entsprechen die Zwei-Punkt-Randwertprobleme
x0 (t) = f (x(t)),
t ∈ [t0 , tf ],
auf einem beschränkten Intervall
g(x(t0 ), x(tf )) = 0,
[t0 , tf ], tf > t0 .
39
g : R2n → Rn ,
(4.1)
Kapitel 4.
Numerische Lösung von Randwertproblemen mit der
Kollokationsmethode
4.3
4.2. Die Kollokationsmethode
Die Kollokationsmethode ist eine globale Diskretisierungsmethode, mit welcher ein
Randwertproblem global über das gesamte Intervall diskretisiert werden kann. Dabei
wird das Intervall
[t0 , tf ]
mit Hilfe eines Gitters
4 = {t0 < t1 < · · · < tm = tf }
unterteilt. Auf diesem Gitter wird die Lösung
durch die Gitterfunktion
x4
x
des Randwertproblems (4.1) global
approximiert. Ziel ist die Berechnung dieser Gitterfunk-
tion. Dafür wird per Kollokation eine Funktion
S(t) =
m−1
X
pi (t),
S
der Form
S ∈ C([t0 , tf ]),
(4.2)
i=0
pi : [ti , ti+1 ] → Rn , i = 0, ..., m − 1, Polynome vom Grad
s sind und [ti , ti+1 ], i = 0, ..., m − 1, jeweils ein Teilintervall der Zerlegung des
Gesamtintervalls [t0 , tf ] ist. Demzufolge ist S ist eine stetige Funktion, die auf jedem
Teilintervall [ti , ti+1 ], i = 0, ..., m − 1, ein Polynom der Ordnung s darstellt.
Jedes Teilintervall [ti , ti+1 ] enthält bei der Kollokationsmethode s Kollokationspunkte
ti + cj τi , j = 1, ..., s. Diese werden nach einer Quadraturformel mit s Knoten 0 ≤
c1 < · · · < cs ≤ 1 im Einheitsintervall [0, 1] bestimmt. Dabei ist τi die Schrittlänge
τi = ti+1 − ti , i = 0, ..., m − 1.
Die Polynome pi werden per Kollokation so konstruiert, dass S zusätzlich zu den
konstruiert, wobei die
Randbedingungen die Dierentialgleichung aus (4.1) in den Kollokationspunkten
exakt erfüllt. Diese Forderung führt auf die Gleichungen
(i)
(ii)
S 0 (ti + cj τi )
= f (S(ti + cj τi )),
g(S(t0 ), S(tf )) = 0.
Für die Stetigkeit von
S
i = 0, ..., m − 1, j = 1, ..., s,
(4.3)
müssen zusätzlich die Bedingungen
pi−1 (ti ) = pi (ti ),
i = 1, ..., m − 1,
(4.4)
erfüllt sein. Die Gleichungen (4.2), (4.3) und (4.4) bilden zusammen folgendes mathematisches Problem:
Gesucht sind
m · (s + 1)
Koezienten der Polynome
p0 , ..., pm .
Gegeben sind dabei:
• m·s
• 1
Gleichungen aus den Kollokationsbedingungen (4.3)(i)
Randbedingung aus (4.3)(ii)
• m−1
Gleichungen aus (4.4) für die Stetigkeit von
S.
m · (s + 1) Gleichungen für m · (s + 1)
Gitterfunktion x4 gilt dann
Insgesamt ist somit ein Gleichungssystem mit
Unbekannte zu lösen. Für die gesuchte
x4 (ti ) = S(ti )
für
i = 0, ..., m.
40
Kapitel 4.
Numerische Lösung von Randwertproblemen mit der
Kollokationsmethode
4.3
4.3. Umsetzung der Kollokationsmethode in der
MATLAB-Funktion bvp4c
Die MATLAB-Funktion
bvp4c
implementiert eine Kollokationsmethode für die Lö-
sung von Randwertproblemen der Form
x0 = f (t, x, p),
t0 ≤ t ≤ tf ,
(4.5)
mit den Zwei-Punkt-Randbedingungen
g(x(t0 ), x(tf ), p) = 0.
S(t) ist eine
stetige Funktion, die ein kubisches Polynom auf jedem Teilintervall [ti , ti+1 ] des Gitters 4 = {t0 < t1 < · · · < tm = tf } darstellt. Dabei erfüllt sie die Randbedingungen
Dabei ist
p
ein Vektor unbekannter Parameter. Die Näherungslösung
g(S(t0 ), S(tf )) = 0.
Zusätzlich wird verlangt, dass die Dierentialgleichung (4.5) an beiden Enden und
in der Mitte jedes Teilintervalls
[ti , ti+1 ], i = 0, ..., m − 1, erfüllt ist. Diese Forderung
führt auf
S 0 (ti ) = f (ti , S(ti ))
S 0 ((ti + ti+1 )/2) = f ((ti + ti+1 )/2, S((ti + ti+1 )/2))
S 0 (ti+1 ) = f (ti+1 , S(ti+1 ))
für
(4.6)
i = 0, ..., m−1. Jedes Teilintervall [ti , ti+1 ] enthält somit drei Kollokationspunkte
1
c1 = 0, c2 = , c3 = 1.
2
Die Bedingungen (4.6) stellen ein System nichtlinearer algebraischer Gleichungen
für die Koezienten von
[t0 , tf ]
S(t)
dar. Die Lösung
x(t)
wird über das gesamte Intervall
approximiert, wobei die Randbedingungen die ganze Zeit berücksichtigt wer-
den.
Die Gleichungen (4.6) werden iterativ mit Linearisierung gelöst, so dass lineare Gleichungslöser basierend auf MATLAB, wie z.B. das Newton-Verfahren, angewandt
werden können.
S(t) eine Approximation vierter Ordnung für eine isokx(t) − S(t)k ≤ Ch4 für alle t ∈ [t0 , tf ]. Hierbei ist
h das Maximum der Schrittweiten τi = ti+1 − ti und C eine Konstante.
Nach der Berechnung der Approximationslösung S(t) mit bvp4c auf einem Gitter
kann S(t) mit der MATLAB-Funktion bvpval in jedem beliebigen t ∈ [t0 , tf ] kostengünstig ausgewertet werden, so dass die Gitterfunktion x4 erhalten wird.
Es kann gezeigt werden, dass
lierte Lösung
x(t)
ist, d.h. es gilt
Randwertprobleme besitzen abhängig von ihren Randbedingugen meist mehr als
41
Kapitel 4.
Numerische Lösung von Randwertproblemen mit der
Kollokationsmethode
4.3
eine Lösung. Deshalb benötigen die Programme zur Lösung solcher Probleme eine erste Schätzung der gewünschten Lösung. Diese Schätzung impliziert eine erste
Näherung eines Anfangsgitters
40 ,
welches das Verhalten der gewünschten Lösung
erkennen lässt. Das Programm passt dieses Gitter dann so lange an, bis eine akzeptable numerische Lösung mit einer hinreichenden Anzahl von Gitterpunkten erhalten
wird. Das Finden einer genügend guten Anfangsschätzung für die Lösung ist oft der
schwierigste Teil bei der Betrachtung von Randwertaufgaben.
In der MATLAB-Funktion
bvp4c
wird der Fehler zwischen der geschätzten und
der wahren Lösung kontrolliert. Im Folgenden wird das Verfahren skizziert:
S(t) auf [t0 , tf ] und die Kollokation am Ende jedes Teilintervalls
S(t) auch eine stetige Ableitung auf [t0 , tf ] hat. Für eine solche
ist das Residuum r(t) in der Dierentialgleichung als
Die Stetigkeit von
impliziert, dass
Approximation
r(t) = S 0 (t) − f (t, S(t))
deniert. Anders betrachtet ist
S(t)
die exakte Lösung der gestörten Dierential-
gleichung
S 0 (t) = f (t, S(t)) + r(t).
Analog ist das Residuum in den Randbedingungen g(S(a),S(b)) deniert.
bvp4c
kontrolliert die Gröÿen dieser Residuen. Sind die Residuen verhältnismäÿig klein,
so ist
S(t)
eine gute Lösung in dem Sinne, dass
S(t)
die exakte Lösung eines Pro-
blems ist, das dem gegebenen Problem sehr nahe ist. Des Weiteren beinhalten kleine
Residuen bei einem gut konditionierten Problem, dass
S(t)
nahe bei
x(t)
ist.
42
5. Optimale Kontrolle von
ZusammenhangsKontrollsystemen
In diesem Kapitel werden optimale Kontrollgleichungen für die Bewegung mechanischer Systeme mit Hilfe des anen Zusammenhanges abgeleitet. Es basiert hauptsächlich auf den Darstellungen von [5] und [9].
Zunächst wird in Abschnitt 5.1 eine Einführung in die optimale Kontrolltheorie gegeben. Hierbei wird sich an den Ausführungen aus [3] und [21] gehalten. Es werden
Fragen wie Was ist optimale Kontrolle? behandelt, und damit verbundene Begrie
und Bezeichnungen eingeführt.
Hauptziel in der geometrischen Mechanik ist es, einen Formalismus zu nden, der
die Bewegung eines Systems beschreibt. Deshalb wird in Abschnitt 5.2 eine Methode vorgestellt, um aus einem physikalischen Problem ein mathematisches Modell zu
erhalten. Das betrachtete mathematische Modell verwendet die Hilfsmittel, die in
Kapitel 2 eingeführt wurden, insbesondere den Formalismus des anen Zusammenhanges aus Abschnitt 2.6.
In Abschnitt 5.3 wird die Steuerbarkeit mechanischer Systeme behandelt, die eine Grundvoraussetzung für die optimale Kontrolle ist. Die Abschnitte 5.4 bis 5.7
beschäftigen sich mit der optimalen Kontrolle mechanischer Systeme. Es wird eine Kostenfunktion deniert, die bezüglich einer aus der Systemdynamik bestehenden Nebenbedingung minimiert wird. Dazu wird in Abschnitt 5.6 die Technik der
Lagrange-Multiplikatoren mit einem Variationsprinzip verwendet.
5.1. Optimale Kontrolle
Maschinen, die automatisch zuvor festgelegte Aufgaben ausführen sollen, sind alltäglich. Thermostate und Zeitmesser kontrollieren das Verhalten von Zentralheizungen und Waschmaschinen. Ein Autofahrer kontrolliert den Weg seines Fahrzeuges,
indem er Fuÿpedal und Lenkrad betätigt. Solche Systeme können in ihrem Verhalten verändert und somit kontrolliert werden. Das bedeutet, dass die Gesetze, die
das Verhalten der Systeme bestimmen, Variablen enthalten, deren Werte von einer
43
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.1
auÿenstehenden Person unabhängig des Systems geändert werden können. Beispielsweise entscheidet sich der Autofahrer dafür, das Bremspedal anstatt des Gaspedals
zu treten, und das Auto wird langsamer. Neben den sogenannten Zustandsvariablen
aus dem Zustandsraum, die präzise denieren, wie sich das System zur Zeit
t verhält
(für ein Auto z.B. seine Positionsvariablen), existieren somit zusätzliche Kontrollva-
riablen. Diese werden dazu verwendet, das Systemverhalten zu verändern; z.B. sind
die Veränderung des Druckes auf das Gaspedal und das Drehen des Lenkrades einfache Hilfsmittel, um Gröÿe und Richtung der auf das Auto wirkenden Gesamtkraft
zu ändern, welche nach Newtons Gesetz den Weg des Autos beschreibt.
Im Rahmen dieser Arbeit wird die Betrachtung auf an-nichtlineare Kontrollsyste-
me beschränkt.
Denition 5.1.1 (An-nichtlineares Kontrollsystem)
Kontrollsystem auf einer dierenzierbaren Mannigfaltigkeit
m
Eingangskontrollen
u1 , ..., um
Ein an-nichtlineares
Q
der Dimension
n
mit
ist eine Dierentialgleichung der Form
ẋ = f (x) +
m
X
gi (x) ui
(5.1)
i=1
mit
x ∈ Q,
glatten Vektorfeldern
Punkt
u = (u1 , ..., um )T : R+ → U ⊂ Rm und den
: Q → T Q auf Q. ẋ ist der Tangentialvektor im
der beschränkten Abbildung
x∈Q
f, g1 , ..., gm
an die glatte Kurve, die die Lösung für eine feste Anfangsbedingung
charakterisiert. Die Mannigfaltigkeit
Q wird als Zustandsraum oder Phasenraum des
Systems bezeichnet.
Die Anzahl
n der Koordinaten der Zustandsvariablen x ist die Anzahl der Freiheits-
1
grade des Systems. Ein System ist voll angetrieben , falls gleich viele Kontrollvaria2
blen m wie Freiheitsgrade n existieren. Andernfalls ist das System unterangetrieben .
Pm
Eine Lösung t → x(t) mit ẋ(t) = f (x(t)) +
i=1 gi (x(t)) ui (t) wird zur Kontrollfunktion
u(t)
gehörige Trajektorie von (5.1) genannt.
t = t0 mit x(t0 ) = x0 gegeben, und es soll in einen
f
anderen gegebenen Zustand x(tf ) = x kontrolliert werden, den es zum Zeitpunkt
t = tf erreichen soll. Jede Wahl von u(t) in t0 ≤ t ≤ tf liefert eine andere Lösung
0
f
für x(t) mit x(t0 ) = x . Einige dieser Trajektorien mögen durch x = x verlaufen,
Das System sei in einem Zustand
andere nicht. Demzufolge ist es möglich, dass keine Kontrollfunktion existiert, die
0
f
das System vom Zustand x in den Zustand x überführt.
Betrachtet wird das zweidimensionale System mit einer Kontrollvariablen, das durch
die Gleichungen
ẋ1 = x1
ẋ2 = u1
t = 0
nach
x1 = x2 = 0
späteren Zeit überführt werden soll. Keine Wahl von
u1 (t)
kann das System von
bestimmt ist und von
1 englischer
2 englischer
x1 = 1, x2 = 2
zur Zeit
zu einer
Begri: fully actuated
Begri: underactuated
44
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
(1, 2)
(0, 0)
nach
überführen, da
Jede Lösung, die mit
x1 (t0 ) = 1
u1
5.1
x1 hat.
t ≥ 0. x1
keinen Einuss auf das Verhalten von
startet, ist von der Form
x1 (t) = exp t
für
wird somit niemals null. Das System ist nicht steuerbar.
Bevor somit über optimale Kontrolle eines Systems diskutiert wird, muss gewährleistet sein, dass das System von einem gegebenen Anfangszustand in den gewünschten
Endzustand steuerbar ist. Dazu wird folgende Denition eingeführt:
Denition 5.1.2 (Steuerbarkeit)
weils zwei Punkte
x0
und
xf
Das System (5.1) ist steuerbar, wenn für je-
im Zustandsraum eine zulässige Kontrollfunktion
u(t)
deniert auf einem Zeitintervall [0, T ] existiert, so dass das System mit der Anfangsx0 den Punkt xf in der endlichen Zeit T erreicht, d.h. x(T ; u(t), x0 ) = xf .
bedingung
Existiert mehr als eine Trajektorie, um das System von
x0
nach
xf
zu bewegen, so
muss entschieden werden, welche Trajektorie gewählt wird. Beispielsweise bewirkt
f
eine Wahl, dass das System sehr lange braucht, um x zu erreichen. Eine andere
Wahl kann teuer im Energieverbrauch sein. Demzufolge wird ein Maÿ der Kosten,
die während der Bewegung auftreten, benötigt. Zur Messung dieser Kosten wird ein
Kostenintegral
J
einer geeigneten Kostenfunktion
riablen aufgestellt:
f0
von Zustands- und Kontrollva-
tf
Z
J(u, x) =
f0 (u(t), x(t)) dt.
t0
Gesucht ist die Kontrollfunktion
u,
welche das Kostenintegral
gleichzeitig (5.1) erfüllt. Die Funktion
f0
J
die Übergangszeit tf
− t0
f0 = 1
u
gesetzt. Dann
minimiert. Wird hingegen
verlangt, dass der Energieverbrauch möglichst gering ist, so wird
chend als eine Funktion abhängig von
minimiert und
hängt von der jeweiligen Problemstellung
ab. Soll der schnellstmögliche Weg gefunden werden, so wird
wird bei der Minimierung von
J
f0
dementspre-
gewählt.
Diese Problemstellung gleicht einem Problem aus der Variationsrechnung: Es muss
u(t)
t0 ≤ t ≤ tf
gewählt werden, so dass das Integral J minimiert
P
ẋ = f (x) + m
i=1 gi (x)ui erfüllt sind. Der einzige
Unterschied zu dem isometrischen Problem ist die Form der Nebenbedingungen: Dieeine Funktion
auf
wird und die Zustandsgleichungen
se sind Dierentialgleichungen anstatt Integrale in
x und u. Die Variationsrechnung
kann allerdings auch für Probleme mit Dierential-Nebenbedingungen angewandt
werden, denn die Nebenbedingung (5.1) ist äquivalent zur Integralnebenbedingung
Rt
P
I(u, x) = t01 g(u, x, ẋ) dt = 0 mit g(u, x, ẋ) = ẋ − f (x) − m
i=1 gi (x)ui .
Kontrollprobleme, die in Natur und Technik auftreten, haben meist Beschränkungen an die Kontrollvariablen. Diese liegen in einem beschränkten Kontrollraum
U.
Beispielsweise kann ein Autofahrer, indem er das Gaspedal tritt, nur eine begrenzte
Kraft
F
auf das Auto ausüben, d.h.
|F | ≤ K ,
wobei
K
eine Konstante ist. Die
meisten Kontrollprobleme haben diese Eigenschaft.
Da der klassische Ansatz mit Hilfe der Variationsrechnung verwendet wird, werden
die Beschränkungen von
u(t)
hier ignoriert.
Im Abschnitt 3.2 wurden die Ideen und Metoden der Variationsrechnung eingeführt,
45
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.2
speziell wurde die Minimierung von Integralen unter Nebenbedingungen (isometrische Probleme) in Abschnitt 3.3 behandelt. In diesem Abschnitt wird die Theorie
der optimalen Kontrolle behandelt, wobei die Kenntnisse der Variationsrechnung
sehr wichtig sind.
Zunächst wird das Problem noch einmal klar formuliert:
Problem 5.1.1
Gegeben:
Zustandsgleichung:
Anfangszustand:
Endzustand:
Kostenintegral
Kontrollfunktionen
Gesucht:
P
ẋ = f (x) + m
i=1 gi (x) ui ,
0
x(t0 ) = x
x(tf ) = xf ,
Rt
J(u, x) = t0f f0 (u(t), x(t)) dt
u(t).
zu gegebener Zeit t0 ,
der zur Zeit tf erreicht wird.
und
∗
∗
Kontrolle u (t) mit zugehöriger Trajektorie x (t), die das System von
x0 nach xf überführt, so dass J minimiert wird.
5.2. Zusammenhangs-Kontrollsystem
Es wird nun das dierentialgeometrische Modell des Problems vorgestellt. Der Inhalt dieses Abschnittes orientiert sich an den Darstellungen aus [3], [5], [9] und [16].
Diese Referenzen werden auch zur Vertiefung des Themas empfohlen.
Die Methodik des anen Zusammenhanges, welche in Abschnitt 2.6 erläutert wurde,
kann seine Anwendung nun in Bezug auf die Modellierung der Dynamik mechanischer Systeme nden. Der ane Zusammenhang vereinfacht eine koordinatenunabhängige Formulierung der Newtonschen Dynamik in dem Sinne, dass die Bewegungsgleichungen mit Hilfe der kovarianten anstatt der gewöhnlichen Ableitung dargestellt
werden. Ebenso vermeidet eine solche Darstellung Coriolis- und andere Zwangskräfte, welche bei bewegten Koordinatensystemen auftreten. Der ane Zusammenhang
ist somit ein nützliches Werkzeug für die Analysis mechanischer Systemdynamik.
Die Umsetzung des mechanischen Kontrollproblems in ein mathematisches Modell
geschieht mittels folgender Schritte:
1. Bestimmung der Kongurationsmannigfaltigkeit des Systems. Diese ist eine
dierenzierbare Mannigfaltigkeit, deren Punkte in 1-1-Korrespondenz mit den
Kongurationen des Systems sind.
2. Wahl geeigneter Koordinaten.
46
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.2
3. Die kinetische Energie des Systems wird als Funktion des Tangentialbündels
der Kongurationsmannigfaltigkeit bestimmt und von dieser die Riemannsche
Metrik abgeleitet. Die Riemannsche Metrik deniert die kinetische EnergieFunktion.
4. Falls auf das System unbeeinussbare äuÿere Kräfte wirken, werden diese als
kotangentialbündelwertige Funktionen auf dem Tangentialbündel dargestellt.
Solche Kräfte beinhalten z.B. Potential- und Reibungskräfte.
5. Auf das System wirkende Kontrollkräfte werden als
1-Form
Felder auf der
Kongurationsmannigfaltigkeit modelliert.
Die Zusammenfassung all dieser Punkte bildet ein einfaches mechanisches Kontroll-
system.
Im Folgenden werden speziell die Punkte
3.
und
4.
näher erläutert.
Kinetische Energie und Riemannsche Metrik
Es wird angenommen, dass eine Kongurationsmannigfaltigkeit mit geeigneten Koordinaten gefunden wurde (siehe Beispiel 1.2.1 in Abschnitt 1.2). Die kinetische
Energie
K : TQ → R
des Systems ist eine Funktion auf dem Tangentialbündel
der Kongurationsmannigfaltigkeit. Speziell für starre Körper setzt sie sich aus der
Translations- und der Rotationsenergie zusammen:
K = Ktrans + Krot .
Bei Systemen aus starren Körpern addieren sich die kinetischen Energien der einzelnen starren Körper.
Ohne auf eine weitere Herleitung der kinetischen Energie einzugehen, kann gezeigt werden, dass ein positiv denites
K = 21 B(vq , vq ), vq ∈ Tq Q gilt.
(0, 2)-Tensorfeld B
auf
Q
existiert, so dass
Aus der kinetischen Energie des Systems wird die Riemannsche Metrik bestimmt:
1
n
Seien g ein (0, 2)-Tensorfeld und (q , ..., q ) die Koordinaten für Q zu der Karte
(U, q).
Dann sind die Komponenten der Riemannschen Metrik
k
X
∂ 2 Ka
gij =
,
i ∂ q̇ j
∂
q̇
a=1
gegeben.
K1 , ..., Kk
g
durch
i, j ∈ {1, ..., n},
sind dabei die Funktionen für die kinetischen Energien der ein-
zelnen Körper, aus denen das System besteht.
47
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.2
Die Euler-Lagrange-Gleichungen auf einer Riemannschen Mannigfaltigkeit
Zur Einführung der Bewegungsgleichungen wird eine spezielle Klasse von LagrangeFunktionen betrachtet.
Sei
(Q, g)
eine Riemannsche Mannigfaltigkeit. Dabei repräsentiert
g
die kinetische
Energie des Systems. Für (Q, g) wird eine zeitunabhängige Lagrange-Funktion Lg
1
auf Q durch Lg (vq ) = g(vq , vq ), vq ∈ Tq Q, deniert. Für ein mechanisches System
2
ist dies die kinetische Energie. Dann sind die Lösungen der Euler-Lagrange Gleig
chungen für die Lagrange-Funktion Lg genau die Geodätischen von ∇. Es ergibt
sich somit die Bewegungsgleichung
g
0
∇c0 (t) c (t) = 0.
(5.2)
Dieses Ergebnis ist die erste Verbindung zwischen Mechanik und Dierentialgeometrie. Der Levi-Civita Zusammenhang spielt demzufolge eine wichtige Rolle in der
Herleitung der Bewegungsgleichungen.
Ein Beweis der Behauptung kann in [5] nachgelesen werden.
Interpretation: Zu der Kurve
c:I →Q
entspricht
c0 : I → Tc(t) Q
der Geschwin-
Es ist nun eine Denition des Beschleunigung entlang c gesucht.
(q 1 , ..., q n ) der Kurve c entspricht die gewöhnliche Denition
1
n
der Beschleunigung dem Objekt mit den Koordinaten (q̈ , ..., q̈ ). Die dazu gehörige
0
Gröÿe ist allerdings im Gegensatz zu c kein Vektorfeld entlang der Kuve c. Mit
digkeit entlang
c.
Mit den Koordinaten
Hilfe des anen Zusammenhanges wird die Beschleunigung in den Tangentialraum
0
0
projiziert, so dass ∇c0 (t) c (t) ein Vektorfeld entlang c ist. ∇c0 (t) c (t) wird auch geo-
metrische Beschleunigung bezüglich
∇
genannt (vgl. Beispiel 2.6.1).
Kräfte in den Euler-Lagrange Gleichungen
Wird von Kontrolltheorie mechanischer Systeme gesprochen, dann sind die Eingänge für diese Systeme die Kräfte. Die Euler-Lagrange Gleichungen für eine LagrangeFunktion
L
beschreiben die natürliche Bewegung des Systems, d.h. die Bewegung
des Systems ohne äuÿere Einüsse. Eine Kraft dagegen ist ein äuÿerer Einuss.
In der geometrischen Mechanik wird eine Kraft auf einer Mannigfaltigkeit Q durch
∗
eine Abbildung F : R × T Q → T Q, (t, q, vq ) 7→ F (t, q, vq ), deniert. Eine Kraft ist
∗
zeitunabhängig, falls es eine Abbildung F0 : T Q → T Q mit F (t, q, vq ) = F0 (q, vq )
gibt. Existiert ein
1-Form
Feld
F0
auf
Q
mit
F (t, q, vq ) = F0 (q),
so wird die Kraft
als grundlegend bezeichnet.
Bemerkung 5.2.1
darstellung einer Kraft
R, i = 1, ..., n,
(q 1 , ..., q n )Pdie Koordinaten für Q, so ist die Koordinatenn
i
i
i
durch F =
i=1 F dq mit den Funktionen F : R × T Q →
Sind
als Komponenten gegeben.
48
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Greifen an das mechanische Systemen externe Kräften
F
5.2
an, so wird seine Dynamik
durch die Euler-Lagrange Gleichungen
∂L ∂L
−
= F i,
dt ∂ q̇i
∂qi
d
beschrieben. Dabei sind
F 1 , ..., F n
i = 1, ..., n,
die Komponenten von
(5.3)
F.
Spezielle Kräfte sind die aus der potentiellen Energie resultierenden Potentialkräfte.
P eine Potentialfunktion auf Q, so ist ihre Potentialkraft die grundlegende Kraft
F (t, vq ) = −dP (q), q ∈ Q, vq ∈ Tq Q.
Ist
Potentialkräfte sind innere Kräfte, da sie implizit in der Lagrange-Funktion vor-
c ein Extremal des
L(q, vq ) = Lg (vq ) − P (q).
kommen können: Für Systeme mit Potentialkräften ist die Kurve
Gütemaÿes
J
zu der Lagrange-Funktion
In den meisten mechanischen Anwendungen wird die Lagrange-Funktion von der
Form kinetische minus potentielle Energie gewählt.
Für eine ausführliche Diskussion zur Modellierung mechanischer Systeme mit Hilfe
von anen Zusammenhängen wird auf die Arbeiten von Bullo [4] und Lewis [14]
verwiesen.
Einfache mechanische Kontrollsysteme
Nach der Vorstellung der einzelnen dierentialgeometrischen Objekte wird nun das
mathematische Modell des Kontrollproblems eingeführt.
Denition 5.2.1 (Allgemeines einfaches mechanisches Kontrollsystem)
Ein allgemeines einfaches mechanisches Kontrollsystem besteht aus folgenden dierentialgeometrischen Objekten:
(i) einer dierenzierbaren Mannigfaltigkeit
Q
(die Kongurationsmannigfaltig-
keit),
(ii) einer Riemannschen Metrik
(iii) einer glatten Funktion
(iv) einer Kraft
F
auf
(v) einer Familie von
(vi)
U ⊂ Rm
Q
P
g
auf
auf
Q
Q
(die kinetische Energie Metrik),
(die Potentialfunktion),
(die externen Kräfte),
1-Form
Feldern
F = {F1 , ..., Fm }
auf
Q
(die Kontrollkräfte),
(die Kontrollmenge).
Das System ist voll angetrieben in
q0 ,
falls
dernfalls ist das System unterangetrieben in
Tq∗0 Q = spanR {F1 (q0 ), ..., Fm (q0 )}, anq0 . Ist das System in jedem Punkt in Q
voll angetrieben, so ist es voll angetrieben.
49
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.2
Die Klasse der allgemeinen einfachen mechanischen Kontrollsystemen ist sehr umfassend, weshalb nun einige Beschränkungen gemacht werden. Diese führen auf eine
Klasse von Kontrollsystemen, die im weiteren Verlauf der Arbeit betrachtet wird.
Das System besitze kein Potential und nur angreifende Kräfte, auf die Kontrolle
ausgeübt werden kann. Dann reduzieren sich die sechs Objekte aus Denition 5.2.1
auf vier Objekte.
Wie zuvor gezeigt, sind die Bewegungsgleichungen für Systeme ohne angreifende
g
0
Kräfte ∇c0 (t) c (t) = 0, deren Lösungen die Geodätischen des Levi-Civita Zusammenhanges sind. Aus einem Vergleich mit der Newtonschen Mechanik (ma
ist nach der Interpretation der Geodätischen ersichtlich, dass der Term
dabei der Beschleunigung
= F ),
∇c0 (t) c0 (t)
a
entspricht. Für Systeme mit angreifenden Kräften ist
0
demnach die geometrische Beschleunigung ∇c0 (t) c (t) einem Objekt gleichzusetzen,
1
das dem Term
F aus der Newtonschen Mechanik entspricht. Anstatt direkt mit
m
den Kräften F1 , ..., Fm zu arbeiten, werden somit Vektorfelder Y1 , ..., Ym verwendet.
P ij j
i
Die Koordinatendarstellung dieser Vektorfelder ist Ya =
j g Fa . Dabei sind die
ij
g die Komponenten der inversen Matrix der Riemannschen Metrik.
In der geometrischen Mechanik wird somit immer direkt mit den Vektorfeldern
{Y1 , ..., Ym }
anstatt mit den
1-Form
Feldern
{F1 , ..., Fm }
gearbeitet.
Die vier Objekte Q, g, F und U können durch die Objekte Q, ∇, Y = {Y1 , ..., Ym }
g
und U mit ∇ =∇ und den eben denierten Vektorfeldern Y identiziert werden.
Motiviert durch diese Klassikation wird eine interessante Klasse von Kontrollproblemen deniert:
Denition 5.2.2 (Zusammenhangs-Kontrollsystem)
Kontrollsystem
{Y1 , ..., Ym }
3
und
Ein Zusammenhangs-
besteht aus den dierentialgeometrischen Objekten
U,
Q, ∇, Y =
wobei
(i)
Q
eine dierenzierbare Mannigfaltigkeit,
(ii)
∇
ein aner Zusammenhang auf
(iii)
Y = {Y1 , ..., Ym }
(vi)
U ⊂ Rm
Q,
eine Familie von Vektorfeldern auf
Q
und
ist. Die globale Repräsentation der Bewegungsgleichungen lautet dann
0
∇c0 (t) c (t) =
m
X
Yi (c(t))ui (t).
(5.4)
i=1
3 englischer
Begri: ane connection control system
50
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.2
t 7→ c0 (t) ∈ Tc(t) Q das Tangentialvektorfeld von c ist, stellt c0 (t) ein Vektorfeld
entlang der Kurve c(t) dar. Zur Vereinfachung der Notation wird Tc(t) Q 3 V (t) =
c0 (t) als dieses Vektorfeld entlang der Kurve c(t) deniert. Wegen der Diskussion nach
0
Denition 2.6.1 kann ∇c0 (t) c (t) dann als kovariante Ableitung von dem Vektorfeld
V dargestellt werden, so dass aus (5.4)
Da
m
X
DV
=
Yi (c(t))ui
dt
i=1
wird. Das System ist in
q0
voll angetrieben, falls
(5.5)
Tq0 Q =
spanR {Y1 (q0 ), ..., Ym (q0 )},
andernfalls ist das System unterangetrieben in q0 .
+
Die Abbildung u(t) : R → U stellt die Kontrollen oder Eingänge dar. Sie nimmt
Werte in der Kontrollmenge
U
an und wird durch die Vektorfelder
gebildet. Festgelegte Kontrollen führen zu Trajektorien
rationsmannigfaltigkeit
Q.
Yi
auf
TQ
ab-
c : I → Q auf der Konguq , die das System
Diese beschreiben die Kongurationen
T Q ist der Zustandsraum mit den Zuständen
(q, v), q ∈ Q, v ∈ Tq Q beschrieben durch das Vektorfeld c0 (t).
m
Wie oft in der ersten Behandlung vieler Kontrollprobleme gilt von nun an U = R .
annehmen kann. Das Tangentialbündel
Dies entspricht unbeschränkten Kontrollfunktionen aus Abschnitt 3.2.
Obwohl alle Vektorfelder auf
Systems auf
T Q,
Tangentialbündel
Q
deniert sind, bestimmen sie die Entwicklung des
da die kovariante Ableitung von
TQ
V ∈ TQ
wiederum auf dem
deniert ist. Der ane Zusammenhang vereinfacht somit die
Formulierung, denn anstatt einer Dierentialgleichung zweiter Ordnung mit der Dar00
stellung c (t) und dem Zustandsraum Q wird eine Dierentialgleichung erster OrdDV
nung mit der Darstellung
dt und dem Zustandsraum T Q erhalten.
Die Gleichung (5.5) kann als kovariante Formulierung von Newtons Gesetz F = ma
aufgefasst werden.
Bemerkung 5.2.2
An dieser Stelle wird skizziert, wie das Zusammenhangs-Kon-
trollsystem (5.5) mit dem im Abschnitt 5.1 denierten an-nichtlinearen Kontrollsystem (5.1) im Zusammenhang steht. Für eine ausführlichere Interpretation wird
auf [5] und [16] verwiesen.
Nach Kapitel 2.6 ist die Koordinatendarstellung der kovarianten Ableitung von
1
n
mit den V -Komponenten (v , ..., v ) durch
V
X
∂
DV
=
(v̇ k + Γkij q̇ i v j ) k .
dt
∂q
i,j,k
V setzt sich aus der gewöhnlichen Ableitung
t plus einem Term,
der abhängig von den Christoel-Symbolen ist, zusammen.
P k i j ∂
der Wahl Z = −
Γij q̇ v ∂qk ∈ T Q ergibt sich eine Bewegungsgleichung der
gegeben. Die kovariante Ableitung nach
nach
Mit
i,j,k
Form
V̇ = Z +
m
X
Yi u i
i=1
51
Kapitel 5.
auf
T Q.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Dieses System ist ein anes Kontrollsystem auf
TQ
5.3
und entspricht der
Form des in Denition 5.1.1 eingeführten an-nichtlinearen Kontrollsystems (5.1).
5.3. Steuerbarkeit
Um ein System optimal kontrollieren zu können, muss zunächst gewährleistet sein,
dass das System überhaupt steuerbar ist, d.h. dass das System mit einer vorgegebenen Klasse von Kontrollfunktionen von einem Punkt zu einem anderen geführt
werden kann. Diese Formulierung der Steuerbarkeit und die damit einhergehende Denition 5.1.2 ist allerdings nicht sehr hilfreich, um die Steuerbarkeit von Systemen
wirklich nachzuweisen. Es müssen Verfahren entwickelt werden, um die Steuerbarkeit direkt zu prüfen.
Das Problem der Steuerbarkeit besteht aus der Beschreibung der Beschaenheit
der Menge von Punkten, die von einem Startpunkt erreichbar sind. Für diese Beschreibung gibt es zwei wichtige Eigenschaften:
1. die Erreichbarkeit, bei der die erreichbare Menge kein leeres Inneres hat,
2. die Steuerbarkeit, die die Erreichbarkeit erweitert, indem geprüft wird, ob der
Startpunkt im Inneren der erreichbaren Menge liegt.
Der Ansatz, der im weiteren Verlauf der Arbeit verwendet wird, orientiert sich an
der Arbeit [18] von Lewis und Murray. Es werden die wichtigsten Ergebnisse zur
Steuerbarkeit mechanischer Systeme und die dazu notwendigen Denitionen und
Werkzeuge vorgestellt. Da hier auf die Anwendung der Steuerbarkeitskriterien auf
ein spezielles System Wert gelegt wird, wird auf Beweise verzichtet. Ausführliche
Diskussionen der Theorie sowie Beweise und Anwendungen der Steuerbarkeitskriterien sind in [5] und [18] zu nden.
Steuerbarkeitsdenitionen für mechanische Kontrollsysteme
Zunächst werden Denitionen und Bezeichnungen zur Steuerbarkeit eingeführt.
Mechanische Systeme haben einen Kongurationsraum
Q
und einen Zustandsraum
T Q. Es macht also Sinn, über Steuerbarkeit in Termen der Kongurationen zu sprechen anstatt in Termen der Zustände, denn in erster Linie sollen vorgegebene Positionen und Ausrichtungen in
Q erreicht werden. In dieser Arbeit wird Steuerbarkeit
nur von Zuständen mit Geschwindigkeit null betrachtet.
52
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Es wird das Zusammenhangs-Kontrollsystem
0
∇c0 (t) c (t) =
m
X
5.3
Σ = (Q, ∇, Y, U )
Yi (c(t))ui (t),
(5.6)
i=1
beziehungsweise für
V = c0
m
X
DV
=
Yi (c(t))ui (t)
dt
i=1
betrachtet. Eine gesteuerte Trajektorie für
eine Funktion und
c : [0, T ] → Q
(5.7)
Σ ist ein Paar (u, c), wobei u : [0, T ] → U
die Lösung von (5.6) ist.
Die folgenden Fragen über Steuerbarkeit mechanischer Systeme werden oft gestellt.
Sie setzen voraus, dass die Anfangsgeschwindigkeit als null angenommen wird. In
Klammern ist die zugehörige allgemeine Bezeichnung angegeben.
1. Ist es möglich, wenn in einer in Ruhe gegebenen Konguration gestartet wird,
eine andere Konguration und deren Umgebung zu erreichen? (Kongurations-
Erreichbarkeit)
2. Ist es möglich, wenn in einer in Ruhe gegebenen Konguration gestartet wird,
eine Konguration, die in einer Umgebung der Startkonguration liegt, zu
erreichen? (lokale Kongurations-Steuerbarkeit)
3. Ist es möglich, diese Konguration mit Endgeschwindigkeit null zu erreichen?
(Gleichgewichts-Steuerbarkeit)
Die folgenden Ergebnisse beruhen alle auf der Voraussetzung, dass die potentielle
Energie des Systems null ist, d.h. das mechanische System besitzt als LagrangeFunktion lediglich die kinetische Energie bezüglich einer Riemannschen Metrik
auf der Kongurations-Mannigfaltigkeit
g
Q.
In der Regel ist es nicht leicht zu beweisen, dass ein System steuerbar ist. Die
etwas schwächere Eigenschaft der Erreichbarkeit ist oft einfacher zu beweisen. Dazu
wird die Bezeichnung der kongurations-erreichbaren Menge benötigt, die von der
Wahl einer positiven Zeit
T
abhängt. Die kongurations-erreichbare Menge wird im
Wesentlichen als die Menge der Punkte deniert, die vom System entlang seiner Trajektorien vom Anfangspunkt mit einer maximalen Zeit
T
erreicht werden können.
Präziser gilt:
Sei
q0 ∈ Q.
Deniere:
RΣ,Q (q0 , T ) = {q ∈ Q | ∃ eine gesteuerte Trajektorie (u, c) von
0
0
so dass c (0) = 0q0 und c (T ) ∈ Tq Q},
(5.7),
53
Kapitel 5.
und
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
S
RΣ,Q (q0 , ≤ T ) =
Menge. Hierbei ist
0q0
5.3
RΣ,Q (q0 , T ) bezeichne die kongurations-erreichbare
0≤t≤T
der Nullvektor im Tangentialraum Tq0 Q.
Es ist zu beachten, dass diese Denition für erreichbare Kongurationen nicht beinhaltet, dass ein Punkt in der erreichbaren Menge mit Endgeschwindigkeit null erreicht werden muss. Es wird nur verlangt, dass dieser Punkt mit irgendeiner Geschwindigkeit erreicht wird.
Nun können die Denitionen der Kongurations-Erreichbarkeit und -Steuerbarkeit
eingeführt werden:
Denition 5.3.1 (Kongurations-erreichbar)
tions-erreichbar in
für
t ∈]0, T ]
q0 ∈ Q,
falls ein
T >0
Das System (5.7) ist kongura-
existiert, so dass int (RΣ,Q (q0 , ≤
t)) 6= ∅
gilt.
Gilt dies in jedem Punkt
q0 ∈ Q, dann ist das System (5.7) kongurations-erreichbar.
Dies bedeutet, dass es einen Punkt
ximalen Zeit
T
q ∈ Q gibt, der ausgehend von q0
nach einer ma-
erreicht werden kann und dass Punkte in der Nähe von
in der Zeit maximal
T
q
ebenfalls
erreicht werden können.
Eine wichtige Steuerbarkeitsbedingung ist die lokale Kongurations-Steuerbarkeit
in kleiner Zeit.
Denition 5.3.2 (Lokal kongurations-steuerbar in kleiner Zeit)
Das Sys-
q0 lokal kongurations-steuerbar in kleiner Zeit, falls ein T > 0
q0 ∈ int (RΣ,Q (q0 , ≤ t)) für t ∈]0, T ].
jedem Punkt q0 ∈ Q, dann ist das System (5.7) lokal kongurations-
tem (5.7) ist in
existiert, so dass
Gilt dies in
steuerbar in kleiner Zeit.
Der Unterschied zur Erreichbarkeit liegt darin, dass ein Punkt
q0
in jeder beliebigen
q0 innerhalb des Zeitraumes T erreicht werden kann. Liegt
RΣ,Q (q0 , ≤ T ), so kann das System nicht in die Richtungen
Richtung ausgehend von
q0
auf dem Rand von
ausgehend von
q0 ,
die nicht mehr in dieser Menge enthalten sind, gesteuert werden,
wie es bei der Erreichbarkeit der Fall sein kann.
In Abbildung 5.1 wird noch einmal der Unterschied zwischen Erreichbarkeit und
lokaler Steuerbarkeit bezüglich der Kongurationen verdeutlicht.
Die bisherigen Denitionen beinhalten nicht, dass das System von einem Gleichgewichtspunkt in den nächsten überführt werden kann. Es wird lediglich verlangt, mit
beliebiger Endgeschwindigkeit einen bestimmten Punkt zu erreichen. Um speziell
zu verlangen, dass die betrachteten Punkte Gleichgewichtspunkte des Systems sind,
wird deniert:
Denition 5.3.3 (Gleichgewichts-steuerbar)
Das System (5.7) ist gleichgewichts-
q1 , q2 ∈ Q eine gesteuerte Trajektorie (u, c) von (5.7) existiert,
c : [0, T ] → Q mit c(0) = q1 , c(T ) = q2 und c0 (0) = 0q1 , c0 (T ) = 0q2 gelten.
steuerbar, falls für
wobei
54
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Abbildung 5.1.:
5.3
Eine Interpretation der Erreichbarkeit und Steuerbarkeit.
In der linken Abbildung ist die erreichbare Menge von niedrigerer
Dimension als der Kongurationsraum. Die mittlere und die rechte Abbildung zeigen den Unterschied zwischen Erreichbarkeit und
Steuerbarkeit. (vgl. [5])
Zusammenfassung der Steuerbarkeitsergebnisse
Lewis und Murray zeigen in [18], dass diese Art der Steuerbarkeit mit Hilfe des
symmetrischen Produktes analysiert werden kann.
Denition 5.3.4 (Symmetrisches Produkt)
Das symmetrische Produkt zweier
Vektorfelder auf Q ist als
g
g
hX : Y i =∇X Y + ∇Y X
g
deniert, wobei
g
∇X Y
die kovariante Ableitung von Y bezüglich X ist.
∇
ist der
Levi-Civita Zusammenhang.
Bezeichne
X (Q)
die Menge aller glatten Vektorfelder auf Q, und sei eine Menge
X1 , ..., Xd ∈ X (Q) auf Q gegeben. Dann ist die Distribution auf
Mannigfaltigkeit Q das Erzeugnis dieser Vektorfelder und wird mit
glatter Vektorfelder
der
4 = span{X1 , ..., Xd }
X, Y auf Q
4 auch [X, Y ] ein Vektorfeld mit Werten in 4 ist.
Sei nun V = {V1 , ..., Vd } ⊂ X (Q), so bezeichnet Sym(V) die Distribution auf Q, die
durch Iterationen symmetrischer Produkte von der Distribution von V erhalten wird.
Sym(V) wird somit durch folgende induktive Folge von Vektorfeldern bestimmt:
bezeichnet. Eine Distribution ist involutiv, wenn für zwei Vektorfelder
mit Werten in
(1)
Sym (V) =
(i)
Sym (V) =
span{V1 , ..., Vd }
span{hX
(j)
(k)
: Y i | X ∈ Sym (V), Y ∈ Sym (V), i = j + k}
mit j, k > 0, i = 2, 3, ...
55
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Die kleinste Distribution, die diese Distributionen enthält, wird mit
5.3
Sym(V)
be-
zeichnet.
Wird dagegen auf
Sym(V) als Anfangsdistribution die obige Iteration mit Lie Klam-
mer Bildung angewandt, so wird die kleinste Distribution, die alle anderen enthält,
wiederum mit
Lie(Sym(V))
Beispiel 5.3.1
Sei
bezeichnet.
X = {X1 , X2 }
(1)
Sym (X ) =
(2)
Sym (X ) =
mit
mit
X2 = x2 ∂x∂ 2 .
Dann gilt:
= span{x1 ∂x∂ 1 , x2 ∂x∂ 2 }
span{hX1 : X2 i, hX1 : X1 i, hX2 : X2 i},
hX1 : X2 i = 0 , hX1 : X1 i = 2x1 ∂x∂ 1
(2)
i=3
und
span{X1 , X2 }
Sym (X ) =
Für
X1 = x1 ∂x∂ 1
und
hX2 : X2 i = 2x2 ∂x∂ 2 .
span{x
Es ist somit
1 ∂
, x2 ∂x∂ 2 }.
∂x1
folgt
(3)
Sym (X ) =
span{hhX1
: X2 i : X1 i, hhX1 : X2 i : X2 i,
hhX1 : X1 i : X1 i, hhX1 : X1 i : X2 i,
hhX2 : X2 i : X1 i, hhX2 : X2 i : X2 i}
mit
hhX1 : X2 i : X1 i = 0,
hhX1 : X2 i : X2 i = 0,
hhX1 : X1 i : X2 i = 0,
hhX2 : X2 i : X1 i = 0,
∂
,
∂x1
∂
hhX2 : X2 i : X2 i} = 4x2 2 .
∂x
hhX1 : X1 i : X1 i = 4x1
Es gilt somit:
(3)
Sym (X ) =
span{x
1 ∂
, x2 ∂x∂ 2 }.
∂x1
Induktiv kann gezeigt werden, dass die Distribution für
i ≥ 1 identisch sind, so dass
für die kleinste Distribution, die all diese Distributionen enthält,
Sym(X ) = span
gilt. Um
Lie(Sym(X ))
∂
∂
x
, x2 2
1
∂x
∂x
1
zu bestimmen, müssen noch die Lie Klammern der symme-
trischen Produkte berechnet und daraus die kleinste Distribution bestimmt werden.
Für
i=2
gilt bereits:
[X1 , X2 ] = 0,
Für
i ≥ 2
[X1 , X1 ] = x1
∂
,
∂x1
[X2 , X2 ] = x2
∂
.
∂x2
kommen bei Bildung der Lie Klammern zwischen allen symmetrischen
Produkten keine neuen Terme dazu, so dass
1 ∂
2 ∂
Lie(Sym(X )) = span x
,x
∂x1
∂x2
folgt.
56
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.3
In Abschnitt 2.4 wurde erwähnt, dass durch Bildung von Lie Klammern neue Richtungen erzeugt werden können. Dementsprechend stellt
reichbaren Geschwindigkeitsrichtungen und
Sym(V)q
Lie(Sym(V))q
die von
0q
die von
0q
er-
erreichbaren
Kongurationsrichtungen dar.
Da hier die Kongurations-Erreichbarkeit und -Steuerbarkeit untersucht wird, ist die
Betrachtung von
Lie(Sym(V))q
ausreichend. Können alle Richtungen des gesamten
Kongurationsraumes durch Bildung von Lie Klammern erzeugt werden, so ist das
System (5.7) kongurations-steuerbar.
Mit den eben eingeführten Bezeichnungen ergeben sich folgende Bedingungen an
Erreichbarkeit und Steuerbarkeit (siehe [18]):
Satz 5.3.1
q,
Das Kontrollsystem (5.7) ist lokal kongurations-erreichbar in
falls
Lie(Sym(Y))q = Tq Q.
Sei
P
ein symmetrisches Produkt der Vektorfelder
Y,
γi (P ) die
γ1 (P ) + ... + γm (P ). P ist
dann bezeichnet
Yi in P . Der Grad von P ist deniert als
γi (P ) für jedes i = 1, ..., m gerade ist. P ist gut, falls P nicht schlecht
ist. Beispielsweise ist das symmetrische Produkt hhY1 : Y2 i : hY1 : Y3 ii gut, während
das symmetrische Produkt hhY1 : Y2 i : hY1 : Y2 ii schlecht ist. Beide Produkte sind
Anzahl der
schlecht, falls
vom Grad vier.
m Symbolen. Für π ∈ Sm und das symmetrisches Produkt P der Vektorfelder Y ist π(P ) als das Produkt deniert, das durch
Transformation von Yi zu Yπ(i) für i = 1, ..., m erhalten wird. Es sei
X
π(P ).
ρ(P ) =
Sei
Sm
die Permutationsgruppe auf
π∈Sm
Die hinreichende Bedingung für lokale Kongurations-Steuerbarkeit in kleiner Zeit
lautet dann:
Satz 5.3.2 Y
sei so gestaltet, dass jedes schlechte symmetrische Produkt
die Eigenschaft
ρ(P )(q) =
m
X
P
in
Y
ξ i Ci (q)
i=1
besitzt. Dabei sind die Ci gute symmetrische Produkte von niedrigerem Grad als P
i
und ξ ∈ R für i = 1, ..., m. Gilt zusätzlich Lie(Sym(Y))q = Tq Q, so ist (5.7) lokal
kongurations-steuerbar in kleiner Zeit in
Bemerkung 5.3.1
q.
Gelten die Aussagen des obigen Satzes in allen Punkten
q ∈ Q,
so ist das System (5.7) gleichgewichts-steuerbar (siehe [18]).
Die Sätze 5.3.1 und 5.3.2 liefern somit die Bedingungen, die bei der Untersuchung
der Steuerbarkeit eines mechanisches Systems überprüft werden müssen.
57
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.4
Die Inhalte der nachfolgenden Abschnitte dieses Kapitels beruhen auf den Ideen von
Fax in [9]. Dabei wird eine Strategie zur optimalen Kontrolle des ZusammenhangsKontrollsystems vorgestellt.
5.4. Kostenfunktion
Das allgemeine Ziel ist die optimale Kontrolle des mechanischen Systems bezüglich
bestimmter Kontrollvariablen, um von einer festen Anfangskonguration zu einer
anderen Konguration zu gelangen. Ist das System steuerbar, so gibt es verschiedene Trajektorien, entlang welcher das System von einer Konguration in eine andere überführt werden kann. Daher muss ein Kostenintegral als Maÿ der Kosten
deniert werden, um das Optimierungsproblem zu vervollständigen. Dies wird, wie
in Abschnitt 5.1 beschrieben, bezüglich gewisser Nebenbedingungen minimiert, so
dass eine optimale Trajektorie gefunden werden kann, entlang welcher das System
von einem gegebenen Anfangszustand
(qf , vf ) ∈ T Q
(q0 , v0 ) ∈ T Q
in einen festen Endzustand
überführt wird.
Die Nebenbedingungen bestehen in diesem Fall aus der Mechanik des vorliegenden
Systems. Sie sind durch das Zusammenhangs-Kontrollsystem (5.5) gegeben.
Um die Gestalt des Kostenintegrals zu beschreiben, wird zunächst folgende Denition eingeführt:
Denition 5.4.1 (Rm -abhängiges (0, r) Tensorfeld)
Tensorfeld auf
Q
1.
A
2.
q 7→ A(u, q)
ist eine Abbildung
m
A:R ×Q→
m
Ein R -abhängiges
0
Tr (T Q), so dass
(0, r)
stetig und
ein glattes
(0, r)
Tensorfeld für jedes
u ∈ Rm
ist.
Die Denition eines Kostenintegrals geschieht folgendermaÿen (siehe [9] und [16]):
Seien i ∈ {1, ..., s}, ri eine nicht negative ganze Zahl und Ai ein symmetrisches
Rm -abhängiges (0, ri ) Tensorfeld auf Q. Dann gilt für das Kostenintegral:
Z
tf
J(u, c, V ) =
t0
wobei
V
ein Operand von
Ai
ist. Ist
s
X
i=1
Ai (u, q) (V, ..., V ) dt,
| {z }
ri -mal
ri = 0,
ri = 2,
q und u.
Ist
Ai
einen
und dem Kontrollaufwand
u ist.
so repräsentiert das Tensorfeld
Kostenterm, der allein abhängig von der Position
q
(5.8)
so sind die Kosten quadratisch in der Geschwindigkeit und abhängig von
58
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.6
Im Rahmen dieser Arbeit werden ausschlieÿlich energieeziente Probleme betrachtet. Die angreifenden Kontrollkräfte sollen somit minimiert werden. Deshalb wird
das Kostenintegral noch weiter speziziert.
versehen. Mit
s
X
Ai (u, q) =
i=1
s
X
Q
sei mit der Riemannschen Metrik
g
g(Yi (q)ui , Yi (q)ui )
i=1
m
(siehe [6] und [16]) wird nach der Darstellung in (5.8) ein R -abhängiges (0, 0)
Ps
Tensorfeld - ein Skalarfeld - verwendet.
i=1 Ai (u, q) entspricht somit einer diem
renzierbaren Abbildung f0 : R × Q → R, die die Kostenfunktion f0 darstellt.
Im weiteren Verlauf der Arbeit beschreibt die Kurve
c(t) = q ∈ Q
und
V
c
die Kongurationen mit
die Geschwindigkeit der Kongurationen mit
V (t) = v ∈ Tq Q.
5.5. Problemstellung
Problem 5.5.1
Endbedingung
Es seien eine Anfangsbedingung
(c(tf ), V (tf )) = (qf , vf )
(c(t0 ), V (t0 )) = (q0 , v0 )
und eine
gegeben. Gesucht sind die Trajektorien, die
das Kostenintegral
Z
tf
J(u, c) =
f0 (u, c(t)) dt
t0
minimieren und die durch Gleichung (5.5) gegebene Nebenbedingung erfüllen.
Eine gesteuerte Trajektorie
γ ∗ = (u∗ , c∗ )
ist Lösung des Problems 5.5.1, wenn
J(γ ∗ ) ≤ J(γ)
für jede gesteuerte Trajektorie γ gilt. Dabei sind u und
0
0
deniert, und es gilt c (t0 ) = v0 mit v0 ∈ Tq0 Q und c (tf )
Bemerkung 5.5.1
c auf dem Intervall [t0 , tf ]
= vf mit vf ∈ Tqf Q.
Es werden auch Probleme betrachtet, bei denen keine festen
Endpunkte vorgegeben werden. Für solche Probleme werden in den Abschnitten 5.6
und 5.7 zusätzliche Randbedingungen erzeugt.
5.6. Problemlösung: Lagrange-Multiplikatoren
und Variationsrechnung
In diesem Abschnitt wird die Lösungsstrategie aus [9] vorgestellt.
Zur Lösung des Problems 5.5.1 werden die Techniken der Lagrange-Multiplikatoren
und der Variationsrechnung verwendet, wie sie in Abschnitt 3.3 und 5.1 beschrieben
59
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.6
werden.
Zusammenfassend lässt sich die Methode folgendermaÿen beschreiben: Bei der Technik der Lagrange-Multiplikatoren wird das Kostenintegral
f (u, c) = 0
bedingungen
λ
Nebenbedingungen gelöst wird. Dabei ist
c
Adjungierte von
J(u, c)
unter den Neben-
optimiert, indem das Minimierungsproblem
J + λf
ohne
eine zusätzliche Variable, bekannt als
mit der Anzahl der Gleichheitsnebenbedingungen als Dimension.
Bei der Durchführung der Optimierung ergeben sich die Euler-Lagrange Gleichun-
gen, die notwendige Bedingungen für optimale Trajektorien in
c
und
λ
liefern.
Die Standard Euler-Lagrange Gleichungen werden für ein System abgeleitet, dessen
ẋ = f (u, x)
Q sind. Allerdings ist die Dynamik vieler mechanischer Sys-
Nebenbedingungen Dierentialgleichungen erster Ordnung von der Form
auf der Mannigfaltigkeit
teme naturgemäÿ zweiter Ordnung. Ein Zusammenhangs-Kontrollsystem kann als
Dierentialgleichung erster Ordnung auf
Q
dargestellt werden, indem Geschwindig-
keiten als unabhängige Zustände eingeführt und die Variation von Lage und Geschwindigkeit unabhängig voneinander betrachtet werden. Dieser Ansatz hat jedoch
mehrere Nachteile: Zum einem wird die Anzahl der Nebenbedingungen und dadurch
auch die Anzahl der Adjungierten verdoppelt. Zum anderen geht bei Wiedergabe
des Systems in erster Ordnung die geometrische Struktur verloren. Das Ziel hier
ist, die Euler-Lagrange Gleichungen abzuleiten, die das optimale Kontrollproblem
bestimmen und dabei die geometrische Struktur zu bewahren.
Anstatt somit die Nebenbedingungen künstlich zu verdoppeln, um die Standardstruktur zu erhalten, wird nur die gegebene Nebenbedingung betrachtet.
Die zu minimierende erweiterte Kostenfunktion nimmt die Form
*
tf
Z
f0 (u, c(t)) +
t0
m
X
DV
λ, −
+
Yi (c(t))ui
dt
i=1
an. Dabei ist die Nebenbedingung auf
TQ
deniert, und
λ
+
dt
stellt ein
1-Form
Feld
dar. Bei Anwendung der Variationsrechnung auf dieses Kostenintegral werden die
u
Variationen von
und
c
betrachtet. Es wird beobachtet, wie die Variationen von
c
das Geschwindigkeitsvektorfeld beeinussen. Dabei wird die kovariante Ableitung,
welche in Kapitel 2.6 eingeführt wurde, verwendet.
c führt nach Abschitt 3.2 auf die Gleichung
*
+ !
m
X
DV
f0 (u, c(t)) + λ, −
+
Yi (c(t))ui dt = 0
(5.9)
dt
i=1
Betrachtung von Variationen der Kurve
Z
tf
δ
t0
oder
Z
tf
t0
d
d
*
f0 (u, c(t)) +
λ, −
DV
+
dt
Im Folgenden wird die Variation bezüglich
m
X
i=1
+!
Yi (c(t))ui
dt
= 0.
=0
c jedes Termes in diesem Ausdruck einzeln
betrachtet. Dabei werden die Regeln des in Abschnitt 3.4 vorgestellten Varitionsprinzips verwendet.
60
Kapitel 5.
1.
d
d
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
5.6
f0 (u, c)
Es gilt
d
d
f0 (u, c) =
s
X
DAi
i=1
d
=
s
X
∇ d c Ai =
s
X
d
i=1
∇δc Ai =
i=1
s
X
∇Ai (δc).
i=1
Nach Anwendung von (2.7) ergibt sich daraus:
d
d
2.
f0 (u, c) =
s D
X
E
di , δc =
∇A
i=1
* s
X
+
di , δc .
∇A
(5.10)
i=1
DV
λ,
d
dt
d
Es gilt
d
d
DV
λ,
dt
D DV
= λ,
.
d dt
Nach Proposition 3.4.3 folgt
d
d
DV
λ,
dt
D DV
= λ,
+ R(δc, V )V .
dt d
Mit Aufteilung des Skalarproduktes, partieller Integration des ersten Termes
und mit Gleichung (2.6) und Proposition 3.4.2 ergibt sich
DV
Dλ Dδc
d
DV
∗
λ,
=−
,
+ T (δc, V ) + hδc, R (λ, V )V i +
λ,
.
d
dt
dt
dt
dt
d
d
Wird wieder partiell integriert, so folgt wiederum mit Gleichung (2.6)
d
d
DV
λ,
dt
D2 λ
Dλ
∗
∗
=
−T
, V + R (λ, V )V, δc +
dt2
dt
d
DV
Dλ
λ,
−
, δc .
dt
d
dt
(5.11)
Der letzte Term kann direkt integriert werden und wird deshalb später bei der
Bestimmung der Endpunktbedingungen in Abschnitt 5.7 betrachtet.
Der bleibende Term im Integranden ist
2
DV
D λ
Dλ
∗
∗
λ,
=
−T
, V + R (λ, V )V, δc .
d
dt
dt2
dt
d
(5.12)
61
Kapitel 5.
3.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
*
d
λ,
d
m
X
5.6
+
Yi (c(t))ui
i=1
Dieser Term wird zu
d
d
*
λ,
m
X
+
Yi (c)ui
*
=
λ,
i=1
m
X
+
∇Yi (δc)ui
i=1
(5.13)
*
=
δc,
m
X
+
∇Yi∗ (λ)ui .
i=1
Nun ist die Variation jedes Termes in die Form
h·, δci gebracht. Alle Ausdrücke in den
Gleichungen (5.10), (5.12) und (5.13) werden zu folgendem Term zusammengefasst:
* s
X
i=1
2
di − D λ + T ∗
∇A
dt2
Dλ
,V
dt
∗
− R (λ, V )V +
m
X
+
∇Yi∗ (λ)ui , δc
.
i=1
Wird dieser Integrand auf null gesetzt, um Gleichung (5.9) zu erfüllen, so ergeben
sich die Bewegungsgleichungen für
λ.
Die Gleichungen werden explizit in Satz 5.6.1
aufgeführt.
Variation von u: stationäre Bedingung
Da die Kostenfunktion abhängig von den Kontrollvariablen
Variation bezüglich
ui
∂f0
δui + hλ, Yi δui i = 0,
∂ui
Da
δui
u
ist, muss noch die
betrachtet werden. Dies ergibt die folgenden Gleichungen:
i = 1, ..., m.
ein Skalar ist, kann er vor das Skalarprodukt gezogen werden und durch
Zusammenfassen ergibt sich:
∂f0
+ hλ, Yi i = 0,
∂ui
Dies sind
m
Bedingungen, die
u
i = 1, ..., m.
als eine Funktion von
q
(5.14)
und
λ
denieren. Hierbei
wird angenommen, dass die Kostenfunktion glatt und konvex bezüglich
u
ist und
Systemzustände und Kontrollvariablen nicht beschränkt sind. Dann repräsentieren
die Gleichungen (5.5), (5.9) und (5.14) zusammen die notwendigen Bedingungen,
die optimale Trajektorien erfüllen müssen. Diese Ergebnisse sind im folgenden Satz
zusammengefasst:
62
Kapitel 5.
Satz 5.6.1
J(u, c)
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
Eine notwendige Bedingung für eine Trajektorie
zu optimieren, ist die Existenz von
λ(t)
und
u(t),
γ(t),
5.7
um die Funktion
die folgende Gleichungen
erfüllen:
D2 λ
− T∗
dt2
Dλ
,V
dt
∗
+ R (λ, V )V =
s
X
di +
∇A
i=1
m
X
(∇Yi∗ (λ)ui )
(5.15)
i=1
und
∂f0
+ hλ, Yi i = 0,
∂ui
i = 1, ..., m.
Es ergibt sich somit eine Gleichung zweiter Ordnung auf
(5.16)
T ∗ Q.
Wird der Levi-Civita Zusammenhang verwendet, so sind die Torsionsterme gleich
null, und der Ausdruck (5.15) vereinfacht sich zu
s
m
X
X
D2 λ
∗
di +
∇A
(∇Yi∗ (λ)ui ).
+
R
(λ,
V
)V
=
dt2
i=1
i=1
5.7. Endpunktbedingungen
Zur Lösung der Dierentialgleichungen, die das optimale Kontrollsystem bestimmen, werden in diesem Abschnitt die Endpunktbedingungen festgelegt. Das optimale Kontrolldierentialgleichungssystem besteht aus zwei Dierentialgleichungen
∗
zweiter Ordnung ((5.5) und (5.15)), wobei eine auf Q und die andere auf T Q deniert ist. Zur Lösung werden somit vier Endpunktbedingungen benötigt, um die
Kontrollfunktion zu berechnen, die die optimale Trajektorie bestimmt.
Folgende zwei optimale Kontrollprobleme werden betrachtet:
1. (Feste Endpunkte)
q0 , V (t0 ) = v0
In diesem Fall sind die Anfangsbedingungen
und die Endbedingungen
c(tf ) = qf , V (tf ) = vf
c(t0 ) =
festgelegt.
Diese Bedingungen bestimmen bereits komplett die optimale Kontrollfunktion
und die zugehörige Trajektorie. Die innitesimalen Variationen am Endpunkt
und somit die Endpunktterme, die durch partielle Integration entstanden sind,
verschwinden.
63
Kapitel 5.
Optimale Kontrolle von Zusammenhangs-Kontrollsystemen
2. (Freie Endpunkte)
In diesem Fall sind die Endbedingungen
5.7
c(tf ), V (tf )
nicht festgelegt. Dies bedeutet, dass die innitesimale Variation der Trajektorie zum Zeitpunkt
tf
nicht null ist. Es werden somit die Bedingungen durch
die Endpunktterme, die durch partielle Integration in Abschnitt 5.6 erhalten
wurden, abgeleitet. Die partielle Integration in Gleichung (5.11) liefert
Z
tf
t0
d
dt
DV
λ,
d
−
Dλ
, δc
dt
dt.
Dieser Term kann direkt integriert werden, so dass für die innitesimale Variation der Kosten
gilt. Zum Zeitpunkt
punkt
tf
tf
DV
Dλ
δJ = λ,
−
, δc d
dt
t0
t0
ist die innitesimale Variation null, aber zum Endzeit-
ergibt sich
DV (tf )
Dλ(tf )
δJf = λ(tf ),
−
, δc(tf ) .
d
dt
Um ein Minimum von J zu erhalten, muss diese Variation null sein. Da der
DV
Term
d zu einem gegebenen Zeitpunkt unabhängig von δc ist, ergeben sich
die zwei Endpunktbedingungen
λ(tf ) = 0
Dλ
(tf ) = 0.
dt
Dλ
dt bestimmen zusammen mit c(t0 ) =
v0 die Randbedingungen für die Lösung des optimalen Kontroll-
Die Bedingungen (5.17) für
q0 , V (t0 ) =
(5.17)
λ
und
problems.
64
6. Optimale Kontrolle eines
starren Körpers
Um zunächst die Theorie zur optimalen Kontrolle von Zusammenhangs-Kontrollsystemen zu verstehen, wird in diesem Kapitel nur ein starrer Körper betrachtet, der
optimal kontrolliert werden soll. Der Körper soll von einer gegebenen Anfangskonguration in eine gegebene Endkonguration gebracht werden. In Kapitel 7 wird dann
ein Verbund starrer Körper mit der in Kapitel 5 erläuterten Theorie analysiert.
Als erstes werden in Abschnitt 6.1 das mathematische Modell und seine Bewegungsgleichungen vorgestellt. In Abschnitt 6.2 wird die Steuerbarkeit des darauf beruhenden Systems gezeigt, so dass in Abschnitt 6.3 die Lösungsstrategie zur optimalen
Kontrolle aus Kapitel 5 angewandt werden kann. Abschlieÿend werden in Abschnitt
6.4 die Simulationsergebnisse vorgestellt.
Das Modell eines einzelnen starren Körpers wird in der Literatur oft als Beispiel
eines mechanischen Systems betrachtet, wie z.B. in [3], [5] und [17]. In [6] und [19]
wird speziell dieses System bezüglich Steuerbarkeit und optimaler Kontrolle und in
[23] seine Linearisierung behandelt.
6.1. Bewegungsgleichungen eines freien starren
Körpers in der Ebene
Es wird das System betrachtet, das aus einem einzelnen starren Körper mit der
Masse
m
besteht, der sich in der Ebene bewegt, die senkrecht zur Wirkrichtung der
Gravitationskraft steht (vgl. Abbildung 6.1).
Der starre Körper in der Ebene hat drei Freiheitsgrade: Translation in Richtung
der
x-Achse,
Translation in Richtung der
y -Achse
und Rotation um den Massen-
mittelpunkt. Die Konguration ist durch die folgenden Variablen bestimmt: Der
(x, y) bezeichnet die Position des Massenzentrums bezüglich des Inertialsystems Σspatial = {Ospatial , e1 , e2 }, und θ beschreibt die relative Orientierung des
Referenzsystems Σbody = {Obody , f1 , f2 } des Körpers zu dem Inertialsystem Σspatial .
2
1
Die Kongurationsmannigfaltigkeit des Systems ist somit Q = R × S mit den KoVektor
65
Kapitel 6.
Optimale Kontrolle eines starren Körpers
Abbildung 6.1.: Der Tangentialraum von
ordinaten
S2
6.1
im Punkt
p
(vgl. [2])
q = (x, y, θ) ∈ Q.
Die Kongurationen des gesamten Systems sind durch eine Kurve
c(t),
c : I → Q, t 7→
V (t) be-
seine Geschwindigkeiten im Kongurationsraum durch das Vektorfeld
schrieben. Für ein festes
t ∈ I
gibt
c(t) = q ∈ Q
V (t) = v ∈ Tq Q die zugehörige Geschwindigkeit
c(t) = (x(t), y(t), θ(t)) und V (t) = (ẋ(t), ẏ(t), θ̇(t)).
eine feste Konguration und
an. In Koordinaten gilt dann
Es ist nun möglich, die totale Energie des Systems als Summe von kinetischer und
potentieller Energie darzustellen. Die kinetische Energie
1
KE = g(v, v)
2
ist durch die Riemannsche Metrik
g = m dx ⊗ dx + m dy ⊗ dy + J dθ ⊗ dθ
gegeben. Es folgt somit
1
1
KE = m(ẋ2 + ẏ 2 ) + J θ̇2 ,
2
2
wobei
m
die Masse des Körpers und
1
J
das Trägheitsmoment über dem Massen-
schwerpunkt ist . Da der Körper sich in einer Ebene, dessen Normale die Richtung
der Gravitationskraft ist, bewegt, ist die potentielle Energie null.
Die antreibende Kraft von variabler Richtung und Gröÿe wirkt auf den Körper in einem Punkt, der eine Distanz
in eine Komponente
F1 ,
h zum Massenschwerpunkt besitzt. Diese Kraft F
kann
die immer tangential zur Bewegungsrichtung des Körpers
wirkt (f1 -Achse), und eine Komponente
F2 ,
die senkrecht zur Bewegungsrichtung
1 Hier
wurde sich bei den Bezeichnungen an die Literatur gehalten. Das Trägheitsmoment über
dem Massenschwerpunkt J ist nicht mit dem Kostenintegral J zu verwechseln.
66
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.2
wirkt (f2 -Achse), aufgeteilt werden. Es wird angenommen, dass der Angrispunkt
f1 -Achse, die durch den Massenschwerpunkt verläuft, liegt.
Das System hat somit n = 3 Freiheitsgrade (x, y, θ) und m = 2 Kontrollkräfte.
bei handelt es sich um ein unterangetriebenes System, da n > m gilt.
der Kraft auf der
Die angreifenden Kräfte sind durch die
F1 = cos θ dx + sin θ dy,
1-Form
Da-
Felder
F2 = − sin θ dx + cos θ dy − h dθ
bestimmt, von denen die Eingangsvektorfelder
Y1 =
cos θ ∂
sin θ ∂
+
,
m ∂x
m ∂y
Y2 = −
sin θ ∂
cos θ ∂
h ∂
+
−
m ∂x
m ∂y J ∂θ
berechnet werden.
Nach Kapitel 5 beschreibt folgendes Zusammenhangs-Kontrollsystem die Bewegung
des starren Körpers in der Ebene:
2
X
DV
=
Yi u i .
dt
i=1
Da die Koezienten der Riemannschen Metrik
g
(6.1)
in den gewählten Koordinaten alle
konstant sind, sind die Christoel-Symbole null, und somit stimmt die kovariante
DV
Ableitung von V mit der gewöhnlichen überein, d.h.
dt = (ẍ, ÿ, θ̈). Mit diesen
Informationen sind die Bewegungsgleichungen des Systems durch
u1 cos θ u2 sin θ
−
m
m
u1 sin θ u2 cos θ
ÿ =
+
m
m
u2 h
θ̈ = −
.
J
ẍ =
(6.2)
gegeben. Werden die Bewegungsgleichungen von Anfang an in Koordinatendarstellung hergeleitet, wobei die Lagrange-Funktion als Riemannsche Metrik bzw. kinetische Energie deniert wird, so ergeben sich als Euler-Lagrange Gleichungen genau
die Bewegungsgleichungen (6.2).
6.2. Steuerbarkeit
Wie schon in Abschnitt 5.3 erläutert wurde, muss zunächst die Steuerbarkeit des
Systems (6.1) gewährleistet sein, um es optimal kontrollieren zu können.
Es werden nun die Steuerbarkeitskriterien, die in Abschnitt 5.3 für nichtlineare
Zusammenhangs-Kontrollsysteme vorgestellt wurden, auf das Beispiel des starren
67
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.2
Körpers in der Ebene angewandt. Laut Abschnitt 5.3 müssen die Eingangsvektorfelder zur Überprüfung der Steuerbarkeit herangezogen werden:
Y1 =
cos θ ∂
sin θ ∂
+
,
m ∂x
m ∂y
Y2 = −
sin θ ∂
cos θ ∂
h ∂
+
−
.
m ∂x
m ∂y J ∂θ
Um Kongurations-Erreichbarkeit und lokale Kongurations-Steuerbarkeit in kleiner
Zeit bzw. Gleichgewichts-Steuerbarkeit für das System nachzuweisen, muss nun die
Gültigkeit von Satz 5.3.1 und Satz 5.3.2 überprüft werden. Dazu sind die folgenden
Berechnungen ausreichend:
hY1 : Y1 i = 0,
hY1 : Y2 i =
h cos θ ∂
h sin θ ∂
−
,
mJ ∂x
mJ ∂y
2h cos θ ∂
2h sin θ ∂
+
,
mJ ∂x
mJ ∂y
h cos θ ∂
h sin θ ∂
[Y1 , Y2 ] = −
+
,
mJ ∂x
mJ ∂y
2h2 cos θ ∂
2h2 sin θ ∂
[Y2 , hY2 : Y2 i] =
−
.
mJ 2 ∂x
mJ 2 ∂y
hY2 : Y2 i =
Damit kann die Kongurations-Steuerbarkeit für den ebenen starren Körper mit
verschiedenen Kombinationen der Eingänge bestimmt werden.
allein:
1. Kontrollkraft Y1
hY1 : Y1 i = 0 gilt, ist es nicht
Lie(Sym(Y)) zu erzeugen. Nach Satz
Da in diesem Fall
möglich, eine andere Richtung als
Y1
in
5.3.1 ist das System (6.1) also nicht kongurations-erreichbar.
Dies führt natürlich dazu, dass das System (6.1) niemals lokal kongurationssteuerbar in kleiner Zeit sein kann.
Interpretation: Aus Abbildung 6.1 ist einzusehen, dass sich bei alleiniger Wirkung der Eingangskraft
F1
der Körper nur entlang der Wirkungslinie dieser
Kraft in Form einer Translation bewegt. Es wird also eine geradlinige Bewegung erzeugt. Das Innere der kongurations-erreichbaren Menge ist immer
leer.
2. Kontrollkraft Y2
Q
allein:
durch die Menge
In diesem Fall wird die maximale Distribution auf
{Y2 , hY2 : Y2 i, [Y2 , hY2 : Y2 i]}
erzeugt. Ebenso wird
TQ
durch diese Menge erzeugt, denn die Vektorfelder in der Menge sind linear
unabhängig: Für das Erzeugnis gilt in Matrixschreibweise

det 

θ
− sin
m
2h cos θ
mJ
2h2 sin θ
mJ 2
cos θ
m
2h sin θ
mJ
2
− 2hmJcos2 θ

− Jh
4h4
0 
 = 2 4 6= 0.
mJ
0
68
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.3
Das System (6.1) ist somit nach Satz 5.3.1 kongurations-erreichbar. Aber das
schlechte symmetrische Produkt
hY2 : Y2 i
ist kein Vielfaches von
Y2 .
(6.1) er-
füllt somit nicht die hinreichende Bedingung für lokale Kongurations-Steuerbarkeit in kleiner Zeit.
Interpretation: Aus Abbildung 6.1 ist einzusehen, dass sich bei alleiniger Wirkung der Eingangskraft
F2
der Körper entlang der Wirkunglinie dieser Kraft
in Form einer Translation bewegt und dabei eine Rotation im Uhrzeigersinn
um den Massenschwerpunkt ausführt. Startet der Körper z.B. im Ursprung, so
x-y -Ebene ausgehend vom Ursprung eine nichtleere kongurationserreichbare Menge erhalten, die sich in der Ebene {(x, y) ∈ R | x > 0} ausbreiwird in der
tet. Allerdings bendet sich der Startpunkt auf dem Rand dieser Menge. Der
Körper erreicht keine Kongurationen in der Ebene
{(x, y) ∈ R | x < 0}.
3. Kontrollkräfte Y1 und Y2 : In diesem Fall wird die maximale Distribution
auf
Q durch die beiden Eingänge Y1 , Y2 und ihrer Lie Klammer [Y1 , Y2 ] gebildet.
T Q durch diese Vektorfelder erzeugt, denn analog zu 2. gilt für
Ebenso wird
dieses Erzeugnis

det 

cos θ
m
θ
− sin
m
sin θ
− hmJ
sin θ
m
cos θ
m
h cos θ
mJ

0
2
h
h 
−J  =
6= 0.
mJ
0
Das System (6.1) ist lokal kongurations-erreichbar nach Satz 5.3.1. Da das
schlechte symmetrische Produkt
hY2 : Y2 i ein Vielfaches von Y1
ist, ist das Sys-
tem nach Satz 5.3.2 lokal kongurations-steuerbar in kleiner Zeit und somit
nach Bemerkung 5.3.1 gleichgewichts-steuerbar.
Interpretation: Der Körper erreicht jede beliebige Konguration in
1
S
Q = R2 ×
.
Die wichtige Voraussetzung für die optimale Kontrolle, die Steuerbarkeit des Systems, ist somit für die Kontrollvektorfelder
Y1
und
Y2
erfüllt.
6.3. Kostenfunktion und Lösung
In diesem Kapitel wird die Theorie aus den Abschnitten 5.4 bis 5.6 auf das Beispiel
des starren Körpers in der Ebene angewandt.
Die Lösung soll energieezient sein, d.h. die Kontrollkräfte sollen minimiert werden.
69
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.4
Nach Abschnitt 5.4 ergibt sich dann die folgende Kostenfunktion
1
(u1 )2 (J + mh2 )(u2 )2
1
f0 (u, q) = hhY1 u1 , Y1 u1 ii + hhY2 u2 , Y2 u2 ii =
+
.
2
2
2m
2Jm
g sind alle Koezienten von g konstant. Die
DV
k
Christoel-Symbole sind demnach gleich null (Γij = 0), und es folgt
dt = (ẍ, ÿ, θ̈).
Der Torsionstensor ist null, da der Levi-Civita Zusammenhang verwendet wird, und
Nach Wahl der Riemannschen Metrik
auch der Krümmungstensor ist null, weil die Christoel-Symbole null sind. Unter
Verwendung von Gleichung (5.15) ergibt sich für die adjungierten Variablen
2
D2 λ X
=
∇Yi∗ (λ)ui .
2
dt
i=1
In Koordinaten mit
λ = (λx , λy , λθ )
(6.3)
wird die Dynamik durch das Dierentialglei-
chungssystem
λ̈x = 0
λ̈y = 0
1
[(−λx sin θ + λy cos θ)u1 + (−λx cos θ − λy sin θ)u2 ]
λ̈θ =
m
(6.4)
beschrieben. Die optimalen Kontrollfunktionen sind durch Gleichung (5.14) gegeben:
∂f0
+ hλ, Yi i = 0,
∂ui
Für
i=1
ergibt sich
∂f0
u1
= ,
∂u1
m
und für
i = 1, 2.
i=2
hλ, Y1 i = λx
cos θ
sin θ
+ λy
,
m
m
folgt
∂f0
J + mh2
=
u2 ,
∂u2
Jm
hλ, Y2 i = −λx
sin θ
cos θ
h
+ λy
− λθ .
m
m
J
Insgesamt ergeben sich somit folgende Bestimmungsgleichungen für
u1 = −(λx cos θ + λy sin θ),
Jm
λx
λy
h
u2 =
sin θ −
cos θ + λθ .
J + mh2 m
m
J
u:
(6.5)
70
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.4
6.4. Simulation
Zur geeigneten Simulation des Systems in MATLAB werden die Gleichungen aus
(6.2), (6.4) und (6.5) verwendet. Das gesamte Kontrollsystem wird durch die Bewegungsgleichungen
ẍ
ÿ
θ̈
λ̈x
u1 cos θ u2 sin θ
−
m
m
u1 sin θ u2 cos θ
=
+
m
m
u2 h
= −
J
= 0
=
(6.6)
λ̈y = 0
λ̈θ =
1
[(−λx sin θ + λy cos θ)u1 + (−λx cos θ − λy sin θ)u2 ]
m
vollständig beschrieben. (6.6) beinhaltet ein System von sechs gewöhnlichen Differentialgleichungen zweiter Ordnung. Die Anfangsdaten des starren Körpers sind
durch
c(t0 ) = (x(t0 ), y(t0 ), θ(t0 )) = q0
und
V (t0 ) = (ẋ(t0 ), ẏ(t0 ), θ̇(t0 )) = v0
fest vorgegeben.
Zum Abschluss dieses Kapitels wird das System für verschiedene Endpunktbedingungen simuliert. Die Ergebnisse sind in Abbildung 6.2 zu sehen.
Die Problemstellung wird durch ein Randwertproblem zwölfter Ordnung beschrieben (sechs Anfangs- und sechs Endwerte), das durch das Dierentialgleichungssystem (6.6) und den von Fall zu Fall verschiedenen Randbedingungen bestimmt ist.
Für die folgenden Simulationen gelten für die Parameter jeweils
und
h = 0.1.
Die Anfangskonguration wird durch
geschwindigkeit durch
v0 = (0, 0, 0)
bestimmt.
q0
q0 = (0, 0, 0)
m = 1, J = 1
und die Anfangs-
ist in den Simulationsbildern in
Abbildung 6.2 durch einen Kreis gekennzeichnet. Der Körper startet somit im Ursprung mit Ausrichtung null, und seine Geschwindigkeiten in
x-
und
y -Richtung
sowie seine Winkelgeschwindigkeit sind null.
Die Endkongurationen des Systems sollen zum festen Zeitpunkt
tf = 5
angenom-
men werden.
1. Fall:
Festlegung der
x-Komponente
der Endkonguration und Endgeschwin-
digkeit. Endbedingungen:
x(tf ) = 1, ẋ(tf ) = 0, λy (tf ) = 0, λ̇y (tf ) = 0, λθ (tf ) = 0, λ̇θ (tf ) = 0.
71
Kapitel 6.
Optimale Kontrolle eines starren Körpers
6.4
2. Fall: Festlegung der x- und y -Komponente der Endkonguration und Endgeschwindigkeit. Endbedingungen:
x(tf ) = 1, ẋ(tf ) = 0, y(tf ) = 1, ẏ(tf ) = 0, λθ (tf ) = 0, λ̇θ (tf ) = 0.
3. Fall: Festlegung der x-, y - und θ-Komponente der Endkonguration und Endgeschwindigkeit. Endbedingungen:
π
x(tf ) = 1, ẋ(tf ) = 0, y(tf ) = 1, ẏ(tf ) = 0, θ(tf ) = − , θ̇(tf ) = 0.
4
Interpretation der Simulationsergebnisse
1. Fall: Da nur eine Translation in x-Richtung ausgeführt wird, ist die Kontrolle
u2
null. Es ist nur eine Kontrolle in
2. Fall:
Für die Translation in
x-
x-Richtung
erforderlich.
y -Richtung ist eine Einwirkung beider
der Kraft F2 wird ein Moment auf den
und
Kraftkomponenten nötig. Aufgrund
Körper ausgeübt, so dass die Endausrichtung nicht mehr null ist.
3. Fall: An den Körper greift kein äuÿeres Moment zur direkten Erzeugung einer
Rotation an. Ein vorgegebener Winkel muss somit durch die Momentenerzeugung der Kraft
F2
erreicht werden. Da
F2
allerdings auch eine Translation des
Körpers zur Folge hat, ist es nicht möglich, den Körper zunächst in die richtige
Endposition zu bringen und dann durch eine Krafteinwirkung die vorgeschriebene Endausrichtung zu erzeugen. Die Ausrichtung
θ
muss sich während der
Translationsbewegungen einstellen. Folglich kann zwar jede Konguration des
Systems erreicht, aber nicht entlang jeder beliebigen Trajektorie beschritten
werden. Somit legt der Körper zur Erreichung seiner Endkonguration groÿe
Bögen zurück (siehe Abbildung 6.2(e)).
Bemerkung 6.4.1
Bei der Simulation sind im Rahmen einiger Testdurchläufe Pro-
bleme aufgetaucht. Für manche Endkongurationen mit festen
x-, y - und θ-Kompo-
nenten wird keine Konvergenz der Kollokationsmethode erreicht bzw. eine schlechte
Näherungslösung berechnet, die nicht der optimalen Lösung entspricht. Der Grund
hierfür liegt in der Schwierigkeit, Randwertprobleme numerisch exakt zu lösen. Ihre
Lösungen sind meist nicht eindeutig. Die Kondition eines Randwertproblems und
die Eindeutigkeit seiner Lösung sind von der Beschaenheit der Randbedingungen
abhängig. Aus diesem Grund muss zur Lösung des Randwertproblems eine erste
Approximationslösung geschätzt werden. Schlechte Anfangsschätzungen führen auf
groÿe Residuen, was bei schlecht konditionierten Problemen die Nicht-Konvergenz
des Verfahrens zur Folge haben kann. Die Berechnung einer korrekten optimalen
Lösung ist also stark von ihrer ersten Anfangsschätzung abhängig.
72
Kapitel 6.
Optimale Kontrolle eines starren Körpers
(a) 1. Fall: Trajektorie
(b) 1. Fall: Kontrollen
(c) 2. Fall: Trajektorie
(d) 2. Fall: Kontrollen
(e) 3. Fall: Trajektorie
(f) 3. Fall: Kontrollen
6.4
Links sind die Trajektorien des Körpers in
der x-y -Ebene und seine Endausrichtungen, rechts die Zeitverläufe der Kontrollfunktionen u1 (t) und u2 (t) abgebildet.
1. Fall: Kosten J = 0.048, 2. Fall: Kosten J = 0.0965, 3. Fall: Kosten
J = 45.4783.
Abbildung 6.2.: Simulation für einen Körper.
73
7. Optimale Kontrolle eines
Verbundes mehrerer starrer
Körper
In diesem Kapitel wird ein Verbund starrer Körper in der Ebene betrachtet. Zunächst wird in Abschnitt 7.1 bis 7.5 der einfachste Fall eines Verbundes von zwei
starren Körpern mit gleicher Masse
m
und gleichem Trägheitsmoment
J
behan-
delt. Dabei sind die Startkongurationen gegeben. Ziel ist es, eine durch bestimmte
Bedingungen gegebene Endkongurationen zu erreichen. Die sich daraus ergebenen
Endbedingungen werden in Abschnitt 7.4 bestimmt. Simulationsergebnisse für den
Verbund zweier Körper werden in Abschnitt 7.5 vorgestellt. Zum Abschluss des Kapitels werden die Ergebnisse eines Verbundes von drei Körpern in Abschnitt 7.6
präsentiert.
7.1. Bewegungsgleichungen
Es wird angenommen, dass sich die beiden Körper in ihrer Dynamik nicht gegenseitig beeinussen. Demzufolge werden zwei unabhängige Systeme in der Form von
Gleichung (5.5) betrachtet. Das aus zwei Körpern bestehende Gesamtsystem hat ins-
x- und y -Achse und Rotation um
den Massenschwerpunkt. Dabei bezeichne (x1 , y1 , θ1 ) analog zu Kapitel 6 die Konguration des ersten starren Körpers und (x2 , y2 , θ2 ) die Konguration des zweiten
4
1
1
starren Körpers. Der Kongurationsraum des Systems ist somit Q = R × S × S
und wird durch die Kurve c(t) = (x1 (t), y1 (t), θ1 (t), x2 (t), y2 (t), θ2 (t)) = q ∈ Q beschrieben. Entsprechend beschreibt V (t) = (ẋ1 (t), ẏ1 (t), θ̇1 (t), ẋ2 (t), ẏ2 (t), θ̇2 (t)) =
v ∈ Tq Q die Geschwindigkeit einer Konguration.
gesamt sechs Freiheitsgrade: jeweils Translation in
Auf jedem dieser Körper wirkt eine wie in Abschnitt 6.1 beschriebene Kontrollkraft
Fi , i = 1, 2,
Fij , i, j = 1, 2,
die in die Kräfte
tangential und orthogonal zur Be-
wegungsrichtung aufgeteilt wird. Die Kontrollkräfte, die am ersten starren Körper
angreifen, werden mit
F11
und
F12
bezeichnet. Entsprechend greifen
F21
und
F22
an
den zweiten starren Körper an.
Das Gesamtsystem hat sechs Freiheitsgrade und vier Kontrollkräfte und ist damit
ein unterangetriebenes System. Es besitzt im Vergleich zu dem System eines einzel-
74
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.2
nen starren Körpers die doppelte Dimension.
Auf der Kongurationsmannigfaltigkeit wird die Riemannsche Metrik
g
durch
g = m dx1 ⊗ dx1 + m dy1 ⊗ dy1 + J dθ1 ⊗ dθ1 +
m dx2 ⊗ dx2 + m dy2 ⊗ dy2 + J dθ2 ⊗ dθ2
deniert. Die kinetische Energie des Gesamtsystems setzt sich aus den kinetischen
Energien der beiden Körper zusammen:
1
1
1
KEges = KE1 + KE2 = m(ẋ21 + ẏ12 + ẋ22 + ẏ22 ) + J(θ̇12 + θ̇22 ) = g(V, V ).
2
2
2
Analog zu Abschnitt 6.1 beschreibt das Zusammenhangs-Kontrollsystem
2
X
DV
=
Yij uij
dt
i,j=1
(7.1)
die Bewegung des Verbundes der beiden starren Körper in der Ebene mit den Eingangsvektorfeldern
Y11 =
cos θ1 ∂
sin θ1 ∂
+
,
m ∂x1
m ∂y1
Y12 = −
sin θ1 ∂
cos θ1 ∂
h ∂
+
−
,
m ∂x1
m ∂y1 J ∂θ1
Y21 =
cos θ2 ∂
sin θ2 ∂
+
,
m ∂x2
m ∂y2
Y22 = −
sin θ2 ∂
cos θ2 ∂
h ∂
+
−
.
m ∂x2
m ∂y2 J ∂θ2
Da die Koezienten der Riemannschen Metrik
g
in den gewählten Koordinaten
konstant sind, sind die Christoel-Symbole null. Demzufolge stimmt die kovariante
DV
Ableitung von V wieder mit der gewöhnlichen überein:
= (ẍ1 , ÿ1 , θ̈1 , ẍ2 , ÿ2 , θ̈2 ).
dt
Mit diesen Informationen sind die Bewegungsgleichungen des Systems durch sechs
Dierentialgleichungen zweiter Ordnung analog zu (6.2) gegeben. Die Dynamik der
beiden einzelnen Körper ist somit völlig entkoppelt. Eine Kopplung der beiden Einzelsysteme kommt lediglich durch die Endbedingungen zustande. Diese werden in
Abschnitt 7.4 behandelt.
7.2. Steuerbarkeit
In diesem Abschnitt wird diskutiert, ob der Verbund jede beliebige Endkonguration
annehmen kann. Dies entspricht der Überlegung, ob die beiden Körper eine beliebige Konguration zueinander in der Kongurationsmannigfaltigkeit
Q
annehmen
können. Folglich muss die Steuerbarkeit des Verbundes geprüft werden.
Die Erfüllung der Steuerbarkeit ist intuitiv klar: Ist ein einzelner Körper steuerbar,
und es kommt ein zweiter hinzu, ohne dass sich die beiden gegenseitig beeinussen, so
ist auch der zweite Körper steuerbar. Die beiden Körper können somit jeweils in eine
beliebige Endkonguration gebracht werden, und dieses Gesamtsystem ist wiederum
75
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.4
steuerbar. Aus dieser Argumentation kann geschlossen werden, dass Steuerbarkeit
eines einzelnen Körpers Steuerbarkeit eines Verbundes von
n
Körpern impliziert,
sofern diese sich nicht gegenseitig beeinussen. Analog zu Abschnitt 6.2 kann diese
Behauptung für den Fall
n=2
leicht mit Hilfe der Theorie aus Abschnitt 5.3 nach-
gerechnet werden.
7.3. Kostenfunktion und Lösung
Wie im Fall eines einzelnen starren Körpers werden auch hier alle Kontrollkräfte
minimiert. Entsprechend zur Kostenfunktion des Kontrollproblems eines einzelnen
starren Körpers nimmt die Kostenfunktion des Verbundsystems die Darstellung
2
1X
f0 (u, q) =
hhYij uij , Yij uij ii
2 i,j=1
(u11 )2 (J + mh2 )(u12 )2 (u21 )2 (J + mh2 )(u22 )2
+
+
+
=
2m
2Jm
2m
2Jm
an. Der Torsionstensor ist null, da der Levi-Civita Zusammenhang verwendet wird,
und auch der Krümmungstensor ist null, weil die Christoel-Symbole null sind.
Unter Verwendung von Gleichung (5.15) ergibt sich analog zu Abschnitt 6.3 für die
adjungierten Variablen:
2
X
D2 λ
=
∇Yij∗ (λ)uij .
dt2
i,j=1
Mit der Koordinatendarstellung
(7.2)
λ = [λx1 , λy1 , λθ1 , λx2 , λy2 , λθ2 ]
werden zur Bestim-
mung der Adjungierten sechs Dierentialgleichungen zweiter Ordnung analog zu dem
System (6.4) erhalten.
Die optimalen Kontrollfunktionen sind durch Gleichung (5.14) gegeben:
∂f0
+ hλ, Yi i = 0,
∂ui
i = 1, ..., 4.
Insgesamt ergeben sich somit folgende Bestimmungsgleichungen für
u11 = −(λx1 cos θ1 + λy1 sin θ1 )
Jm
λ x1
λy
u12 =
sin θ1 − 1 cos θ1 +
2
J + mh
m
m
u21 = −(λx2 cos θ2 + λy2 sin θ2 )
Jm
λ x2
λy
u22 =
sin θ2 − 2 cos θ2 +
2
J + mh
m
m
h
λθ
J 1
u:
(7.3)
h
λθ .
J 2
76
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.4
7.4. Endbedingungen
Ziel ist es, dass der Verbund bestehend aus zwei Körpern eine bestimmte Endkonguration annimmt. Diese Endkonguration wird durch relative Daten der beiden
Körper zueinander bestimmt. Es kann beispielsweise der Abstand der beiden Körper
in der Endkonguration festgelegt werden. Die gesamte Endkonguration wird dabei
nicht eindeutig festgelegt, sondern kann bei der Lösung des optimalen Kontrollproblems im Rahmen der vorgegebenen Bedingungen variieren. Bei der Anordnung zu
einem festen Zeitpunkt haben die Körper somit eine freie Wahlmöglichkeit.
Dafür werden zunächst weniger Endbedingungen als nötig festgelegt. Anschlieÿend
werden für das Problem ergänzende Randbedingungen aus der Problemstellung konstruiert.
Die Endkonguration für feste Zeit
t = tf
soll folgenden Bedingungen genügen (siehe
Abbildung 7.1):
Abbildung 7.1.: Zwei starre Körper in ihrer Endkonguration
1. Alle Endgeschwindigkeiten sind null (V
(tf ) = 0):
x˙1 (tf ) = 0, y˙1 (tf ) = 0, x˙2 (tf ) = 0, y˙2 (tf ) = 0, θ˙1 (tf ) = 0, θ˙2 (tf ) = 0.
(7.4)
(6 Bedingungen)
2. Die beiden Körper nehmen eine vorgegebene Endausrichtung an:
θ1 (tf ) = ϕ1 , θ2 (tf ) = ϕ2 .
(7.5)
(2 Bedingungen)
77
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
3. Der Mittelpunkt
M = (Mx , My )
7.4
der Verbindungsstrecke zwischen den beiden
Massenschwerpunkten ist fest:
1
(x1 (tf ) + x2 (tf )) = Mx ,
2
1
(y1 (tf ) + y2 (tf )) = My .
2
(7.6)
(2 Bedingungen)
4. Der Abstand
d
der beiden Massenschwerpunkte ist fest:
(x1 (tf ) − x2 (tf ))2 + (y1 (tf ) − y2 (tf ))2 = d2
(7.7)
(1 Bedingung)
Insgesamt bilden die Bedingungen (7.4) bis (7.7) elf Randbedingungen. In Abbildung 7.1 ist zu sehen, dass sich die Körper in ihrer Endkonguration bei festem
Abstand
d
auf einem Kreis mit dem Durchmesser
d
bewegen können, um die End-
bedingungen zu erfüllen. Dies ist die freie Wahlmöglichkeit bei der Anordnung zum
Endzeitpunkt.
Die Dierentialgleichungen (7.1), (7.2) und (7.3) beschreiben ein Dierentialgleichungssystem der Ordnung
24. Wird die Anfangskonguration und Anfangsgeschwin-
digkeit des Verbundes komplett vorgeschrieben (zwölf Bedingungen), so bildet das
Dierentialgleichungssystem mit den Anfangsbedingungen und den Endbedingungen (7.4) bis (7.7) noch kein vollständiges Randwertproblem der Ordnung
nur
23
24,
da
Randwertbedingungen gegeben sind. Somit muss zur Lösung des Randwert-
problems eine weitere Randbedingung gefunden werden.
Bestimmung der zusätzlichen Randbedingung
Zur Minimierung des Kostenintegrals müssen nach Kapitel 5.7 bei optimalen Kontrollproblemen mit freien Endpunkten die Bedingungen
λ(tf ) = 0
und
Dλ
(tf ) = 0
dt
(7.8)
erfüllt sein. Diese ergaben sich aus der Variationsbetrachtung des durch partielle
Integration erhaltenen Termes
DV (tf )
Dλ(tf )
λ(tf ),
−
, δc(tf ) = 0.
d
dt
(7.9)
In diesem Fall sind die Endpunkte nur teilweise festgelegt. Es wird eine einzelne
zusätzliche Bedingung zur Vervollständigung des Randwertproblems benötigt. Die
78
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.4
Gleichungen (7.8) bilden dagegen für den Verbund zwölf zusätzliche Endpunktbedingungen.
Um eine passende Bedingung aus (7.9) zu erhalten, werden die schon denierten
Endbedingungen (7.4) bis (7.7) verwendet und mit Hilfe der Variationsrechnung Bedingungen an die innitesimalen Variationen der einzelnen Koordinaten bestimmt.
Untersuchung der bekannten Endbedingungen:
V (tf ) = vf = 0 vorgegeben wird, bleibt die Variation der Geschwindigkeitskurve in tf stationär.
DV (tf )
Somit ist ihre innitesimale Variation
= 0. Die Endbedingung (7.9)
d
reduziert sich zu
Dλ(tf )
, δc(tf ) = 0,
(7.10)
dt
1. Da für die Endkonguration eine feste Geschwindigkeit
und in Koordinatenschreibweise bedeutet dies
λ̇x1 (tf )δx1 (tf ) + λ̇y1 (tf )δy1 (tf ) + λ̇x2 (tf )δx2 (tf ) + λ̇y2 (tf )δy2 (tf )
(7.11)
+λ̇θ1 (tf )δθ1 (tf ) + λ̇θ2 (tf )δθ2 (tf ) = 0.
2. Die Endausrichtungen der Körper nehmen einen vorgegebenen Wert an, d.h.
auch die innitesimalen Variationen zum Zeitpunkt tf von
θ1
und
θ2
sind null.
Bedingung (7.11) reduziert sich zu
λ̇x1 (tf )δx1 (tf ) + λ̇y1 (tf )δy1 (tf ) + λ̇x2 (tf )δx2 (tf ) + λ̇y2 (tf )δy2 (tf ) = 0.
(7.12)
Dies waren die einfachen Randbedingungen, die lediglich einen bestimmten Wert
für eine Koordinate zum Endzeitpunkt festlegen. Die Randbedingungen (7.6) und
(7.7) bestehen dagegen aus Funktionen, die einen bestimmten Wert zum Endzeitpunkt annehmen sollen.
Die Variationsbetrachtung solcher Funktionen wird formal folgendermaÿen durchgeführt:
e:Q→R
e(c(tf )) = 0 eine Endbedingung des Systems vorschreibt. Es werden Variationen c (t) = c(t, ) von c betrachtet, die auf dem
Intervall [t0 , tf ] mit ∈ [−0 , 0 ] deniert sind und die Endbedingung des Systems
e(c (tf )) = 0 erfüllen. Da die Funktion ẽ() : [−0 , 0 ] → R mit ẽ() = e(c (tf ))
konstant für alle ∈ [−0 , 0 ] ist, gilt
Sei
eine Funktion, die durch
0=
Dabei ist
d
d
ẽ() =
c (tf ) = q˜f .
d
d
e(c (tf )) =
Somit ist
q˜f
◦ c )
(tf ) = de(q˜f ) · δc(tf ).
d
d(e
die Konguration in der Mannigfaltigkeit
das System des Verbundes zum Endzeitpunkt
t = tf
(7.13)
Q,
die
annimmt.
79
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
Mit den Koordinaten
(x1 , y1 , θ1 , x2 , y2 , θ2 )
der Kurve
c
7.4
folgt für die innitesimale
Variation
δc = δx1
∂
∂
∂
∂
∂
∂
+ δy1
+ δθ1
+ δx2
+ δy2
+ δθ2
.
∂x1
∂y1
∂θ1
∂x2
∂y2
∂θ2
Das beschriebene Variationsprinzip wird nun auf die drei übrigen Randbedingungen
(7.6) und (7.7) angewandt.
3. Die Randbedingung für die Lage des Mittelpunktes wird in Koordinaten durch
1
1
die Funktionen ex (q) = (x1 +x2 )−Mx und ey (q) = (y1 +y2 )− My bestimmt.
2
2
Dann gilt
dex (q)
=
1
1
dx 1 +
dx2
2
2
und
dey (q)
=
1
1
dy 1 +
dy 2 .
2
2
Nach (7.13) müssen dann die Endbedingungen
δx1 (tf ) + δx2 (tf ) = 0
δy1 (tf ) + δy2 (tf ) = 0
und
(7.14)
erfüllt werden.
Interpretation: Die Lage des Mittelpunktes zwischen den beiden Körpern ist
fest. Verschiebt sich einer der Körper um
um
δx1
δx1 ,
so muss sich der andere Körper
in die andere Richtung verschieben, damit die
x-Komponente des Mit-
telpunktes erhalten bleibt. Die Summe der Variationen der beiden Körper in
x-Richtung muss also null sein. Die gleiche Argumentation gilt für Variationen
in y -Richtung.
4. Die Randbedingung für den Abstand der beiden Körper wird in Koordinaten
2
2
2
durch die Funktion e(q) = (x1 − x2 ) + (y1 − y2 ) − d bestimmt. Dann folgt
de(q)
= 2(x1 − x2 ) dx1 + 2(y1 − y2 ) dx2 − 2(x1 − x2 ) dy1 − 2(y1 − y2 ) dy2 .
Anwendung von (7.13) führt auf die Endbedingung
(δx1 (tf ) − δx2 (tf ))(x1 (tf ) − x2 (tf ))+
(δy1 (tf ) − δy2 (tf ))(y1 (tf ) − y2 (tf )) = 0.
Dabei sind
x1 (tf ), x2 (tf ), y1 (tf )
und
y2 (tf )
Koordinaten des Punktes
(7.15)
q̃f .
Interpretation: Der Abstand zwischen den beiden Körpern ist fest. Sind
und
(x2 , y2 )
(x1 , y1 )
die Koordinaten der beiden Körper, so muss die Gleichung
(x1 − x2 )2 + (y1 − y2 )2 = d2
(7.16)
80
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.6
erfüllt sein. Verschiebt sich einer der Körper um δx1 in x-Richtung und δy1 in
y -Richtung, so muss sich zur Erhaltung des Abstandes d der zweite Körper um
δx2 in x-Richtung und δy2 in y -Richtung verschieben, so dass die Gleichung
(x1 + δx1 − x2 − δx2 )2 + (y1 + δy1 − y2 − δy2 )2 = d2
(7.17)
erfüllt ist. Gleichsetzen von (7.16) und (7.17) und Vernachlässigung von Termen höherer Ordnung liefert
(x1 − x2 )2 + (y1 − y2 )2 = (x1 + δx1 − x2 − δx2 )2 + (y1 + δy1 − y2 − δy2 )2
= (x1 − x2 )2 + 2(x1 − x2 )(δx1 − δx2 ) + (y1 − y2 )2 + 2(y1 − y2 )(δy1 − δy2 ) + h.o.t..
Daraus folgt direkt die Gleichung (7.15).
Die Randbedingungen (7.6) und (7.7) liefern somit zusätzlich drei Endbedingungen
an die Variationen. Substitution der Gleichungen (7.14) und (7.15) in die Bedingung
(7.12) führt zu
λ̇x1 (tf ) − λ̇x2 (tf ) x1 (tf ) − x2 (tf )
−
y1 (tf ) − y2 (tf )
λ̇y1 (tf ) − λ̇y2 (tf )
Da die innitesimale Variation
δx1 (tf )
!
δx1 (tf ) = 0.
nicht notwendig null ist, ergibt sich als zu-
sätzliche Endpunktbedingung für das Randwertproblem
λ̇x1 (tf ) − λ̇x2 (tf ) x1 (tf ) − x2 (tf )
= 0.
−
y1 (tf ) − y2 (tf )
λ̇y1 (tf ) − λ̇y2 (tf )
(7.18)
7.5. Simulation
Zur geeigneten Simulation des Systems in MATLAB werden die Bewegungsgleichungen aus (7.1), (7.2) und (7.3) verwendet.
Diese bilden ein System von zwölf gewöhnlichen Dierentialgleichungen zweiter Ordnung. Zusammen mit den Randbedingungen bestehend aus der Vorgabe der Anfangskonguration, der Anfangsgeschwindigkeit und den Endbedingungen (7.4) bis
(7.7) und (7.18) ergibt sich ein Randwertproblem der Ordnung
24.
Bei den durchgeführten Simulationen sind alle Anfangsgeschwindigkeiten null und
für die Parameter des Systems gilt für jeden Körper
m = 1, J = 1, h = 0.1, tf = 5.
Die Ergebnisse der Simulation sind in Abbildung 7.2 zu sehen.
7.6. Drei Körper
Für den Fall des Verbundes von drei Körpern wird analog zu dem Fall für zwei
Körper verfahren. In diesem Abschnitt sollen nur die Ergebnisse zu den zugehörigen
Endbedingungen präsentiert werden.
81
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
7.6
Endbedingungen
1. Alle Endgeschwindigkeiten sind null (V
(tf ) = 0):
x˙1 (tf ) = 0, y˙1 (tf ) = 0, θ˙1 (tf ) = 0,
x˙2 (tf ) = 0, y˙2 (tf ) = 0, θ˙2 (tf ) = 0,
x˙3 (tf ) = 0, y˙3 (tf ) = 0, θ˙3 (tf ) = 0.
(9 Bedingungen)
2. Die drei Körper nehmen eine vorgegebene Endausrichtung an:
θ1 (tf ) = ϕ1 , θ2 (tf ) = ϕ2 , θ3 (tf ) = ϕ3 .
(3 Bedingungen)
3. Die drei Körper bilden ein Dreieck mit den festen Abständen
d12 , d13
und
d23 :
(x1 (tf ) − x2 (tf ))2 + (y1 (tf ) − y2 (tf ))2 = d212 ,
(x1 (tf ) − x3 (tf ))2 + (y1 (tf ) − y3 (tf ))2 = d213 ,
(x2 (tf ) − x3 (tf ))2 + (y2 (tf ) − y3 (tf ))2 = d223 .
(3 Bedingungen)
4. Der Schwerpunkt
M = (Mx , My )
fest:
des Dreiecks, das die drei Körper bilden, ist
1
(x1 (tf ) + x2 (tf ) + x3 (tf )) = Mx ,
3
1
(y1 (tf ) + y2 (tf ) + y3 (tf )) = My .
3
(2 Bedingungen)
Zusatzbedingung:
λ̇x1 + λ̇y1
−2x1 + x2 + x3
−2y1 + 2y2 − y3
x1 − 2x2 + x3
+ λ̇x2
+ λ̇y2
+
2y1 − y2 − y3
2y1 − y2 − y3
2y1 − y2 − y3
λ̇x3
−y1 − y2 + 2y3
x1 + x2 − 2x3
+ λ̇y3
= 0.
2y1 − y2 − y3
2y1 − y2 − y3
Die Ergebnisse der Simulation sind in Abbildung 7.3 zu sehen. Dabei sind die Paramter des Systems analog zu dem Verbund zweier Körper und die Anfangsgeschwindigkeit als null gewählt.
Bemerkung 7.6.1
Bei der Simulation der Verbunde mehrerer Körper ergaben sich
ähnliche Probleme wie sie in Bemerkung 6.4.1 beschrieben wurden.
82
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
(a) 1. Fall: Trajektorien
(b) 1. Fall: Kontrollen
(c) 2. Fall: Trajektorien
(d) 2. Fall: Kontrollen
Abbildung 7.2.:
Simulation für Verbund zweier Körper.
jektorien der Körper in der
x-y -Ebene
7.6
Links sind die Tra-
und ihre Endausrichtungen,
rechts die Zeitverläufe der Kontrollfunktionen abgebildet.
1.
2.
Fall:
Fall:
ϕ1 = ϕ2 = 0, M = (2, 0), d = 2, Kosten J = 0.096.
ϕ1 = ϕ2 = − π4 , M = (2, 1), d = 2, Kosten J = 86.31.
83
Kapitel 7.
Optimale Kontrolle eines Verbundes mehrerer starrer Körper
(a) 1. Fall: Trajektorien
(b) 1. Fall: Kontrollen
(c) 2. Fall: Trajektorien
(d) 2. Fall: Kontrollen
Abbildung 7.3.:
7.6
Simulation für Verbund von drei Körpern. Links sind die Trajektorien der Körper in der
x-y -Ebene
und ihre Endausrichtungen,
rechts die Zeitverläufe der Kontrollfunktionen
abgebildet.
√
3
5
1. Fall: ϕ1 = ϕ2 = ϕ3 = 0, M = ( 2 , 3 ), d12 = d13 =
Kosten J = 0.3241.
2. Fall: ϕ1 = ϕ2 = ϕ3 = − π4 , M = (2, 1), d12 = d13 =
Kosten
d23 = 2,
d23 = 3,
J = 142.7426.
84
8. Fazit und Ausbilck
In diesem Kapitel werden noch einmal die wichtigsten Aussagen und Schritte der
Arbeit zusammengefasst. Abschlieÿend werden einige Motivationen für zukünftige
Forschungsarbeiten dargelegt.
8.1. Fazit
Ziel dieser Arbeit war es, eine Lösungsstrategie zu entwickeln, um einen Verbund
starrer Körper von einer gegebenen Anfangskonguration energieoptimal in eine
Endkonguration zu steuern. Diese Endkonguration muss nicht notwendigerweise fest sein. Hier wurde sie dadurch bestimmt, dass die Körper des Verbundes zum
Endzeitpunkt bestimmte Relationen zueinander und relativ zu einem Ziel annehmen
sollen. Dabei haben sie in ihrer Endpositionierung noch eine freie Wahlmöglichkeit.
Als eine mögliche Anwendung kann ein Verbund von
n Satelliten betrachtet werden,
die sich um ein Ziel anordnen und dabei jeweils gleiche Abstände zueinander haben
sollen. Ob das gleichseitige
n-Eck, das die Positionen der Satelliten bilden, um einen
Winkel in seinem Schwerpunkt gedreht wird oder nicht, spielt hierbei keine Rolle.
Der Verbund wurde zunächst mit Methoden der Dierentialgeometrie modelliert,
um die abstrakten Kongurationsräume dieses Systems zu beschreiben und Koordinateninvarianz der Objekte des Modells zu sichern. Bei dieser Modellierung spielen
der ane Zusammenhang und die kovariante Ableitung, die eine koordinatenunabhängige Formulierung der Bewegungsgleichungen des Systems ermöglichen, eine
wichtige Rolle.
Mit der Methode der Lagrange-Multiplikatoren und einem Variationsansatz, der eng
mit dem anen Zusammenhang in Verbindung steht, wurde zur Lösung des optimalen Kontrollproblems ein Randwertproblem generiert, das mit Hilfe numerischer
Methoden gelöst und simuliert werden konnte.
8.2. Ausblick
Die hier vorgestellten Motivationen für zukünftige Forschungsarbeiten gründen sowohl auf entstandene Probleme als auch auf neue Ansätze und Ideen. Zur Ver-
85
Kapitel 8.
Fazit und Ausbilck
8.2
besserung des mathematischen Modells und somit zur Berechnung realitätsnäheren
Lösungen können Erweiterungen des physikalischen Modells vorgenommen und neue
Optimierungsstrategien entwickelt werden. Die folgende Liste beinhaltet nur einen
Teil der Ideen, die bei der Modellierung und dem Lösungsverfahren umgesetzt werden können.
•
Bei der Modellierung des Verbundes ist die Kollision zweier oder mehrerer
Körper nicht ausgeschlossen. Eine Kopplung der Bewegungsgleichungen der
einzelnen Körper durch die Einführung künstlicher Potentiale dient zur Kollisionsvermeidung. Dabei wirken bei der Näherung zweier Körper künstliche
Potentialkräfte entgegen dieser Bewegungsrichtung, so dass eine Kollision nicht
möglich ist. Dieser Ansatz wird in [13] für Punktmassen vorgestellt.
•
Realitätsnähere Betrachtungen im Raum anstatt in der Ebene führen auf eine
gröÿere Anzahl von Freiheitsgraden und damit auf komplexere physikalische
und höherdimensionalere mathematische Modelle.
•
Zur Ausführung von Formationen des Verbundes ist Kommunikation zwischen
den Körpern und somit ein Informationsaustausch notwendig. Dieser kann in
dem System mit Hilfe graphentheoretischer Methoden modelliert werden (siehe
[9]).
•
Um die numerischen Schwierigkeiten (siehe Bemerkung 6.4.1) zu umgehen,
können andere Optimierungsansätze als die Methode der Euler-Lagrange-Multiplikatoren berachtet werden. Dies kann auf ezientere numerische Verfahren
zur Lösung des Randwertproblems führen.
Anhand dieser Punkte wird deutlich, dass das hier zugrundeliegende Modell nur der
Grundstein für komplexere Probleme darstellt. Als motivierendes Beispiel ist dabei
die eziente Kontrolle von Verbunden von Raumfahrzeugen und Formationsügen
zu nennen. Allerdings sind zum vollständigen Verständnis und zur Modellierung
solch komplexer Probleme die in dieser Arbeit behandelten Methoden zur Modellierung und Analyse mechanischer Verbundsysteme unverzichtbar.
86
Literaturverzeichnis
[1] R. Abraham, J. E. Marsden, T. Ratiu. Manifolds, Tensor Analysis, and
Applications. Springer-Verlag, New York, 1988.
[2] C. Bär. Elementare Dierentialgeometrie. Walter de Gruyter GmbH & Co.
KG, Berlin, 2001.
[3] A. M. Bloch. Nonholonomic Mechanics and Control. Springer-Verlag, New
York, 2003.
[4] F. Bullo. Nonlinear Control of Mechanical Systems: A Riemannian geometry approach. Ph.D. thesis, California Institute of Technology, 1999.
[5] F. Bullo, A. D. Lewis. Geometric Control of Mechanical Systems. In Vor-
bereitung, 2004.
[6] A. T. Coombs, A. D. Lewis. Optimal control for a simplied hovercraft
model. Preprint, 2000.
[7] P. Deuhard, F. Bornemann. Scientic Computing with Ordinary Dierential Eqautions. Springer-Verlag, New York, 2002.
[8] M. P. Do Carmo. Riemannian Geometry. Birkhäuser, Boston, 1992.
[9] J. A. Fax. Optimal and Cooperative Control of Vehicle Formations. Ph.D.
thesis, California Institute of Technology, 2002.
[10] A. Isidori. Nonlinear Control Systems (Third Edition). Springer-Verlag,
London, 1995.
[11] V. Jurdjevic. Geometric Control Theory. Cambridge University Press,
New York, 1997.
[12] S. Kobayashi, K. Nomizu. Foundations of Dierential Geometry, Vol I. In-
terscience Publishers, New York, 1963.
[13] N. E. Leonard, E. Fiorelli. Virtuel Leaders, Articial Potentials and Coordinated Control of Groups. Proc. of the 40th IEEE conference on Decision
and Control, Orlando, FL, 2968-2973, 2001.
87
Literaturverzeichnis
.0
[14] A. D. Lewis. Aspects of Geometric Mechanics and Control of Mechanical
Systems. Ph.D. thesis, California Institute of Technology, 1995.
[15] A. D. Lewis. The geometry of optimal control for ane connection control
systems. Preprint, 1999.
[16] A. D. Lewis. The geometry of the maximum principle for ane connection
control systems. Preprint, 2000.
[17] A. D. Lewis, R. M. Murray. Decomposition for control systems on manifolds with an ane connection. Systems & Control Letters
31(4), 199-205,
1997.
[18] A. D. Lewis, R. M. Murray. Conguration controllability of simple mechanical control systems. SIAM Review. A Publication of the Society for In-
dustrial and Applied Mathematics
41(3), 555-574, 1999.
[19] A. D. Lewis, D. R. Tyner. Controllability of a hovercraft model (and two
general results). Nicht veröentlicht.
[20] J. E. Marsden,
T. Ratiu.
Introduction
to
Mechanics
and
Symmetry.
Springer-Verlag, New York, 1994.
[21] E. R. Pinch. Optimal Control and the Calculus of Variations. Oxford Uni-
versity Press, New York, 1993.
[22] L. F. Shampine, J. Kierzenka, M. W. Reichelt. Solving Boundary Value
Problems for Ordinary Dierential Equations in MATLAB with
bvp4c.
Index of ftp://ftp.mathworks.com/pub/doc/papers/bvp/.
[23] D. R. Tyner. Linearization of ane connection control system. MSc The-
sis, Queen's University, 2000.
88
Herunterladen