Zur optimalen Kontrolle von Verbunden starrer Körper Sina Ober-Blöbaum Diplomarbeit Universität Paderborn Fakultät für Elektrotechnik, Informatik und Mathematik Institut für Mathematik 31.03.2004 0.0 Betreuer: Dr. Oliver Junge Danksagung Ich danke Herrn Dr. Oliver Junge und Herrn Prof. Dr. Michael Dellnitz für die Vergabe des Themas. Insbesondere bedanke ich mich für die intensive Betreuung bei Herrn Dr. Oliver Junge und für die Beantwortung zahlreicher Fragen und Korrekturlesungen bei den Mitgliedern des Lehrstuhls für Angewandte Mathematik an der Universität Paderborn. Besonderen Dank gilt auch meinen Eltern, die mich während meines Studiums immer unterstützt haben. Sina Ober-Blöbaum Erklärung Hiermit versichere ich, dass ich die folgende Arbeit selbstständig und ohne unerlaubte fremde Hilfe angefertigt, keine anderen als die angegebenen Quellen und Hilfsmittel benutzt und den benutzten Quellen wörtlich oder inhaltlich entnommene Stellen als solche kenntlich gemacht habe. Paderborn, den 31.03.2004 (Sina Ober-Blöbaum) ii Inhaltsverzeichnis 1. Einleitung 1 1.1. Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2. Dierentialgeometrische Sichtweise . . . . . . . . . . . . . . . . . . . 3 1.3. Methoden und Struktur . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.4. Übersicht der einzelnen Kapitel . . . . . . . . . . . . . . . . . . . . . 2. Grundlagen zur Dierentialgeometrie 6 8 2.1. Mannigfaltigkeit und Abbildungen zwischen Mannigfaltigkeiten . . . . 8 2.2. Tangentialvektor und Tangentialbündel . . . . . . . . . . . . . . . . . 11 2.3. Kovektor und Kotangentialbündel . . . . . . . . . . . . . . . . . . . . 15 2.4. Vektorfeld und Lie Klammer . . . . . . . . . . . . . . . . . . . . . . . 17 2.5. Tensor und Tensorfeld 21 2.6. Theorie des Anen Zusammenhangs 2.7. Riemannsche Geometrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 . . . . . . . . . . . . . . . . . . . . . . . . . 28 3. Variationsrechung und Euler-Lagrange Gleichungen 31 3.1. Begrie und Denitionen . . . . . . . . . . . . . . . . . . . . . . . . . 31 3.2. Minimierung mit Variationsrechnung . . . . . . . . . . . . . . . . . . 32 3.3. Minimierung mit Nebenbedingungen . . . . . . . . . . . . . . . . . . 35 3.4. Variationsrechnung in der anen Zusammenhangstheorie . . . . . . . 37 4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode 39 4.1. Was sind Randwertprobleme? . . . . . . . . . . . . . . . . . . . . . . 39 4.2. Die Kollokationsmethode . . . . . . . . . . . . . . . . . . . . . . . . . 40 4.3. Umsetzung der Kollokationsmethode in der MATLAB-Funktion iii bvp4c 41 Inhaltsverzeichnis 0.0 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 43 5.1. Optimale Kontrolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 5.2. Zusammenhangs-Kontrollsystem . . . . . . . . . . . . . . . . . . . . . 46 5.3. Steuerbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 5.4. Kostenfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.5. Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.6. Problemlösung: Lagrange-Multiplikatoren und Variationsrechnung . . 59 5.7. Endpunktbedingungen 63 . . . . . . . . . . . . . . . . . . . . . . . . . . 6. Optimale Kontrolle eines starren Körpers 65 6.1. Bewegungsgleichungen eines freien starren Körpers in der Ebene . . . 65 6.2. Steuerbarkeit 67 6.3. Kostenfunktion und Lösung . . . . . . . . . . . . . . . . . . . . . . . 69 6.4. Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.1. Bewegungsgleichungen 7.2. Steuerbarkeit 7.3. Kostenfunktion und Lösung 7.4. Endbedingungen 74 . . . . . . . . . . . . . . . . . . . . . . . . . . 74 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 . . . . . . . . . . . . . . . . . . . . . . . 76 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 7.5. Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 7.6. Drei Körper . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 8. Fazit und Ausbilck 85 8.1. Fazit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 8.2. Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 Literaturverzeichnis 87 iv Abbildungsverzeichnis 1.1. Ein ebener starrer Körper . . . . . . . . . . . . . . . . . . . . . . . . 4 2.1. Koordinatenkarten auf einer dierenzierbaren Mannigfaltigkeit . . . . 9 2.2. Die 2.3. Stereographische Koordinaten für . . . . . . . . . . . . . . . . . . 11 2.4. Dierenzierbare Abbildung . . . . . . . . . . . . . . . . . . . . . . . . 12 S2 Sphäre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . S 2.5. Der Tangentialraum von 2.6. Das Tangentialbündel von 2 S1 im Punkt p. 10 . . . . . . . . . . . . . . . . 14 . . . . . . . . . . . . . . . . . . . . . . 15 2.7. Das Dierential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.8. Das Gravitationskraftfeld . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.9. Die Fluss-Interpretation der Lie Klammer . . . . . . . . . . . . . . . 20 3.1. Variation und innitesimale Variation . . . . . . . . . . . . . . . . . . 32 5.1. Erreichbarkeit und Steuerbarkeit 55 6.1. Der Tangentialraum von 6.2. Simulation für einen Körper S1 S2 . . . . . . . . . . . . . . . . . . . . im Punkt p. . . . . . . . . . . . . . . . . 66 . . . . . . . . . . . . . . . . . . . . . . . 73 7.1. Zwei starre Körper in ihrer Endkonguration . . . . . . . . . . . . . . 77 7.2. Simulation für Verbund zweier Körper . . . . . . . . . . . . . . . . . 83 7.3. Simulation für Verbund von drei Körpern . . . . . . . . . . . . . . . . 84 v 1. Einleitung Zu Beginn wird in Abschnitt 1.1 das Thema motiviert. Schlüsselbegrie werden erläutert und Anwendungsbeispiele vorgestellt. In dieser Arbeit wird das Thema aufbauend auf Methoden der Dierentialgeometrie bearbeitet. Diese Sichtweise des Problems wird in Abschnitt 1.2 diskutiert. Anschlieÿend werden in Abschnitt 1.3 die verwendeten Methoden und die Struktur der Arbeit erläutert. Zur Übersicht bildet der Abschluss der Einleitung eine Auistung der Inhalte der einzelnen Kapitel. 1.1. Motivation Als erstes werden die Begrie im Titel der Diplomarbeit Zur optimalen Kontrolle von Verbunden starrer Körper näher erläutert. Was ist ein Verbund starrer Körper? Ein starrer Körper kann als System von unendlich vielen Massenpunkten aufgefasst werden, deren gegenseitige Abstände sich nicht ändern. Er ist demzufolge nicht deformierbar. Eine beliebige Bewegung eines solchen starren Körpers kann zerlegt werden in die Translation seines Schwerpunktes (Position) und in seine Rotationsbewegung um eine Achse, die durch den Schwerpunkt verläuft (Ausrichtung). Ein Verbund starrer Körper besteht aus mindestens zwei Körpern, die hinsichtlich der Gesamtgeometrie eine bestimmte Konguration (Positionen und Ausrichtungen jedes Körpers) annehmen sollen. Viele in Natur und Technik auftretende Objekte können physikalisch zunächst als starre Körper modelliert werden. Somit ist es von groÿem Interesse, Verbunde starrer Körper (speziell in der Fahrzeugdynamik) zu betrachten. Eine Anwendung aus der aktuellen Forschung sind Verbunde von Raumfahrzeugen, die durch ein Zusammenwirken der Einzelfahrzeuge ein deutlich leistungsfähigeres System darstellen. So besteht beispielsweise das wesentliche Ziel der Missionen Darwin der ESA bzw. Ter- restrial Planet Finder (TPF) der NASA darin, mit Hilfe eines durch den Verbund der Raumfahrzeuge generierten Interferometers Planeten in anderen Sonnensystemen zu detektieren. Weitere Anwendungen sind z.B. 1 Kapitel 1. Einleitung 1.1 • Verbunde von Satelliten zur Beobachtung der Erde und • Verbunde autonomer Unterwasserfahrzeuge für ozeanographische Forschungen. In den meisten Fällen sind die Körper dynamisch entkoppelt, d.h. dass die Bewegung eines Körpers nicht direkt die Bewegung der anderen beeinusst. Stattdessen sind die Körper über die gemeinsam zu erfüllende Aufgabe miteinander gekoppelt. Beispielsweise sollen sie innerhalb des Verbundes eine relative Position zueinander einnehmen. Was bedeutet optimale Kontrolle? Eine Aufgabe bei der Betrachtung von Verbunden von Fahrzeugen ist die Rekon- guration, d.h. die Umpositionierung der Körper relativ zueinander oder zu einem Referenzpunkt. Eine Änderung des Formationszieles, Ausfall oder Beschädigung eines Fahrzeuges und eine äuÿere Störung sind Situationen, die eine Rekonguration des Verbundes erfordern. Steht die gewünschte Endkonguration fest, so müssen Trajektorien hergeleitet werden, um jedes Fahrzeug zu einer bestimmten Position zu bringen. Im Modell der starren Körper sollen diese von einer vorgegebenen Anfangskongu- ration zu einer vorgegebenen Endkonguration geführt werden. Dies geschieht durch sogenannte Kontrollkräfte F, die an den starren Körpern angreifen. Jedoch muss zunächst überprüft werden, ob der Verbund überhaupt steuerbar ist, d.h. ob eine Überführung einer beliebigen Anfangskonguration des Verbundes in jede beliebige Endkonguration in endlicher Zeit möglich ist. Ist dies gewährleistet, so kann der Begri der Optimierung eingeführt werden: Optimale Kontrolle beinhaltet die Denition einer von bestimmten Parametern abhängige Kostenfunktion, welche bei diesem Vorgang minimiert werden soll. Zu den Parametern gehören beispielsweise die Zeit, die zur Durchführung der Formation benötigt wird (zeitoptimal) oder die dazu benötigten Kontrollkräfte F (energiee- zient). Die Berechnung der Trajektorien erfolgt, indem das Problem als Optimierungsproblem mit der Systemdynamik als Nebenbedingungen formuliert wird. Eventuell müssen zusätzlich Beschränkungen an die Position und den Kontrollaufwand bzw. Beschränkungen an die Kontrollfunktionen erfüllt sein. Die zu optimierende Gröÿe ist problemabhängig. Im Beispiel des Verbundes von Raumfahrzeugen wird eine energieoptimale Trajektorie gefordert, um den Treibstoverbrauch zu minimieren und damit die Einsatzzeit des Verbundes zu maximieren. Dabei kann bei jeder Steuerung nur eine begrenzte Schubkraft aufgebracht werden. Im Rahmen dieser Arbeit wird diese optimale Kontrolle betrachtet, d.h. die während der Formation auftretenden Kontrollkräfte sollen minimiert werden. Die Lösung optimaler Kontrollprobleme ist oft ein schwieriges mathematisches Pro- 2 Kapitel 1. Einleitung 1.2 blem. Numerische Ansätze protieren wesentlich von guten Anfangsschätzungen für die optimale Lösung. In dieser Arbeit wird die optimale Kontrolle der Körperdynamik aus der Perspektive einer klassischen Formulierung des optimalen Kontrollproblems, der Euler-Lagrange Gleichungen, untersucht. 1.2. Dierentialgeometrische Sichtweise Um ein System optimal kontrollieren zu können, muss das System zunächst innerhalb eines mathematischen Rahmens beschrieben werden. In der klassischen Mechanik werden abhängig von dem betrachteten Problem eine bevorzugte Menge von Koordinaten im euklidischen Raum gewählt. Diese generalisierten Koordinaten geben dabei die Geometrie des Problems wieder. Die Wahl von geeigneten Koordinaten für eine möglichst elegante Darstellung der Bewegungsgleichungen ist bei vielen Systemen schwierig. Oft müssen zur Beschreibung des Systems bewegliche oder rotierende Koordinaten eingeführt werden, so dass bei der Aufstellung der Systemgleichungen Coriolis- oder andere Zwangskräfte berücksichtigt werden müssen. Dies führt oft zu langen und komplizierten Ausdrücken für die Systemdynamik. Ein weiteres Problem dabei ist die Abhängigkeit der Objekte von der Wahl der Koordinaten. Um diese Probleme zu vermeiden, werden die Systeme nicht im euklidischen Raum, sondern auf dierenzierbaren Mannigfaltigkeiten betrachtet. Die Objekte auf einer Mannigfaltigkeit sind koordinateninvariant, so dass eine koordinatenunabhängige Formulierung der Newtonschen Mechanik möglich ist. Anschlieÿend kann diese Formulierung in beliebigen Koordinaten dargestellt werden. Koordinatenwechsel stellen dann im Gegensatz zur klassischen Mechanik kein Problem dar. Im Folgenden soll ein Beispiel zeigen, wie einem mechanischen System eine dierenzierbare Mannigfaltigkeit zugeordnet wird. Diese gibt dann die Kongurationen des Systems wieder. Beispiel 1.2.1 Betrachtet werden die Kongurationen eines starren Körpers in der Ebene (siehe Abbildung 1.1). Um die Lage des starren Körpers zu identizieren, wird ein Referenzpunkt benötigt, von dem aus Abstände und Winkel gemessen werden. Dazu wird in der Ebene ein inertiales Referenzsystem mit orthogonalen Vektoren s1 und s2 1 Σspatial = (Ospatial , {s1 , s2 }) festgelegt . Zur eindeutigen Festlegung der Lage muss sowohl die Position als auch die Orientierung festgestellt werden. Es wird somit ein körperfestes Koordinatensystem Vektoren b1 und b2 , Σbody = (Obody , {b1 , b2 }) mit orthogonalen das sich mit dem Körper bewegt, gewählt. Die Angabe der Position des starren Körpers erfolgt über den Vektor der relativ zur Basis einer Matrix 1 Im R r = (x, y) = Obody − Ospatial , {s1 , s2 } angegeben wird. Die Orientierung des Körpers wird mit i-te Spalte die Komponenten von bi in der Basis bestimmt, deren inertiales Referenzsystems gelten Newtons und Eulers Gesetze der Bewegung. 3 Kapitel 1. Einleitung 1.3 Abbildung 1.1.: Ein ebener starrer Körper (vgl. [5]) {s1 , s2 } beinhaltet. Sie ist von der Form R(t) = cos θ(t) sin θ(t) − sin θ(t) cos θ(t) , θ der Winkel ist, um den der Körper und damit Σbody gegen den Uhrzeigersinn rotiert. Ist r der Vektor zu einem Punkt auf dem Körper, so beschreibt r̃ = R · r diesen Punkt nach einer Drehung um θ gegen den Uhrzeigersinn. R ist eine orthogonale Matrix mit det R(t) = 1 und gehört damit zu der speziellen orthogonalen 2×2 Gruppe SO(2) = {R ∈ R | RRT = 1, det R(t) = 1}. wobei Demzufolge wird die Lage des starren Körpers eindeutig durch cos θ(t) sin θ(t) − sin θ(t) cos θ(t) , (x, y) ∈ SO(2) × R2 beschrieben, und die Kongurationsmannigfaltigkeit des Systems ist Q = SO(2) × R2 . SO(2) kann dabei mit der Einheitssphäre S 1 = {x ∈ R2 | kxk = 1} identiziert werden. Bei der Behandlung von Systemen auf dierenzierbaren Mannigfaltigkeiten muss auf Hilfsmittel auÿerhalb des Arbeitsgebietes der nichtlinearen Kontrolltheorie zurückgegrien werden. Dabei werden physikalische Objekte der Mechanik wie z.B. der Kongurationsraum durch mathematische Objekte der Dierentialgeometrie - hier einer dierenzierbaren Mannigfaltigkeit - repräsentiert. Die präzise Repräsentation physikalischer durch dierentialgeometrischer Gröÿen wird in Abschnitt 5.2 behandelt. Die Behandlung mechanischer Systeme im Rahmen der Dierentialgeometrie wird auch geometrische Mechanik genannt. 4 Kapitel 1. Einleitung 1.3 1.3. Methoden und Struktur Für eine dierentialgeometrische Behandlung des Problems werden in Kapitel 2 die wesentlichen Grundlagen zur Dierentialgeometrie beschrieben. Die Theorie des af- nen Zusammenhanges ist bei der Modellierung mechanischer Kontrollsysteme von besonderer Bedeutung. Sie ermöglicht die kovariante Ableitung tensorieller Gröÿen. Aufbauend auf diese Theorie wird in Kapitel 3 ein spezielles Variationsprinzip für dierentialgeometrische Berechnungen vorgestellt. Dabei werden mit Hilfe der kovarianten Ableitung Variationen der Positionen und Variationen der Geschwindigkeiten durch dem anen Zusammenhang zugehörige Tensoren in Relation gesetzt. Dieses Variationsprinzip ist ein wichtiger Bestandteil für die Lösung des optimalen Kontrollproblems. Da die Lösung auf ein Randwertproblem führt, wird in Kapitel 4 eine numerische Methode zur Lösung solcher Randwertprobleme erläutert. Kapitel 2 bis 4 stellen die Grundlagen für die Behandlung der geometrischen Mechanik und der optimalen Kontrolltheorie aus Kapitel 5 bereit. Zunächst werden zur Entwicklung des mathematischen Modells die dierentialgeometrischen Objekte des Problems abgeleitet, welche den physikalischen Objekten entsprechen: Bestimmung der Kongurationsmannigfaltigkeit, Auswahl von Koordinaten, Bestimmung einer aus der kinetischen Energie des Systems resultiernden Riemannschen Metrik und Modellierung der das System angreifenden Kräfte. Darauf aufbauend werden mit Hilfe eines Lagrangeprinzips die Bewegungsgleichungen des Systems aufgestellt. Dabei besteht die Lagrange-Funktion aus der kinetischen Energie des Systems in Form einer Riemannschen Metrik. In den resultierenden Euler-Lagrange Gleichun- gen erscheint der ane Zusammenhang als Levi-Civita Zusammenhang. Diese Modellierung führt auf eine kovariante Formulierung von Newtons Gesetz F = ma, die zudem koordinatenunabhängig ist. Für das entwickelte mathematische Modell werden Steuerbarkeitskriterien mit Hilfe eines symmetrischen Produktes und anschlieÿend ein Verfahren zur optimalen Kontrolle vorgestellt. Dazu wird das Variationsprinzip zusammen mit der Methode der Lagrange-Multiplikatoren folgendermaÿen verwendet: Das optimale Kontrollproblem stellt ein Optimierungsproblem einer geeignet gewählten Kostenfunktion mit Nebenbedingungen dar. Dabei entsprechen die Nebenbedingungen den Bewegungsgleichungen des mechanischen Systems. Diese sind meist Dierentialgleichungen zweiter Ordnung. Anstatt die Bewegungsgleichungen als ein System erster Ordnung darzustellen und dabei die Anzahl der Nebenbedingungen zu verdoppeln, werden die Nebenbedingungen in ihrer natürlichen Form - als Nebenbedingung zweiter Ordnung - eingearbeitet. Es wird eine Formulierung der EulerLagrange Gleichungen abgeleitet, indem der passend auf diese Situation zugeschnittene Variationsansatz verwendet wird. Während der Optimierung wird untersucht, wie Variationen der Position Variationen in der Geschwindigkeit induzieren anstatt unabhängige Variationen der beiden zu betrachten. Die Bewegungsgleichungen für die adjungierten Variablen sind dann Dierentialgleichungen zweiter Ordnung, die 5 Kapitel 1. Einleitung 1.4 durch Verwendung der kovarianten Ableitung bestimmt werden. Auf diese Weise erben die adjungierten Variablen die geometrische Struktur der Systemdynamik der Körper. Dieser Ansatz hat rechnerische Vorteile, denn die Anzahl der adjungierten Variablen wird halbiert. Die erarbeitete Theorie wird anschlieÿend auf den Verbund starrer Körper angewandt. Der Begri Verbund wird zunächst vernachlässigt, da mehr Bedeutung auf den Begri optimale Kontrolle gelegt wird. In Kapitel 6 liegt das Hauptaugenmerk auf der optimalen Kontrolle eines einzelnen starren Körpers. Für dieses System werden die in Kapitel 5 vorgestellten Schritte durchgeführt, so dass durch die Bestimmung der dierentialgeometrischen Objekte ein mathematisches Modell erhalten wird. Die Steuerbarkeitskriterien werden hier erstmals anschaulich auf dieses Modell angewandt. Weiterhin wird das Randwertproblem bestehend aus einem System gewöhnlicher Dierentialgleichungen aufgestellt. Dies wird mit der Theorie der LagrangeMultiplikatoren und der Variationsrechnung hergeleitet. In Kapitel 7 erfolgt die Betrachtung des Verbundes der Starrkörper und dessen optimale Kontrolle. Dabei wird sich auf einen Verbund von zwei bzw. drei Körpern beschränkt. Analog zu Kapitel 6 werden nun die Aussagen für den Verbund beschrieben. Da die Körper nicht über ihre Dynamik miteinander gekoppelt sind, verlaufen viele Schritte analog zu denen eines einzelnen starren Körpers. Die Rechnungen beinhalten z.B. die Bestimmung der Objekte der Dierentialgeometrie, das Aufstellen der Bewegungsgleichungen, die Überprüfung auf Steuerbarkeit und die optimale Kontrolle mit der Methode der Lagrange-Multiplikatoren. Allerdings sind die Körper des Verbundes über die Nebenbedingungen an die Endkonguration miteinander gekoppelt, so dass völlig neue Endbedingungen für das resultierende Randwertproblem betrachtet werden müssen. Das Bewegungsverhalten der Systeme aus Kapitel 6 und 7 wird mit Hilfe von MATLAB 6.1 simuliert. Die Ergebnisse sind jeweils am Ende des Kapitels dargestellt. 1.4. Übersicht der einzelnen Kapitel • Kapitel 2: Vorstellung der Terminologie der Dierentialgeometrie, die in der gesamten Arbeit verwendet wird. • Kapitel 3: Einführung der Grundlagen zur Variationsrechnung, die zur Aufstellung der Systemgleichungen und zur optimalen Kontrolle notwendig sind. • Kapitel 4: Vorstellung der Kollokationsmethode - ein numerischer Ansatz zur Lösung von Randwertproblemen. • Kapitel 5: Modellierung eines mechanischen Kontrollsystems, Überprüfung auf Steuerbarkeit und Vorstellung einer Lösungsstrategie zur Generierung energieoptimaler Trajektorien. 6 Kapitel 1. • Einleitung 1.4 Kapitel 6: Anwendung der Theorie aus Kapitel 5 auf das System eines einzelnen starren Körpers und Vorstellung der Ergebnisse. • Kapitel 7: Anwendung der Theorie aus Kapitel 5 auf einen Verbund mehrerer starrer Körper und Vorstellung der Ergebnisse. • Kapitel 8: Zusammenfassung der Ergebnisse der Arbeit und Motivation möglicher zukünftiger Forschungsarbeiten. 7 2. Grundlagen zur Dierentialgeometrie Wie schon in der Einleitung beschrieben, werden die mechanischen Kontrollsysteme dierentialgeometrisch behandelt. In diesem Kapitel wird eine Übersicht der wesentlichen Hilfsmittel der Dierentialgeometrie vorgestellt, die im Rahmen dieser Arbeit benötigt werden. Die Ausführungen hier beruhen im Wesentlichen auf [5] und [8]. Für eine ausführliche Behandlung dieses Themas wird auf [5], [8] und [12] verwiesen. Zunächst wird noch einmal erläutert, warum eine dierentialgeometrische Behandlung mechanischer Systeme sinnvoll ist. Eines der grundlegenden Objekte in der Dierentialgeometrie sind die dierenzierbaren Mannigfaltigkeiten. Anschaulich sehen sie lokal betrachtet wie oene Mengen im euklidischen Raum aus. Ein wesentlicher Unterschied ist allerdings, dass alle Objekte, die verwendet werden, koordinatenunabhängig sind. Diese Koordinatenunabhängigkeit der Mannigfaltigkeiten ist vor allem aus physikalischen Gründen wichtig: Ein physikalisches Problem wird typischerweise von physikalischen Daten begleitet und normalerweise beinhalten diese Daten keine spezielle Menge von Koordinaten. Viele Benutzer legen bestimmte Koordinaten fest, obwohl diese manchmal für die eigentliche physikalische Problemstellung ungeeignet sind. In dem betrachteten Beispiel wird ebenfalls ein festgelegtes Koordinatensystem gewählt. Dies ist unkompliziert, da aufgrund der koordinatenunabhängigen Formulierung auf Mannigfaltigkeiten nur koordinateninvariante Objekte verwendet werden. Zusammenfassend lässt sich sagen, dass bei der Wahl der Dierentialgeometrie als Werkzeug die Koordinateninvarianz die Konsequenz ist. Dies ist eine der Hauptmotivationen für eine dierentialgeometrische Behandlung. 2.1. Mannigfaltigkeit und Abbildungen zwischen Mannigfaltigkeiten In diesem Abschnitt wird das grundlegende Objekt der Dierentialgeometrie, die dierenzierbare Mannigfaltigkeit, eingeführt. 8 Kapitel 2. Grundlagen zur Dierentialgeometrie Denition 2.1.1 (Dierenzierbare Mannigfaltigkeit) 2.1 Eine dierenzierbare Mannigfaltigkeit der Dimension n ist eine Menge Q und eine Familie injektiver Abn n bildungen qα : Uα ⊂ Q → R von Mengen Uα von Q in den R , so dass: 1. S Uα = Q, α 2. für jeden nichtleeren Durchschnitt Uα ∩ Uβ ist qi (Uα ∩ Uβ ), i = α, β , eine oene −1 n Teilmenge des R , und die Abbildung qα ◦ qβ : qβ (Uα ∩ Uβ ) → qα (Uα ∩ Uβ ) ist eine glatte Funktion. Abbildung 2.1.: Koordinatenkarten auf einer dierenzierbaren Mannigfaltigkeit (vgl. [5]) Die Paare (Uα , qα ) in der Denition werden Koordinatenkarten und die Abbildungen qα Koordinatenfunktionen oder lokale Koordinaten genannt. Eine Familie von Kar1. und 2. aus 2.1.1 erfüllen, heiÿt Atlas, und die Abbildungen qα ◦ qβ−1 sind Koordinatentransformationen. ten, die V eines Punktes p in einer Mannigfaltigkeit Q ist eine n Teilmenge des Denitionsbereiches U einer Koordinatenkarte q : U ⊂ Q → R , so n dass q(V ) oen im R ist. Vereinigungen von Koordinatenumgebungen denieren Eine Koordinatenumgebung die oenen Mengen in Q. Diese oene Mengen bilden eine Topologie. Ein nützlicher Gesichtspunkt ist es, Q als eine Menge zu betrachten, die durch eine 1 n Ansammlung von Koordinatenkarten mit den lokalen Koordinaten (q , ..., q ) überdeckt ist. Sie besitzt die Eigenschaft, dass alle Koordinatentransformationen glatte 1 n Abbildungen sind. (q , ..., q ) wird dann auch lokales Koordinatensystem genannt. 9 Kapitel 2. Grundlagen zur Dierentialgeometrie Bemerkung 2.1.1 R3 2.1 Eine dierenzierbare Mannigfaltigkeit der Dimension zwei im ist eine reguläre Fläche. Der euklidische Raum Rn mit der Identität als Atlas ist ein triviales Beispiel für eine dierenzierbare Mannigfaltigkeit. Ein nichttriviales Beispiel ist das folgende: Beispiel 2.1.1 (Die Sphäre) Betrachte die Sphäre S 2 = {(x, y, z)T ∈ R3 | x2 + y 2 + z 2 = 1}. S2 Abbildung 2.2.: Die Sphäre Setze nun U1 := S 2 \{(0, 0, 1)} und U2 := S 2 \{(0, 0, −1)} U1 ist die Sphäre ohne den Nordpol und U2 ist die Sphäre ohne den Südpol. Deniere 2 2 q1 : U1 ⊂ S → R , (x, y, z) 7→ x y , 1−z 1−z und 2 2 q2 : U2 ⊂ S → R , Es gilt qi (Ui ) = Rn \{0}, i ∈ 1, 2, (x, y, z) 7→ T . und die Koordinatentransformation ist durch (q2 ◦ q1−1 )(y) = für x y , 1+z 1+z T y kyk2 y ∈ Rn \{0} gegeben. Diese Abbildung ist glatt, und mit S 2 = U1 ∪ U2 dierenzierbare Mannigfaltigkeit der Dimension zwei. ist S2 eine 10 Kapitel 2. Grundlagen zur Dierentialgeometrie Abbildung 2.3.: Stereographische Koordinaten für 2.2 S1 (vgl. [5]) Als Konsequenz macht es Sinn, von dierenzierbaren Abbildungen auf dierenzierbaren Mannigfaltigkeiten zu sprechen. Denition 2.1.2 (Dierenzierbarkeit von Abbildungen) ferenzierbare Mannigfaltigkeiten. Eine Abbildung ϕ : Q1 → m falls zu einer gegebenen Karte y : V ⊂ Q2 → R eine Karte ϕ(U ) ⊂ V Seien Q1 und Q2 dif- Q2 ist dierenzierbar, x : U ⊂ Q1 → Rn mit existiert, so dass die Abbildung y ◦ ϕ ◦ x−1 : x(U ) → y(V ) dierenzierbar ist. Aus Bedingung 2. von Denition 2.1.1 folgt, dass die obige Denition unabhängig von der Wahl der lokalen Koordinaten ist. 2.2. Tangentialvektor und Tangentialbündel Als nächstes wird die Idee des Tangentialvektors auf dierenzierbaren Mannigfal3 tigkeiten behandelt. Wird eine Fläche im R betrachtet, so ist der Tangentialvektor 3 im Punkt p als die Geschwindigkeit einer Kurve im R durch p deniert. Es muss also eine charakteristische Eigenschaft des Tangentialvektors gefunden werden, die die Idee der Geschwindigkeit wiedergibt. Die folgenden Betrachtungen sollen die Denition des Tangentialvektors motivieren: n n Sei c : I ⊂ R → R mit 0 ∈ I eine dierenzierbare Kurve in R mit c(0) = p. In 11 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.2 Abbildung 2.4.: Dierenzierbare Abbildung (vgl. [8]) 12 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.2 Koordinaten gelte c(t) = (q 1 (t), ..., q n (t)), t ∈ I, (q 1 , ..., q n ) ∈ Rn . c0 (0) = (q̇ 1 (0), ..., q̇ n (0)) = v ∈ Rn . p denierte dierenzierbare Funktion. f kann Dann gilt f Sei eine auf einer Umgebung von dann auf die Kurve c eingeschränkt v ∈ Rn wird dann als werden. Die Richtungsableitung bezüglich des Vektors n n X X ∂f dcj ◦ c) (0) = (0) = dt ∂q i dt i=1 d(f v ausgedrückt. Die Richtungsableitung bezüglich v ferenzierbaren Funktionen, der nur von i=1 ∂ q̇ (0) i ∂q ! i f (2.1) ist also ein Operator auf den dif- abhängt. Dies ist die charakteristische Eigenschaft des Tangentialvektors, die die Idee der Geschwindigkeit wiedergibt. Denition 2.2.1 (Kurve in einer Mannigfaltigkeit) Q eine dierenzierbac : I ⊂ R → Q wird (dieren- re Mannigfaltigkeit. Eine dierenzierbare Funktion zierbare) Kurve in Q Sei genannt. Während der gesamten Arbeit wird angenommen, dass Denition 2.2.2 (Tangentialvektor) gilt. D(p) die Menge der dierenzierbaren Funktionen deniert auf einer Umgebung von p. Sei c : I → Q, t 7→ c(t) eine dierenzierbare Kurve mit c(0) = p. Der Tangentialvektor an eine Kurve c in t = 0 ist eine Funktion c0 (0) : D(p) → R deniert durch c0 (0)f = Der Tangentialvektor in Q mit c(0) = p. p Sei p∈Q 0∈I ◦ c) (0), dt d(f und f ∈ D. ist der Tangentialvektor in t=0 Die Menge aller Tangentialvektoren von c:I → mit Tp Q an eine Kurve Q in p wird bezeichnet. Seien q 1 , ..., q n die Koordinaten der Kurve c0 (0)f = = d(f ◦c) dt (0) n P i q̇ (0) i=1 d.h. der Vektor c0 (0) = c, so gilt in Koordinaten df (q 1 ,...,q n ) (0) dt ∂f ∂q i = n P i q̇ (0) i=1 ∂ ∂q i f, p kann in Koordinaten als 0 c (0) = n X i=1 i q̇ (0) ∂ ∂q i (2.2) p 13 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.3 ausgedrückt werden. Der Ausdruck (2.2) zeigt, dass der Tangentialvektor an eine c nur von der Ableitung von c in einem Koordinatensystem abhängt. Die Menge Tp Q bildet mit den gewöhnlichen Operationen von Funktionen einen Vekn torraum der Dimension Wahl einer Koordinatenfunktion q : U ⊂ Q → R n. Die ∂ 1 bestimmt eine Basis , ..., ∂q∂n in Tp Q. Die lineare Struktur in Tp Q ∂q 1 Kurve p p q ab. Der Vektorraum Tp Q der Tanp wird Tangentialraum von Q in p genannt. Ein Beispiel für einen Tangentialraum ist in Abbildung 2.5 zu sehen. Die n-Tupel bestehend aus den Zahlen Pn i ∂ 1 1 n n v = q̇ (0), ..., v = q̇ (0) heiÿen Komponenten des Vektors i=1 v ∂qi bezüglich hängt dabei nicht von der Koordinatenfunktion gentialvektoren in p des lokalen Koordinatensystems q 1 , ..., q n . Abbildung 2.5.: Der Tangentialraum von S2 im Punkt p (vgl. [2]) (p, v), p ∈ Q, v ∈ Tp Q bildet eine 2n-dimensionale Man2 Tangentialbündel genannt und mit T Q bezeichnet. Das Tan- Die Gesamtheit aller Paare nigfaltigkeit, wird gentialbündel ist der natürliche Raum, mit dem gearbeitet wird, wenn Fragen zu Positionen und Geschwindigkeiten behandelt werden, wie es in der Mechanik meist der Fall ist. Beispiel 2.2.1 (n-Sphäre) n Das Tangentialbündel einer n-Sphäre S ist die GeP P n+1 n+1 samtheit aller Punkte (p, v) in R × Rn+1 , so dass i=1 p2i = 1 und n+1 i=1 pi vi = 0 1 1 1 gelten. Für n = 1 entspricht T S dabei S × R (siehe Abbildung 2.6). 1 Der Index p verdeutlicht, dass ein Koordinatensystem in einer Umgebung von p betrachtet wird. Wenn keine Verwechslungsmöglichkeit besteht, kannSdieser entfallen. 2 In der Literatur wird auch oft die Denition T Q = Tp Q angegeben. p∈Q 14 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.3 Abbildung 2.6.: Das Tangentialbündel von S1 (vgl. [11]) 2.3. Kovektor und Kotangentialbündel Ist f : Q1 → Q2 eine glatte Abbildung, so ist sie in jedem Punkt zierbar, und man erhält eine Abbildung Tp f : Tp Q1 → Tf (p) Q2 . p ∈ Q1 dieren- Diese Konstruktion führt auf die folgende Denition: Denition 2.3.1 (Dierential) : Tp Q1 → Tf (p) Q2 ist das Dierential von f und ist folgendermaÿen deniert: Zu v ∈ Tp Q1 0 wird eine Kurve c : I → Q1 mit c(0) = p und c (0) = v deniert. Dann ist df (p) · v der Geschwindigkeitsvektor in t = 0 der Kurve f ◦ c : R → Q2 mit Die lineare Abbildung df mit df (p) df (p) Der Vektor df (p) ·v ·v = ◦ c) (0). dt d(f ist unabhängig von der Kurve c und hängt nur vom Vektor v ab. v ∈ Tp Q1 wird eine Kurve c(t) in Q1 gewählt, so c(t) in p = c(0) ist. Dann ist df (p) · v der Vektor tangential an die Kurve f (c(t)) in f (p) = f (c(0)). Ist q die Koordinatendarstellung der Kurve c, dann ist die Richtungsableitung df (q)·v mit q ∈ Q und v ∈ Tq Q durch Mit anderen Worten: Zu jedem dass der Vektor v tangential zu der Kurve df (q) mit v= n P i=1 v i ∂q∂ i ·v = n X ∂f i v i ∂q i=1 gegeben. 15 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.3 Abbildung 2.7.: Das Dierential (vgl. [10]) Beispiel 2.3.1 (Dierential) A : R3 → R3 eine orthogonale lineare Abbil2 2 2 dung. Setze f : S → S , f := A|S 2 , und sei p ∈ S . Es wird nun das Dierential 2 von f in p berechnet. Sei dazu c : I → S eine dierenzierbare Kurve mit c(0) = p 0 2 und c (0) = v ∈ Tp S . Wegen der Linearität von A gilt Sei ◦ c) d(A ◦ c) (0) = (0) dt d t d = A◦ c (0) dt = A(v). d(f Somit ist df (p) Es gilt df (p) = A|Tp S 2 : Tp S 2 → TAp S 2 . ∈ Tp∗ Q1 , wobei Tp∗ Q1 der Dualraum des Vektorraums wird auch der Raum der Kovektoren in TAp S 2 . Wird jeder Vektorraum Tp Q p Tp Q1 ist. Dieser Tp∗ S 2 = genannt. Für Beispiel 2.3.1 gilt durch seinen Dualraum Tp∗ Q ersetzt, so ergibt sich 2n-dimensionale Mannigfaltigkeit, die Kotangentialbündel genannt und mit T ∗ Q ∂ i bezeichnet wird. Die duale Basis zu wird mit dq bezeichnet. Zu der Wahl eines ∂q i eine Koordinatensystems ergibt sich dann die Basisformulierung df (p) = X ∂f i dq i ∂q i 16 Kapitel 2. Grundlagen zur Dierentialgeometrie für jede glatte Abbildung 2.4 f : Q1 → Q2 . bare Form vom Grad 1) genannt. Jede 1-Form j beschrieben werden, wobei die Funktionen b ω p wird 1-Form (oder dierenzierP j j kann eindeutig durch ω = j b dq Eine Zuordnung eines Kovektors zu einem Punkt die Komponenten von ω sind. Das natürliche Skalarprodukt zwischen Vektoren und 1-Formen wird mit zeichnet, und es gilt D ∂ , dq j ∂q i E = h·, ·i be- δji . 2.4. Vektorfeld und Lie Klammer Mit Hilfe der Notation des Tangentialbündels kann der Begri des Vektorfeldes deniert werden: Denition 2.4.1 (Vektorfeld) Ein Vektorfeld X auf einer dierenzierbaren Man- Q ordnet jedem Punkt p ∈ Q einen Vektor X(p) ∈ Tp Q zu. X eine Abbildung von Q in das Tangentialbündel T Q. X ist dierenzierbar, falls die Abbildung X : Q → T Q dierenzierbar ist. nigfaltigkeit ist somit Ein Vektorfeld ordnet also jedem Punkt auf der Mannigfaltigkeit einen Vektor zu, der in diesem Punkt tangential an die Mannigfaltigkeit ist. Beispiel 2.4.1 (Newtons Gravitationsgesetz) Betrachtet wird ein Vektorfeld, R3 die Mannig- das durch Newtons Gesetz der Schwerkraft bestimmt ist. Hierbei ist faltigkeit, und das Vektorfeld wird durch F (x, y, z) = − beschrieben, wobei m mM G r r3 die Masse des Testkörpers, pG die Gravitationskonstante, r der Vektor (x2 + y 2 + z 2 ) ist (siehe Abbildung 2.8). pers, r= Sei q : U ⊂ Q → Rn M die Masse des zentralen Kör- vom Ursprung zu (x, y, z) und ein lokales Koordinatensystem, so gilt X(p) = n X i=1 ai (p) ∂ , ∂q i i wobei n o die Funktionen a : U → R die Komponenten des Vektorfeldes X sind und ∂ , i = 1, ..., n, die zu q gehörige Basis ist. X ist genau dann dierenzierbar, ∂q i wenn die Funktionen ai für irgendeine Karte dierenzierbar sind. 17 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.4 Abbildung 2.8.: Das Gravitationskraftfeld (vgl. [3]) X : D → F von D der dierenzierbaren Funktionen auf Q in die Menge F der Funktionen Gelegentlich ist es zweckmäÿig, das Vektorfeld als eine Abbildung der Menge auf Q zu betrachten. Sie ist durch (Xf )(p) = n X i=1 ai (p) ∂f (p) = df (p) · X(p) ∂q i deniert und heiÿt Richtungsableitung von f nach dem Vektorfeld X in Richtung p. X X D X zu betrachten. Wenn z.B. und Y dierenzierbare Felder auf Q sind und f : Q → R eine dierenzierbare Funktion ist, so können die Funktionen X(Y f ) und Y (Xf ) Die Interpretation von als ein Operator auf erlaubt es, Iterationen von betrachtet werden. Diese Überlegung führt auf den Begri der Lie Klammer, welche später zum Nachweis der Steuerbarkeit mechanischer Systeme herangezogen wird. Denition 2.4.2 (Lie Klammer) Seien X und Y dierenzierbare Vektorfelder, dann ist ihre Lie Klammer als [X, Y ]f = XY f − Y Xf deniert. [X, Y ] Das Vektorfeld ist dann wieder ein dierenzierbares Vektorfeld. [X, Y ] ist eindeutig und in lokalen Koordinaten durch folgende Be- ziehungen gegeben: 18 Kapitel 2. Seien Grundlagen zur Dierentialgeometrie X(q) = n P i=1 und [X, Y ](q) = ai (q 1 , ..., q n ) ∂q∂ i , Y (q) = n P j=1 n P j=1 2.4 bj (q 1 , ..., q n ) ∂q∂ j cj (q 1 , ..., q n ) ∂q∂ j . Dann gilt XY f = X X j X Y Xf = Y i Und somit folgt j c = ∂f b ∂q j ! ∂f ai i ∂q ! j n X i=1 ai = i=1 ∂ und ∂q i Y = n P j=1 ai 2 X ∂bj ∂f i j ∂ f + a b , ∂q i ∂q j ∂q i ∂q j i,j bj ∂ai ∂f X i j ∂ 2 f + ab . i ∂q j ∂q j ∂q i ∂q i,j i,j = X i,j j ∂bj i ∂a − b , ∂q i ∂q i Beispiel 2.4.2 (Satz von Schwarz) n P X Sind X j = 1, 2, ..., n. und Y Koordinatenfelder, d.h. X= ∂ , so verschwindet die Lie Klammer, denn es gilt ∂q j " n n X ∂f X ∂f [X, Y ]f = , ∂q i j=1 ∂q j i=1 # = 0. Dies ist nichts anderes als der Satz von Schwarz aus der Analysis. Interpretation der Lie Klammer Um die Bedeutung der Lie Klammer entsprechend zu [10] geeignet zu interpretieren, muss zunächst der Begri des Flusses eines Vektorfeldes erläutert werden: X ein dierenzierbares Vektorfeld auf einer dierenzierbaren Mannigfaltigkeit Q und p ∈ Q. Dann existiert eine oene Umgebung U ⊂ Q von p, ein Intervall I und eine dierenzierbare Abbildung ϕX : I × U → Q, so dass die Kurve t → X ϕX (t, q), t ∈ I, q ∈ Q, die einzige Kurve ist, die die Bedingung ∂ϕ∂t = X(ϕX (t, q)) X 0 mit ϕ (0, q) = q erfüllt. Eine Kurve c : I → Q, die den Bedingungen c (t) = X(c(t)) und c(0) = q genügt, wird Trajektorie des Vektorfeldes X genannt, die für t = 0 X X durch den Punkt q verläuft. Es ist üblich, die Notation ϕt (q) = ϕ (t, q) zu verwenX den und ϕt : U → Q den lokalen Fluss von X zu nennen. Seien nun X und Y glatte Vektorfelder auf Q und p ∈ Q. Eine Kurve c in Q sei Seien durch ◦ ϕ−X ◦ ϕYt ◦ ϕX c(t) = ϕ−Y t t t (p) deniert. Dann gilt c0 (0) = [X, Y ](p). 19 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.4 Abbildung 2.9.: Die Fluss-Interpretation der Lie Klammer (vgl. [5]) Ist [X, Y ] nicht im Erzeugnis von X und Y , X und Y eine Bewegung in eine neue von so wird durch Verknüpfung der Flüsse unabhängige Richtung erzeugt. Diese Art der Interpretation der Lie Klammer spielt eine groÿe Rolle bei der Steuerbarkeit nichtlinearer Kontrollsysteme. Dies wird in Kapitel 5.3 näher erläutert. Das bisherige Konzept von Vektorfeldern reicht für nachfolgende Betrachtungen nicht aus. Ist beispielsweise gewünscht, das Geschwindigkeitsfeld einer Kurve zu betrachten, die in einer Fläche verläuft, so ist das bisherige Konzept von Vektorfeldern nicht passend. Zum einen ist das Geschwindigkeitsfeld nicht auf der ganzen Fläche, sondern nur längs der Kurve deniert. Zum anderen kann die Kurve Selbstdurchdringungen besitzen, so dass der Geschwindigkeitsvektor in einem solchen Selbstschnittpunkt unterschiedliche Werte annimmt. Aufgefasst als Vektorfeld auf der Fläche wäre dieses in solchen Punkten nicht eindeutig festgelegt. Daher wird folgendes deniert: Denition 2.4.3 (Vektorfeld entlang einer Kurve) V entlang t ∈ I einen Ein Vektorfeld c : I → Q ist eine dierenzierbare Abbildung, die jedem V (t) ∈ Tc(t) Q zuordnet. V ist dierenzierbar, wenn für jede dierenzierbare Funktion f auf Q die Funktion t → V (t)f eine dierenzierbare Funktion auf I ist. einer Kurve Tangentialvektor 20 Kapitel 2. Grundlagen zur Dierentialgeometrie Beispiel 2.4.3 (Geschwindigkeitsvektorfeld) dc dt ist ein solches Vektorfeld längs 2.5 Das Geschwindigkeitsvektorfeld c. Für die Bestimmung der Ableitung von Vektorfelder wird das Konzept des anen Zusammenhanges benötigt. Zuvor ist es allerdings notwendig, noch die Theorie von Tensoren einzuführen. Eine gute Einführung dazu wird in [1] gegeben. Von nun an bezeichne re Dualmenge auf X (Q) die Menge aller glatten Vektorfelder und X ∗ (Q) ih- Q. 2.5. Tensor und Tensorfeld Die Notation des Tensors ist ein nützliches Objekt in der Dierentialgeometrie. Die Idee eines Tensors ist die Verallgemeinerung der Idee von Vektorfeldern. Denition 2.5.1 (Tensor der Ordnung (r, s)) auf einer n-dimensinalen Mannigfaltigkeit Q Ein Tensor T der Ordnung (r, s) ist eine multilineare Abbildung T : X ∗ (Q) × ... × X ∗ (Q) × X (Q) × ... × X (Q) → R. | {z } | {z } r Faktoren s Faktoren Zu gegebenen Y1 , ..., Yr ∈ X ∗ (Q) und X1 , ..., Xs ∈ X (Q) ist T (Y1 , ..., Yr , X1 , ..., Xs ) Q ist. Multilinear bedeutet, dass T linear somit eine dierenzierbare Funktion auf in allen r+s Argumenten ist. Der Raum der Tensoren auf Q bildet einen Vektorraum und wird mit Trs (Q) be- zeichnet. Eine Basisoperation der Tensoren ist das Tensorprodukt zweier Tensoren r1 +r2 r und T2 ∈ Ts 2 . Dieses ergibt einen Tensor T1 ⊗ T2 ∈ Ts1 +s2 wie folgt: T1 ∈ Tsr11 2 (T1 ⊗ T2 )(Y1 , ..., Yr1 , Ỹ1 , ..., Ỹr2 , X1 , ..., Xs1 , X̃1 , ..., X̃s2 ) = T1 (Y1 , ..., Yr1 , X1 , ..., Xs1 ) · T2 (Ỹ1 , ..., Ỹr2 , X̃1 , ..., X̃s2 ). { ∂q∂ i } von X (Q) und der Dualbasis {dq j } sind die Komponen,...,ir nr+s Funktionen Tji11,...,j s Zur Koordinatenbasis ten von T durch die ,...,ir Tji11,...,j = T (dq i1 , ..., dq ir , s ∂ ∂ , ..., ) j ∂q 1 ∂q js deniert. Die Koordinatendarstellung eines Tensors ist dann T = X i1 ,...,ir ,j1 ,...,js ,...,ir Tji11,...,j s ∂ ∂ ⊗ ... ⊗ ir ⊗ dq j1 ⊗ ... ⊗ dq js . i 1 ∂q ∂q 21 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.6 Beispiel 2.5.1 ((0,2) Tensor) Matrix mit den Komponenten Jedes innere Produkt h·, ·i auf Ist T ein (0, 2) Tensor auf Q, dann ist T Tij ( ∂q∂ i , ∂q∂ j ). Q ist ein (0, 2) Tensor. eine n×n Analog zum Vektorfeld wird der Begri des Tensorfeldes eingeführt: Denition 2.5.2 (Tensorfeld) Ein Tensorfeld der Ordnung (r, s) ist eine Abbils dung, die jedem q ∈ Q einen Tensor T (q) ∈ Tr (q) zuordnet, so dass die Tensorkomponenten bezüglich einer Karte um q beliebig oft stetig dierenzierbar sind. Diese Denition wird hier auch für den Fall r = s = 0 ausgeweitet: Unter einem (0, 0) soll eine dierenzierbare Abbildung f : Q → R verR als Mannigfaltigkeit deniert ist, die mit der kanonischen Dierenzierbarkeitsstruktur von R ausgestattet ist. Ein Tensorfeld vom Grad (0, 0) Tensorfeld der Ordnung standen werden, wobei wird auch als Skalarfeld bezeichnet. Ein sehr anschauliches Beispiel eines Skalarfeldes aus der Physik ist das eines Temperaturfeldes: Jedem Punkt im Raum (der durch eine Mannigfaltigkeit Q beschrieben wird) wird die dort herrschende Temperatur zugeordnet. Bemerkung 2.5.1 1-Form 1-Form ist auch klar, dass mit einem (0, 1) gemeint ist. Ein Vektorfeld ist ein Nach der Denition einer Feld ein Tensorfeld der Ordnung Tensorfeld der Ordnung (1, 0). 2.6. Theorie des Anen Zusammenhangs Nach dem Einschub über Tensoren wird sich der Frage gewidmet, wie Vektorfelder entlang von Kurven dierenziert werden. 3 Seien S ⊂ R eine Fläche und c : I → S eine parametrisierte Kurve in S mit dem 3 Vektorfeld V : I → R entlang c tangential an S . Wird das dierenzierbare VekdV 3 torfeld V naiv abgeleitet, so ergibt sich die Abbildung dt : I → R . Das Problem dV besteht nun darin, dass dt im Allgemeinen nicht mehr tangential an die Fläche ist. dV dV Dieses Problem wird dadurch gelöst, dass dt durch die Projektion von dt auf die Tangentialebene im entsprechenden Kurvenpunkt ersetzt wird. Dieser orthogonal DV projizierte Vektor ist die kovariante Ableitung und wird mit dt bezeichnet. Die Existenz einer kovarianten Ableitung basiert auf der Möglichkeit eines Vergleiches tensorieller Gröÿen aus verschiedenen Tangentialräumen. Dies erfordert eine bestimmte Eigenschaft an die Tangentialräume. Die Eigenschaft ist der ane Zu- sammenhang. Denition 2.6.1 (Aner Zusammenhang) ist eine Abbildung Ein aner Zusammenhang auf ∇ : X (Q) × X (Q) → X (Q), die mit ∇ : X, Y 7→ ∇X Y Q bezeichnet wird und folgende Bedingungen erfüllt: 22 Kapitel 2. Grundlagen zur Dierentialgeometrie 1. ∇f X+gY Z = f ∇X Z + g∇Y Z , 2. ∇X (Y + Z) = ∇X Y + ∇X Z , 3. ∇X (f Y ) = f ∇X Y + X(f )Y , mit X, Y, Z ∈ X (Q), und f, g 2.6 glatte Funktionen auf Q. Es werden im Folgenden einige Konstruktionen aus [5] vorgestellt, die mit Hilfe des anen Zusammenhangs gemacht werden können. Seien X vq ∈ Tq Q und Y ∈ T Q, ∇vq Y (q) = ∇X Y (q) ∈ Tq Q Eigenschaft X(q) = vq ist. dann wird ein glattes Vektorfeld mit der deniert, wobei Eine wichtige Anwendung dieser Beobachtung ist die folgende: Seien eine Kurve und Y ∈ T Q. Dann kann ein Vektorfeld entlang c c:I⊂R→Q durch I 3 t 7→ ∇c0 (t) Y (c(t)) ∈ Tc(t) Q deniert werden. Diese Konstruktion macht auch dann Sinn, falls Y ein Vektor- c anstatt auf ganz Q deniert ist. Ist also I 3 t 7→ V (t) ∈ Tc(t) Q ein solches Vektorfeld, so wird ein anderes Vektorfeld entlang c durch ∇c0 (t) V (t) = ∇c0 (t) Y (c(t)) deniert. Hierbei gilt für das Vektorfeld Y die Beziehung Y (c(t)) = V (t) für alle t ∈ I . Das Vektorfeld t 7→ ∇c0 (t) V (t) entlang c wird als die kovariante Ableitung von V entlang c bezeichnet. Dies führt zu folgender Denition: feld ist, welches nur entlang Denition 2.6.2 (Kovariante Ableitung) c(t) eine dierenzierbare Kurve in Q. Dann existiert eine eindeutige Korrespondenz, die jedem entlang c(t) deniertem DV Vektorfeld V ein anderes Vektorfeld dt , welches die kovariante Ableitung von V Sei entlang c genannt wird, zuordnet, so dass gilt: D 1. dt (V 2. dt (f V D 3. Ist DV dt + W) = )= df dt V DV dt + DW dt . + f DV dt . V durch ein Vektorfeld Y ∈ X (Q) induziert, d.h. V (t) = Y (c(t)), dann gilt = ∇ dc Y . dt Diese Denition zeigt, dass die Wahl eines anen Zusammenhangs auf Q auf eine Ableitung von Vektorfeldern entlang von Kurven führt. Im Speziellen ist es dann möglich, über die Beschleunigung einer Kurve in Beispiel 2.6.1 (Kovariante Ableitung) Q zu sprechen. Gegeben sei die Sphäre S 2. Es wird die kovariante Ableitung des Geschwindigkeitsfeldes der Kurve c : R → S 2, 23 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.6 c(t) = (cos t, sin t, 0)T 2 beschreibt den Schnitt von S mit der x-y 2 Ebene, d.h. sie durchläuft gerade den Äquator von S . Die gewöhnliche Ableitung 0 T der Kurve ist c (t) = (− sin t, cos t, 0) und bestimmt. Die Denition der Kurve c(t) c00 (t) = (− cos t, − sin t, 0)T = −c(t). Daraus ist ersichtlich, dass für jedes t ∈ R der Vektor c00 (t) senkrecht auf Tc(t) S 2 steht. Da die kovariante Ableitung die orthogonale Projektion auf den Tangentialraum darstellt, folgt Dc0 (t) ≡ 0. dt Der ane Zusammenhang und die kovariante Ableitung werden in der Literatur oft austauschbar benutzt. Sind die Operanden Elemente von X (Q), so wird der ane Zusammenhang benutzt. Sind dagegen die Operanden entlang von Kurven denierte Vektorfelder, so spricht man von der kovarianten Ableitung. Aufgrund der Tatsache, dass die kovariante Ableitung die Linearität und eine Produktregel erfüllt, ist sie eine Ableitung im algebraischen Sinne. Eine weitere Besonderheit ist, dass sie ein Element aus TQ anstatt aus TTQ wiedergibt, da die Ableitung in den Tangentialraum projiziert wird. Koordinatendarstellung X, Y Vektorfelder mit den P j ∂ Y = y ∂qj , wobei xi , y j glatte Seien Koordinatendarstellungen X= P i Funktionen auf Q xi ∂q∂ i und sind. Dann gilt j ∇X Y = X i xi ∇ X ∂ ∂q i j ∂ yj j ∂q ! = X i,j xi y j ∇ X ∂y j ∂ ∂ + xi i j . ∂q j ∂q ∂q i,j ∂ ∂q i ∇ ∂ i ∂q∂ j = Γkij ∂q∂k , so sind die Γkij dierenzierbare Funktionen, und mit ∂q k P k i ∂y k X(y ) = x ∂qi folgt, dass der ane Zusammenhang die Koordinatendarstellung Setzt man P i ! ∇X Y = X X k hat. Dabei sind die Funktionen Γkij xi y j Γkij + X(y k ) i,j auf Q ∂ ∂q k die sogenannten Christoel-Symbole. Die Christoel-Symbole bestimmen gerade die Korrekturterme, die den Unterschied 24 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.6 der gewöhnlichen Ableitungen der Koezientenfunktionen und der kovarianten Ableitung ausmachen. Die Notation des anen Zusammenhangs führt zur Denition einer Geodätischen eines anen Zusammenhangs 0 die die Gleichung ∇c0 (t) c (t) = ∇. Die Geodätische 0 erfüllt. ist diejenige Kurve c : I → Q, Für viele Kontrollprobleme wird die Dynamik ohne äuÿere Kräfte durch die Geodätische für einen bestimmten anen Zusammenhang, der sich aus der Physik des Problems ergibt, beschrieben. Diese Beziehung wird in Kapitel 5.2 erläutert. Zugehörig zu dieser Diskussion ist die Bezeichnung des parallelen Transportes: Ist c : I ⊂ R → Q eine Kurve, dann ist ein Vektorfeld Y : Q → T Q entlang c parallel, falls ∇c0 (t) Y (t) = 0c(t) für alle t ∈ I gilt. Dabei bezeichnet 0c(t) den Nullvektor im Tangentialraum Tc(t) Q. Andersherum kann die Gleichung ∇c0 (t) Y (t) = 0 als Dierentialgleichung für das Vektorfeld Y entlang c betrachtet werden. Ist c zweimal stetig dierenzierbar und wird der Wert von Y in c(t0 ) für ein t0 ∈ I angegeben, so ist dadurch Y (t) eindeutig für t nah genug an t0 bestimmt. Die Abbildung τtc0 ,t : Tc(t0 ) Q → Tc(t) Q, die v ∈ Tc(t0 ) Q auf den eindeutigen Vektor Y (t) ∈ Tc(t) Q abbildet, ist durch das Anfangswertproblem ∇c0 (t) Y (t) = 0, deniert. Die Abbildung τtc0 ,t Y (t0 ) = v ist der parallele Transport entlang c und entspricht einer Parallelverschiebung von Vektoren. Zugeordnete Tensoren Es werden nun zwei zu dem anen Zusammenhang ∇ gehörige Tensoren einge- führt, die im späteren Verlauf verwendet werden. 1. Der Krümmungstensor R: Es wird die zweite kovariante Ableitung betrachtet. Ihr Wert hängt von der Reihenfolge ab, in der dierenziert wird. Der Satz von Schwarz über die Vertauschbarkeit der Richtungsableitungen gilt demzufolge für die kovariante Ableitung nicht. Der Krümmungstensor misst gerade den Fehler, der beim Vertauschen der Ableitungen auftritt, d.h. er beschreibt, in welchem Grade eine Mannigfaltigkeit davon abweicht, euklidisch zu sein. Um diese Abweichung zu bestimmen, wird zunächst eine Denition der zweiten kovariante Ableitung benötigt. Sind X, Y und Z Vektorfelder auf einer dierenzierbaren 25 Kapitel 2. Grundlagen zur Dierentialgeometrie Mannigfaltigkeit Q, so kann natürlich das Vektorfeld 2.6 ∇Y Z noch einmal nach variant dierenziert werden. Dabei treten jedoch auch Ableitungen von Y X ko- nach X auf. In der folgenden Denition wird dieser Eekt kompensiert und nur die zweite Ableitung von Z in Richtung X Y und angegeben. Denition 2.6.3 (Zweite kovariante Ableitung) tung von Z nach X und Y Die zweite kovariante Ablei- ist durch ∇2X,Y := ∇X ∇Y Z − ∇∇X Y Z gegeben. Nun kann der Krümmungstensor als der Fehlerterm, der die Nichtvertauschbarkeit der beiden Argumente in der zweiten kovarianten Ableitung misst, deniert werden. Es gilt: R(X, Y )Z = ∇2X,Y − ∇2Y,X = ∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z. 2. Der Torsionstensor T: Der Torsionstensor ist durch T (X, Y ) = ∇X Y − ∇Y X − [X, Y ] deniert. Diese Tensoren haben die Koordinatendarstellung Tijs = Γsij − Γsji , s Rijk = ∂Γsjk ∂q i − ∂Γsik ∂q j + Γljk Γsil − Γlik Γsjl , wobei die Indexnotation durch PP s i j ∂ ( Tij x y ) ∂qs , s i,j P P s i j k ∂ R(X, Y )Z = ( Rijk x y Z ) ∂qs T (X, Y ) = s (2.3) i,j,k gegeben ist. Ist der Torsionstensor null, so wird der ane Zusammenhang als sym- metrisch bezeichnet, und er erfüllt die Eigenschaft [X, Y ] = ∇X Y − ∇Y X. Dierentiation von Tensoren Analog zu Vektorfeldern ist die kovariante Ableitung von Tensoren ein wichtiger 26 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.6 Punkt. Da dies im späteren Verlauf benötigt wird, werden nun die Formeln beruhend auf den Darstellungen aus [8] und [9] für kovariante Ableitungen beliebiger Tensoren präsentiert. Sei A ein Tensor der Ordnung Tensor der Ordnung (0, r + 1) (0, r). Dann ist das kovariante Dierential ∇A ein deniert durch (∇A)(X1 , ..., Xr , Z) = Z[A(X1 , ..., Xr )] − A(∇Z X1 , ..., Xr ) − ... − A(X1 , ..., ∇Z Xr ), und die kovariante Ableitung von A in Richtung Z ist ein (0, r) Tensor ∇Z A deniert durch (∇Z A)(X1 , ..., Xr ) = (∇A)(X1 , ..., Xr , Z). Soll speziell eine 1-Form λ dierenziert werden, so ergibt sich hX, ∇Z λi = Z(hX, λi) − h∇Z X, λi. Ist Z (2.4) c(t), so kann (2.4) als DX Dλ , λ + X, dt dt ein Tangentialvektor an die Kurve d dt hX, λi = (2.5) geschrieben werden. Die Denition für kovariante Dierentiation von Tensoren führt also zu einer Produktregel. Die Gleichung (2.5) ist aus zwei Gründen wichtig: 1. Sie wird benutzt, um Ausdrücke mit kovarianten Ableitungen partiell zu integrieren. 2. Wird t durch ersetzt, d.h. es wird eine örtliche anstatt einer zeitlichen Ab- leitung betrachtet, so ist dieser Ausdruck hilfreich, um die Auswirkungen des Variationsprinzips (Abschnitt 3.4) in Gleichungen mit kovarianten Ableitungen zu verstehen. Beispiel 2.6.2 (Kovariante Ableitung eines Tensors) X ∈ X (Q). X werde mit dem Tensor identiziert, der dem Vektorfeld Y ∈ X (Q) die Funktion hX, Y i zuordnet. Die kovariante Ableitung des Tensors X nach dem Vektorfeld Z ∈ X (Q) Sei ist ∇Z X(Y ) = ∇X(Y, Z) = Z(X(Y )) − X(∇Z Y ) = ZhX, Y i − hX, ∇Z Y i = h∇Z X, Y i für alle Y ∈ X (Q). Der Tensor ∇Z X kann somit mit dem Vektorfeld ∇Z X identi- ziert werden. Dies zeigt, dass die kovariante Ableitung von Tensoren eine Verallgemeinerung der kovarianten Ableitung von Vektorfeldern ist. Ergänzende Denitionen Zum Abschluss dieses Abschnittes wird eine Terminologie aus [9] und [15] zur Umbenennung von Tensoren eingeführt, die in späteren Berechnungen im Umgang mit Tensoren nützlich ist. 27 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.7 (1, r) Tensor A und eine 1-Form λ. Dem Tensor A A∗ zugeordnet, der folgende Gleichung erfüllt: 1. Gegeben seien ein (2, r − 1) Tensor wird ein hA(X1 , ..., Xr ), λi = hX1 , A∗ (λ, X2 , ..., Xr )i. 2. Zu einem (0, r) Tensor A wird ein (r, 2) Tensor  (2.6) zugeordnet, so dass A(X1 , ..., Xr−1 , Y ) = hY, Â(X1 , ..., Xr−1 )i. (2.7) gilt. 2.7. Riemannsche Geometrie In diesem Abschnitt werden einige Grundlagen der Riemannschen Metrik eingeführt. Historisch war die Riemannsche Geometrie eine natürliche Entwicklung der Die3 rentialgeometrie von Flächen im R . 3 Ist eine Fläche S ⊂ R gegeben, so gibt es einen natürlichen Weg, die Längen von Vektoren tangential an S zu messen: Das innere Produkt hv, wi zweier Vektoren tan- gential an S in einem Punkt p ∈ S ist das innere Produkt dieser zwei Vektoren im R3 . Beispielsweise werden nach Denition die Längen von Kurven durch Integration h·, ·i erlaubt es S , sondern auch Winkel zwischen Kurven der Länge ihres Geschwindigkeitsvektors berechnet. Die Denition auÿerdem, nicht nur Längen von Kurven in und all die anderen metrischen Ideen zu messen, die in der Geometrie verwendet werden. Der Ausgangspunkt ist hier eine dierenzierbare Mannigfaltigkeit, auf der für jeden Punkt ein Verfahren zum Messen der Länge von Tangentialvektoren eingeführt wird. Denition 2.7.1 (Riemannsche Metrik) mannsche Struktur) Punkt p∈Q g Eine Riemannsche Metrik (oder Rie- auf einer dierenzierbaren Mannigfaltigkeit ein inneres Produkt hh·, ·iip im Tangentialraum Tp Q Q ordnet jedem zu. Das Produkt ist dabei eine symmetrische, bilineare, positiv-denite Form. g ein Tensorfeld der Ordnung (0, 2). q , ..., q n sind die Komponenten von g Nach der Bezeichnung von Denition 2.5.2 ist In Termen eines lokalen Koordinatensystems durch g ij gij = g ∂ , ∂ ∂q i ∂q j 1 gegeben. Die Komponenten der inversen Matrix werden mit bezeichnet. Die Denition 2.7.1 ist oensichtlich unabhängig von der Wahl des Koordinatensystems. gij wird lokale Repräsentation q : U ⊂ Q → Rn genannt. Die Funktion natensystem der Riemannschen Metrik im Koordi- Eine dierenzierbare Mannigfaltigkeit mit einer Riemannschen Metrik ist eine Rie- mannsche Mannigfaltigkeit. 28 Kapitel 2. Grundlagen zur Dierentialgeometrie Beispiel 2.7.1 (Euklidischer Raum) Q = Rn mit den natürlichen Koordina∂ . Für die Koordinaten im Tangentialraum gilt = ei = (0, ..., 1, ..., 0). ∂q i n Die Metrik ist durch hhei , ej ii = δij gegeben. R wird euklidischer Raum der Dimenten 1 q , ..., q sion n Sei 2.7 n genannt, und die Riemannsche Geometrie dieses Raumes ist die metrische euklidische Geometrie. Ein charakteristisches Ergebnis in der Riemannschen Geometrie ist das folgende: Satz 2.7.1 (Levi-Civita) Eine Riemannsche Mannigfaltigkeit Q besitzt einen eing deutigen anen Zusammenhang ∇, der die folgenden Bedingungen erfüllt: g 1. ∇ ist symmetrisch. 2. Seien c(t) X und Y zwei Vektorfelder, Q deniert sind, so gilt die entlang einer dierenzierbaren Kurve in d dt hhX, Y ii = DX ,Y dt + DY X, dt . Dieser Levi-Civita Zusammenhang erfüllt die Produktregel bezüglich der Riemannschen Metrik. Die zugehörigen Christoel-Symbole sind in lokalen Koordinaten durch Γkij = X1 m 2 g mk ∂gmj ∂gmi ∂gij + − m ∂q i ∂q j ∂q gegeben. Durch die Denition der Christoel-Symbole Γkij (2.8) ist der anen Zusammen- hang eindeutig bestimmt. g Die Beziehung zwischen dem anen Zusammenhang ∇ und der Lagrange-Mechanik wird in Kapitel 5.2 dargelegt. Beispiel 2.7.2 (Riemannsche Metrik und Christoel-Symbole) mit den Koordinaten (x, y). Sei Q = R2 Dann deniert g = dx ⊗ dx + dy ⊗ dy eine Riemannsche Metrik auf Q. Seien X X = x1 ∂ ∂ + x2 , ∂x ∂y und Y Vektorfelder auf Y = y1 Q bestimmt durch ∂ ∂ + y2 , ∂x ∂y 29 Kapitel 2. Grundlagen zur Dierentialgeometrie 2.7 dann gilt g(X, Y ) = = dx(X) · dx(Y ) + dy(X) · dy(Y ) ∂ ∂ ∂ 1 ∂ + x2 ∂y ) · dx (y 1 ∂x + y 2 ∂y ) ∂x 1 ∂ 2 ∂ 1 ∂ 2 ∂ (x ∂x + x ∂y ) · dy (y ∂x + y ∂y ) dx (x +dy 1 1 ∂ ∂ ∂ ∂ 2 2 +y dx · y dx +x dx = x dx ∂y ∂x ∂y ∂x | {z } | {z } | {z } | {z } =0 =1 =0 =1 1 1 ∂ ∂ ∂ ∂ 2 2 · y dy +y dy +x dy + x dy ∂y ∂x ∂y ∂x | {z } | {z } | {z } | {z } =0 =1 =0 =1 = x1 y 1 + x2 y 2 . Da die Komponenten von g alle konstant sind, sind die Christoel-Symbole nach Gleichung (2.8) in den gegebenen Koordinaten alle null. 30 3. Variationsrechung und Euler-Lagrange Gleichungen Viele wichtige Ideen in der Mechanik basieren auf einem Variationsprinzip, das auf die sogenannten Euler-Lagrange Gleichungen führt. Die Variationsrechnung ist ein weitreichendes komplexes Gebiet, das hier in den Grundzügen vorgestellt wird. Eine wichtige Erkenntnis ist, dass die Gesetze der Natur sich so verhalten, dass sie bestimmte Funktionen optimieren. Deshalb wird die Variationsrechnung auch als Theorie zur Optimierung von Integralen bezeichnet. Zuerst werden in Abschnitt 3.1 Begrie und Denitionen der Variationsrechnung eingeführt. In Abschnitt 3.2 wird eine notwendige Bedingung zur Minimierung von Integralen mit Hilfe der Variationsrechnung hergeleitet. Die Darstellungen aus den ersten beiden Abschnitten beruhen im Wesentlichen auf [5]. In Abschnitt 3.3 wird ein Verfahren zur Minimierung mit Nebenbedingungen vorgestellt (vgl. [21]). Eine ausführliche Behandlung der Variationsrechnung wird in [21] gegeben. Abschlieÿend wird in Abschnitt 3.4 ein Variationsprinzip in der Dierentialgeometrie mit Hilfe des anen Zusammenhanges eingeführt. 3.1. Begrie und Denitionen Q eine dierenzierbare Mannigfaltigkeit. Eine Lagrange-Funktion L : R × T Q → R ist eine C ∞ -Funktion auf R × T Q. Sie ist also von Zeit, Position und Geschwindigkeit abhängig. L ist zeitunabhängig, falls eine Funktion L0 : T Q → R mit L(t, q, vq ) = L0 (q, vq ), q ∈ Q, vq ∈ Tq Q, existiert. In dieser Arbeit wird mit zeitunabhängigen Lagrange-Funktionen gearbeitet, die dann mit L anstatt mit L0 bezeichSei net werden. Q mit den Koordinaten (q 1 , ..., q n ), so wird bei der Berech1 n 1 n nung in Koordinaten L(q , ..., q , v , ..., v ) oder kurz L(q, v) geschrieben. Dabei gilt v i = q̇ i für i = 1, ..., n. Ist (U, q) eine Karte für Eine vorgegebene Funktion soll über einer Klasse von Kurven minimiert werden. Dazu muss erklärt werden, wie eine Kurve variiert. 31 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen Denition 3.1.1 (Variation) c von (i) ist eine C 2 Abbildung 3.2 c : [t0 , tf ] → Q eine C 2 Kurve. Eine Variation σ : [t0 , tf ] × [−0 , 0 ] → Q mit den Eigenschaften Sei σ(t, 0) = c(t), (ii) σ(t0 , ) = c(t0 ) (iii) σ(tf , ) = c(tf ). und Die innitesimale Variation für die Variation durch δσ(t) = d d σ ist das Vektorfeld entlang c, das σ(t, ) ∈ Tc(t) Q =0 gegeben ist. Eine Variation von c ist eine Störung von c. Eine innitesimale Variation liefert ein Maÿ der Störung für kleine Werte des Störungsparameters. (siehe Abbildung 3.1) Abbildung 3.1.: Eine Variation (links) und eine innitesimale Variation (rechts) (vgl. [5]) Es sei bemerkt, dass die Endpunkte der Variation nach Denition stationär bleiben, so dass die innitesimalen Variationen in den Endpunkten verschwinden. 3.2. Minimierung mit Variationsrechnung In diesem Abschnitt wird erläutert, wie mit Hilfe der Variationsrechnung gewisse Integrale minimiert werden können, was auf die sogenannten Euler-Lagrange Glei- chungen führt. Sei t0 < tf ∈ R mit q0 , qf ∈ Q. Sei C 2 ([t0 , tf ], q0 , qf ) = {c : [t0 , tf ] → Q | c(t0 ) = q0 , c(tf ) = qf , zweimal stetig dierenzierbar} und c ist 32 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen die Familie der zweimal stetig dierenzierbaren Kurven auf dem Intervall q0 3.2 [t0 , tf ], die qf enden. Diese Menge wird als zulässige Menge bezeichnet. 2 Zu einer Lagrange-Funktion auf Q wird eine Funktion J : C ([t0 , tf ], q0 , qf ) → in starten und in durch Z tf J(c) = R L(c0 (t)) dt t0 0 t 7→ c (t) das Tangentialvektorfeld der Kurve c. Die Funktion ∗ 2 heiÿt auch Gütemaÿ. Eine Kurve c ∈ C ([t0 , tf ], q0 , qf ) minimiert J , falls deniert. Dabei ist J(c∗ ) ≤ J(c) für alle c ∈ C 2 ([t0 , tf ], q0 , qf ) J (3.1) gilt. c∗ (t) Lösung des Miwie c (t) gefunden werden jedes mögliche c(t) getestet Die Bedingung (3.1) ist notwendig und hinreichend, damit nimierungsproblems ist. Allerdings sagt sie nicht aus, ∗ kann und verlangt, dass jeder Kandidat für c (t) gegen ∗ wird. Das Problem kann also nicht direkt durch Bedingung (3.1) gelöst werden, aber aus ihr können nützliche Informationen über das Verhalten minimierender Kurven hergeleitet werden. An dieser Stelle wird sich auf das Finden notwendiger Bedingungen konzentriert. Bemerkung 3.2.1 t 7→ (q 1 (t), ..., q n (t)) die Koordinatendatstellung der Kurve c in den Koordinaten (q 1 , ..., q n ), dann ist t 7→ (q 1 (t), ..., q n (t), q̇ 1 (t), ..., q̇ n (t)) die 0 Koordinatendarstellung von c (t). Ist Notwendige Bedingung für die Minimierung die Euler-Lagrange Gleichungen Die Bedingung wird als notwendige Bedingung erster Ordnung dafür betrachtet, 2 dass eine Kurve c ∈ C ([t0 , tf ], q0 , qf ) die Funktion J minimiert. Sie entspricht der Bedingung an die erste Ableitung einer zu minimierenden Funktion. 2 Seien σ eine Variation von c und σ ∈ C ([t0 , tf ], q0 , qf ) deniert durch σ (t) = σ(t, ). gσ , die auf dem Intervall [−0 , 0 ] durch gσ () = J(σ ) deniert ist. Minimiert c die Funktion J , so muss = 0 ein Minimum von gσ für jede Variation σ von c sein. Sei q die Koordinatendarstellung von c und entsprechend q die Koordinatendarstellung von σ . Dann gilt Z tf d d gσ () = 0= L(q (t), q̇ (t)) dt d =0 d =0 t0 Betrachtet wird eine Funktion Z tf = t0 ∂L dqi (t) ∂L dq̇i (t) + dt. ∂q i d =0 ∂ q̇ i d =0 33 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen 3.2 Es ist zu beachten, dass i dq̇ (t) = d =0 d i dq (t) d dt =0 i d dq (t) = dt d =0 gilt. Dann folgt 0= d tf Z d ∂L dqi (t) ∂L d dqi (t) + dt ∂q i d =0 ∂ q̇ i dt d =0 d ∂L − i ∂q dt ∂L ∂ q̇ i i dq (t) ∂L d − ∂q i dt ∂L ∂ q̇ i i dq (t) gσ () = t0 =0 tf Z = t0 Z tf = t0 t=t ∂L dqi (t) f dt + d ∂ q̇ i d =0 t=t0 =0 dt. d =0 Dabei wurde partielle Integration verwendet und die Tatsache benutzt, dass eine innitesimale Variation an den Endpunkten verschwindet. Da Z tf t0 d ∂L − i ∂q dt ∂L ∂ q̇ i i dq (t) dt = 0 d =0 für jede Variation gelten soll, muss die Bedingung d dt ∂L ∂ q̇ i − ∂L = 0, ∂q i i = 1, ..., n, erfüllt sein. Diese Gleichungen werden die Euler-Lagrange Gleichungen für L ge- nannt. Sie sind ebenfalls bei der Maximierung von Funktionen erfüllt. 2 Eine Kurve in C ([t0 , tf ], q0 , qf ) wird Extremal für das Gütemaÿ J genannt, wenn sie die Euler-Lagrange Gleichungen für L erfüllt. Dies spiegelt die Tatsache wieder, dass die Euler-Lagrange Gleichungen sinngemäÿ der Bedingung an die erste Ableitung in der Dierentialrechnung entsprechen. Beispiel 3.2.1 Seien Q = R2 und L die Funktion 1 L(x, y, vx , vy ) = (vx2 + vy2 ). 2 Angenommen die Kurve t 7→ (x(t), y(t)) minimiere J für ein gegebenes Intervall und gegebene Endpunkte. Dann gilt nach den Euler-Lagrange Gleichungen d dt d dt ∂L ∂vx ∂L ∂vy − ∂L = ∂x − ∂L = ∂y d dt d dt vx (t) = v̇x (t) = ẍ(t) = 0 vy (t) = v̇y (t) = ÿ(t) = 0. 34 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen 3.3 Demzufolge sind die Euler-Lagrange-Gleichungen gewöhnliche Dierentialgleichungen zweiter Ordnung ẍ(t) = 0, ÿ(t) = 0, x(t) = x(0) + ẋ(0) t und y(t) = y(0) + ẏ(0) t. Q = R2 . und diese haben die Lösung Diese Gleichungen beschreiben Geraden in der Ebene 3.3. Minimierung mit Nebenbedingungen Ziel dieses Abschnittes ist das Aunden eine Kurve, die eine gegebene Funktion minimiert, während sie einer anderen Funktion einen vorgegebenen Wert zuordnet. Solche Probleme werden aus historischen Gründen isoperimetrische Probleme (aus dem Griechischen: iso = gleich, peri = herum) genannt, denn das erste betrachtete Problem sollte aus der Menge aller geschlossenener Kurven gleicher Länge die Kurve nden, die die eingeschlossene Fläche maximiert. Problem 3.3.1 Seien niert. Gesucht ist eine Rt C 2 ([t0 , tf ], q0 , qf ) und J(c) = t0f L(c0 (t)) dt ∗ 2 Kurve c ∈ C ([t0 , tf ], q0 , qf ), die J bezüglich benbedingung Z tf I(c) = wie oben deder Integralne- h(c0 (t)) dt = d t0 minimiert, wobei d eine gegebene Konstante ist. Die Lösung dieses Problems kann durch die direkte Substitution der Integralnebenbedingung in den Ausdruck für J(c) gefunden werden. Dies ist oft sehr schwierig durchzuführen. Ein alternativer Ansatz ist die Betrachtung eines erweiterten Kos- tenintegrals JA mit Z tf JA (c, λ) = J(c) + λI(c) = (L(c0 (t)) + λh(c0 (t))) dt, t0 das bezüglich c minimiert werden soll. Die Nebenbedingung nalen Kostenintegral J(c) I(c) mit Hilfe des Lagrange-Multiplikators wird zu dem origi- λ hinzuaddiert. Der folgende Satz zeigt, dass die Lösung des Minimierungsproblems des Integrals mit Nebenbedingung auch eine Lösung des Minimierungsproblems des erweiterten Kostenintegrals ohne Nebenbedingung ist. Satz 3.3.1 Damit einer Konstante λ c = c∗ (t) eine Lösung des Problems 3.3.1 ist, ist die Existenz ∗ notwendig, so dass c (t) ein Extremal von Z tf JA (c, λ) = (L(c0 (t)) + λh(c0 (t))) dt t0 ist. 35 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen σ ∈ C 2 ([t0 , tf ], q0 , qf ) Beweis: Seien σ σ (t) = σ(t, ). Es sind nur die Variationen der Kurven von Interesse, die durch die eine Variation von c 3.3 und deniert durch Endbedingungen verlaufen und die Nebenbedingung erfüllen. Zur Konstruktion einer σ (t) in der Form σ (t) = αη (t) + und η (t), ζ (t) an den Endpunken Variation, die die Nebenbedingungen erfüllt, wird βζ (t) α, β geschrieben, wobei Konstanten sind η (t) und ζ (t) sind unabhängig voneinander, d.h. es η (t) = kζ (t) für alle t erfüllt. Betrachtet wird nun eine Funktion h̃σ , die auf dem Intervall [−0 , 0 ] durch h̃σ () = I(σ ) deniert ist. Erfüllt c die Gleichung I = d, dann muss für = 0 die Gleichung h̃σ = d für jede Variation σ von c erfüllt sein. Da h̃σ für = 0 konstant ist, muss d h̃σ () 0= d verschwinden. Die Funktionen existiert keine Konstante k, die =0 q die Koordinatendarstellung von c, qη die Koordinatendarstellung von entsprechend qζ die Koordinatendarstellung von ζ . Dann ergibt sich nach gelten. Seien η und analoger Rechnung zu Abschnitt 3.2: Z tf t0 i i d(αqη (t) + βqζ (t)) ∂h d ∂h − dt = 0. ∂q i dt ∂ q̇ i d =0 | {z } = LG(h) c∗ kein Extremal von I ist, gilt LG(h) 6= 0, und somit stehen für jedes und ζ die Konstanten α und β durch Gleichung (3.2) in Beziehung. Variationsrechnung für J ergibt analog Z tf i i d (αq (t) + βq (t)) d ∂L ∂L η ζ − dt = 0, i i ∂q dt ∂ q̇ d t0 =0 | {z } = LG(L) Da (3.2) Paar η (3.3) c∗ eine minimierende Kurve ist. α und β müssen dabei (3.2) erfüllen. Elimination von α und β zwischen (3.2) und (3.3) ergibt R tf R tf dqζi (t) dqηi (t) LG(L) dt LG(L) d d =0 dt t0 t0 =0 = R tf R tf dqζi (t) dqηi (t) LG(h) d dt LG(h) d dt t0 t0 da =0 für unabhängige Koordinaten Seiten gleich einer Konstanten c∗ so sein, dass Z tf =0 qη und qζ . Dies kann nur erfüllt sein, wenn beide −λ sind. Somit muss wegen der Linearität von LG LG(L + λh) i dq η (t) dt = 0 d =0 t0 für alle zulässigen η (t) ist. Dann führt das gleiche Argument aus der Herleitung der Euler-Lagrange Gleichungen zu der notwendigen Bedingung d dt ∂(L + λh) ∂ q̇ i − ∂(L + λh) = 0. ∂q i 36 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen Demzufolge ist Beispiel 3.3.1 c∗ ein Extremal von Seien Q = R2 , L Rb a 3.4 (L + λh) dt. die Funktion L(x, y, vx , vy ) = vx2 und h die Funktion h(x, y, vx , vy ) = x. Angenommen die Kurve t 7→ (x(t), y(t)) minimiere J für ein gegebenes Intervall und für gegebene Endpunkten und erfülle dabei die Integralnebenbedingung I. Dann muss diese Kurve nach den Euler-Lagrange Gleichungen d dt ∂(L + λh) ∂vx − ∂(L + λh) d = 2vx (t) − λ = 2v̇x (t) − λ = 2ẍ(t) − λ = 0 ∂x dt erfüllen. Die Euler-Lagrange Gleichung ist eine gewöhnliche Dierentialgleichung zweiter Ordnung ẍ(t) = welche die Lösung x(t) = λ , 2 λ 2 t + vx (0) t + x(0) 4 hat. 3.4. Variationsrechnung in der anen Zusammenhangstheorie In diesem Abschnitt wird die Theorie des anen Zusammenhangs mit der Theorie der Variationsrechnung verbunden. Es werden entsprechend den Ausführungen in [9] Eigenschaften von Variationen abgeleitet, die später benutzt werden. c(t, ) eine Familie von Trajektorien deniert auf einem Intervall [t0 , tf ] × [−0 , 0 ], und c(t) stehe für c(t, 0). Genauso kann bei festem t einen Pfad abhängig von betrachtet werden. Hier ist zu beachten, dass für die Kurve c(t) und ihre Variation σ(t, ) aus Denition 3.1.1 die gleiche Bezeichnung c verwendet wird. Die innitesimalen Variationen von c(t) werden standardmäÿig durch ∂c(t, ) δc(t) = ∈ Tc(t) Q ∂ =0 Sei deniert. Das Geschwindigkeitsvektorfeld ist durch V (t, ) = ∂c(t, ) ∈ Tc(t,) Q ∂t 37 Kapitel 3. Variationsrechung und Euler-Lagrange Gleichungen 3.4 = 0, so ist die Geschwindigkeit V (t). δc(t) ein entlang des Pfades c(t) deniertes Vektorfeld, das in Abbildung 3.1 der innitesimalen Variation δσ entspricht. Dabei ist zu beachten, dass δc nicht notwendigerweise in den Endpunkten verschwindet. Ist t fest, so kann V (t, ) als ein entlang des Pfades c(t, ) deniertes Vektorfeld werden, das durch paramegegeben. Ist Anschaulich ist DV trisiert ist. Mit Hilfe dieser anschaulichen Bedeutung ist leicht einzusehen, dass d Dδq in = 0 und für alle t wohldeniert sind. dt Im Folgenden werden drei Behauptungen mit Hilfe der Koordinatendarstellung von kovarianten Ableitungen bewiesen. Es sei q die Koordinatendarstellung von i i entsprechend seien {q̇ } = {v } die Komponenten von V . Dann gilt: Proposition 3.4.1 c(t), und ∂δq k ∂v k = . ∂ ∂t Beweis: Dies folgt sofort aus den Denitionen und der Gleichheit gemischter parti- eller Ableitungen. Proposition 3.4.2 T (δc(t), V (t)) = DV Dδc − . d dt Beweis: Die Denition der kovarianten Dierentiation in Koordinaten ist ! ∂ ∂q k ! ∂ . ∂q k X DV = d k ∂v k X j i k + v δq Γij ∂ i,j Dδc X = dt k ∂δq k X j i k + δq v Γij ∂t i,j und Subtraktion und Anwendung von Proposition 3.4.1 ergibt ∂ DV Dδc X j i k − = v δq Γij − Γkji , k d dt ∂q i,j,k was die Koordinatendarstellung von Proposition 3.4.3 T (δc, V ) R(δc(t), V (t))Z = in Gleichung (2.3) darstellt. DD DD − d dt dt d Z. Beweis: Der Beweis verläuft analog zu dem von Proposition 3.4.2. Anhand Proposition 3.4.2 und 3.4.3 wird deutlich, wie der Krümmungs- und der Torsionstensor des anen Zusammenhanges die Variationen der Position und die Variation der Geschwindigkeit zueinander in Relation setzen. 38 4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode Wie in Kapitel 1 beschrieben, führt das optimale Kontrollproblem auf das Lösen eines Randwertproblems gewöhnlicher Dierentialgleichungen. Aus diesem Grund behandelt dieses Kapitel die numerische Lösung solcher Randwertprobleme. Dazu wird in Abschnitt 4.1 zunächst ein Randwertproblem deniert. Zur numerischen Lösung dieser Probleme wird die Kollokationsmethode in Abschnitt 4.2 beschrieben. Im Programmpaket MATLAB ist diese Lösungsmethode in der Funktion bvp4c implementiert, deren Beschreibung den Abschluss dieses Kapitels in Abschnitt 4.3 bildet. 4.1. Was sind Randwertprobleme? Gewöhnliche Dierentialgleichungen oder Systeme gewöhnlicher Dierentialgleichungen beschreiben Phänomene, die sich kontinuierlich verändern. Sie tauchen in Modellen der Mathematik, der Wissenschaft und des Ingenieurwesens auf. Ein Dierentialgleichungssystem besitzt viele Lösungen. Beispielsweise wird eine interessierende Lösung bestimmt, indem die Werte all ihrer Komponenten in einem einzigen Punkt t = tf festgelegt werden. Dies ist ein Anfangswertproblem (AWP). In vielen Anwen- dungen sind allerdings Werte oder Gleichungen für die Komponenten der Lösung an mehr als einem Punkt t festgelegt. Dies führt auf Randwertprobleme (RWP), welche zur Lösung der in dieser Arbeit betrachteten Probleme herangezogen wird. Der einfachsten Form entsprechen die Zwei-Punkt-Randwertprobleme x0 (t) = f (x(t)), t ∈ [t0 , tf ], auf einem beschränkten Intervall g(x(t0 ), x(tf )) = 0, [t0 , tf ], tf > t0 . 39 g : R2n → Rn , (4.1) Kapitel 4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode 4.3 4.2. Die Kollokationsmethode Die Kollokationsmethode ist eine globale Diskretisierungsmethode, mit welcher ein Randwertproblem global über das gesamte Intervall diskretisiert werden kann. Dabei wird das Intervall [t0 , tf ] mit Hilfe eines Gitters 4 = {t0 < t1 < · · · < tm = tf } unterteilt. Auf diesem Gitter wird die Lösung durch die Gitterfunktion x4 x des Randwertproblems (4.1) global approximiert. Ziel ist die Berechnung dieser Gitterfunk- tion. Dafür wird per Kollokation eine Funktion S(t) = m−1 X pi (t), S der Form S ∈ C([t0 , tf ]), (4.2) i=0 pi : [ti , ti+1 ] → Rn , i = 0, ..., m − 1, Polynome vom Grad s sind und [ti , ti+1 ], i = 0, ..., m − 1, jeweils ein Teilintervall der Zerlegung des Gesamtintervalls [t0 , tf ] ist. Demzufolge ist S ist eine stetige Funktion, die auf jedem Teilintervall [ti , ti+1 ], i = 0, ..., m − 1, ein Polynom der Ordnung s darstellt. Jedes Teilintervall [ti , ti+1 ] enthält bei der Kollokationsmethode s Kollokationspunkte ti + cj τi , j = 1, ..., s. Diese werden nach einer Quadraturformel mit s Knoten 0 ≤ c1 < · · · < cs ≤ 1 im Einheitsintervall [0, 1] bestimmt. Dabei ist τi die Schrittlänge τi = ti+1 − ti , i = 0, ..., m − 1. Die Polynome pi werden per Kollokation so konstruiert, dass S zusätzlich zu den konstruiert, wobei die Randbedingungen die Dierentialgleichung aus (4.1) in den Kollokationspunkten exakt erfüllt. Diese Forderung führt auf die Gleichungen (i) (ii) S 0 (ti + cj τi ) = f (S(ti + cj τi )), g(S(t0 ), S(tf )) = 0. Für die Stetigkeit von S i = 0, ..., m − 1, j = 1, ..., s, (4.3) müssen zusätzlich die Bedingungen pi−1 (ti ) = pi (ti ), i = 1, ..., m − 1, (4.4) erfüllt sein. Die Gleichungen (4.2), (4.3) und (4.4) bilden zusammen folgendes mathematisches Problem: Gesucht sind m · (s + 1) Koezienten der Polynome p0 , ..., pm . Gegeben sind dabei: • m·s • 1 Gleichungen aus den Kollokationsbedingungen (4.3)(i) Randbedingung aus (4.3)(ii) • m−1 Gleichungen aus (4.4) für die Stetigkeit von S. m · (s + 1) Gleichungen für m · (s + 1) Gitterfunktion x4 gilt dann Insgesamt ist somit ein Gleichungssystem mit Unbekannte zu lösen. Für die gesuchte x4 (ti ) = S(ti ) für i = 0, ..., m. 40 Kapitel 4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode 4.3 4.3. Umsetzung der Kollokationsmethode in der MATLAB-Funktion bvp4c Die MATLAB-Funktion bvp4c implementiert eine Kollokationsmethode für die Lö- sung von Randwertproblemen der Form x0 = f (t, x, p), t0 ≤ t ≤ tf , (4.5) mit den Zwei-Punkt-Randbedingungen g(x(t0 ), x(tf ), p) = 0. S(t) ist eine stetige Funktion, die ein kubisches Polynom auf jedem Teilintervall [ti , ti+1 ] des Gitters 4 = {t0 < t1 < · · · < tm = tf } darstellt. Dabei erfüllt sie die Randbedingungen Dabei ist p ein Vektor unbekannter Parameter. Die Näherungslösung g(S(t0 ), S(tf )) = 0. Zusätzlich wird verlangt, dass die Dierentialgleichung (4.5) an beiden Enden und in der Mitte jedes Teilintervalls [ti , ti+1 ], i = 0, ..., m − 1, erfüllt ist. Diese Forderung führt auf S 0 (ti ) = f (ti , S(ti )) S 0 ((ti + ti+1 )/2) = f ((ti + ti+1 )/2, S((ti + ti+1 )/2)) S 0 (ti+1 ) = f (ti+1 , S(ti+1 )) für (4.6) i = 0, ..., m−1. Jedes Teilintervall [ti , ti+1 ] enthält somit drei Kollokationspunkte 1 c1 = 0, c2 = , c3 = 1. 2 Die Bedingungen (4.6) stellen ein System nichtlinearer algebraischer Gleichungen für die Koezienten von [t0 , tf ] S(t) dar. Die Lösung x(t) wird über das gesamte Intervall approximiert, wobei die Randbedingungen die ganze Zeit berücksichtigt wer- den. Die Gleichungen (4.6) werden iterativ mit Linearisierung gelöst, so dass lineare Gleichungslöser basierend auf MATLAB, wie z.B. das Newton-Verfahren, angewandt werden können. S(t) eine Approximation vierter Ordnung für eine isokx(t) − S(t)k ≤ Ch4 für alle t ∈ [t0 , tf ]. Hierbei ist h das Maximum der Schrittweiten τi = ti+1 − ti und C eine Konstante. Nach der Berechnung der Approximationslösung S(t) mit bvp4c auf einem Gitter kann S(t) mit der MATLAB-Funktion bvpval in jedem beliebigen t ∈ [t0 , tf ] kostengünstig ausgewertet werden, so dass die Gitterfunktion x4 erhalten wird. Es kann gezeigt werden, dass lierte Lösung x(t) ist, d.h. es gilt Randwertprobleme besitzen abhängig von ihren Randbedingugen meist mehr als 41 Kapitel 4. Numerische Lösung von Randwertproblemen mit der Kollokationsmethode 4.3 eine Lösung. Deshalb benötigen die Programme zur Lösung solcher Probleme eine erste Schätzung der gewünschten Lösung. Diese Schätzung impliziert eine erste Näherung eines Anfangsgitters 40 , welches das Verhalten der gewünschten Lösung erkennen lässt. Das Programm passt dieses Gitter dann so lange an, bis eine akzeptable numerische Lösung mit einer hinreichenden Anzahl von Gitterpunkten erhalten wird. Das Finden einer genügend guten Anfangsschätzung für die Lösung ist oft der schwierigste Teil bei der Betrachtung von Randwertaufgaben. In der MATLAB-Funktion bvp4c wird der Fehler zwischen der geschätzten und der wahren Lösung kontrolliert. Im Folgenden wird das Verfahren skizziert: S(t) auf [t0 , tf ] und die Kollokation am Ende jedes Teilintervalls S(t) auch eine stetige Ableitung auf [t0 , tf ] hat. Für eine solche ist das Residuum r(t) in der Dierentialgleichung als Die Stetigkeit von impliziert, dass Approximation r(t) = S 0 (t) − f (t, S(t)) deniert. Anders betrachtet ist S(t) die exakte Lösung der gestörten Dierential- gleichung S 0 (t) = f (t, S(t)) + r(t). Analog ist das Residuum in den Randbedingungen g(S(a),S(b)) deniert. bvp4c kontrolliert die Gröÿen dieser Residuen. Sind die Residuen verhältnismäÿig klein, so ist S(t) eine gute Lösung in dem Sinne, dass S(t) die exakte Lösung eines Pro- blems ist, das dem gegebenen Problem sehr nahe ist. Des Weiteren beinhalten kleine Residuen bei einem gut konditionierten Problem, dass S(t) nahe bei x(t) ist. 42 5. Optimale Kontrolle von ZusammenhangsKontrollsystemen In diesem Kapitel werden optimale Kontrollgleichungen für die Bewegung mechanischer Systeme mit Hilfe des anen Zusammenhanges abgeleitet. Es basiert hauptsächlich auf den Darstellungen von [5] und [9]. Zunächst wird in Abschnitt 5.1 eine Einführung in die optimale Kontrolltheorie gegeben. Hierbei wird sich an den Ausführungen aus [3] und [21] gehalten. Es werden Fragen wie Was ist optimale Kontrolle? behandelt, und damit verbundene Begrie und Bezeichnungen eingeführt. Hauptziel in der geometrischen Mechanik ist es, einen Formalismus zu nden, der die Bewegung eines Systems beschreibt. Deshalb wird in Abschnitt 5.2 eine Methode vorgestellt, um aus einem physikalischen Problem ein mathematisches Modell zu erhalten. Das betrachtete mathematische Modell verwendet die Hilfsmittel, die in Kapitel 2 eingeführt wurden, insbesondere den Formalismus des anen Zusammenhanges aus Abschnitt 2.6. In Abschnitt 5.3 wird die Steuerbarkeit mechanischer Systeme behandelt, die eine Grundvoraussetzung für die optimale Kontrolle ist. Die Abschnitte 5.4 bis 5.7 beschäftigen sich mit der optimalen Kontrolle mechanischer Systeme. Es wird eine Kostenfunktion deniert, die bezüglich einer aus der Systemdynamik bestehenden Nebenbedingung minimiert wird. Dazu wird in Abschnitt 5.6 die Technik der Lagrange-Multiplikatoren mit einem Variationsprinzip verwendet. 5.1. Optimale Kontrolle Maschinen, die automatisch zuvor festgelegte Aufgaben ausführen sollen, sind alltäglich. Thermostate und Zeitmesser kontrollieren das Verhalten von Zentralheizungen und Waschmaschinen. Ein Autofahrer kontrolliert den Weg seines Fahrzeuges, indem er Fuÿpedal und Lenkrad betätigt. Solche Systeme können in ihrem Verhalten verändert und somit kontrolliert werden. Das bedeutet, dass die Gesetze, die das Verhalten der Systeme bestimmen, Variablen enthalten, deren Werte von einer 43 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.1 auÿenstehenden Person unabhängig des Systems geändert werden können. Beispielsweise entscheidet sich der Autofahrer dafür, das Bremspedal anstatt des Gaspedals zu treten, und das Auto wird langsamer. Neben den sogenannten Zustandsvariablen aus dem Zustandsraum, die präzise denieren, wie sich das System zur Zeit t verhält (für ein Auto z.B. seine Positionsvariablen), existieren somit zusätzliche Kontrollva- riablen. Diese werden dazu verwendet, das Systemverhalten zu verändern; z.B. sind die Veränderung des Druckes auf das Gaspedal und das Drehen des Lenkrades einfache Hilfsmittel, um Gröÿe und Richtung der auf das Auto wirkenden Gesamtkraft zu ändern, welche nach Newtons Gesetz den Weg des Autos beschreibt. Im Rahmen dieser Arbeit wird die Betrachtung auf an-nichtlineare Kontrollsyste- me beschränkt. Denition 5.1.1 (An-nichtlineares Kontrollsystem) Kontrollsystem auf einer dierenzierbaren Mannigfaltigkeit m Eingangskontrollen u1 , ..., um Ein an-nichtlineares Q der Dimension n mit ist eine Dierentialgleichung der Form ẋ = f (x) + m X gi (x) ui (5.1) i=1 mit x ∈ Q, glatten Vektorfeldern Punkt u = (u1 , ..., um )T : R+ → U ⊂ Rm und den : Q → T Q auf Q. ẋ ist der Tangentialvektor im der beschränkten Abbildung x∈Q f, g1 , ..., gm an die glatte Kurve, die die Lösung für eine feste Anfangsbedingung charakterisiert. Die Mannigfaltigkeit Q wird als Zustandsraum oder Phasenraum des Systems bezeichnet. Die Anzahl n der Koordinaten der Zustandsvariablen x ist die Anzahl der Freiheits- 1 grade des Systems. Ein System ist voll angetrieben , falls gleich viele Kontrollvaria2 blen m wie Freiheitsgrade n existieren. Andernfalls ist das System unterangetrieben . Pm Eine Lösung t → x(t) mit ẋ(t) = f (x(t)) + i=1 gi (x(t)) ui (t) wird zur Kontrollfunktion u(t) gehörige Trajektorie von (5.1) genannt. t = t0 mit x(t0 ) = x0 gegeben, und es soll in einen f anderen gegebenen Zustand x(tf ) = x kontrolliert werden, den es zum Zeitpunkt t = tf erreichen soll. Jede Wahl von u(t) in t0 ≤ t ≤ tf liefert eine andere Lösung 0 f für x(t) mit x(t0 ) = x . Einige dieser Trajektorien mögen durch x = x verlaufen, Das System sei in einem Zustand andere nicht. Demzufolge ist es möglich, dass keine Kontrollfunktion existiert, die 0 f das System vom Zustand x in den Zustand x überführt. Betrachtet wird das zweidimensionale System mit einer Kontrollvariablen, das durch die Gleichungen ẋ1 = x1 ẋ2 = u1 t = 0 nach x1 = x2 = 0 späteren Zeit überführt werden soll. Keine Wahl von u1 (t) kann das System von bestimmt ist und von 1 englischer 2 englischer x1 = 1, x2 = 2 zur Zeit zu einer Begri: fully actuated Begri: underactuated 44 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen (1, 2) (0, 0) nach überführen, da Jede Lösung, die mit x1 (t0 ) = 1 u1 5.1 x1 hat. t ≥ 0. x1 keinen Einuss auf das Verhalten von startet, ist von der Form x1 (t) = exp t für wird somit niemals null. Das System ist nicht steuerbar. Bevor somit über optimale Kontrolle eines Systems diskutiert wird, muss gewährleistet sein, dass das System von einem gegebenen Anfangszustand in den gewünschten Endzustand steuerbar ist. Dazu wird folgende Denition eingeführt: Denition 5.1.2 (Steuerbarkeit) weils zwei Punkte x0 und xf Das System (5.1) ist steuerbar, wenn für je- im Zustandsraum eine zulässige Kontrollfunktion u(t) deniert auf einem Zeitintervall [0, T ] existiert, so dass das System mit der Anfangsx0 den Punkt xf in der endlichen Zeit T erreicht, d.h. x(T ; u(t), x0 ) = xf . bedingung Existiert mehr als eine Trajektorie, um das System von x0 nach xf zu bewegen, so muss entschieden werden, welche Trajektorie gewählt wird. Beispielsweise bewirkt f eine Wahl, dass das System sehr lange braucht, um x zu erreichen. Eine andere Wahl kann teuer im Energieverbrauch sein. Demzufolge wird ein Maÿ der Kosten, die während der Bewegung auftreten, benötigt. Zur Messung dieser Kosten wird ein Kostenintegral J einer geeigneten Kostenfunktion riablen aufgestellt: f0 von Zustands- und Kontrollva- tf Z J(u, x) = f0 (u(t), x(t)) dt. t0 Gesucht ist die Kontrollfunktion u, welche das Kostenintegral gleichzeitig (5.1) erfüllt. Die Funktion f0 J die Übergangszeit tf − t0 f0 = 1 u gesetzt. Dann minimiert. Wird hingegen verlangt, dass der Energieverbrauch möglichst gering ist, so wird chend als eine Funktion abhängig von minimiert und hängt von der jeweiligen Problemstellung ab. Soll der schnellstmögliche Weg gefunden werden, so wird wird bei der Minimierung von J f0 dementspre- gewählt. Diese Problemstellung gleicht einem Problem aus der Variationsrechnung: Es muss u(t) t0 ≤ t ≤ tf gewählt werden, so dass das Integral J minimiert P ẋ = f (x) + m i=1 gi (x)ui erfüllt sind. Der einzige Unterschied zu dem isometrischen Problem ist die Form der Nebenbedingungen: Dieeine Funktion auf wird und die Zustandsgleichungen se sind Dierentialgleichungen anstatt Integrale in x und u. Die Variationsrechnung kann allerdings auch für Probleme mit Dierential-Nebenbedingungen angewandt werden, denn die Nebenbedingung (5.1) ist äquivalent zur Integralnebenbedingung Rt P I(u, x) = t01 g(u, x, ẋ) dt = 0 mit g(u, x, ẋ) = ẋ − f (x) − m i=1 gi (x)ui . Kontrollprobleme, die in Natur und Technik auftreten, haben meist Beschränkungen an die Kontrollvariablen. Diese liegen in einem beschränkten Kontrollraum U. Beispielsweise kann ein Autofahrer, indem er das Gaspedal tritt, nur eine begrenzte Kraft F auf das Auto ausüben, d.h. |F | ≤ K , wobei K eine Konstante ist. Die meisten Kontrollprobleme haben diese Eigenschaft. Da der klassische Ansatz mit Hilfe der Variationsrechnung verwendet wird, werden die Beschränkungen von u(t) hier ignoriert. Im Abschnitt 3.2 wurden die Ideen und Metoden der Variationsrechnung eingeführt, 45 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.2 speziell wurde die Minimierung von Integralen unter Nebenbedingungen (isometrische Probleme) in Abschnitt 3.3 behandelt. In diesem Abschnitt wird die Theorie der optimalen Kontrolle behandelt, wobei die Kenntnisse der Variationsrechnung sehr wichtig sind. Zunächst wird das Problem noch einmal klar formuliert: Problem 5.1.1 Gegeben: Zustandsgleichung: Anfangszustand: Endzustand: Kostenintegral Kontrollfunktionen Gesucht: P ẋ = f (x) + m i=1 gi (x) ui , 0 x(t0 ) = x x(tf ) = xf , Rt J(u, x) = t0f f0 (u(t), x(t)) dt u(t). zu gegebener Zeit t0 , der zur Zeit tf erreicht wird. und ∗ ∗ Kontrolle u (t) mit zugehöriger Trajektorie x (t), die das System von x0 nach xf überführt, so dass J minimiert wird. 5.2. Zusammenhangs-Kontrollsystem Es wird nun das dierentialgeometrische Modell des Problems vorgestellt. Der Inhalt dieses Abschnittes orientiert sich an den Darstellungen aus [3], [5], [9] und [16]. Diese Referenzen werden auch zur Vertiefung des Themas empfohlen. Die Methodik des anen Zusammenhanges, welche in Abschnitt 2.6 erläutert wurde, kann seine Anwendung nun in Bezug auf die Modellierung der Dynamik mechanischer Systeme nden. Der ane Zusammenhang vereinfacht eine koordinatenunabhängige Formulierung der Newtonschen Dynamik in dem Sinne, dass die Bewegungsgleichungen mit Hilfe der kovarianten anstatt der gewöhnlichen Ableitung dargestellt werden. Ebenso vermeidet eine solche Darstellung Coriolis- und andere Zwangskräfte, welche bei bewegten Koordinatensystemen auftreten. Der ane Zusammenhang ist somit ein nützliches Werkzeug für die Analysis mechanischer Systemdynamik. Die Umsetzung des mechanischen Kontrollproblems in ein mathematisches Modell geschieht mittels folgender Schritte: 1. Bestimmung der Kongurationsmannigfaltigkeit des Systems. Diese ist eine dierenzierbare Mannigfaltigkeit, deren Punkte in 1-1-Korrespondenz mit den Kongurationen des Systems sind. 2. Wahl geeigneter Koordinaten. 46 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.2 3. Die kinetische Energie des Systems wird als Funktion des Tangentialbündels der Kongurationsmannigfaltigkeit bestimmt und von dieser die Riemannsche Metrik abgeleitet. Die Riemannsche Metrik deniert die kinetische EnergieFunktion. 4. Falls auf das System unbeeinussbare äuÿere Kräfte wirken, werden diese als kotangentialbündelwertige Funktionen auf dem Tangentialbündel dargestellt. Solche Kräfte beinhalten z.B. Potential- und Reibungskräfte. 5. Auf das System wirkende Kontrollkräfte werden als 1-Form Felder auf der Kongurationsmannigfaltigkeit modelliert. Die Zusammenfassung all dieser Punkte bildet ein einfaches mechanisches Kontroll- system. Im Folgenden werden speziell die Punkte 3. und 4. näher erläutert. Kinetische Energie und Riemannsche Metrik Es wird angenommen, dass eine Kongurationsmannigfaltigkeit mit geeigneten Koordinaten gefunden wurde (siehe Beispiel 1.2.1 in Abschnitt 1.2). Die kinetische Energie K : TQ → R des Systems ist eine Funktion auf dem Tangentialbündel der Kongurationsmannigfaltigkeit. Speziell für starre Körper setzt sie sich aus der Translations- und der Rotationsenergie zusammen: K = Ktrans + Krot . Bei Systemen aus starren Körpern addieren sich die kinetischen Energien der einzelnen starren Körper. Ohne auf eine weitere Herleitung der kinetischen Energie einzugehen, kann gezeigt werden, dass ein positiv denites K = 21 B(vq , vq ), vq ∈ Tq Q gilt. (0, 2)-Tensorfeld B auf Q existiert, so dass Aus der kinetischen Energie des Systems wird die Riemannsche Metrik bestimmt: 1 n Seien g ein (0, 2)-Tensorfeld und (q , ..., q ) die Koordinaten für Q zu der Karte (U, q). Dann sind die Komponenten der Riemannschen Metrik k X ∂ 2 Ka gij = , i ∂ q̇ j ∂ q̇ a=1 gegeben. K1 , ..., Kk g durch i, j ∈ {1, ..., n}, sind dabei die Funktionen für die kinetischen Energien der ein- zelnen Körper, aus denen das System besteht. 47 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.2 Die Euler-Lagrange-Gleichungen auf einer Riemannschen Mannigfaltigkeit Zur Einführung der Bewegungsgleichungen wird eine spezielle Klasse von LagrangeFunktionen betrachtet. Sei (Q, g) eine Riemannsche Mannigfaltigkeit. Dabei repräsentiert g die kinetische Energie des Systems. Für (Q, g) wird eine zeitunabhängige Lagrange-Funktion Lg 1 auf Q durch Lg (vq ) = g(vq , vq ), vq ∈ Tq Q, deniert. Für ein mechanisches System 2 ist dies die kinetische Energie. Dann sind die Lösungen der Euler-Lagrange Gleig chungen für die Lagrange-Funktion Lg genau die Geodätischen von ∇. Es ergibt sich somit die Bewegungsgleichung g 0 ∇c0 (t) c (t) = 0. (5.2) Dieses Ergebnis ist die erste Verbindung zwischen Mechanik und Dierentialgeometrie. Der Levi-Civita Zusammenhang spielt demzufolge eine wichtige Rolle in der Herleitung der Bewegungsgleichungen. Ein Beweis der Behauptung kann in [5] nachgelesen werden. Interpretation: Zu der Kurve c:I →Q entspricht c0 : I → Tc(t) Q der Geschwin- Es ist nun eine Denition des Beschleunigung entlang c gesucht. (q 1 , ..., q n ) der Kurve c entspricht die gewöhnliche Denition 1 n der Beschleunigung dem Objekt mit den Koordinaten (q̈ , ..., q̈ ). Die dazu gehörige 0 Gröÿe ist allerdings im Gegensatz zu c kein Vektorfeld entlang der Kuve c. Mit digkeit entlang c. Mit den Koordinaten Hilfe des anen Zusammenhanges wird die Beschleunigung in den Tangentialraum 0 0 projiziert, so dass ∇c0 (t) c (t) ein Vektorfeld entlang c ist. ∇c0 (t) c (t) wird auch geo- metrische Beschleunigung bezüglich ∇ genannt (vgl. Beispiel 2.6.1). Kräfte in den Euler-Lagrange Gleichungen Wird von Kontrolltheorie mechanischer Systeme gesprochen, dann sind die Eingänge für diese Systeme die Kräfte. Die Euler-Lagrange Gleichungen für eine LagrangeFunktion L beschreiben die natürliche Bewegung des Systems, d.h. die Bewegung des Systems ohne äuÿere Einüsse. Eine Kraft dagegen ist ein äuÿerer Einuss. In der geometrischen Mechanik wird eine Kraft auf einer Mannigfaltigkeit Q durch ∗ eine Abbildung F : R × T Q → T Q, (t, q, vq ) 7→ F (t, q, vq ), deniert. Eine Kraft ist ∗ zeitunabhängig, falls es eine Abbildung F0 : T Q → T Q mit F (t, q, vq ) = F0 (q, vq ) gibt. Existiert ein 1-Form Feld F0 auf Q mit F (t, q, vq ) = F0 (q), so wird die Kraft als grundlegend bezeichnet. Bemerkung 5.2.1 darstellung einer Kraft R, i = 1, ..., n, (q 1 , ..., q n )Pdie Koordinaten für Q, so ist die Koordinatenn i i i durch F = i=1 F dq mit den Funktionen F : R × T Q → Sind als Komponenten gegeben. 48 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Greifen an das mechanische Systemen externe Kräften F 5.2 an, so wird seine Dynamik durch die Euler-Lagrange Gleichungen ∂L ∂L − = F i, dt ∂ q̇i ∂qi d beschrieben. Dabei sind F 1 , ..., F n i = 1, ..., n, die Komponenten von (5.3) F. Spezielle Kräfte sind die aus der potentiellen Energie resultierenden Potentialkräfte. P eine Potentialfunktion auf Q, so ist ihre Potentialkraft die grundlegende Kraft F (t, vq ) = −dP (q), q ∈ Q, vq ∈ Tq Q. Ist Potentialkräfte sind innere Kräfte, da sie implizit in der Lagrange-Funktion vor- c ein Extremal des L(q, vq ) = Lg (vq ) − P (q). kommen können: Für Systeme mit Potentialkräften ist die Kurve Gütemaÿes J zu der Lagrange-Funktion In den meisten mechanischen Anwendungen wird die Lagrange-Funktion von der Form kinetische minus potentielle Energie gewählt. Für eine ausführliche Diskussion zur Modellierung mechanischer Systeme mit Hilfe von anen Zusammenhängen wird auf die Arbeiten von Bullo [4] und Lewis [14] verwiesen. Einfache mechanische Kontrollsysteme Nach der Vorstellung der einzelnen dierentialgeometrischen Objekte wird nun das mathematische Modell des Kontrollproblems eingeführt. Denition 5.2.1 (Allgemeines einfaches mechanisches Kontrollsystem) Ein allgemeines einfaches mechanisches Kontrollsystem besteht aus folgenden dierentialgeometrischen Objekten: (i) einer dierenzierbaren Mannigfaltigkeit Q (die Kongurationsmannigfaltig- keit), (ii) einer Riemannschen Metrik (iii) einer glatten Funktion (iv) einer Kraft F auf (v) einer Familie von (vi) U ⊂ Rm Q P g auf auf Q Q (die kinetische Energie Metrik), (die Potentialfunktion), (die externen Kräfte), 1-Form Feldern F = {F1 , ..., Fm } auf Q (die Kontrollkräfte), (die Kontrollmenge). Das System ist voll angetrieben in q0 , falls dernfalls ist das System unterangetrieben in Tq∗0 Q = spanR {F1 (q0 ), ..., Fm (q0 )}, anq0 . Ist das System in jedem Punkt in Q voll angetrieben, so ist es voll angetrieben. 49 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.2 Die Klasse der allgemeinen einfachen mechanischen Kontrollsystemen ist sehr umfassend, weshalb nun einige Beschränkungen gemacht werden. Diese führen auf eine Klasse von Kontrollsystemen, die im weiteren Verlauf der Arbeit betrachtet wird. Das System besitze kein Potential und nur angreifende Kräfte, auf die Kontrolle ausgeübt werden kann. Dann reduzieren sich die sechs Objekte aus Denition 5.2.1 auf vier Objekte. Wie zuvor gezeigt, sind die Bewegungsgleichungen für Systeme ohne angreifende g 0 Kräfte ∇c0 (t) c (t) = 0, deren Lösungen die Geodätischen des Levi-Civita Zusammenhanges sind. Aus einem Vergleich mit der Newtonschen Mechanik (ma ist nach der Interpretation der Geodätischen ersichtlich, dass der Term dabei der Beschleunigung = F ), ∇c0 (t) c0 (t) a entspricht. Für Systeme mit angreifenden Kräften ist 0 demnach die geometrische Beschleunigung ∇c0 (t) c (t) einem Objekt gleichzusetzen, 1 das dem Term F aus der Newtonschen Mechanik entspricht. Anstatt direkt mit m den Kräften F1 , ..., Fm zu arbeiten, werden somit Vektorfelder Y1 , ..., Ym verwendet. P ij j i Die Koordinatendarstellung dieser Vektorfelder ist Ya = j g Fa . Dabei sind die ij g die Komponenten der inversen Matrix der Riemannschen Metrik. In der geometrischen Mechanik wird somit immer direkt mit den Vektorfeldern {Y1 , ..., Ym } anstatt mit den 1-Form Feldern {F1 , ..., Fm } gearbeitet. Die vier Objekte Q, g, F und U können durch die Objekte Q, ∇, Y = {Y1 , ..., Ym } g und U mit ∇ =∇ und den eben denierten Vektorfeldern Y identiziert werden. Motiviert durch diese Klassikation wird eine interessante Klasse von Kontrollproblemen deniert: Denition 5.2.2 (Zusammenhangs-Kontrollsystem) Kontrollsystem {Y1 , ..., Ym } 3 und Ein Zusammenhangs- besteht aus den dierentialgeometrischen Objekten U, Q, ∇, Y = wobei (i) Q eine dierenzierbare Mannigfaltigkeit, (ii) ∇ ein aner Zusammenhang auf (iii) Y = {Y1 , ..., Ym } (vi) U ⊂ Rm Q, eine Familie von Vektorfeldern auf Q und ist. Die globale Repräsentation der Bewegungsgleichungen lautet dann 0 ∇c0 (t) c (t) = m X Yi (c(t))ui (t). (5.4) i=1 3 englischer Begri: ane connection control system 50 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.2 t 7→ c0 (t) ∈ Tc(t) Q das Tangentialvektorfeld von c ist, stellt c0 (t) ein Vektorfeld entlang der Kurve c(t) dar. Zur Vereinfachung der Notation wird Tc(t) Q 3 V (t) = c0 (t) als dieses Vektorfeld entlang der Kurve c(t) deniert. Wegen der Diskussion nach 0 Denition 2.6.1 kann ∇c0 (t) c (t) dann als kovariante Ableitung von dem Vektorfeld V dargestellt werden, so dass aus (5.4) Da m X DV = Yi (c(t))ui dt i=1 wird. Das System ist in q0 voll angetrieben, falls (5.5) Tq0 Q = spanR {Y1 (q0 ), ..., Ym (q0 )}, andernfalls ist das System unterangetrieben in q0 . + Die Abbildung u(t) : R → U stellt die Kontrollen oder Eingänge dar. Sie nimmt Werte in der Kontrollmenge U an und wird durch die Vektorfelder gebildet. Festgelegte Kontrollen führen zu Trajektorien rationsmannigfaltigkeit Q. Yi auf TQ ab- c : I → Q auf der Konguq , die das System Diese beschreiben die Kongurationen T Q ist der Zustandsraum mit den Zuständen (q, v), q ∈ Q, v ∈ Tq Q beschrieben durch das Vektorfeld c0 (t). m Wie oft in der ersten Behandlung vieler Kontrollprobleme gilt von nun an U = R . annehmen kann. Das Tangentialbündel Dies entspricht unbeschränkten Kontrollfunktionen aus Abschnitt 3.2. Obwohl alle Vektorfelder auf Systems auf T Q, Tangentialbündel Q deniert sind, bestimmen sie die Entwicklung des da die kovariante Ableitung von TQ V ∈ TQ wiederum auf dem deniert ist. Der ane Zusammenhang vereinfacht somit die Formulierung, denn anstatt einer Dierentialgleichung zweiter Ordnung mit der Dar00 stellung c (t) und dem Zustandsraum Q wird eine Dierentialgleichung erster OrdDV nung mit der Darstellung dt und dem Zustandsraum T Q erhalten. Die Gleichung (5.5) kann als kovariante Formulierung von Newtons Gesetz F = ma aufgefasst werden. Bemerkung 5.2.2 An dieser Stelle wird skizziert, wie das Zusammenhangs-Kon- trollsystem (5.5) mit dem im Abschnitt 5.1 denierten an-nichtlinearen Kontrollsystem (5.1) im Zusammenhang steht. Für eine ausführlichere Interpretation wird auf [5] und [16] verwiesen. Nach Kapitel 2.6 ist die Koordinatendarstellung der kovarianten Ableitung von 1 n mit den V -Komponenten (v , ..., v ) durch V X ∂ DV = (v̇ k + Γkij q̇ i v j ) k . dt ∂q i,j,k V setzt sich aus der gewöhnlichen Ableitung t plus einem Term, der abhängig von den Christoel-Symbolen ist, zusammen. P k i j ∂ der Wahl Z = − Γij q̇ v ∂qk ∈ T Q ergibt sich eine Bewegungsgleichung der gegeben. Die kovariante Ableitung nach nach Mit i,j,k Form V̇ = Z + m X Yi u i i=1 51 Kapitel 5. auf T Q. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Dieses System ist ein anes Kontrollsystem auf TQ 5.3 und entspricht der Form des in Denition 5.1.1 eingeführten an-nichtlinearen Kontrollsystems (5.1). 5.3. Steuerbarkeit Um ein System optimal kontrollieren zu können, muss zunächst gewährleistet sein, dass das System überhaupt steuerbar ist, d.h. dass das System mit einer vorgegebenen Klasse von Kontrollfunktionen von einem Punkt zu einem anderen geführt werden kann. Diese Formulierung der Steuerbarkeit und die damit einhergehende Denition 5.1.2 ist allerdings nicht sehr hilfreich, um die Steuerbarkeit von Systemen wirklich nachzuweisen. Es müssen Verfahren entwickelt werden, um die Steuerbarkeit direkt zu prüfen. Das Problem der Steuerbarkeit besteht aus der Beschreibung der Beschaenheit der Menge von Punkten, die von einem Startpunkt erreichbar sind. Für diese Beschreibung gibt es zwei wichtige Eigenschaften: 1. die Erreichbarkeit, bei der die erreichbare Menge kein leeres Inneres hat, 2. die Steuerbarkeit, die die Erreichbarkeit erweitert, indem geprüft wird, ob der Startpunkt im Inneren der erreichbaren Menge liegt. Der Ansatz, der im weiteren Verlauf der Arbeit verwendet wird, orientiert sich an der Arbeit [18] von Lewis und Murray. Es werden die wichtigsten Ergebnisse zur Steuerbarkeit mechanischer Systeme und die dazu notwendigen Denitionen und Werkzeuge vorgestellt. Da hier auf die Anwendung der Steuerbarkeitskriterien auf ein spezielles System Wert gelegt wird, wird auf Beweise verzichtet. Ausführliche Diskussionen der Theorie sowie Beweise und Anwendungen der Steuerbarkeitskriterien sind in [5] und [18] zu nden. Steuerbarkeitsdenitionen für mechanische Kontrollsysteme Zunächst werden Denitionen und Bezeichnungen zur Steuerbarkeit eingeführt. Mechanische Systeme haben einen Kongurationsraum Q und einen Zustandsraum T Q. Es macht also Sinn, über Steuerbarkeit in Termen der Kongurationen zu sprechen anstatt in Termen der Zustände, denn in erster Linie sollen vorgegebene Positionen und Ausrichtungen in Q erreicht werden. In dieser Arbeit wird Steuerbarkeit nur von Zuständen mit Geschwindigkeit null betrachtet. 52 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Es wird das Zusammenhangs-Kontrollsystem 0 ∇c0 (t) c (t) = m X 5.3 Σ = (Q, ∇, Y, U ) Yi (c(t))ui (t), (5.6) i=1 beziehungsweise für V = c0 m X DV = Yi (c(t))ui (t) dt i=1 betrachtet. Eine gesteuerte Trajektorie für eine Funktion und c : [0, T ] → Q (5.7) Σ ist ein Paar (u, c), wobei u : [0, T ] → U die Lösung von (5.6) ist. Die folgenden Fragen über Steuerbarkeit mechanischer Systeme werden oft gestellt. Sie setzen voraus, dass die Anfangsgeschwindigkeit als null angenommen wird. In Klammern ist die zugehörige allgemeine Bezeichnung angegeben. 1. Ist es möglich, wenn in einer in Ruhe gegebenen Konguration gestartet wird, eine andere Konguration und deren Umgebung zu erreichen? (Kongurations- Erreichbarkeit) 2. Ist es möglich, wenn in einer in Ruhe gegebenen Konguration gestartet wird, eine Konguration, die in einer Umgebung der Startkonguration liegt, zu erreichen? (lokale Kongurations-Steuerbarkeit) 3. Ist es möglich, diese Konguration mit Endgeschwindigkeit null zu erreichen? (Gleichgewichts-Steuerbarkeit) Die folgenden Ergebnisse beruhen alle auf der Voraussetzung, dass die potentielle Energie des Systems null ist, d.h. das mechanische System besitzt als LagrangeFunktion lediglich die kinetische Energie bezüglich einer Riemannschen Metrik auf der Kongurations-Mannigfaltigkeit g Q. In der Regel ist es nicht leicht zu beweisen, dass ein System steuerbar ist. Die etwas schwächere Eigenschaft der Erreichbarkeit ist oft einfacher zu beweisen. Dazu wird die Bezeichnung der kongurations-erreichbaren Menge benötigt, die von der Wahl einer positiven Zeit T abhängt. Die kongurations-erreichbare Menge wird im Wesentlichen als die Menge der Punkte deniert, die vom System entlang seiner Trajektorien vom Anfangspunkt mit einer maximalen Zeit T erreicht werden können. Präziser gilt: Sei q0 ∈ Q. Deniere: RΣ,Q (q0 , T ) = {q ∈ Q | ∃ eine gesteuerte Trajektorie (u, c) von 0 0 so dass c (0) = 0q0 und c (T ) ∈ Tq Q}, (5.7), 53 Kapitel 5. und Optimale Kontrolle von Zusammenhangs-Kontrollsystemen S RΣ,Q (q0 , ≤ T ) = Menge. Hierbei ist 0q0 5.3 RΣ,Q (q0 , T ) bezeichne die kongurations-erreichbare 0≤t≤T der Nullvektor im Tangentialraum Tq0 Q. Es ist zu beachten, dass diese Denition für erreichbare Kongurationen nicht beinhaltet, dass ein Punkt in der erreichbaren Menge mit Endgeschwindigkeit null erreicht werden muss. Es wird nur verlangt, dass dieser Punkt mit irgendeiner Geschwindigkeit erreicht wird. Nun können die Denitionen der Kongurations-Erreichbarkeit und -Steuerbarkeit eingeführt werden: Denition 5.3.1 (Kongurations-erreichbar) tions-erreichbar in für t ∈]0, T ] q0 ∈ Q, falls ein T >0 Das System (5.7) ist kongura- existiert, so dass int (RΣ,Q (q0 , ≤ t)) 6= ∅ gilt. Gilt dies in jedem Punkt q0 ∈ Q, dann ist das System (5.7) kongurations-erreichbar. Dies bedeutet, dass es einen Punkt ximalen Zeit T q ∈ Q gibt, der ausgehend von q0 nach einer ma- erreicht werden kann und dass Punkte in der Nähe von in der Zeit maximal T q ebenfalls erreicht werden können. Eine wichtige Steuerbarkeitsbedingung ist die lokale Kongurations-Steuerbarkeit in kleiner Zeit. Denition 5.3.2 (Lokal kongurations-steuerbar in kleiner Zeit) Das Sys- q0 lokal kongurations-steuerbar in kleiner Zeit, falls ein T > 0 q0 ∈ int (RΣ,Q (q0 , ≤ t)) für t ∈]0, T ]. jedem Punkt q0 ∈ Q, dann ist das System (5.7) lokal kongurations- tem (5.7) ist in existiert, so dass Gilt dies in steuerbar in kleiner Zeit. Der Unterschied zur Erreichbarkeit liegt darin, dass ein Punkt q0 in jeder beliebigen q0 innerhalb des Zeitraumes T erreicht werden kann. Liegt RΣ,Q (q0 , ≤ T ), so kann das System nicht in die Richtungen Richtung ausgehend von q0 auf dem Rand von ausgehend von q0 , die nicht mehr in dieser Menge enthalten sind, gesteuert werden, wie es bei der Erreichbarkeit der Fall sein kann. In Abbildung 5.1 wird noch einmal der Unterschied zwischen Erreichbarkeit und lokaler Steuerbarkeit bezüglich der Kongurationen verdeutlicht. Die bisherigen Denitionen beinhalten nicht, dass das System von einem Gleichgewichtspunkt in den nächsten überführt werden kann. Es wird lediglich verlangt, mit beliebiger Endgeschwindigkeit einen bestimmten Punkt zu erreichen. Um speziell zu verlangen, dass die betrachteten Punkte Gleichgewichtspunkte des Systems sind, wird deniert: Denition 5.3.3 (Gleichgewichts-steuerbar) Das System (5.7) ist gleichgewichts- q1 , q2 ∈ Q eine gesteuerte Trajektorie (u, c) von (5.7) existiert, c : [0, T ] → Q mit c(0) = q1 , c(T ) = q2 und c0 (0) = 0q1 , c0 (T ) = 0q2 gelten. steuerbar, falls für wobei 54 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Abbildung 5.1.: 5.3 Eine Interpretation der Erreichbarkeit und Steuerbarkeit. In der linken Abbildung ist die erreichbare Menge von niedrigerer Dimension als der Kongurationsraum. Die mittlere und die rechte Abbildung zeigen den Unterschied zwischen Erreichbarkeit und Steuerbarkeit. (vgl. [5]) Zusammenfassung der Steuerbarkeitsergebnisse Lewis und Murray zeigen in [18], dass diese Art der Steuerbarkeit mit Hilfe des symmetrischen Produktes analysiert werden kann. Denition 5.3.4 (Symmetrisches Produkt) Das symmetrische Produkt zweier Vektorfelder auf Q ist als g g hX : Y i =∇X Y + ∇Y X g deniert, wobei g ∇X Y die kovariante Ableitung von Y bezüglich X ist. ∇ ist der Levi-Civita Zusammenhang. Bezeichne X (Q) die Menge aller glatten Vektorfelder auf Q, und sei eine Menge X1 , ..., Xd ∈ X (Q) auf Q gegeben. Dann ist die Distribution auf Mannigfaltigkeit Q das Erzeugnis dieser Vektorfelder und wird mit glatter Vektorfelder der 4 = span{X1 , ..., Xd } X, Y auf Q 4 auch [X, Y ] ein Vektorfeld mit Werten in 4 ist. Sei nun V = {V1 , ..., Vd } ⊂ X (Q), so bezeichnet Sym(V) die Distribution auf Q, die durch Iterationen symmetrischer Produkte von der Distribution von V erhalten wird. Sym(V) wird somit durch folgende induktive Folge von Vektorfeldern bestimmt: bezeichnet. Eine Distribution ist involutiv, wenn für zwei Vektorfelder mit Werten in (1) Sym (V) = (i) Sym (V) = span{V1 , ..., Vd } span{hX (j) (k) : Y i | X ∈ Sym (V), Y ∈ Sym (V), i = j + k} mit j, k > 0, i = 2, 3, ... 55 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Die kleinste Distribution, die diese Distributionen enthält, wird mit 5.3 Sym(V) be- zeichnet. Wird dagegen auf Sym(V) als Anfangsdistribution die obige Iteration mit Lie Klam- mer Bildung angewandt, so wird die kleinste Distribution, die alle anderen enthält, wiederum mit Lie(Sym(V)) Beispiel 5.3.1 Sei bezeichnet. X = {X1 , X2 } (1) Sym (X ) = (2) Sym (X ) = mit mit X2 = x2 ∂x∂ 2 . Dann gilt: = span{x1 ∂x∂ 1 , x2 ∂x∂ 2 } span{hX1 : X2 i, hX1 : X1 i, hX2 : X2 i}, hX1 : X2 i = 0 , hX1 : X1 i = 2x1 ∂x∂ 1 (2) i=3 und span{X1 , X2 } Sym (X ) = Für X1 = x1 ∂x∂ 1 und hX2 : X2 i = 2x2 ∂x∂ 2 . span{x Es ist somit 1 ∂ , x2 ∂x∂ 2 }. ∂x1 folgt (3) Sym (X ) = span{hhX1 : X2 i : X1 i, hhX1 : X2 i : X2 i, hhX1 : X1 i : X1 i, hhX1 : X1 i : X2 i, hhX2 : X2 i : X1 i, hhX2 : X2 i : X2 i} mit hhX1 : X2 i : X1 i = 0, hhX1 : X2 i : X2 i = 0, hhX1 : X1 i : X2 i = 0, hhX2 : X2 i : X1 i = 0, ∂ , ∂x1 ∂ hhX2 : X2 i : X2 i} = 4x2 2 . ∂x hhX1 : X1 i : X1 i = 4x1 Es gilt somit: (3) Sym (X ) = span{x 1 ∂ , x2 ∂x∂ 2 }. ∂x1 Induktiv kann gezeigt werden, dass die Distribution für i ≥ 1 identisch sind, so dass für die kleinste Distribution, die all diese Distributionen enthält, Sym(X ) = span gilt. Um Lie(Sym(X )) ∂ ∂ x , x2 2 1 ∂x ∂x 1 zu bestimmen, müssen noch die Lie Klammern der symme- trischen Produkte berechnet und daraus die kleinste Distribution bestimmt werden. Für i=2 gilt bereits: [X1 , X2 ] = 0, Für i ≥ 2 [X1 , X1 ] = x1 ∂ , ∂x1 [X2 , X2 ] = x2 ∂ . ∂x2 kommen bei Bildung der Lie Klammern zwischen allen symmetrischen Produkten keine neuen Terme dazu, so dass 1 ∂ 2 ∂ Lie(Sym(X )) = span x ,x ∂x1 ∂x2 folgt. 56 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.3 In Abschnitt 2.4 wurde erwähnt, dass durch Bildung von Lie Klammern neue Richtungen erzeugt werden können. Dementsprechend stellt reichbaren Geschwindigkeitsrichtungen und Sym(V)q Lie(Sym(V))q die von 0q die von 0q er- erreichbaren Kongurationsrichtungen dar. Da hier die Kongurations-Erreichbarkeit und -Steuerbarkeit untersucht wird, ist die Betrachtung von Lie(Sym(V))q ausreichend. Können alle Richtungen des gesamten Kongurationsraumes durch Bildung von Lie Klammern erzeugt werden, so ist das System (5.7) kongurations-steuerbar. Mit den eben eingeführten Bezeichnungen ergeben sich folgende Bedingungen an Erreichbarkeit und Steuerbarkeit (siehe [18]): Satz 5.3.1 q, Das Kontrollsystem (5.7) ist lokal kongurations-erreichbar in falls Lie(Sym(Y))q = Tq Q. Sei P ein symmetrisches Produkt der Vektorfelder Y, γi (P ) die γ1 (P ) + ... + γm (P ). P ist dann bezeichnet Yi in P . Der Grad von P ist deniert als γi (P ) für jedes i = 1, ..., m gerade ist. P ist gut, falls P nicht schlecht ist. Beispielsweise ist das symmetrische Produkt hhY1 : Y2 i : hY1 : Y3 ii gut, während das symmetrische Produkt hhY1 : Y2 i : hY1 : Y2 ii schlecht ist. Beide Produkte sind Anzahl der schlecht, falls vom Grad vier. m Symbolen. Für π ∈ Sm und das symmetrisches Produkt P der Vektorfelder Y ist π(P ) als das Produkt deniert, das durch Transformation von Yi zu Yπ(i) für i = 1, ..., m erhalten wird. Es sei X π(P ). ρ(P ) = Sei Sm die Permutationsgruppe auf π∈Sm Die hinreichende Bedingung für lokale Kongurations-Steuerbarkeit in kleiner Zeit lautet dann: Satz 5.3.2 Y sei so gestaltet, dass jedes schlechte symmetrische Produkt die Eigenschaft ρ(P )(q) = m X P in Y ξ i Ci (q) i=1 besitzt. Dabei sind die Ci gute symmetrische Produkte von niedrigerem Grad als P i und ξ ∈ R für i = 1, ..., m. Gilt zusätzlich Lie(Sym(Y))q = Tq Q, so ist (5.7) lokal kongurations-steuerbar in kleiner Zeit in Bemerkung 5.3.1 q. Gelten die Aussagen des obigen Satzes in allen Punkten q ∈ Q, so ist das System (5.7) gleichgewichts-steuerbar (siehe [18]). Die Sätze 5.3.1 und 5.3.2 liefern somit die Bedingungen, die bei der Untersuchung der Steuerbarkeit eines mechanisches Systems überprüft werden müssen. 57 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.4 Die Inhalte der nachfolgenden Abschnitte dieses Kapitels beruhen auf den Ideen von Fax in [9]. Dabei wird eine Strategie zur optimalen Kontrolle des ZusammenhangsKontrollsystems vorgestellt. 5.4. Kostenfunktion Das allgemeine Ziel ist die optimale Kontrolle des mechanischen Systems bezüglich bestimmter Kontrollvariablen, um von einer festen Anfangskonguration zu einer anderen Konguration zu gelangen. Ist das System steuerbar, so gibt es verschiedene Trajektorien, entlang welcher das System von einer Konguration in eine andere überführt werden kann. Daher muss ein Kostenintegral als Maÿ der Kosten deniert werden, um das Optimierungsproblem zu vervollständigen. Dies wird, wie in Abschnitt 5.1 beschrieben, bezüglich gewisser Nebenbedingungen minimiert, so dass eine optimale Trajektorie gefunden werden kann, entlang welcher das System von einem gegebenen Anfangszustand (qf , vf ) ∈ T Q (q0 , v0 ) ∈ T Q in einen festen Endzustand überführt wird. Die Nebenbedingungen bestehen in diesem Fall aus der Mechanik des vorliegenden Systems. Sie sind durch das Zusammenhangs-Kontrollsystem (5.5) gegeben. Um die Gestalt des Kostenintegrals zu beschreiben, wird zunächst folgende Denition eingeführt: Denition 5.4.1 (Rm -abhängiges (0, r) Tensorfeld) Tensorfeld auf Q 1. A 2. q 7→ A(u, q) ist eine Abbildung m A:R ×Q→ m Ein R -abhängiges 0 Tr (T Q), so dass (0, r) stetig und ein glattes (0, r) Tensorfeld für jedes u ∈ Rm ist. Die Denition eines Kostenintegrals geschieht folgendermaÿen (siehe [9] und [16]): Seien i ∈ {1, ..., s}, ri eine nicht negative ganze Zahl und Ai ein symmetrisches Rm -abhängiges (0, ri ) Tensorfeld auf Q. Dann gilt für das Kostenintegral: Z tf J(u, c, V ) = t0 wobei V ein Operand von Ai ist. Ist s X i=1 Ai (u, q) (V, ..., V ) dt, | {z } ri -mal ri = 0, ri = 2, q und u. Ist Ai einen und dem Kontrollaufwand u ist. so repräsentiert das Tensorfeld Kostenterm, der allein abhängig von der Position q (5.8) so sind die Kosten quadratisch in der Geschwindigkeit und abhängig von 58 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.6 Im Rahmen dieser Arbeit werden ausschlieÿlich energieeziente Probleme betrachtet. Die angreifenden Kontrollkräfte sollen somit minimiert werden. Deshalb wird das Kostenintegral noch weiter speziziert. versehen. Mit s X Ai (u, q) = i=1 s X Q sei mit der Riemannschen Metrik g g(Yi (q)ui , Yi (q)ui ) i=1 m (siehe [6] und [16]) wird nach der Darstellung in (5.8) ein R -abhängiges (0, 0) Ps Tensorfeld - ein Skalarfeld - verwendet. i=1 Ai (u, q) entspricht somit einer diem renzierbaren Abbildung f0 : R × Q → R, die die Kostenfunktion f0 darstellt. Im weiteren Verlauf der Arbeit beschreibt die Kurve c(t) = q ∈ Q und V c die Kongurationen mit die Geschwindigkeit der Kongurationen mit V (t) = v ∈ Tq Q. 5.5. Problemstellung Problem 5.5.1 Endbedingung Es seien eine Anfangsbedingung (c(tf ), V (tf )) = (qf , vf ) (c(t0 ), V (t0 )) = (q0 , v0 ) und eine gegeben. Gesucht sind die Trajektorien, die das Kostenintegral Z tf J(u, c) = f0 (u, c(t)) dt t0 minimieren und die durch Gleichung (5.5) gegebene Nebenbedingung erfüllen. Eine gesteuerte Trajektorie γ ∗ = (u∗ , c∗ ) ist Lösung des Problems 5.5.1, wenn J(γ ∗ ) ≤ J(γ) für jede gesteuerte Trajektorie γ gilt. Dabei sind u und 0 0 deniert, und es gilt c (t0 ) = v0 mit v0 ∈ Tq0 Q und c (tf ) Bemerkung 5.5.1 c auf dem Intervall [t0 , tf ] = vf mit vf ∈ Tqf Q. Es werden auch Probleme betrachtet, bei denen keine festen Endpunkte vorgegeben werden. Für solche Probleme werden in den Abschnitten 5.6 und 5.7 zusätzliche Randbedingungen erzeugt. 5.6. Problemlösung: Lagrange-Multiplikatoren und Variationsrechnung In diesem Abschnitt wird die Lösungsstrategie aus [9] vorgestellt. Zur Lösung des Problems 5.5.1 werden die Techniken der Lagrange-Multiplikatoren und der Variationsrechnung verwendet, wie sie in Abschnitt 3.3 und 5.1 beschrieben 59 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.6 werden. Zusammenfassend lässt sich die Methode folgendermaÿen beschreiben: Bei der Technik der Lagrange-Multiplikatoren wird das Kostenintegral f (u, c) = 0 bedingungen λ Nebenbedingungen gelöst wird. Dabei ist c Adjungierte von J(u, c) unter den Neben- optimiert, indem das Minimierungsproblem J + λf ohne eine zusätzliche Variable, bekannt als mit der Anzahl der Gleichheitsnebenbedingungen als Dimension. Bei der Durchführung der Optimierung ergeben sich die Euler-Lagrange Gleichun- gen, die notwendige Bedingungen für optimale Trajektorien in c und λ liefern. Die Standard Euler-Lagrange Gleichungen werden für ein System abgeleitet, dessen ẋ = f (u, x) Q sind. Allerdings ist die Dynamik vieler mechanischer Sys- Nebenbedingungen Dierentialgleichungen erster Ordnung von der Form auf der Mannigfaltigkeit teme naturgemäÿ zweiter Ordnung. Ein Zusammenhangs-Kontrollsystem kann als Dierentialgleichung erster Ordnung auf Q dargestellt werden, indem Geschwindig- keiten als unabhängige Zustände eingeführt und die Variation von Lage und Geschwindigkeit unabhängig voneinander betrachtet werden. Dieser Ansatz hat jedoch mehrere Nachteile: Zum einem wird die Anzahl der Nebenbedingungen und dadurch auch die Anzahl der Adjungierten verdoppelt. Zum anderen geht bei Wiedergabe des Systems in erster Ordnung die geometrische Struktur verloren. Das Ziel hier ist, die Euler-Lagrange Gleichungen abzuleiten, die das optimale Kontrollproblem bestimmen und dabei die geometrische Struktur zu bewahren. Anstatt somit die Nebenbedingungen künstlich zu verdoppeln, um die Standardstruktur zu erhalten, wird nur die gegebene Nebenbedingung betrachtet. Die zu minimierende erweiterte Kostenfunktion nimmt die Form * tf Z f0 (u, c(t)) + t0 m X DV λ, − + Yi (c(t))ui dt i=1 an. Dabei ist die Nebenbedingung auf TQ deniert, und λ + dt stellt ein 1-Form Feld dar. Bei Anwendung der Variationsrechnung auf dieses Kostenintegral werden die u Variationen von und c betrachtet. Es wird beobachtet, wie die Variationen von c das Geschwindigkeitsvektorfeld beeinussen. Dabei wird die kovariante Ableitung, welche in Kapitel 2.6 eingeführt wurde, verwendet. c führt nach Abschitt 3.2 auf die Gleichung * + ! m X DV f0 (u, c(t)) + λ, − + Yi (c(t))ui dt = 0 (5.9) dt i=1 Betrachtung von Variationen der Kurve Z tf δ t0 oder Z tf t0 d d * f0 (u, c(t)) + λ, − DV + dt Im Folgenden wird die Variation bezüglich m X i=1 +! Yi (c(t))ui dt = 0. =0 c jedes Termes in diesem Ausdruck einzeln betrachtet. Dabei werden die Regeln des in Abschnitt 3.4 vorgestellten Varitionsprinzips verwendet. 60 Kapitel 5. 1. d d Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 5.6 f0 (u, c) Es gilt d d f0 (u, c) = s X DAi i=1 d = s X ∇ d c Ai = s X d i=1 ∇δc Ai = i=1 s X ∇Ai (δc). i=1 Nach Anwendung von (2.7) ergibt sich daraus: d d 2. f0 (u, c) = s D X E di , δc = ∇A i=1 * s X + di , δc . ∇A (5.10) i=1 DV λ, d dt d Es gilt d d DV λ, dt D DV = λ, . d dt Nach Proposition 3.4.3 folgt d d DV λ, dt D DV = λ, + R(δc, V )V . dt d Mit Aufteilung des Skalarproduktes, partieller Integration des ersten Termes und mit Gleichung (2.6) und Proposition 3.4.2 ergibt sich DV Dλ Dδc d DV ∗ λ, =− , + T (δc, V ) + hδc, R (λ, V )V i + λ, . d dt dt dt dt d d Wird wieder partiell integriert, so folgt wiederum mit Gleichung (2.6) d d DV λ, dt D2 λ Dλ ∗ ∗ = −T , V + R (λ, V )V, δc + dt2 dt d DV Dλ λ, − , δc . dt d dt (5.11) Der letzte Term kann direkt integriert werden und wird deshalb später bei der Bestimmung der Endpunktbedingungen in Abschnitt 5.7 betrachtet. Der bleibende Term im Integranden ist 2 DV D λ Dλ ∗ ∗ λ, = −T , V + R (λ, V )V, δc . d dt dt2 dt d (5.12) 61 Kapitel 5. 3. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen * d λ, d m X 5.6 + Yi (c(t))ui i=1 Dieser Term wird zu d d * λ, m X + Yi (c)ui * = λ, i=1 m X + ∇Yi (δc)ui i=1 (5.13) * = δc, m X + ∇Yi∗ (λ)ui . i=1 Nun ist die Variation jedes Termes in die Form h·, δci gebracht. Alle Ausdrücke in den Gleichungen (5.10), (5.12) und (5.13) werden zu folgendem Term zusammengefasst: * s X i=1 2 di − D λ + T ∗ ∇A dt2 Dλ ,V dt ∗ − R (λ, V )V + m X + ∇Yi∗ (λ)ui , δc . i=1 Wird dieser Integrand auf null gesetzt, um Gleichung (5.9) zu erfüllen, so ergeben sich die Bewegungsgleichungen für λ. Die Gleichungen werden explizit in Satz 5.6.1 aufgeführt. Variation von u: stationäre Bedingung Da die Kostenfunktion abhängig von den Kontrollvariablen Variation bezüglich ui ∂f0 δui + hλ, Yi δui i = 0, ∂ui Da δui u ist, muss noch die betrachtet werden. Dies ergibt die folgenden Gleichungen: i = 1, ..., m. ein Skalar ist, kann er vor das Skalarprodukt gezogen werden und durch Zusammenfassen ergibt sich: ∂f0 + hλ, Yi i = 0, ∂ui Dies sind m Bedingungen, die u i = 1, ..., m. als eine Funktion von q (5.14) und λ denieren. Hierbei wird angenommen, dass die Kostenfunktion glatt und konvex bezüglich u ist und Systemzustände und Kontrollvariablen nicht beschränkt sind. Dann repräsentieren die Gleichungen (5.5), (5.9) und (5.14) zusammen die notwendigen Bedingungen, die optimale Trajektorien erfüllen müssen. Diese Ergebnisse sind im folgenden Satz zusammengefasst: 62 Kapitel 5. Satz 5.6.1 J(u, c) Optimale Kontrolle von Zusammenhangs-Kontrollsystemen Eine notwendige Bedingung für eine Trajektorie zu optimieren, ist die Existenz von λ(t) und u(t), γ(t), 5.7 um die Funktion die folgende Gleichungen erfüllen: D2 λ − T∗ dt2 Dλ ,V dt ∗ + R (λ, V )V = s X di + ∇A i=1 m X (∇Yi∗ (λ)ui ) (5.15) i=1 und ∂f0 + hλ, Yi i = 0, ∂ui i = 1, ..., m. Es ergibt sich somit eine Gleichung zweiter Ordnung auf (5.16) T ∗ Q. Wird der Levi-Civita Zusammenhang verwendet, so sind die Torsionsterme gleich null, und der Ausdruck (5.15) vereinfacht sich zu s m X X D2 λ ∗ di + ∇A (∇Yi∗ (λ)ui ). + R (λ, V )V = dt2 i=1 i=1 5.7. Endpunktbedingungen Zur Lösung der Dierentialgleichungen, die das optimale Kontrollsystem bestimmen, werden in diesem Abschnitt die Endpunktbedingungen festgelegt. Das optimale Kontrolldierentialgleichungssystem besteht aus zwei Dierentialgleichungen ∗ zweiter Ordnung ((5.5) und (5.15)), wobei eine auf Q und die andere auf T Q deniert ist. Zur Lösung werden somit vier Endpunktbedingungen benötigt, um die Kontrollfunktion zu berechnen, die die optimale Trajektorie bestimmt. Folgende zwei optimale Kontrollprobleme werden betrachtet: 1. (Feste Endpunkte) q0 , V (t0 ) = v0 In diesem Fall sind die Anfangsbedingungen und die Endbedingungen c(tf ) = qf , V (tf ) = vf c(t0 ) = festgelegt. Diese Bedingungen bestimmen bereits komplett die optimale Kontrollfunktion und die zugehörige Trajektorie. Die innitesimalen Variationen am Endpunkt und somit die Endpunktterme, die durch partielle Integration entstanden sind, verschwinden. 63 Kapitel 5. Optimale Kontrolle von Zusammenhangs-Kontrollsystemen 2. (Freie Endpunkte) In diesem Fall sind die Endbedingungen 5.7 c(tf ), V (tf ) nicht festgelegt. Dies bedeutet, dass die innitesimale Variation der Trajektorie zum Zeitpunkt tf nicht null ist. Es werden somit die Bedingungen durch die Endpunktterme, die durch partielle Integration in Abschnitt 5.6 erhalten wurden, abgeleitet. Die partielle Integration in Gleichung (5.11) liefert Z tf t0 d dt DV λ, d − Dλ , δc dt dt. Dieser Term kann direkt integriert werden, so dass für die innitesimale Variation der Kosten gilt. Zum Zeitpunkt punkt tf tf DV Dλ δJ = λ, − , δc d dt t0 t0 ist die innitesimale Variation null, aber zum Endzeit- ergibt sich DV (tf ) Dλ(tf ) δJf = λ(tf ), − , δc(tf ) . d dt Um ein Minimum von J zu erhalten, muss diese Variation null sein. Da der DV Term d zu einem gegebenen Zeitpunkt unabhängig von δc ist, ergeben sich die zwei Endpunktbedingungen λ(tf ) = 0 Dλ (tf ) = 0. dt Dλ dt bestimmen zusammen mit c(t0 ) = v0 die Randbedingungen für die Lösung des optimalen Kontroll- Die Bedingungen (5.17) für q0 , V (t0 ) = (5.17) λ und problems. 64 6. Optimale Kontrolle eines starren Körpers Um zunächst die Theorie zur optimalen Kontrolle von Zusammenhangs-Kontrollsystemen zu verstehen, wird in diesem Kapitel nur ein starrer Körper betrachtet, der optimal kontrolliert werden soll. Der Körper soll von einer gegebenen Anfangskonguration in eine gegebene Endkonguration gebracht werden. In Kapitel 7 wird dann ein Verbund starrer Körper mit der in Kapitel 5 erläuterten Theorie analysiert. Als erstes werden in Abschnitt 6.1 das mathematische Modell und seine Bewegungsgleichungen vorgestellt. In Abschnitt 6.2 wird die Steuerbarkeit des darauf beruhenden Systems gezeigt, so dass in Abschnitt 6.3 die Lösungsstrategie zur optimalen Kontrolle aus Kapitel 5 angewandt werden kann. Abschlieÿend werden in Abschnitt 6.4 die Simulationsergebnisse vorgestellt. Das Modell eines einzelnen starren Körpers wird in der Literatur oft als Beispiel eines mechanischen Systems betrachtet, wie z.B. in [3], [5] und [17]. In [6] und [19] wird speziell dieses System bezüglich Steuerbarkeit und optimaler Kontrolle und in [23] seine Linearisierung behandelt. 6.1. Bewegungsgleichungen eines freien starren Körpers in der Ebene Es wird das System betrachtet, das aus einem einzelnen starren Körper mit der Masse m besteht, der sich in der Ebene bewegt, die senkrecht zur Wirkrichtung der Gravitationskraft steht (vgl. Abbildung 6.1). Der starre Körper in der Ebene hat drei Freiheitsgrade: Translation in Richtung der x-Achse, Translation in Richtung der y -Achse und Rotation um den Massen- mittelpunkt. Die Konguration ist durch die folgenden Variablen bestimmt: Der (x, y) bezeichnet die Position des Massenzentrums bezüglich des Inertialsystems Σspatial = {Ospatial , e1 , e2 }, und θ beschreibt die relative Orientierung des Referenzsystems Σbody = {Obody , f1 , f2 } des Körpers zu dem Inertialsystem Σspatial . 2 1 Die Kongurationsmannigfaltigkeit des Systems ist somit Q = R × S mit den KoVektor 65 Kapitel 6. Optimale Kontrolle eines starren Körpers Abbildung 6.1.: Der Tangentialraum von ordinaten S2 6.1 im Punkt p (vgl. [2]) q = (x, y, θ) ∈ Q. Die Kongurationen des gesamten Systems sind durch eine Kurve c(t), c : I → Q, t 7→ V (t) be- seine Geschwindigkeiten im Kongurationsraum durch das Vektorfeld schrieben. Für ein festes t ∈ I gibt c(t) = q ∈ Q V (t) = v ∈ Tq Q die zugehörige Geschwindigkeit c(t) = (x(t), y(t), θ(t)) und V (t) = (ẋ(t), ẏ(t), θ̇(t)). eine feste Konguration und an. In Koordinaten gilt dann Es ist nun möglich, die totale Energie des Systems als Summe von kinetischer und potentieller Energie darzustellen. Die kinetische Energie 1 KE = g(v, v) 2 ist durch die Riemannsche Metrik g = m dx ⊗ dx + m dy ⊗ dy + J dθ ⊗ dθ gegeben. Es folgt somit 1 1 KE = m(ẋ2 + ẏ 2 ) + J θ̇2 , 2 2 wobei m die Masse des Körpers und 1 J das Trägheitsmoment über dem Massen- schwerpunkt ist . Da der Körper sich in einer Ebene, dessen Normale die Richtung der Gravitationskraft ist, bewegt, ist die potentielle Energie null. Die antreibende Kraft von variabler Richtung und Gröÿe wirkt auf den Körper in einem Punkt, der eine Distanz in eine Komponente F1 , h zum Massenschwerpunkt besitzt. Diese Kraft F kann die immer tangential zur Bewegungsrichtung des Körpers wirkt (f1 -Achse), und eine Komponente F2 , die senkrecht zur Bewegungsrichtung 1 Hier wurde sich bei den Bezeichnungen an die Literatur gehalten. Das Trägheitsmoment über dem Massenschwerpunkt J ist nicht mit dem Kostenintegral J zu verwechseln. 66 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.2 wirkt (f2 -Achse), aufgeteilt werden. Es wird angenommen, dass der Angrispunkt f1 -Achse, die durch den Massenschwerpunkt verläuft, liegt. Das System hat somit n = 3 Freiheitsgrade (x, y, θ) und m = 2 Kontrollkräfte. bei handelt es sich um ein unterangetriebenes System, da n > m gilt. der Kraft auf der Die angreifenden Kräfte sind durch die F1 = cos θ dx + sin θ dy, 1-Form Da- Felder F2 = − sin θ dx + cos θ dy − h dθ bestimmt, von denen die Eingangsvektorfelder Y1 = cos θ ∂ sin θ ∂ + , m ∂x m ∂y Y2 = − sin θ ∂ cos θ ∂ h ∂ + − m ∂x m ∂y J ∂θ berechnet werden. Nach Kapitel 5 beschreibt folgendes Zusammenhangs-Kontrollsystem die Bewegung des starren Körpers in der Ebene: 2 X DV = Yi u i . dt i=1 Da die Koezienten der Riemannschen Metrik g (6.1) in den gewählten Koordinaten alle konstant sind, sind die Christoel-Symbole null, und somit stimmt die kovariante DV Ableitung von V mit der gewöhnlichen überein, d.h. dt = (ẍ, ÿ, θ̈). Mit diesen Informationen sind die Bewegungsgleichungen des Systems durch u1 cos θ u2 sin θ − m m u1 sin θ u2 cos θ ÿ = + m m u2 h θ̈ = − . J ẍ = (6.2) gegeben. Werden die Bewegungsgleichungen von Anfang an in Koordinatendarstellung hergeleitet, wobei die Lagrange-Funktion als Riemannsche Metrik bzw. kinetische Energie deniert wird, so ergeben sich als Euler-Lagrange Gleichungen genau die Bewegungsgleichungen (6.2). 6.2. Steuerbarkeit Wie schon in Abschnitt 5.3 erläutert wurde, muss zunächst die Steuerbarkeit des Systems (6.1) gewährleistet sein, um es optimal kontrollieren zu können. Es werden nun die Steuerbarkeitskriterien, die in Abschnitt 5.3 für nichtlineare Zusammenhangs-Kontrollsysteme vorgestellt wurden, auf das Beispiel des starren 67 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.2 Körpers in der Ebene angewandt. Laut Abschnitt 5.3 müssen die Eingangsvektorfelder zur Überprüfung der Steuerbarkeit herangezogen werden: Y1 = cos θ ∂ sin θ ∂ + , m ∂x m ∂y Y2 = − sin θ ∂ cos θ ∂ h ∂ + − . m ∂x m ∂y J ∂θ Um Kongurations-Erreichbarkeit und lokale Kongurations-Steuerbarkeit in kleiner Zeit bzw. Gleichgewichts-Steuerbarkeit für das System nachzuweisen, muss nun die Gültigkeit von Satz 5.3.1 und Satz 5.3.2 überprüft werden. Dazu sind die folgenden Berechnungen ausreichend: hY1 : Y1 i = 0, hY1 : Y2 i = h cos θ ∂ h sin θ ∂ − , mJ ∂x mJ ∂y 2h cos θ ∂ 2h sin θ ∂ + , mJ ∂x mJ ∂y h cos θ ∂ h sin θ ∂ [Y1 , Y2 ] = − + , mJ ∂x mJ ∂y 2h2 cos θ ∂ 2h2 sin θ ∂ [Y2 , hY2 : Y2 i] = − . mJ 2 ∂x mJ 2 ∂y hY2 : Y2 i = Damit kann die Kongurations-Steuerbarkeit für den ebenen starren Körper mit verschiedenen Kombinationen der Eingänge bestimmt werden. allein: 1. Kontrollkraft Y1 hY1 : Y1 i = 0 gilt, ist es nicht Lie(Sym(Y)) zu erzeugen. Nach Satz Da in diesem Fall möglich, eine andere Richtung als Y1 in 5.3.1 ist das System (6.1) also nicht kongurations-erreichbar. Dies führt natürlich dazu, dass das System (6.1) niemals lokal kongurationssteuerbar in kleiner Zeit sein kann. Interpretation: Aus Abbildung 6.1 ist einzusehen, dass sich bei alleiniger Wirkung der Eingangskraft F1 der Körper nur entlang der Wirkungslinie dieser Kraft in Form einer Translation bewegt. Es wird also eine geradlinige Bewegung erzeugt. Das Innere der kongurations-erreichbaren Menge ist immer leer. 2. Kontrollkraft Y2 Q allein: durch die Menge In diesem Fall wird die maximale Distribution auf {Y2 , hY2 : Y2 i, [Y2 , hY2 : Y2 i]} erzeugt. Ebenso wird TQ durch diese Menge erzeugt, denn die Vektorfelder in der Menge sind linear unabhängig: Für das Erzeugnis gilt in Matrixschreibweise det θ − sin m 2h cos θ mJ 2h2 sin θ mJ 2 cos θ m 2h sin θ mJ 2 − 2hmJcos2 θ − Jh 4h4 0 = 2 4 6= 0. mJ 0 68 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.3 Das System (6.1) ist somit nach Satz 5.3.1 kongurations-erreichbar. Aber das schlechte symmetrische Produkt hY2 : Y2 i ist kein Vielfaches von Y2 . (6.1) er- füllt somit nicht die hinreichende Bedingung für lokale Kongurations-Steuerbarkeit in kleiner Zeit. Interpretation: Aus Abbildung 6.1 ist einzusehen, dass sich bei alleiniger Wirkung der Eingangskraft F2 der Körper entlang der Wirkunglinie dieser Kraft in Form einer Translation bewegt und dabei eine Rotation im Uhrzeigersinn um den Massenschwerpunkt ausführt. Startet der Körper z.B. im Ursprung, so x-y -Ebene ausgehend vom Ursprung eine nichtleere kongurationserreichbare Menge erhalten, die sich in der Ebene {(x, y) ∈ R | x > 0} ausbreiwird in der tet. Allerdings bendet sich der Startpunkt auf dem Rand dieser Menge. Der Körper erreicht keine Kongurationen in der Ebene {(x, y) ∈ R | x < 0}. 3. Kontrollkräfte Y1 und Y2 : In diesem Fall wird die maximale Distribution auf Q durch die beiden Eingänge Y1 , Y2 und ihrer Lie Klammer [Y1 , Y2 ] gebildet. T Q durch diese Vektorfelder erzeugt, denn analog zu 2. gilt für Ebenso wird dieses Erzeugnis det cos θ m θ − sin m sin θ − hmJ sin θ m cos θ m h cos θ mJ 0 2 h h −J = 6= 0. mJ 0 Das System (6.1) ist lokal kongurations-erreichbar nach Satz 5.3.1. Da das schlechte symmetrische Produkt hY2 : Y2 i ein Vielfaches von Y1 ist, ist das Sys- tem nach Satz 5.3.2 lokal kongurations-steuerbar in kleiner Zeit und somit nach Bemerkung 5.3.1 gleichgewichts-steuerbar. Interpretation: Der Körper erreicht jede beliebige Konguration in 1 S Q = R2 × . Die wichtige Voraussetzung für die optimale Kontrolle, die Steuerbarkeit des Systems, ist somit für die Kontrollvektorfelder Y1 und Y2 erfüllt. 6.3. Kostenfunktion und Lösung In diesem Kapitel wird die Theorie aus den Abschnitten 5.4 bis 5.6 auf das Beispiel des starren Körpers in der Ebene angewandt. Die Lösung soll energieezient sein, d.h. die Kontrollkräfte sollen minimiert werden. 69 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.4 Nach Abschnitt 5.4 ergibt sich dann die folgende Kostenfunktion 1 (u1 )2 (J + mh2 )(u2 )2 1 f0 (u, q) = hhY1 u1 , Y1 u1 ii + hhY2 u2 , Y2 u2 ii = + . 2 2 2m 2Jm g sind alle Koezienten von g konstant. Die DV k Christoel-Symbole sind demnach gleich null (Γij = 0), und es folgt dt = (ẍ, ÿ, θ̈). Der Torsionstensor ist null, da der Levi-Civita Zusammenhang verwendet wird, und Nach Wahl der Riemannschen Metrik auch der Krümmungstensor ist null, weil die Christoel-Symbole null sind. Unter Verwendung von Gleichung (5.15) ergibt sich für die adjungierten Variablen 2 D2 λ X = ∇Yi∗ (λ)ui . 2 dt i=1 In Koordinaten mit λ = (λx , λy , λθ ) (6.3) wird die Dynamik durch das Dierentialglei- chungssystem λ̈x = 0 λ̈y = 0 1 [(−λx sin θ + λy cos θ)u1 + (−λx cos θ − λy sin θ)u2 ] λ̈θ = m (6.4) beschrieben. Die optimalen Kontrollfunktionen sind durch Gleichung (5.14) gegeben: ∂f0 + hλ, Yi i = 0, ∂ui Für i=1 ergibt sich ∂f0 u1 = , ∂u1 m und für i = 1, 2. i=2 hλ, Y1 i = λx cos θ sin θ + λy , m m folgt ∂f0 J + mh2 = u2 , ∂u2 Jm hλ, Y2 i = −λx sin θ cos θ h + λy − λθ . m m J Insgesamt ergeben sich somit folgende Bestimmungsgleichungen für u1 = −(λx cos θ + λy sin θ), Jm λx λy h u2 = sin θ − cos θ + λθ . J + mh2 m m J u: (6.5) 70 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.4 6.4. Simulation Zur geeigneten Simulation des Systems in MATLAB werden die Gleichungen aus (6.2), (6.4) und (6.5) verwendet. Das gesamte Kontrollsystem wird durch die Bewegungsgleichungen ẍ ÿ θ̈ λ̈x u1 cos θ u2 sin θ − m m u1 sin θ u2 cos θ = + m m u2 h = − J = 0 = (6.6) λ̈y = 0 λ̈θ = 1 [(−λx sin θ + λy cos θ)u1 + (−λx cos θ − λy sin θ)u2 ] m vollständig beschrieben. (6.6) beinhaltet ein System von sechs gewöhnlichen Differentialgleichungen zweiter Ordnung. Die Anfangsdaten des starren Körpers sind durch c(t0 ) = (x(t0 ), y(t0 ), θ(t0 )) = q0 und V (t0 ) = (ẋ(t0 ), ẏ(t0 ), θ̇(t0 )) = v0 fest vorgegeben. Zum Abschluss dieses Kapitels wird das System für verschiedene Endpunktbedingungen simuliert. Die Ergebnisse sind in Abbildung 6.2 zu sehen. Die Problemstellung wird durch ein Randwertproblem zwölfter Ordnung beschrieben (sechs Anfangs- und sechs Endwerte), das durch das Dierentialgleichungssystem (6.6) und den von Fall zu Fall verschiedenen Randbedingungen bestimmt ist. Für die folgenden Simulationen gelten für die Parameter jeweils und h = 0.1. Die Anfangskonguration wird durch geschwindigkeit durch v0 = (0, 0, 0) bestimmt. q0 q0 = (0, 0, 0) m = 1, J = 1 und die Anfangs- ist in den Simulationsbildern in Abbildung 6.2 durch einen Kreis gekennzeichnet. Der Körper startet somit im Ursprung mit Ausrichtung null, und seine Geschwindigkeiten in x- und y -Richtung sowie seine Winkelgeschwindigkeit sind null. Die Endkongurationen des Systems sollen zum festen Zeitpunkt tf = 5 angenom- men werden. 1. Fall: Festlegung der x-Komponente der Endkonguration und Endgeschwin- digkeit. Endbedingungen: x(tf ) = 1, ẋ(tf ) = 0, λy (tf ) = 0, λ̇y (tf ) = 0, λθ (tf ) = 0, λ̇θ (tf ) = 0. 71 Kapitel 6. Optimale Kontrolle eines starren Körpers 6.4 2. Fall: Festlegung der x- und y -Komponente der Endkonguration und Endgeschwindigkeit. Endbedingungen: x(tf ) = 1, ẋ(tf ) = 0, y(tf ) = 1, ẏ(tf ) = 0, λθ (tf ) = 0, λ̇θ (tf ) = 0. 3. Fall: Festlegung der x-, y - und θ-Komponente der Endkonguration und Endgeschwindigkeit. Endbedingungen: π x(tf ) = 1, ẋ(tf ) = 0, y(tf ) = 1, ẏ(tf ) = 0, θ(tf ) = − , θ̇(tf ) = 0. 4 Interpretation der Simulationsergebnisse 1. Fall: Da nur eine Translation in x-Richtung ausgeführt wird, ist die Kontrolle u2 null. Es ist nur eine Kontrolle in 2. Fall: Für die Translation in x- x-Richtung erforderlich. y -Richtung ist eine Einwirkung beider der Kraft F2 wird ein Moment auf den und Kraftkomponenten nötig. Aufgrund Körper ausgeübt, so dass die Endausrichtung nicht mehr null ist. 3. Fall: An den Körper greift kein äuÿeres Moment zur direkten Erzeugung einer Rotation an. Ein vorgegebener Winkel muss somit durch die Momentenerzeugung der Kraft F2 erreicht werden. Da F2 allerdings auch eine Translation des Körpers zur Folge hat, ist es nicht möglich, den Körper zunächst in die richtige Endposition zu bringen und dann durch eine Krafteinwirkung die vorgeschriebene Endausrichtung zu erzeugen. Die Ausrichtung θ muss sich während der Translationsbewegungen einstellen. Folglich kann zwar jede Konguration des Systems erreicht, aber nicht entlang jeder beliebigen Trajektorie beschritten werden. Somit legt der Körper zur Erreichung seiner Endkonguration groÿe Bögen zurück (siehe Abbildung 6.2(e)). Bemerkung 6.4.1 Bei der Simulation sind im Rahmen einiger Testdurchläufe Pro- bleme aufgetaucht. Für manche Endkongurationen mit festen x-, y - und θ-Kompo- nenten wird keine Konvergenz der Kollokationsmethode erreicht bzw. eine schlechte Näherungslösung berechnet, die nicht der optimalen Lösung entspricht. Der Grund hierfür liegt in der Schwierigkeit, Randwertprobleme numerisch exakt zu lösen. Ihre Lösungen sind meist nicht eindeutig. Die Kondition eines Randwertproblems und die Eindeutigkeit seiner Lösung sind von der Beschaenheit der Randbedingungen abhängig. Aus diesem Grund muss zur Lösung des Randwertproblems eine erste Approximationslösung geschätzt werden. Schlechte Anfangsschätzungen führen auf groÿe Residuen, was bei schlecht konditionierten Problemen die Nicht-Konvergenz des Verfahrens zur Folge haben kann. Die Berechnung einer korrekten optimalen Lösung ist also stark von ihrer ersten Anfangsschätzung abhängig. 72 Kapitel 6. Optimale Kontrolle eines starren Körpers (a) 1. Fall: Trajektorie (b) 1. Fall: Kontrollen (c) 2. Fall: Trajektorie (d) 2. Fall: Kontrollen (e) 3. Fall: Trajektorie (f) 3. Fall: Kontrollen 6.4 Links sind die Trajektorien des Körpers in der x-y -Ebene und seine Endausrichtungen, rechts die Zeitverläufe der Kontrollfunktionen u1 (t) und u2 (t) abgebildet. 1. Fall: Kosten J = 0.048, 2. Fall: Kosten J = 0.0965, 3. Fall: Kosten J = 45.4783. Abbildung 6.2.: Simulation für einen Körper. 73 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper In diesem Kapitel wird ein Verbund starrer Körper in der Ebene betrachtet. Zunächst wird in Abschnitt 7.1 bis 7.5 der einfachste Fall eines Verbundes von zwei starren Körpern mit gleicher Masse m und gleichem Trägheitsmoment J behan- delt. Dabei sind die Startkongurationen gegeben. Ziel ist es, eine durch bestimmte Bedingungen gegebene Endkongurationen zu erreichen. Die sich daraus ergebenen Endbedingungen werden in Abschnitt 7.4 bestimmt. Simulationsergebnisse für den Verbund zweier Körper werden in Abschnitt 7.5 vorgestellt. Zum Abschluss des Kapitels werden die Ergebnisse eines Verbundes von drei Körpern in Abschnitt 7.6 präsentiert. 7.1. Bewegungsgleichungen Es wird angenommen, dass sich die beiden Körper in ihrer Dynamik nicht gegenseitig beeinussen. Demzufolge werden zwei unabhängige Systeme in der Form von Gleichung (5.5) betrachtet. Das aus zwei Körpern bestehende Gesamtsystem hat ins- x- und y -Achse und Rotation um den Massenschwerpunkt. Dabei bezeichne (x1 , y1 , θ1 ) analog zu Kapitel 6 die Konguration des ersten starren Körpers und (x2 , y2 , θ2 ) die Konguration des zweiten 4 1 1 starren Körpers. Der Kongurationsraum des Systems ist somit Q = R × S × S und wird durch die Kurve c(t) = (x1 (t), y1 (t), θ1 (t), x2 (t), y2 (t), θ2 (t)) = q ∈ Q beschrieben. Entsprechend beschreibt V (t) = (ẋ1 (t), ẏ1 (t), θ̇1 (t), ẋ2 (t), ẏ2 (t), θ̇2 (t)) = v ∈ Tq Q die Geschwindigkeit einer Konguration. gesamt sechs Freiheitsgrade: jeweils Translation in Auf jedem dieser Körper wirkt eine wie in Abschnitt 6.1 beschriebene Kontrollkraft Fi , i = 1, 2, Fij , i, j = 1, 2, die in die Kräfte tangential und orthogonal zur Be- wegungsrichtung aufgeteilt wird. Die Kontrollkräfte, die am ersten starren Körper angreifen, werden mit F11 und F12 bezeichnet. Entsprechend greifen F21 und F22 an den zweiten starren Körper an. Das Gesamtsystem hat sechs Freiheitsgrade und vier Kontrollkräfte und ist damit ein unterangetriebenes System. Es besitzt im Vergleich zu dem System eines einzel- 74 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.2 nen starren Körpers die doppelte Dimension. Auf der Kongurationsmannigfaltigkeit wird die Riemannsche Metrik g durch g = m dx1 ⊗ dx1 + m dy1 ⊗ dy1 + J dθ1 ⊗ dθ1 + m dx2 ⊗ dx2 + m dy2 ⊗ dy2 + J dθ2 ⊗ dθ2 deniert. Die kinetische Energie des Gesamtsystems setzt sich aus den kinetischen Energien der beiden Körper zusammen: 1 1 1 KEges = KE1 + KE2 = m(ẋ21 + ẏ12 + ẋ22 + ẏ22 ) + J(θ̇12 + θ̇22 ) = g(V, V ). 2 2 2 Analog zu Abschnitt 6.1 beschreibt das Zusammenhangs-Kontrollsystem 2 X DV = Yij uij dt i,j=1 (7.1) die Bewegung des Verbundes der beiden starren Körper in der Ebene mit den Eingangsvektorfeldern Y11 = cos θ1 ∂ sin θ1 ∂ + , m ∂x1 m ∂y1 Y12 = − sin θ1 ∂ cos θ1 ∂ h ∂ + − , m ∂x1 m ∂y1 J ∂θ1 Y21 = cos θ2 ∂ sin θ2 ∂ + , m ∂x2 m ∂y2 Y22 = − sin θ2 ∂ cos θ2 ∂ h ∂ + − . m ∂x2 m ∂y2 J ∂θ2 Da die Koezienten der Riemannschen Metrik g in den gewählten Koordinaten konstant sind, sind die Christoel-Symbole null. Demzufolge stimmt die kovariante DV Ableitung von V wieder mit der gewöhnlichen überein: = (ẍ1 , ÿ1 , θ̈1 , ẍ2 , ÿ2 , θ̈2 ). dt Mit diesen Informationen sind die Bewegungsgleichungen des Systems durch sechs Dierentialgleichungen zweiter Ordnung analog zu (6.2) gegeben. Die Dynamik der beiden einzelnen Körper ist somit völlig entkoppelt. Eine Kopplung der beiden Einzelsysteme kommt lediglich durch die Endbedingungen zustande. Diese werden in Abschnitt 7.4 behandelt. 7.2. Steuerbarkeit In diesem Abschnitt wird diskutiert, ob der Verbund jede beliebige Endkonguration annehmen kann. Dies entspricht der Überlegung, ob die beiden Körper eine beliebige Konguration zueinander in der Kongurationsmannigfaltigkeit Q annehmen können. Folglich muss die Steuerbarkeit des Verbundes geprüft werden. Die Erfüllung der Steuerbarkeit ist intuitiv klar: Ist ein einzelner Körper steuerbar, und es kommt ein zweiter hinzu, ohne dass sich die beiden gegenseitig beeinussen, so ist auch der zweite Körper steuerbar. Die beiden Körper können somit jeweils in eine beliebige Endkonguration gebracht werden, und dieses Gesamtsystem ist wiederum 75 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.4 steuerbar. Aus dieser Argumentation kann geschlossen werden, dass Steuerbarkeit eines einzelnen Körpers Steuerbarkeit eines Verbundes von n Körpern impliziert, sofern diese sich nicht gegenseitig beeinussen. Analog zu Abschnitt 6.2 kann diese Behauptung für den Fall n=2 leicht mit Hilfe der Theorie aus Abschnitt 5.3 nach- gerechnet werden. 7.3. Kostenfunktion und Lösung Wie im Fall eines einzelnen starren Körpers werden auch hier alle Kontrollkräfte minimiert. Entsprechend zur Kostenfunktion des Kontrollproblems eines einzelnen starren Körpers nimmt die Kostenfunktion des Verbundsystems die Darstellung 2 1X f0 (u, q) = hhYij uij , Yij uij ii 2 i,j=1 (u11 )2 (J + mh2 )(u12 )2 (u21 )2 (J + mh2 )(u22 )2 + + + = 2m 2Jm 2m 2Jm an. Der Torsionstensor ist null, da der Levi-Civita Zusammenhang verwendet wird, und auch der Krümmungstensor ist null, weil die Christoel-Symbole null sind. Unter Verwendung von Gleichung (5.15) ergibt sich analog zu Abschnitt 6.3 für die adjungierten Variablen: 2 X D2 λ = ∇Yij∗ (λ)uij . dt2 i,j=1 Mit der Koordinatendarstellung (7.2) λ = [λx1 , λy1 , λθ1 , λx2 , λy2 , λθ2 ] werden zur Bestim- mung der Adjungierten sechs Dierentialgleichungen zweiter Ordnung analog zu dem System (6.4) erhalten. Die optimalen Kontrollfunktionen sind durch Gleichung (5.14) gegeben: ∂f0 + hλ, Yi i = 0, ∂ui i = 1, ..., 4. Insgesamt ergeben sich somit folgende Bestimmungsgleichungen für u11 = −(λx1 cos θ1 + λy1 sin θ1 ) Jm λ x1 λy u12 = sin θ1 − 1 cos θ1 + 2 J + mh m m u21 = −(λx2 cos θ2 + λy2 sin θ2 ) Jm λ x2 λy u22 = sin θ2 − 2 cos θ2 + 2 J + mh m m h λθ J 1 u: (7.3) h λθ . J 2 76 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.4 7.4. Endbedingungen Ziel ist es, dass der Verbund bestehend aus zwei Körpern eine bestimmte Endkonguration annimmt. Diese Endkonguration wird durch relative Daten der beiden Körper zueinander bestimmt. Es kann beispielsweise der Abstand der beiden Körper in der Endkonguration festgelegt werden. Die gesamte Endkonguration wird dabei nicht eindeutig festgelegt, sondern kann bei der Lösung des optimalen Kontrollproblems im Rahmen der vorgegebenen Bedingungen variieren. Bei der Anordnung zu einem festen Zeitpunkt haben die Körper somit eine freie Wahlmöglichkeit. Dafür werden zunächst weniger Endbedingungen als nötig festgelegt. Anschlieÿend werden für das Problem ergänzende Randbedingungen aus der Problemstellung konstruiert. Die Endkonguration für feste Zeit t = tf soll folgenden Bedingungen genügen (siehe Abbildung 7.1): Abbildung 7.1.: Zwei starre Körper in ihrer Endkonguration 1. Alle Endgeschwindigkeiten sind null (V (tf ) = 0): x˙1 (tf ) = 0, y˙1 (tf ) = 0, x˙2 (tf ) = 0, y˙2 (tf ) = 0, θ˙1 (tf ) = 0, θ˙2 (tf ) = 0. (7.4) (6 Bedingungen) 2. Die beiden Körper nehmen eine vorgegebene Endausrichtung an: θ1 (tf ) = ϕ1 , θ2 (tf ) = ϕ2 . (7.5) (2 Bedingungen) 77 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 3. Der Mittelpunkt M = (Mx , My ) 7.4 der Verbindungsstrecke zwischen den beiden Massenschwerpunkten ist fest: 1 (x1 (tf ) + x2 (tf )) = Mx , 2 1 (y1 (tf ) + y2 (tf )) = My . 2 (7.6) (2 Bedingungen) 4. Der Abstand d der beiden Massenschwerpunkte ist fest: (x1 (tf ) − x2 (tf ))2 + (y1 (tf ) − y2 (tf ))2 = d2 (7.7) (1 Bedingung) Insgesamt bilden die Bedingungen (7.4) bis (7.7) elf Randbedingungen. In Abbildung 7.1 ist zu sehen, dass sich die Körper in ihrer Endkonguration bei festem Abstand d auf einem Kreis mit dem Durchmesser d bewegen können, um die End- bedingungen zu erfüllen. Dies ist die freie Wahlmöglichkeit bei der Anordnung zum Endzeitpunkt. Die Dierentialgleichungen (7.1), (7.2) und (7.3) beschreiben ein Dierentialgleichungssystem der Ordnung 24. Wird die Anfangskonguration und Anfangsgeschwin- digkeit des Verbundes komplett vorgeschrieben (zwölf Bedingungen), so bildet das Dierentialgleichungssystem mit den Anfangsbedingungen und den Endbedingungen (7.4) bis (7.7) noch kein vollständiges Randwertproblem der Ordnung nur 23 24, da Randwertbedingungen gegeben sind. Somit muss zur Lösung des Randwert- problems eine weitere Randbedingung gefunden werden. Bestimmung der zusätzlichen Randbedingung Zur Minimierung des Kostenintegrals müssen nach Kapitel 5.7 bei optimalen Kontrollproblemen mit freien Endpunkten die Bedingungen λ(tf ) = 0 und Dλ (tf ) = 0 dt (7.8) erfüllt sein. Diese ergaben sich aus der Variationsbetrachtung des durch partielle Integration erhaltenen Termes DV (tf ) Dλ(tf ) λ(tf ), − , δc(tf ) = 0. d dt (7.9) In diesem Fall sind die Endpunkte nur teilweise festgelegt. Es wird eine einzelne zusätzliche Bedingung zur Vervollständigung des Randwertproblems benötigt. Die 78 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.4 Gleichungen (7.8) bilden dagegen für den Verbund zwölf zusätzliche Endpunktbedingungen. Um eine passende Bedingung aus (7.9) zu erhalten, werden die schon denierten Endbedingungen (7.4) bis (7.7) verwendet und mit Hilfe der Variationsrechnung Bedingungen an die innitesimalen Variationen der einzelnen Koordinaten bestimmt. Untersuchung der bekannten Endbedingungen: V (tf ) = vf = 0 vorgegeben wird, bleibt die Variation der Geschwindigkeitskurve in tf stationär. DV (tf ) Somit ist ihre innitesimale Variation = 0. Die Endbedingung (7.9) d reduziert sich zu Dλ(tf ) , δc(tf ) = 0, (7.10) dt 1. Da für die Endkonguration eine feste Geschwindigkeit und in Koordinatenschreibweise bedeutet dies λ̇x1 (tf )δx1 (tf ) + λ̇y1 (tf )δy1 (tf ) + λ̇x2 (tf )δx2 (tf ) + λ̇y2 (tf )δy2 (tf ) (7.11) +λ̇θ1 (tf )δθ1 (tf ) + λ̇θ2 (tf )δθ2 (tf ) = 0. 2. Die Endausrichtungen der Körper nehmen einen vorgegebenen Wert an, d.h. auch die innitesimalen Variationen zum Zeitpunkt tf von θ1 und θ2 sind null. Bedingung (7.11) reduziert sich zu λ̇x1 (tf )δx1 (tf ) + λ̇y1 (tf )δy1 (tf ) + λ̇x2 (tf )δx2 (tf ) + λ̇y2 (tf )δy2 (tf ) = 0. (7.12) Dies waren die einfachen Randbedingungen, die lediglich einen bestimmten Wert für eine Koordinate zum Endzeitpunkt festlegen. Die Randbedingungen (7.6) und (7.7) bestehen dagegen aus Funktionen, die einen bestimmten Wert zum Endzeitpunkt annehmen sollen. Die Variationsbetrachtung solcher Funktionen wird formal folgendermaÿen durchgeführt: e:Q→R e(c(tf )) = 0 eine Endbedingung des Systems vorschreibt. Es werden Variationen c (t) = c(t, ) von c betrachtet, die auf dem Intervall [t0 , tf ] mit ∈ [−0 , 0 ] deniert sind und die Endbedingung des Systems e(c (tf )) = 0 erfüllen. Da die Funktion ẽ() : [−0 , 0 ] → R mit ẽ() = e(c (tf )) konstant für alle ∈ [−0 , 0 ] ist, gilt Sei eine Funktion, die durch 0= Dabei ist d d ẽ() = c (tf ) = q˜f . d d e(c (tf )) = Somit ist q˜f ◦ c ) (tf ) = de(q˜f ) · δc(tf ). d d(e die Konguration in der Mannigfaltigkeit das System des Verbundes zum Endzeitpunkt t = tf (7.13) Q, die annimmt. 79 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper Mit den Koordinaten (x1 , y1 , θ1 , x2 , y2 , θ2 ) der Kurve c 7.4 folgt für die innitesimale Variation δc = δx1 ∂ ∂ ∂ ∂ ∂ ∂ + δy1 + δθ1 + δx2 + δy2 + δθ2 . ∂x1 ∂y1 ∂θ1 ∂x2 ∂y2 ∂θ2 Das beschriebene Variationsprinzip wird nun auf die drei übrigen Randbedingungen (7.6) und (7.7) angewandt. 3. Die Randbedingung für die Lage des Mittelpunktes wird in Koordinaten durch 1 1 die Funktionen ex (q) = (x1 +x2 )−Mx und ey (q) = (y1 +y2 )− My bestimmt. 2 2 Dann gilt dex (q) = 1 1 dx 1 + dx2 2 2 und dey (q) = 1 1 dy 1 + dy 2 . 2 2 Nach (7.13) müssen dann die Endbedingungen δx1 (tf ) + δx2 (tf ) = 0 δy1 (tf ) + δy2 (tf ) = 0 und (7.14) erfüllt werden. Interpretation: Die Lage des Mittelpunktes zwischen den beiden Körpern ist fest. Verschiebt sich einer der Körper um um δx1 δx1 , so muss sich der andere Körper in die andere Richtung verschieben, damit die x-Komponente des Mit- telpunktes erhalten bleibt. Die Summe der Variationen der beiden Körper in x-Richtung muss also null sein. Die gleiche Argumentation gilt für Variationen in y -Richtung. 4. Die Randbedingung für den Abstand der beiden Körper wird in Koordinaten 2 2 2 durch die Funktion e(q) = (x1 − x2 ) + (y1 − y2 ) − d bestimmt. Dann folgt de(q) = 2(x1 − x2 ) dx1 + 2(y1 − y2 ) dx2 − 2(x1 − x2 ) dy1 − 2(y1 − y2 ) dy2 . Anwendung von (7.13) führt auf die Endbedingung (δx1 (tf ) − δx2 (tf ))(x1 (tf ) − x2 (tf ))+ (δy1 (tf ) − δy2 (tf ))(y1 (tf ) − y2 (tf )) = 0. Dabei sind x1 (tf ), x2 (tf ), y1 (tf ) und y2 (tf ) Koordinaten des Punktes (7.15) q̃f . Interpretation: Der Abstand zwischen den beiden Körpern ist fest. Sind und (x2 , y2 ) (x1 , y1 ) die Koordinaten der beiden Körper, so muss die Gleichung (x1 − x2 )2 + (y1 − y2 )2 = d2 (7.16) 80 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.6 erfüllt sein. Verschiebt sich einer der Körper um δx1 in x-Richtung und δy1 in y -Richtung, so muss sich zur Erhaltung des Abstandes d der zweite Körper um δx2 in x-Richtung und δy2 in y -Richtung verschieben, so dass die Gleichung (x1 + δx1 − x2 − δx2 )2 + (y1 + δy1 − y2 − δy2 )2 = d2 (7.17) erfüllt ist. Gleichsetzen von (7.16) und (7.17) und Vernachlässigung von Termen höherer Ordnung liefert (x1 − x2 )2 + (y1 − y2 )2 = (x1 + δx1 − x2 − δx2 )2 + (y1 + δy1 − y2 − δy2 )2 = (x1 − x2 )2 + 2(x1 − x2 )(δx1 − δx2 ) + (y1 − y2 )2 + 2(y1 − y2 )(δy1 − δy2 ) + h.o.t.. Daraus folgt direkt die Gleichung (7.15). Die Randbedingungen (7.6) und (7.7) liefern somit zusätzlich drei Endbedingungen an die Variationen. Substitution der Gleichungen (7.14) und (7.15) in die Bedingung (7.12) führt zu λ̇x1 (tf ) − λ̇x2 (tf ) x1 (tf ) − x2 (tf ) − y1 (tf ) − y2 (tf ) λ̇y1 (tf ) − λ̇y2 (tf ) Da die innitesimale Variation δx1 (tf ) ! δx1 (tf ) = 0. nicht notwendig null ist, ergibt sich als zu- sätzliche Endpunktbedingung für das Randwertproblem λ̇x1 (tf ) − λ̇x2 (tf ) x1 (tf ) − x2 (tf ) = 0. − y1 (tf ) − y2 (tf ) λ̇y1 (tf ) − λ̇y2 (tf ) (7.18) 7.5. Simulation Zur geeigneten Simulation des Systems in MATLAB werden die Bewegungsgleichungen aus (7.1), (7.2) und (7.3) verwendet. Diese bilden ein System von zwölf gewöhnlichen Dierentialgleichungen zweiter Ordnung. Zusammen mit den Randbedingungen bestehend aus der Vorgabe der Anfangskonguration, der Anfangsgeschwindigkeit und den Endbedingungen (7.4) bis (7.7) und (7.18) ergibt sich ein Randwertproblem der Ordnung 24. Bei den durchgeführten Simulationen sind alle Anfangsgeschwindigkeiten null und für die Parameter des Systems gilt für jeden Körper m = 1, J = 1, h = 0.1, tf = 5. Die Ergebnisse der Simulation sind in Abbildung 7.2 zu sehen. 7.6. Drei Körper Für den Fall des Verbundes von drei Körpern wird analog zu dem Fall für zwei Körper verfahren. In diesem Abschnitt sollen nur die Ergebnisse zu den zugehörigen Endbedingungen präsentiert werden. 81 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper 7.6 Endbedingungen 1. Alle Endgeschwindigkeiten sind null (V (tf ) = 0): x˙1 (tf ) = 0, y˙1 (tf ) = 0, θ˙1 (tf ) = 0, x˙2 (tf ) = 0, y˙2 (tf ) = 0, θ˙2 (tf ) = 0, x˙3 (tf ) = 0, y˙3 (tf ) = 0, θ˙3 (tf ) = 0. (9 Bedingungen) 2. Die drei Körper nehmen eine vorgegebene Endausrichtung an: θ1 (tf ) = ϕ1 , θ2 (tf ) = ϕ2 , θ3 (tf ) = ϕ3 . (3 Bedingungen) 3. Die drei Körper bilden ein Dreieck mit den festen Abständen d12 , d13 und d23 : (x1 (tf ) − x2 (tf ))2 + (y1 (tf ) − y2 (tf ))2 = d212 , (x1 (tf ) − x3 (tf ))2 + (y1 (tf ) − y3 (tf ))2 = d213 , (x2 (tf ) − x3 (tf ))2 + (y2 (tf ) − y3 (tf ))2 = d223 . (3 Bedingungen) 4. Der Schwerpunkt M = (Mx , My ) fest: des Dreiecks, das die drei Körper bilden, ist 1 (x1 (tf ) + x2 (tf ) + x3 (tf )) = Mx , 3 1 (y1 (tf ) + y2 (tf ) + y3 (tf )) = My . 3 (2 Bedingungen) Zusatzbedingung: λ̇x1 + λ̇y1 −2x1 + x2 + x3 −2y1 + 2y2 − y3 x1 − 2x2 + x3 + λ̇x2 + λ̇y2 + 2y1 − y2 − y3 2y1 − y2 − y3 2y1 − y2 − y3 λ̇x3 −y1 − y2 + 2y3 x1 + x2 − 2x3 + λ̇y3 = 0. 2y1 − y2 − y3 2y1 − y2 − y3 Die Ergebnisse der Simulation sind in Abbildung 7.3 zu sehen. Dabei sind die Paramter des Systems analog zu dem Verbund zweier Körper und die Anfangsgeschwindigkeit als null gewählt. Bemerkung 7.6.1 Bei der Simulation der Verbunde mehrerer Körper ergaben sich ähnliche Probleme wie sie in Bemerkung 6.4.1 beschrieben wurden. 82 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper (a) 1. Fall: Trajektorien (b) 1. Fall: Kontrollen (c) 2. Fall: Trajektorien (d) 2. Fall: Kontrollen Abbildung 7.2.: Simulation für Verbund zweier Körper. jektorien der Körper in der x-y -Ebene 7.6 Links sind die Tra- und ihre Endausrichtungen, rechts die Zeitverläufe der Kontrollfunktionen abgebildet. 1. 2. Fall: Fall: ϕ1 = ϕ2 = 0, M = (2, 0), d = 2, Kosten J = 0.096. ϕ1 = ϕ2 = − π4 , M = (2, 1), d = 2, Kosten J = 86.31. 83 Kapitel 7. Optimale Kontrolle eines Verbundes mehrerer starrer Körper (a) 1. Fall: Trajektorien (b) 1. Fall: Kontrollen (c) 2. Fall: Trajektorien (d) 2. Fall: Kontrollen Abbildung 7.3.: 7.6 Simulation für Verbund von drei Körpern. Links sind die Trajektorien der Körper in der x-y -Ebene und ihre Endausrichtungen, rechts die Zeitverläufe der Kontrollfunktionen abgebildet. √ 3 5 1. Fall: ϕ1 = ϕ2 = ϕ3 = 0, M = ( 2 , 3 ), d12 = d13 = Kosten J = 0.3241. 2. Fall: ϕ1 = ϕ2 = ϕ3 = − π4 , M = (2, 1), d12 = d13 = Kosten d23 = 2, d23 = 3, J = 142.7426. 84 8. Fazit und Ausbilck In diesem Kapitel werden noch einmal die wichtigsten Aussagen und Schritte der Arbeit zusammengefasst. Abschlieÿend werden einige Motivationen für zukünftige Forschungsarbeiten dargelegt. 8.1. Fazit Ziel dieser Arbeit war es, eine Lösungsstrategie zu entwickeln, um einen Verbund starrer Körper von einer gegebenen Anfangskonguration energieoptimal in eine Endkonguration zu steuern. Diese Endkonguration muss nicht notwendigerweise fest sein. Hier wurde sie dadurch bestimmt, dass die Körper des Verbundes zum Endzeitpunkt bestimmte Relationen zueinander und relativ zu einem Ziel annehmen sollen. Dabei haben sie in ihrer Endpositionierung noch eine freie Wahlmöglichkeit. Als eine mögliche Anwendung kann ein Verbund von n Satelliten betrachtet werden, die sich um ein Ziel anordnen und dabei jeweils gleiche Abstände zueinander haben sollen. Ob das gleichseitige n-Eck, das die Positionen der Satelliten bilden, um einen Winkel in seinem Schwerpunkt gedreht wird oder nicht, spielt hierbei keine Rolle. Der Verbund wurde zunächst mit Methoden der Dierentialgeometrie modelliert, um die abstrakten Kongurationsräume dieses Systems zu beschreiben und Koordinateninvarianz der Objekte des Modells zu sichern. Bei dieser Modellierung spielen der ane Zusammenhang und die kovariante Ableitung, die eine koordinatenunabhängige Formulierung der Bewegungsgleichungen des Systems ermöglichen, eine wichtige Rolle. Mit der Methode der Lagrange-Multiplikatoren und einem Variationsansatz, der eng mit dem anen Zusammenhang in Verbindung steht, wurde zur Lösung des optimalen Kontrollproblems ein Randwertproblem generiert, das mit Hilfe numerischer Methoden gelöst und simuliert werden konnte. 8.2. Ausblick Die hier vorgestellten Motivationen für zukünftige Forschungsarbeiten gründen sowohl auf entstandene Probleme als auch auf neue Ansätze und Ideen. Zur Ver- 85 Kapitel 8. Fazit und Ausbilck 8.2 besserung des mathematischen Modells und somit zur Berechnung realitätsnäheren Lösungen können Erweiterungen des physikalischen Modells vorgenommen und neue Optimierungsstrategien entwickelt werden. Die folgende Liste beinhaltet nur einen Teil der Ideen, die bei der Modellierung und dem Lösungsverfahren umgesetzt werden können. • Bei der Modellierung des Verbundes ist die Kollision zweier oder mehrerer Körper nicht ausgeschlossen. Eine Kopplung der Bewegungsgleichungen der einzelnen Körper durch die Einführung künstlicher Potentiale dient zur Kollisionsvermeidung. Dabei wirken bei der Näherung zweier Körper künstliche Potentialkräfte entgegen dieser Bewegungsrichtung, so dass eine Kollision nicht möglich ist. Dieser Ansatz wird in [13] für Punktmassen vorgestellt. • Realitätsnähere Betrachtungen im Raum anstatt in der Ebene führen auf eine gröÿere Anzahl von Freiheitsgraden und damit auf komplexere physikalische und höherdimensionalere mathematische Modelle. • Zur Ausführung von Formationen des Verbundes ist Kommunikation zwischen den Körpern und somit ein Informationsaustausch notwendig. Dieser kann in dem System mit Hilfe graphentheoretischer Methoden modelliert werden (siehe [9]). • Um die numerischen Schwierigkeiten (siehe Bemerkung 6.4.1) zu umgehen, können andere Optimierungsansätze als die Methode der Euler-Lagrange-Multiplikatoren berachtet werden. Dies kann auf ezientere numerische Verfahren zur Lösung des Randwertproblems führen. Anhand dieser Punkte wird deutlich, dass das hier zugrundeliegende Modell nur der Grundstein für komplexere Probleme darstellt. Als motivierendes Beispiel ist dabei die eziente Kontrolle von Verbunden von Raumfahrzeugen und Formationsügen zu nennen. Allerdings sind zum vollständigen Verständnis und zur Modellierung solch komplexer Probleme die in dieser Arbeit behandelten Methoden zur Modellierung und Analyse mechanischer Verbundsysteme unverzichtbar. 86 Literaturverzeichnis [1] R. Abraham, J. E. Marsden, T. Ratiu. Manifolds, Tensor Analysis, and Applications. Springer-Verlag, New York, 1988. [2] C. Bär. Elementare Dierentialgeometrie. Walter de Gruyter GmbH & Co. KG, Berlin, 2001. [3] A. M. Bloch. Nonholonomic Mechanics and Control. Springer-Verlag, New York, 2003. [4] F. Bullo. Nonlinear Control of Mechanical Systems: A Riemannian geometry approach. Ph.D. thesis, California Institute of Technology, 1999. [5] F. Bullo, A. D. Lewis. Geometric Control of Mechanical Systems. In Vor- bereitung, 2004. [6] A. T. Coombs, A. D. Lewis. Optimal control for a simplied hovercraft model. Preprint, 2000. [7] P. Deuhard, F. Bornemann. Scientic Computing with Ordinary Dierential Eqautions. Springer-Verlag, New York, 2002. [8] M. P. Do Carmo. Riemannian Geometry. Birkhäuser, Boston, 1992. [9] J. A. Fax. Optimal and Cooperative Control of Vehicle Formations. Ph.D. thesis, California Institute of Technology, 2002. [10] A. Isidori. Nonlinear Control Systems (Third Edition). Springer-Verlag, London, 1995. [11] V. Jurdjevic. Geometric Control Theory. Cambridge University Press, New York, 1997. [12] S. Kobayashi, K. Nomizu. Foundations of Dierential Geometry, Vol I. In- terscience Publishers, New York, 1963. [13] N. E. Leonard, E. Fiorelli. Virtuel Leaders, Articial Potentials and Coordinated Control of Groups. Proc. of the 40th IEEE conference on Decision and Control, Orlando, FL, 2968-2973, 2001. 87 Literaturverzeichnis .0 [14] A. D. Lewis. Aspects of Geometric Mechanics and Control of Mechanical Systems. Ph.D. thesis, California Institute of Technology, 1995. [15] A. D. Lewis. The geometry of optimal control for ane connection control systems. Preprint, 1999. [16] A. D. Lewis. The geometry of the maximum principle for ane connection control systems. Preprint, 2000. [17] A. D. Lewis, R. M. Murray. Decomposition for control systems on manifolds with an ane connection. Systems & Control Letters 31(4), 199-205, 1997. [18] A. D. Lewis, R. M. Murray. Conguration controllability of simple mechanical control systems. SIAM Review. A Publication of the Society for In- dustrial and Applied Mathematics 41(3), 555-574, 1999. [19] A. D. Lewis, D. R. Tyner. Controllability of a hovercraft model (and two general results). Nicht veröentlicht. [20] J. E. Marsden, T. Ratiu. Introduction to Mechanics and Symmetry. Springer-Verlag, New York, 1994. [21] E. R. Pinch. Optimal Control and the Calculus of Variations. Oxford Uni- versity Press, New York, 1993. [22] L. F. Shampine, J. Kierzenka, M. W. Reichelt. Solving Boundary Value Problems for Ordinary Dierential Equations in MATLAB with bvp4c. Index of ftp://ftp.mathworks.com/pub/doc/papers/bvp/. [23] D. R. Tyner. Linearization of ane connection control system. MSc The- sis, Queen's University, 2000. 88