Analytische Geometrie - Universität Würzburg

Werbung
Analytische Geometrie
für Lehramtstudierende der Schulformen Grund-, Haupt- und Realschule
Jörn Steuding
Universität Würzburg, Wintersemester 2011/12
Geometrie steht wörtlich für die Vermessung der Erde, entspringt also einem
praktischen Anliegen, hat sich aber natürlich im Laufe ihrer über fünf Jahrtausende währenden Geschichte zu einer sehr vielfältigen mathematischen Disziplin
entwickelt. In der Schule spielt die Geometrie eine zentrale Rolle, insbesondere
in der Mittel- und Oberstufe. In dieser Vorlesung werden wir insbesondere jene Aspekte eingehend studieren, die sich mit Hilfe der Methoden der linearen
Algebra untersuchen lassen: Neben der Klassifikation der Quadriken (insbesondere der Kegelschnitte) werden wir auch ein wenig klassische Geometrie kennen
lernen, aber auch japanische Geometrierätsel (so genannte sangakus) lösen...
Ein herzlicher Dank an Nicola Oswald für das Erstellen diverser Bilder und
kritische Lektüre. Trotzdem ist dieses Skript - wie fast jeder längere geschriebene Text - wohl nicht ohne Druckfehler. Vielen Dank für weitere Korrekturen
einer früheren Version dieses Skriptes gebühren meinem Koellegen Prof. Dr. Fabian Wirth. Weitere Berichtigungen und Verbesserungsvorschläge sind herzlich
willkommen. Viel Spaß!
Jörn Steuding, Würzburg im April 2013.
Empfehlenswerte Literatur zum Thema:
• T. Arens, F. Hettlich, C. Karpfinger, U. Kockelkorn, K. Lichtenegger, H. Stachel, Mathematik, Spektrum 2008 (ein umfangreiches Buch mit den wichtigsten Resultaten
zur Analysis und linearen Algebra)
• Rolf Brandl, Vorlesungen über analytische Geometrie, Brandl Verlag, 1997 (hält, was
es verspricht)
• D.M. Burton, The history of Mathematics, McGraw-Hill, 2011 (Geschichte!)
• R. Courant, H. Robbins, Was ist Mathematik?, Springer 1993, 4. Auflage (ein Klassiker!)
• G. Fischer, Analytische Geometrie, Vieweg 2001, 7. Auflage (die Standardreferenz!)
• A. Holme, Geometry. Our cultural heritage, Springer 2010, 2nd ed. (sehr schön geschriebenes Buch zur Geschichte der Geometrie)
• K. Johannson, Geometrie für das Lehramt, www.mathematik.uni-frankfurt.de/∼johannson
(schönes Vorlesungsskript!)
• F. Klein, Elementarmathematik vom höheren Standpunkt, Teil II: Geometrie, Teubner
1909 (setzte seinerzeit Maßstäbe für das Lehramt)
• M. Koecher, A. Krieg, Ebene Geometrie, Springer 2007, 3. Auflage (alles Wissenswerte
zur Geometrie in der Ebene)
• J. Kratz, K. Wörle, Geometrie, Bayerischer Schulbuchverlag München 1972 (ein älteres
Schulbuch)
• H. Scheid, W. Schwarz, Elemente der Geometrie, Spektrum 2007, 4. Auflage (uneingeschränkt empfehlenswert!)
• C.J. Scriba, P. Schreiber, 5000 Jahre Geometrie, Springer 2001 (umfangreiches Geschichtswerk)
• J.
Steuding,
Elementare
Zahlentheorie,
Vorlesungsskript
WS
2009/10,
www.mathematik.uni-wuerzburg.de/∼steuding/elzt.pdf
• J. Stilwell, Numbers and Geometry, Springer 2001 (Zahlentheorie und Geometrie gut
erklärt und mit geschichtlichem Hintergrund)
Inhaltsverzeichnis
Kapitel 1. Eine kurze Geschichte der Geometrie
1. Thales und die Ursprünge der Geometrie
2. Eratosthenes und die Messung des Erdumfangs
3. Der Satz des Pythagoras und seine Verwandten
4. Pythagoräische Tripel
5. Die Entdeckung der Inkommensurabilität
6. Platonische Körper und die Polyederformel
7. Euklids Elemente und die Axiomatisierung der Mathematik
8. Was lässt sich mit Zirkel und Lineal konstruieren?
9. Die Algebraisierung der Geometrie durch Descartes und Fermat
10. Sangakus
4
4
7
9
11
15
18
22
25
28
31
Kapitel 2. Analytische Geometrie in euklidischen Räumen
1. Lineare Gleichungssysteme
2. Geraden und Ebenen
3. Das Skalarprodukt
4. Symmetrische Matrizen
5. Winkel und die trigonometrischen Funktionen
6. Orthogonalität
7. Hessesche Normalform
8. Vektorprodukt und Spatprodukt
33
33
35
38
43
46
50
54
60
Kapitel 3. Kegelschnitte
1. Quadratische Formen
2. Kreise und Ellipsen
3. Hyperbeln und Parabeln
4. Die orthogonale Gruppe
5. Drehungen in der Ebene und im Raum
6. Euklidische Bewegungen
* Wiederholung: Eigenwerte und Diagonalisierbarkeit *
7. Bewegungen in der Ebene
*** Weihnachtsvorlesung ***
8. Ähnlichkeitsabbildungen
9. Hauptachsentransformation
10. Allgemeine Kurven zweiter Ordnung
11. Klassifikation der Quadriken
12. Kegelschnitte
3
66
66
69
73
77
80
86
89
91
95
99
103
110
121
128
KAPITEL 1
Eine kurze Geschichte der Geometrie
Geometrie ist mit einer Tradition von über fünftausend Jahren eine der
ältesten mathematischen Disziplinen überhaupt. Wir geben im Folgenden einen
sehr kurzen Abriss ihrer Entwicklung mit Fokus auf die ebene Elementargeometrie und diejenigen Aspekte, welche insbesondere für die analytische Geometrie
relevant sind (und darüber hinaus auch viel für den Schulunterricht zu bieten
haben).
1. Thales und die Ursprünge der Geometrie
Bereits im alten Mesopotamien und Ägypten finden sich bemerkenswerte
geometrische Einsichten wie etwa die Formel für die Fläche eines Dreiecks sowie Näherungen für die Kreisfläche. Auf dem ägyptischen Papyrus Rhind findet
sich beispielsweise bereits ca. 1700 v.Chr. die Approximation 4( 89 )2 = 3, 16 . . .
an die Kreiszahl π. Über den Kenntnisstand und den Hintergrund ihrer mathematischen Untersuchungen ist mangels Überlieferungen oft leider nur wenig bekannt. So ist auch die Herleitung der genannten Näherung an π nicht klar; sie ist
aber recht nahe an der exzellenten Kettenbruchnäherung 3 71 (während die alten
Babylonier und Hebräer hatten noch die wesentlich schlechtere Approximation
3 benutzt haben). Es wird heutzutage davon ausgegangen, dass die Mathematik, die in diesen Kulturen betrieben wurde, sehr an praktischen Problemen
orientiert war und Rechenmethoden phänomenologisch entdeckt wurden. Das
Konzept des Beweises, welches die Mathematik zu einer exakten Wissenschaft
macht (der einzigen!), hat wohl erst mit den alten griechischen Denkern Einzug
in die Mathematik genommen!
Der Beginn der Geometrie ist nur bedingt auf einen Zeitpunkt bzw. auf eine Kultur oder gar eine Person datierbar. Als erster griechische Geometer mag
vielleicht Thales von Milet (∗ 622 - † 547) gelten. Viele seiner Erkenntnisse
erwarb er in Ägypten und Babylonien, jedoch entwickelte er zusätzlich eigene
bahnbrechende Ideen in Philosophie und Mathematik. Thales größter geometrischer Verdienst ist die Einführung von Winkeln und erste Untersuchungen
ebendieser. Ein Winkel entsteht demzufolge durch den Schnitt zweier Geraden;
ein rechter Winkel ist dabei ein solcher, wenn die beiden Geraden sich ’symmetrisch’ schneiden. Für ebensolche gibt Thales folgende Konstruktion an: Zu zwei
verschiedenen Punkten P, Q bilde man die Verbindungsstrecke P Q und schlage
jeweils einen Kreis von einem Radius größer als die Hälfte der Länge von P Q;
dann schneiden sich diese Kreise in zwei verschiedenen Punkten P ′ , Q′ und deren Verbindungsstrecke P ′ Q′ steht auf Grund der Symmetrie senkrecht auf P Q,
so dass ein rechter Winkel entstanden ist (bzw. mehrere rechte Winkel).
4
5
Wir geben einige weitere repräsentative Beispiele seines Schaffens:
Satz 1.1. In einem gleichschenkligen Dreieck sind die Basiswinkel gleich.
Beweis (nach Pappus). Wir führen implizit grundsätzliche Notation ein. Sei
ABC ein gleichschenkliges Dreieck mit Eckpunkten A, B und C; dabei gelte
für die Längen der Strecken AB von A nach B und BC von B nach C Gleichheit: |AB| = |BC|. Jetzt spiegeln wir das Dreieck so, dass AB auf BC zu liegen kommt und BC auf AB. Wegen der Symmetrie gleichschenkliger Dreiecke
nimmt das gespiegelte Dreieck genauso viel Fläche ein wie das Ausgangsdreieck
und insbesondere sind die Basiswinkel gleich. •
Übrigens: An Bildern lassen sich mathematische Schlussweisen manchmal
gut illustrieren, allerdings kann ein Bild keinen mathematischen Beweis ersetzen. Das logische Begründen eines jeden Schrittes ist notwendig! Ein Bild stellt
oftmals nur einen bestimmten Spezialfall eines viel allgemeineren Sachverhaltes
dar.
Abbildung 1. Links Thales’ Konstruktion eines rechten Winkels. Aus
der rechten Figur lassen sich viele von Thales’ Ergebnissen entwickeln, z.B.:
der Durchmesser halbiert den Kreis. Entdecken Sie weitere Gesetzmäßigkeiten?
Satz 1.2. Der Durchmesser halbiert den Kreis.
Beweis. Der Durchmesser zerlegt den Kreis in zwei Teile. Wir denken uns den
einen Teil auf den anderen gelegt. Sind die beiden nicht gleich, so liegt der
obere Teil entweder innerhalb oder außerhalb des unteren. Da alle Linien vom
Mittelpunkt zur Kreislinie einander gleich sind, folgt in beiden Fällen, dass die
kürzere Gerade gleich der längeren ist, der gewünschte Widerspruch. •
Dieser Beweis geht auf Proklos (im fünften Jahrhundert n.Chr.) zurück und ist
einer der ersten überlieferten indirekten Beweise überhaupt!
Satz 1.3 (Winkelsummensatz). Die Winkelsumme im Dreieck ist zwei Rechte (beträgt also π bzw. 180 Grad).
6
Bevor wir den Beweis in Angriff nehmen, erinnern wir: Schneidet eine Gerade
zwei andere Geraden g und h, so nennt man die auf den gleichen Seiten liegenden
Winkel Stufenwinkel; diese sind genau dann gleich, wenn die Geraden g und h
parallel sind. Die gegenüber sitzenden Winkel nennt man oft Wechselwinkel
und auch diese sind natürlich genau dann gleich, wenn die Geraden parallel
sind.
Beweis. Gegeben ein Dreieck ABC, ziehen wir eine Parallele zur Seite AB
durch den Punkt C. Weil die Wechselwinkel an parallelen Geraden gleich sind,
finden wir die Innenwinkel an den Ecken A und B zwischen der Parallelen und
den Schenkeln an C wieder. Es folgt also, dass die Summe der Innenwinkel gleich
zwei rechten Winkeln ist. •
Abbildung 2. Beispiels zum Winkelsummensatz (links) und dem Satz
des Thales (rechts); zur Übung wird empfohlen, rechts die Bezeichnungen
des Beweises einzufügen und den Beweis noch einmal am Bild nachzuvollziehen.
Und natürlich zeigte Thales seinen berühmten
Satz 1.4 (Satz des Thales). Der Peripheriewinkel im Halbkreis ist ein rechter.
Ein Dreieck in einem Halbkreis beinhaltet also stets einen rechten Winkel. Es
heißt, dass Thales aus Dank für diese Erkenntnis den Göttern einen Ochsen
opferte!
Beweis (nach Euklid). Sei ABC das Dreieck mit den Eckpunkten A, B, C über
einem Kreisdurchmesser AB, so ist zu zeigen, dass für den Winkel ∠(ACB) bei
C im Bogenmaß die Gleichung ∠(ACB) = π2 gilt. Sei M der Mittelpunkt des
Kreises, dann sind AM C und CM B gleichschenklige Dreiecke mit also gleichen
Winkeln ∠(M AC) = ∠(M CA) =: ϕ und ∠(M CB) = ∠(M BC) =: ψ. Mit dem
Winkelsummensatz folgt
π = ∠(CM A) + ∠(BM C) = (π − 2ϕ) + (π − 2ψ)
und daraus ergibt sich daraus ∠(ACB) = ϕ + ψ = π2 . •
Thales befasste sich auch mit Navigationsproblemen in der Schifffahrt. Die
Seefahrer des Altertums orientierten sich soweit möglich an der Küstenlinie∗
und Thales benutzte seine Winkel zur Bestimmung der Entfernung von Schiffen
von der Küste. Aber Thales betätigte sich auch als Astronom und sagte die
∗
was vielleicht Odysseus’ lange Irrfahrt erklärt?
7
Sonnenfinsternis am 22. Mai 585 v.Chr. (nach unserer Zeitrechnung) voraus. In
erster Linie wird Thales aber (seit Aristoteles) als Philosoph verstanden, fragte
er doch als Erster nach dem Urgund des Seins und Geschehens; seine Naturphilosophie basiert auf der Überlegung, dass alles in der einen oder anderen Weise
aus dem Wasser entstanden ist.
Aufgaben
Aufgabe 1. Beweisen Sie folgende Sätze von Thales:
• Die Scheitelwinkel zwischen zwei sich schneidenden Geraden sind gleich.
• Die Diagonalen eines Rechtecks sind gleich und halbieren einander.
Aufgabe 2. Welche geometrische Methode mag Thales für die Messung der Entfernung
eines Schiffes von der Küste benutzt haben? (Hinweis: Das Buch von Hulme.)
2. Eratosthenes und die Messung des Erdumfangs
Geometrie steht für die die Messung der Erde. Lokal sieht unsere Umwelt
(abgesehen von den Weinbergen) eben aus, tatsächlich ist unsere Erde aber
eine abgeflachte Kugel. Bei den alten Griechen war die Meinung, dass die Erde
eine Kugel sei, bereits seit den Arbeiten von Pythagoras und seinen Schülern
(s.u.), sowie Parmenides und Plato vertreten. Aristoteles gab als einen Grund
an, dass bei sich von der Küste entfernenden Schiffen zunächst der Rumpf und
erst später die Segel und der Mast verschwinden; auch sei der Erdschatten bei
einer Mondfinsternis kreisförmig. Diese Idee hat Eratosthenes von Syrene (∗ 276
- † 194 v.Chr.) noch wesentlich weiter gesponnen und in einem beeindruckenden
Experiment eine Näherung für die Größe der Erdkugel angegeben.
Eratosthenes beobachtete mittags am Tag der Sonnenwende (21. Juni) die
Reflexion der Sonne in einem tiefen Brunnen in Syrene (dem heutigen Assuan),
also steht die Sonne zu diesem Zeitpunkt nahezu senkrecht. Eratosthenes ließ an
diesem Tag des darauf folgenden Jahres zwei Winkel messen: einmal den Winkel
des Schattens, den die Sonne am Obelisken in Alexandria warf, sowie den rechten Winkel in besagtem Brunnen in Syrene. Ferner geht die Sonne in Syrene und
Alexandria fast zur selben Zeit auf (sie liegen auf nahezu demselben Längengrad). Die Distanz zwischen Syrene und Alexandria beträgt 5000 Stadien; ein
Stadion war eine im Mittelmeerraum zur damaligen Zeit übliche Längeneinheit,
die regional zwischen 150 und 180 Metern schwankte. Der Winkel des Schattens betrug 7◦ 12′ Grad, bzw. 2π
50 als Bogenmaß. Entsprechend ergibt sich ein
Erdumfang von
360◦
× 5 000 = 50 × 5 000 = 250 000
7◦ 12′
Stadien. Legen wir eine Länge von 160 Metern für ein Stadion zu Grunde, ergeben sich 40 000 Kilometer für den Erdumfang. Wie gelangte Eratosthenes zu
letzter Formel? Als Stufenwinkel paralleler Geraden sind die Winkel α und α′
in Abbildung 3 gleich, also α = α′ = 2π
50 , woraus für die Länge des Kreisbogens
von Alexandria nach Syrene eben die 25 000 Stadien resultieren. Tatsächlich
8
Abbildung 3. Die Sonne scheint auf Eratosthenes Experiment.
beträgt der Erdumfang über die Pole 40 007, 76 Kilometer. Für eine Korrektur
der Rechnung des Eratosthenes sei bemerkt, dass die wirkliche Entfernung von
Syrene zu Alexandria 729 Kilometer beträgt und der Winkel des Schattens in
Alexandria 7◦ 5′ ist. Ferner liegen Alexandria und Syrene nicht auf demselben
Längenkreis, sondern um drei Grad verschoben. Eine weitere Annahme in Eratosthenes Experiment ist, dass die Sonnenstrahlen parallel verlaufen, was wir
hier aber nicht weiter erörtern wollen...
Eratosthenes war nicht nur Erdvermesser, sondern auch Mathematiker,
Astronom und Direktor der legendären Bibliothek von Alexandria. In der Philosophie war er ein Anhänger Platos (dem wir später noch kurz begegnen werden); in der Mathematik ist das Sieb des Eratosthenes ein wichtiges Werkzeug
zur Auflistung der Primzahlen (vgl. das Skript Elementare Zahlentheorie). Die
Liste der prominenten mathematischen Landvermesser ließe sich weiter ausdehnen. Beispielsweise vermaß Gauß von 1821 bis 1825 das Königreich Hannover;
seine Triangulationsmethode bildet einen Meilenstein in der Kartographie.†
Aufgaben
Aufgabe 3. Bereits Thales nutzte Geometrie zur Vermessung der Welt. So benutzte er
den Schattenwurf einer Pyramide zu zwei verschiedenen Zeitpunkten, um deren Höhe
zu messen! Konsultieren Sie Burtons Buch (Seite 88) für eine Anleitung. Illustrieren
Sie die Methode mit einem praktischen Beispiel.
Aufgabe 4. Versuchen Sie Eratosthenes’ Berechnung unter Verwendung der angegebenen präzisierten Daten zu verbessern!
Aufgabe 5. Sie peilen abwechselnd über einen 20 cm entfernten Bleistift mit dem
rechten Auge das Haus und mit dem linken Auge den Baum in Abbildung 4 an. Wenn
†
und wurde auf der früheren 10 DM-Note verewigt; sehr lesenswert ist der Roman ’Die
Vermessung der Welt’ von Daniel Kehlmann.
9
Abbildung 4. Geometrie in action!
Ihre Augen acht Zentimeter auseinanderliegen und Sie vom Haus 50 Meter entfernt
sind, wie weit ist der Baum vom Haus entfernt? Testen Sie dieses Verfahren in ihrer
Umwelt!
3. Der Satz des Pythagoras und seine Verwandten
Wir gehen etwas zurück in der Zeit und widmen uns Pythagoras von Samos
(ca. ∗ 569 -† 475 v.Chr.) und seiner Schule, die man als einen Vorläufer heutiger Universitäten ansehen kann. Die Pythagoräer befreiten die Mathematik von
der Notwendigkeit praktischer Anwendungen; die Motivation ihrer Mathematik
war, dem Göttlichen näher zu kommen (um es mit den Worten von van der
Waerden zu sagen).‡ Aber für Pythagoras und seine Schüler galten auch einige
auf uns heute seltsam anmutende, selbst auferlegte Regeln wie etwa das Verbot,
Bohnen zu essen. Eine mögliche Erklärung für dieses sonderliche Gebot mag in
dem Selbstverständnis der griechischen Denker liegen: Gemäßigte Lebensweise
und Mathematik wurden als der Weg angesehen, die unsterbliche Seele zu reinigen. Ein anderer, für uns relevanter, wenngleich ebenso kontroverser Grundsatz
der Pythagoräer lautete: Alles ist Zahl, wobei das Zahlenuniversum der damaligen Zeit aus den positiven rationalen Zahlen bestand. Diese Behauptung sollte
zur ersten Grundlagenkrise der Mathematik führen (die wir im anschließenden
Paragraphen diskutieren werden).
Aber zuerst behandeln wir den vielleicht bekanntesten Satz der Mathematik
überhaupt:
Satz 1.5 (Satz des Pythagoras). In einem rechtwinkligen Dreieck ist die
Summe der Quadrate der Katheten gleich dem Quadrat der Hypothenuse.
‡
Das äußerst lesenswerte Buch Als die Götter lachen lernten von H. Heuser (Piper 1992)
gibt einen amüsanten Einblick in die Gedankenwelt der alten Griechen.
10
Abbildung 5. Links der Satz des Pythagoras ”a2 + b2 = c2 ”, rechts ein
Bild, welches zu einem Beweis desselben ausgebaut werden kann.
Beweis. Wir berechnen den Flächeninhalt des Quadrates mit Kantenlänge a +
b in Abbildung 5 auf zwei verschiedene Arten. Zunächst einmal ist besagte
Fläche gleich dem Quadrat der Seitenlänge; andererseits können wir besagtes
Quadrat auch in ein Quadrat der Kantenlänge c und vier kongruente, also
deckungsgleiche rechtwinklige Dreiecke mit Kathetenlängen a und b disjunkt
zerlegen. Also gilt
(a + b)2 = c2 + 4 · 12 ab.
Mit dem binomischen Satz folgt hieraus unmittelbar die Formel des Satzes. •
Es sei bemerkt, dass der binomische Satz geometrisch im Sinne von Abbildung
6 gedeutet werden kann. Es gibt eine Vielzahl von weiteren Beweisen des Sat-
Abbildung 6. Der binomische Lehrsatz (a + b)2 = a2 + 2ab + b2 .
zes des Pythagoras; z.B. von Leonardo da Vinci, dem indischen Mathematiker
Bhaskara II aus dem 12 Jhd. oder vom US-Präsidenten Garfield (siehe hierzu
die Bücher von Scheid & Schwarz bzw. Stilwell).
Der Satz des Pythagoras und die folgenden beiden Sätze bilden die so genannte Satzgruppe des Pythagoras:
11
Satz 1.6 (Kathetensatz). In einem rechtwinkligen Dreieck ist das Quadrat
über eine Kathete gleich dem Rechteck aus der Hypothenuse und dem der Kathete anliegenden Hypothenusenabschnitt.
Abbildung 7. Links eine Illustration des Kathetensatzes, rechts des
Höhensatzes: Bezeichnen q und p die Längen der Hypothenuse links bzw.
rechts der Höhe h, so gelten a2 = pc und h2 = qp.
Satz 1.7 (Höhensatz). In einem rechtwinkligen Dreieck ist das Quadrat über
der Höhe zur Hypothenuse gleich dem Rechteck aus den Hypothenusenabschnitten.
Jeder Satz der Satzgruppe des Pythagoras ist gleichwertig, d.h. jeder Satz
ist aus jedem anderen der Sätze herleitbar: Kathetensatz, Höhensatz und der
Satz des Pythagoras sind äquivalent (siehe entsprechende Übungsaufgabe).
Aufgaben
Aufgabe 6. Zeigen Sie folgende Implikationen: Kathetensatz ⇒ Satz des Pythagoras
⇒ Höhensatz ⇒ Kathetensatz.
Aufgabe 7. Parallel zur Grundlinie eines Dreieckes werden Linien gezeichnet, die die
beiden anderen Seiten des Dreiecks in jeweils zehn gleich große Teile zerlegen. Jeder
zweite sich so ergebende Streifen wird schwarz eingefärbt. Wie viel Prozent der Fläche
des Dreiecks können schwarz sein?
Aufgabe 8. Zeigen Sie folgende Verallgemeinerung des Satzes des Pythagoras: Wir
zeichnen über den Seiten eines rechtwinkligen Dreiecks gleichsinnig ähnliche Dreiecke
(mit also gleichen Winkeln in den entsprechenden Ecken) wie in Abbildung 8. Zeigen
Sie, dass dann die Flächensumme der Kathetendreiecke mit der Fläche des Hypothenusendreiecks übereinstimmt.
4. Pythagoräische Tripel
Der Satz des Pythagoras lässt sich auf nicht notwendig rechtwinklige Dreiecke verallgemeinern:
12
Abbildung 8. Der pythagoräische Lehrsatz gilt auch mit ähnlichen Dreiecken statt der üblichen Quadrate.
Satz 1.8 (Cosinussatz). Gegeben ein Dreieck ABC mit Seitenlängen a, b und
c (gegenüber den Ecken A, B und C wie in Abbildung 9). Dann gilt
a2 + b2 = c2 + 2ab cos γ,
wobei γ = ∠(ACB) der Winkel bei C ist.
Abbildung 9. Nicht jedes Dreieck ist rechtwinklig!
Wir werden diesen Satz erst im nächsten Kapitel beweisen.§ Als unmittelbare
Konsequenz ergibt sich
§
Der/Die ungeduldige LeserIn sei auf das Skript von Johannson verwiesen.
13
Korollar 1.9 (Umkehrung des pythagoräischen Satzes). Gegeben ein
Dreieck mit Seitenlängen a, b und c. Gilt a2 + b2 = c2 , so ist das Dreieck rechtwinklig.
Der Satz des Pythagoras und seine Verallgemeinerung haben enorme Konsequenzen. Von diesen wollen wir zuerst mit den pythagoräischen Tripeln eine
arithmetische Anwendung mit durchaus praktischen Nutzen betrachten: Die pythagoräischen Tripel erlauben die Konstruktion von rechten Winkeln, die in der
Baukunst so wichtig sind und welche bereits den alten Babyloniern vor ca. 3500
Jahren bekannt waren. Auch die Aussage des Satzes des Pythagoras war wohl zu
diesen Zeiten bereits bekannt, wenngleich es in der babylonischen Mathematik
wohl noch keine Beweise gab. Hier einige Beispiele:
32 + 42 = 52 ,
52 + 122 = 132 ,
652 + 722 = 972 ,
...
Wegen des Cosinussatzes 1.9 führen diese Identitäten tatsächlich auf rechtwinklige Dreiecke mit ganzzahligen Seitenlängen; gerade wegen der Ganzzahligkeit
der seiten, sind diese Dreiecke damit leicht zu konstruieren!
Aber wie gelangt man zu Identitäten wie die oben erwähnten? Gegeben sei
die Gleichung
X 2 + Y 2 = Z 2;
Lösungen (x, y, z) in natürlichen Zahlen heißen pythagoräische Tripel zu Ehren von Pythagoras. Mit einer solchen Lösung (x, y, z) ist offensichtlich auch
jedes Tripel (ax, ay, az) mit a ∈ N eine Lösung, wenn auch keine sonderlich
interessante. Deshalb heißen Tripel (x, y, z), für die ggT(x, y, z) = 1 gilt, primitiv; die Teilerfremdheitsbedingung ist dabei äquivalent zur Forderung, dass die
Zahlen x, y, z paarweise teilerfremd sind. Beispiele primitiver pythagoräischer
Tripel sind gegeben durch
32 + 42 = 52 ,
52 + 122 = 132 ,
82 + 152 = 172 ,
während die folgenden Tripel offensichtlich nicht primitiv sind:
15222 + 28522 = 32322
und
31522 + 10822 = 33322 .
Pythagoras fand eine unendliche Familie von primitiven pythagoräischen Tripeln basierend auf der Identität
(2n + 1)2 + (2n2 + 2n)2 = (2n2 + 2n + 1)2 .
Euklid gelang die komplette Charakterisierung primitiver pythagoräischer Tripel:
Satz 1.10. Es seien a und b teilerfremde natürliche Zahlen unterschiedlicher
Parität (d.h. entweder ist a gerade und b ungerade oder umgekehrt) und es gelte
a > b. Dann ist (x, y, z), gegeben durch
x = a 2 − b2 ,
y = 2ab,
z = a2 + b2 ,
ein primitives pythagoräisches Tripel. Ferner ist jedes primitives pythagoräische
Tripel von dieser Form.
14
Abbildung 10. Links: Der Einheitskreis geschnitten mit der Sekante
durch die Punkte (−1, 0) und ( 53 , − 45 ) (mit Steigung m = − 21 ); dem zweiten Schnittpunkt entspricht das pythagoräische Tripel (3, 4, 5). Man beachte,
dass die Zuordnung zwischen rationalen Punkten und pythagoräischen Tripeln nicht bijektiv ist (man denke an Vorzeichensymmetrien).
Wir geben hiervon einen geometrischen
Beweis (nach Bachet). Mittels U = cos t und V = sin t für 0 ≤ t < 2π lässt
sich der Einheitskreis in der euklidischen Ebene parametrisieren (aus der Schule
bekannt?) und der Satz des Pythagoras liefert damit via cos2 + sin2 = 1 die
algebraische Gleichung
C : U 2 + V 2 = 1.
Wir schneiden nun diesen Einheitskreis mit der Geradenschar
Lm : V = m(U + 1)
für m ∈ Q.
Jede Gerade Lm schneidet den Kreis in dem Punkt (−1, 0) sowie in einem
weiteren Schnittpunkt, dessen Koordinaten sich vermöge Einsetzen über
1 = U 2 + (m(U + 1))2
⇐⇒
(1 + m2 )U 2 + 2m2 U + m2 − 1 = 0
leicht berechnen als
1 − m2
2m .
1 + m 1 + m2
Tatsächlich ist also dieser zweite Schnittpunkt genau dann rational, wenn die
Steigung m der Geraden Lm rational ist. Das ist für rationale m sofort einsichtig;
√
für irrationale m der Form r mit einer rationalen Zahl r, die kein Quadrat ist,
schaue man auf die v-Koordinate. Auf diese Weise erhalten wir nicht nur viele
rationale Punkte auf dem Kreis, sondern sogar sämtliche: Die Sekante durch
(−1, 0) und (u, v) ∈ C ∩ Q2 \ {(−1, 0)} besitzt nämlich eine rationale Steigung
(u, v) =
,
2
15
b
a
für ganzzahlige a, b ergibt sich so
a 2 − b2
2ab ,
∈ C.
(u, v) =
a2 + b2 a2 + b2
Den Punkt (−1, 0) erhalten wir vermöge m → ∞ (dem Fall der Tangente an
(−1, 0)). Weil nun u2 + v 2 = 1 mit rationalen u = xz und v = yz auf x2 + y 2 = z 2
mit ganzzahligen x, y und z führt, und auch jedes solche einem rationalen Punkt
entspricht, ergibt sich nun der euklidische Satz 1.10, allerdings zunächst ohne
die Unterscheidung primitiver pythagoräischer Tripel (welche aber leicht mit
elementaren Teilbarkeitsargumenten hinzugefügt werden kann). •
und mittels m =
Die pythagoräischen Tripel parametrisieren also die rationalen Punkte auf dem
Einheitskreis! (was wir bereits in der Elementaren Zahlentheorie gesehen hatten.)
Aufgaben
Aufgabe 9. Heron von Alexandria lebte im ersten Jahrhundert nach Christus und
bewies die so genannte Heronsche Formel: Ein Dreieck mit Seitenlängen a, b, c besitzt
den Flächeninhalt
p
s(s − a)(s − b)(s − c),
wobei s := 21 (a + b + c).
Aufgabe 10. Es seien a1 = 3, c1 = 5 und
an+1 = 3an + 2cn + 1
und
cn+1 = 4an + 3cn + 2
für n ∈ N. Zeigen Sie, dass dann (an , an + 1, cn ) ein pythagoräisches Tripel ist.
5. Die Entdeckung der Inkommensurabilität
Nun kommen wir zur angekündigten Grundlagenkrise der griechischen Mathematik. Nach dem√pythagoräischen Satz ist die Länge einer Diagonale im Einheitsquadrat gleich 2, welches bekanntlich keine rationale Zahl ist und damit
nicht in das Weltbild der Pythagorärer passte. Diese Beobachtung geht wohl auf
den Pythagoras-Schüler Hippasos von Metapont zurück; die Legende berichtet,
dass Hippasos für den Verrat dieses Geheimnisses vom pythagoräischen Geheimbundes ausgestoßen und womöglich sogar ertränkt wurde. Die Einführung der
reellen Irrationalzahlen blieb den griechischen Denkern verwehrt; sie behoben
ihr mathematisches Dilemma auf einem anderen Wege. Eudoxos (ca. ∗ 408 - †
347 v.Chr.) entwickelte seine Proportionenlehre, welche auf geniale Weise die
Schwierigkeit keine irrationalen Zahlen zu kennen, aus dem Wege räumt.
Zwei Strecken heißen kommensurabel, falls es eine Strecke gibt, so dass
beide Strecken jeweils ein ganzzahliges Vielfaches dieser sind (also deren Proportion rational ist); andernfalls sind die Strecken inkommensurabel. Kommensurabilität lässt sich mit Hilfe der geometrischen Wechselwegnahme –
das ist eine Form des euklidischen Algorithmus bzw. sukzessiver Division mit
Rest (vgl. Elementare Zahlentheorie) –, entscheiden.
Zur Illustration betrachten wir ein Quadrat. Bezeichnen wir in Abbildung
12 die Ecken des großen Quadrates mit A, B, C und D und ziehen wir um A
16
Abbildung 11. Eine geometrische Variante des euklidischen Algorithmus: 33 = 3 · 10 + 3, 10 = 3 · 3 + 1
Abbildung 12. Erste Schritte zur Inkommensurabilität von Diagonale
und Basis des Quadrates. Beschriften der Eck- und Schniottpunkte hilft beim
Verständnis!
einen Kreis durch B, so schneidet dieser die Diagonale von A nach C in einem
Punkt E. Dabei gilt für die jeweiligen Längen
|AC| = |AB| + |EC|.
Wir bilden ein Quadrat zur Strecke EC und definieren F als den Eckpunkt auf
der Geraden BC (verschieden von C) und nennen G den weiteren Eckpunkt.
Dann ist das Dreieck BF E gleichschenklig und also |BF | = |F E|. Damit folgt
|AB| = |BC| = |EC| + |F C|.
Diese beiden Gleichungen bilden den Beginn des euklidischen Algorithmus für
die Längen |AC| und |AB|, wobei vom großen Quadrat ABCD zum kleineren
Quadrat EF GC übergegangen wurde. Setzen wir diese Konstruktion nun fort
(zunächst mit dem Schlagen eines Kreises um F vom Radius |EF |), so ergeben
sich sukzessive weitere, immer kleinere Quadrate; der euklidische Algorithmus
terminiert nicht, d.h. die Längen |AC| und |AB| sind inkommensurabel. Wir
haben also gezeigt:
17
Satz 1.11. Diagonale und Basis eines Quadrates sind inkommensurabel.
Wir können diese Inkommensurabilität auch quantifizieren: Nach dem Satz des
Pythagoras beträgt das Verhältnis von Diagonale und Seite eines Quadrates
√
|AC|/|AB| = 2
√
und obiger Satz beweist die Irrationalität von 2 geometrisch!¶ Der nichtdeterminierende euklidische Algorithmus liefert übrigens einen unendlichen Kettenbruch:
√
2 = |AC|/|AB| = 1 + |EC|/|AB|
1
1
=1+
= 1 + |AB|/|EC|
1 + |F C|/|EC|
...
=
1+
1
2+
1
2+ 1
;
..
.
es ergibt sich der unendliche Kettenbruch mit lauter Zweien als Teilnennern.
Abbildung 13. Die Seitenlängen zweier Quadrate, deren Flächen sich
wie 2 : 1 verhalten sind nicht kommensurabel.
Aufgaben
Aufgabe 11. Zeigen Sie an einem regelmäßigen Fünfeck (Pentagramm), dass das
Verhältnis von Diagonale und Seite inkommensurabel bzw. irrational ist.
Aufgabe 12. Beweisen Sie,
• dass die Seitenlängen zweier Quadrate, deren Flächen sich wie 2 : 1 verhalten
nicht kommensurabel sind (leicht);
• dass die Flächen zweier Kreise mit rationalen Radien kommensurabel sind
(schwierig – und natürlich ohne die bekannte Formel für die Kreisfläche zu
benutzen).
¶
für einen algebraischen Beweis sei an die Elementare Zahlentheorie erinnert!
18
6. Platonische Körper und die Polyederformel
Den Pythagoräern folgte die Schule des großen Philosophen Sokrates. Einer
dessen Schüler war Plato (oder Platon) (∗ 427 - † 347), welcher wiederum auch
für die Mathematik bedeutsam war. Er gründete eine Akademie über deren
Eingang stand geschrieben:
Kein der Geometrie Unkundiger trete ein!
Eines der berühmtesten Mitglieder der Akademie war Aristoteles, Philosoph und
u.a. Erzieher des jungen Alexander, der sich später den Beinamen der Große
gab. Aristoteles’ Ideen beeinflussten die Wissensschaft bis in die Renaissance;
erst zu Zeiten von Kopernikus und Galilei wurden die aristotelischen Schriften
teilweise widerlegt. Ein weiterer Schüler Platos war Theaitetos, dem bedeutende
Einsichten in der räumlichen Geometrie gelangen.
Abbildung 14. Die fünf platonischen Körper von links nach rechts: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder.
Unter einem (dreidimensionalen) Polyeder verstehen wir einen von ausschließlich geraden Flächen (Ebenen) begrenztem Körper. Ein Polyeder heißt
regulär bzw. platonischer Körper, falls alle Seitenflächen kongruente reguläre Vielecke sind und an jeder Ecke gleich viele von ihnen zusammen treffen.
Einige Beispiele solcher sind uns wohlbekannt.
Satz 1.12. Es gibt genau fünf platonische Körper, nämlich Tetraeder, Würfel,
Oktaeder, Dodekaeder und Ikosaeder.∗
Die Entdeckung von Dodekaeder und Ikosaeder sind bemerkenswert und werden
Theaitetos (ca. ∗ 417 - † 369 v.Chr.) zugesprochen; ihre Konstruktion in Buch
XIII bildet einen der Höhepunkte in Euklids Elementen (s.u.). Den Beweis der
Eindeutigkeitsaussage erbringen wir hier auf einem anderen Wege als Euklid,
nämlich mit kombinatorischen Methoden einer Idee Eulers aus dem 18. Jahrhundert folgend. Dieser untersuchte, welche kombinatorischen Gesetzmäßigkeiten Polyeder im dreidimensionalen Raum besitzen. Kann es beispielsweise einen
Polyeder mit 10 Ecken, 25 Kanten und 18 Flächen geben? Nein! Denn:
Satz 1.13 (Eulersche Polyederformel). Gegeben sei ein Polyeder mit genau
e Ecken, f Flächen und k Kanten. Dann gilt
e + f = k + 2.
∗
Eine Bastelanleitung
bayreuth.de//mmlu/gzu
findet
man
im
Internet,
z.B.
auf
http://did.mat.uni-
19
Euler formulierte seine Polyederformel erstmals im Jahre 1750 in einem Brief
an Goldbach. Tatsächlich war diese Formel im Wesentlichen bereits Descartes bekannt. Leibniz sichtete nämlich den Nachlass von Descartes und notierte
eine verwandte Formel; während Descartes’ Papiere verschollen sind, wurden
Leibnizs Aufzeichnungen im 19. Jahrhunder in der Königlich Hannoverschen
Bibliothek wiedergefunden.
Beweis (nach Thurston†). Wir stellen das gegebene Polyeder so in eine leere
Badewanne, dass keine zwei Ecken auf gleicher Höhe sind, womit auch keine
waagerechten Kanten auftreten. Nun lassen wir Wasser in die Wanne fließen.
Immer, wenn der Wasserspiegel eine Ecke übersteigt, werden neue Kanten und
Flächen nass; handelt es sich dabei nicht um die unterste oder oberste Ecke,
werden dabei stets eine Kante mehr nass als Flächen. Bei der untersten Ecke
hingegen sind es gleich viele Kanten wie Flächen; bei der obersten wird gar nichts
Neues nass. Damit ergibt sich nach vollständigem Wassereinlass die Anzahl der
Kanten als Anzahl der Flächen plus einer zusätzlichen Kante pro Ecke, wobei
die oberste und unterste Ecke auszuschließen ist. Also: k = f + e − 2, was zu
zeigen war. •
Nun gelingt der
Beweis von Satz 1.12. Unser Polyeder besitze f Flächen, e Ecken und k
Kanten. Wir erinnern an die Definition eines regulären Polyeders: Jede Fläche ist
ein reguläres n-Eck und von jeder Ecke gehen genau m Kanten aus; jede Kante
berandet zwei Flächen und verbindet zwei Ecken. Also bestehen die Gleichungen
2k = nf und 2k = me. Mit der Eulerschen Polyederformel ergibt sich
2
2
−1+
.
2=f −k+e=k
n
m
1
Also muss die Ungleichung n1 + m
> 12 bestehen. Damit kommen nur 3 ≤ m, n ≤
5 in Frage. Wir notieren für die fünf platonischen Körper:
Tetraeder
Würfel
Oktaeder
Dodekaeder
Ikosaeder
f
4
6
8
12
20
k e m n
6 4 3 3
12 8 3 4
12 6 4 3
30 20 3 5
30 12 5 3
Es ist nicht schwierig zu sehen, dass für andere Werte von m, n besagte Ungleichung nicht besteht, womit die Existenz von genau den oben angeführten fünf
platonischen Körpern erbracht ist. •
Der Beweis ist sehr interessant, benutzt er doch eine kombinatorische Beschreibung von Gestalt und Form. Geometrische Objekte werden auf gewisse mathematische Größen reduziert; die Schlussweise basiert letztendlich auf einer
†
siehe hierzu auch C. Blatter, G.M. Ziegler, Eulers Polederformel, und die Arithmetisierung der Gestalt, www.math.eth.ch/∼blatter/Mathesis.pdf
20
Ungleichung für eben diese Kenngrößen. Diese Idee, sich auf die wesentlichen
Daten eines geometrischen Objektes zu konzentrieren, wurde von Euler auch
bei seiner Behandlung des Königsberger Brückenproblems gewinnbringend eingesetzt, womit er u.a. die Topologie begründete.
Abbildung 15. Das Königsberger Brückenproblem: Existiert ein Rundweg durch Königsberg (heute Kaliningrad), welcher jede der sieben Brücken
über den Fluss Pregel genau einmal überquert?
Übrigens: Der Architekt und Designer Buckminster Fuller konstruierte
geodätische Kuppeln wie etwa den buckyball C60 , ein abgestumpftes Ikosaeder
mit einer Oberfläche bestehend aus zwölf regulären Fünf- und zwanzig regulären
Sechsecken.‡ Den Hintergrund bilden die so genannten Fullerene, also sphärische Moleküle von Kohlenstoffen, welche zuerst von Osawa 1970 vorausgesagt
wurden.
Zur weiteren Flächen- und Volumenberechnung von regelmäßigen Körpern
haben wir in der Analysis mit dem Integralkalkül ein wichtiges Konzept kennen gelernt. Oft genug hilft aber auch elementare Geometrie: Ein regelmäßiges
Sechseck mit Seitenlänge a lässt sich in sechs gleichseitige Dreiecke zerlegen. Da
für deren Höhe h jeweils
a 2 3
= a2
h2 = a2 −
2
4
√
gilt, ergibt sich für den Flächeninhalt des regelmäßigen Sechsecks 3 2 3 a2 . Selbiges für das regelmäßige Fünfeck zu berechnen ist bereits schwieriger (hier
gibt es ein Wiedersehen mit dem aus der elementaren Zahlentheorie bekannten
goldenen Schnitt).
Der Satz von Pick aus dem Jahre 1899 erlaubt eine einfache Berechnung
des Flächeninhaltes von Polygonen durch Abzählen von Gitterpunkten. Dazu
‡
welchem gewisse Fußbälle nachempfunden sind!
21
sei P ein Polygon, welches nur Eckpunkte mit ganzzahligen Koordinaten in der
Ebene besitze. Der Rand des Polygons sei so beschaffen, dass das Innere eine
zusammenhängende Menge sei. Es bezeichne i(P ) die Anzahl der Gitterpunkte
(x, y) ∈ Z2 im Inneren von P und r(P ) die Anzahl der Gitterpunkte auf dem
Rand von P . Dann gilt der erstaunliche Satz
Satz 1.14 (Satz von Pick). Ein Polygon, welches den obigen Voraussetzungen
genügt, besitzt Flächeninhalt
Fläche(P ) = i(P ) + 12 r(P ) − 1.
Beweisskizze. Zunächst verifiziert man leicht die Formel des Satzes für achsenparallele Rechtecke. Ebenso gilt die Aussage für rechtwinklige Dreiecke mit
achsenparallelen Katheten. Als Nächstes mache man sich klar, dass im Falle von
zwei Polygonen P1 und P2 , die beiden den Voraussetzungen des Satzes genügen,
und welche eine Strecke als gemeinsame Schnittmenge besitzen, die Formel auch
für die Vereinigung P = P1 ∪P2 gilt. Nun ergibt sich so, dass der Satz für beliebige Dreiecke richtig ist, solange die Voraussetzungen erfüllt sind. Schließlich folgt
die allgemeine Aussage per Induktion nach der Anzahl der Ecken von P ; beim
Induktionsschritt zerlegt man P dabei in zwei geeignete Polygone mit weniger
Ecken. •
Abschließend wollen wir noch die Arbeit des womöglich innovativsten griechischen Mathematikers betrachten. Archimedes (ca. ∗ 287 - † 212 v.Chr.) ist
bekannt für sein vielfältiges Wirken in Physik, Ingenieurswesen und natürlich
Mathematik. Unvergessen ist sein Eureka! im Bad, welches der Physik das archimedische Prinzip bescherte und ebenso legendär sein bonmot Störe meine
Kreise nicht!, adressiert an einen römischen Soldaten, der ihn der Überlieferung
zufolge hierfür ins Jenseits beförderte. Wir wollen hier Archimedes’ Arbeit zur
Kreisfläche beleuchten.
Archimedes’ Idee zur Kreismessung basiert auf einer Zerlegung des Kreises
in Sektoren gleichen Winkels und Approximation derselben durch entsprechende Dreiecke; damit wird der Kreis also durch ein reguläres Vieleck angenähert!
So sind beispielsweise beim regulären Achteck die Winkel der jeweiligen acht
Dreiecke π4 und (zweimal) 3π
8 . Legen wir einen Kreis vom Radius 1 zu Grunde.
√
2
ergibt sich so
2 und dem Cosinussatz√
2
4 . Damit erhalten wir 2 2 = 2, 82 . . .
Unter Verwendung von sin π4 = cos π4 =√
die Fläche eines solchen Dreiecks als
als Approximation an die Einheitskreisfläche. Insofern wird also die Kreisfläche
durch die Fläche des einbeschriebenen Polygons approximiert und mit wachsender Eckenanzahl des Polygons ergibt sich eine beliebige Genauigkeit. Ebenso
kann man natürlich auch mit einem umschreibenden Polygon arbeiten, welches
den Kreis berührt. Auf diese Art und Weise erzielt Archimedes mit regulären
96-Ecken die Näherungen
10
= 3, 14084 . . . <
3 71
π = 3, 14159 . . .
< 3 17 = 3, 14285 . . .
22
Abbildung 16. Ein einem Kreis einbeschriebenes regelmäßiges Achteck.
Erst Jahrhunderte später wurden bessere rationale Näherungen an die Kreiszahl
π gefunden (mit Hilfe von Kettenbrüchen; vgl. Elementare Zahlentheorie). Archimedes’ Exhaustionsmethode kann als ein Vorläufer der Integrationsrechnung
angesehen werden.
Aufgaben
Aufgabe 13. Mit welchen regelmäßigen n-Ecken kann eine Ebene parkettiert werden?
Aufgabe 14. Untersuchen Sie, ob beim Fußball (gebildet aus regelmäßigen Fünf- und
Sechsecken) die Eulersche Polyederformel Bestand hat!
Aufgabe 15. In wie viele Pyramiden zerlegen die Diagonalen zwischen gegenüber liegenden Ecken eines Würfels denselben?
Aufgabe 16. Ein so genanntes Möbiusband besteht aus einer Fläche und einer Kante, aber keiner Ecke, ist also kein Polyeder. Können Sie ein solches Möbiusband basteln?
Forschen Sie ferner in der Bibliothek oder im Internet nach der Kleinschen Flasche...
Aufgabe 17. Auf Archimedes’ Grabstein sollen der Überlieferung nach ineinander
geschachtelt ein Zylinder, eine Kugel und ein Kegel von jeweils gleicher Höhe und gleicher Kreisgrundfläche eingemeisselt gewesen sein. In welchem Verhältnis stehen diese
Körper?
7. Euklids Elemente und die Axiomatisierung der Mathematik
Während über das Leben des Euklid von Alexandria (ca. ∗ 325 - † 265
v.Chr.) nur wenig bekannt ist, bilden seine aus 13 Bänden bestehenden Elemente das meistverbreitetste und einflussreichste Mathematiklehrbuch aller Zeiten.
Euklid systematisierte mit seinen Elementen das mathematische Wissen seiner
23
Zeit (soweit wir es heute beurteilen können). Die Elemente bilden damit das
Fundament für die moderne Mathematik. Vieles von dem was wir bislang behandelt haben, ist in den Elementen zu finden (z.B. ist Satz 32, Buch I, der
Satz über die Winkelsumme): Euklid behandelt
• Planimetrie: Geometrie der Ebene und der Figuren in der Ebene
(enthält beispielsweise die Satzgruppe des Pythagoras).
• Stereometrie: Geometrie im Raum sowie krperlicher Figuren; hier werden die platonischen Körper mit Zirkel und Lineal konstruiert (ein
Thema, dem wir uns anschließend noch widmen werden).
• Arithmetik: Dies ist elementare Zahlentheorie (inkl. dem euklidischen
Algorithmus und dem Beweis der Existenz unendlich vieler Primzahlen).
• Proportionenlehre: Hier verbirgt sich Eudoxos’ Theorie der kommensurable und inkommensurablen Größen.
Das Revolutionäre seines Werkes jedoch ist die strenge axiomatische Begründung der Geometrie. Neben Definitionen kommen zu Anfang so genannte
Axiome, also Aussagen, die nicht bewiesen werden, aus denen heraus aber alles
weitere folgt, nämlich Definitionen sowie Sätze und deren Beweise; in jedem
Beweis darf dabei (außer den Axiomen) nur verwendet werden, was zuvor bewiesen wurde. Dieser deduktive Aufbau der Mathematik ist bis in die heutige
Zeit richtungsweisend! Die Elemente waren nicht umsonst für lange Zeit der
Prototyp für ein mathematisches Lehrbuch schlechthin.
Beispielsweise beginnt der erste Band der Elemente mit folgenden Definitionen:
(i)
(ii)
(iii)
(iv)
(v)
(vi)
(vii)
(viii)
(ix)
(x)
(xi)
(xii)
Ein Punkt ist, was keine Teile hat.
Eine Linie breitenlose Länge.
Die Ende einer Linie sind Punkte.
Eine gerade Linie (Strecke) ist eine solche, die zu den Punkten auf
ihr gleichmäßig liegt.
Eine Fläche ist, was nur Länge und Breite hat.
Die Enden einer Fläche sind Linien.
Eine ebene Fläche ist eine solche, die zu den geraden Linien
gleichmäßig liegt.
Ein ebener Winkel ist die Neigung zweier Linien in einer Ebene gegeneinander, die einander treffen, ohne einander gerade fortzusetzen.
Wenn die den Winkel umfassenden Linien gerade sind, heißt der Winkel geradlinig.
Wenn eine gerade Linie, auf eine gerade Linie gestellt, einander gleiche
Nebenwinkel bildet, dann ist jeder der beiden gleichen Winkel ein
rechter; und die stehende gerade Linie heißt senkrecht zu (Lot auf)
der, auf der sie steht.
Stumpf ist ein Winkel, wenn er größer als ein rechter ist.
Spitz, wenn kleiner als ein rechter.
24
Es folgen noch weitere Definitionen, die jedoch für das Weitere unerheblich sind.
Es schließen sich Postulate an. In diesen wird gefordert
(i) dass man von jedem Punkt nach jedem Punkt die Strecke ziehen kann,
(ii) dass man eine begrenzte gerade Linie zusammenhängend gerade
verlängern kann,
(iii) dass man mit jedem Mittelpunkt und Abstand den Kreis zeichnen
kann,
(iv) dass alle rechten Winkel gleich sind, und
(v) das Parallelenaxiom, dass nämlich, wenn eine gerade Linie beim
Schnitt mit zwei geraden Linien bewirkt, dass innen auf derselben
Seite entstehende Winkel zusammen kleiner als zwei Rechte werden,
dann die zwei geraden Linien bei Verlängerung ins Unendliche sich
treffen auf der Seite, auf der die Winkel liegen, die zusammen kleiner
als zwei Rechte sind.
Hier sei insbesondere auf das Parallelenaxiom hingewiesen; seine Formulierung
ist wesentlich länger als die der anderen. Sämtliche Versuche, dieses aus den
anderen herzuleiten, scheiterten, so dass schließlich über Modelle nachgedacht
wurden, wie eine Geometrie ohne dieses aussehen könnte.§
Und es folgen weitere Axiome:
(i) Was demselben gleich ist, ist auch einander gleich.
(ii) Wenn Gleichem Gleiches hinzugefügt wird, sind die Ganzen gleich.
(iii) Wenn von Gleichem Gleiches weggenommen wird, sind die Reste
gleich.
Auch hier folgen noch einige weitere Axiome, die wir aber nicht angeben wollen.
Lange Zeit blieb die Geometrie trotz der Elemente stark der Anschaulichkeit verhaftet. Erst mit Hilberts Grundlagen der Geometrie von 1899 wurde eine vollständige moderne axiomatische Begründung der euklidischen Geometrie
gegeben. Er entwarf hierzu ein vollständiges Axiomensystem und entwicklete
hieraus das Gesamtgebäude der Geometrie (soweit damals bekannt). Die Begriffe, die Hilbert verwendet, heißen zwar noch Punkt, Gerade, Ebene, besitzen
jedoch im Gegensatz zu Euklids Elementen keinerlei Bezug zur Anschauung;
hatte es bei letzterem doch z.B. ’Ein Punkt ist, was keine Teile hat’ geheißen.
Hilberts Begriffe Punkt, Gerade, Ebene könnten also durch beliebige Ausdrücke
wie Tisch, Stuhl, Bierseidel ersetzt werden. Hilbert war einer der bedeutendsten Vertreter des so genannten Formalismus, wonach Mathematik aus einem
gegebenen Axiomen- und Regelwerk durch striktes logisches Schlussfolgern entsteht. Dem gegenüber behauptet der Realismus bzw. Platonismus mit prominenten Vertretern wie Plato, Erdös und Gödel, dass Mathematik nicht erfunden
sondern vielmehr entdeckt wird.
§
womit wir uns in der Vorlesung Vertiefung Mathematik im WS 2012/13 noch beschäftigen
wollen
25
Aufgaben
Aufgabe 18. Euklids Proposition 1 in Buch I fragt nach der Konstruktion eines gleichseitigen Dreiecks über einer gegebenen Strecke mit ausschließlich Zirkel und Lineal.
Realisieren Sie dies!
Aufgabe 19. Bereits im Schulunterricht lernt man: Sind von einem Dreieck bekannt
die Längen bzw. Größen
(sss)
(sws)
(wsw)
(Ssw)
dreier Seiten,
zweier Seiten und des eingeschlossenen Winkels,
einer Seite und der beiden anliegenden Winkel,
zweier Seiten und des der größeren Seite gegenüberliegenden Winkels,
so kann dieses Dreieck eindeutig konstruiert werden (vgl. das Schulbuch von Kratz &
Wörle bzw. die Monographie von Scheid & Schwarz, §I.3). Führen Sie diese Konstruktionen explizit durch!
8. Was lässt sich mit Zirkel und Lineal konstruieren?
Bereits Pythagoras und seine Schule konstruierte das reguläre Fünfeck. Euklid gibt in seinen Elementen ebenfalls diese Konstruktion an und zeigt, dass
sich die Seiten im Pentagramm im Verhältnis des goldenen Schnittes teilen (siehe Aufgabe 10 und auch das Skript von Johannson). In diesem Kontext sei
folgende allgemeinere Aufgabe gestellt:
•
Gegeben eine ganze Zahl n ≥ 3, konstruiere ein reguläres n-Eck.
Für n = 3 und n = 4 ist dies trivial; ebenso für Produkte dieser n mit beliebigen Zweierpotenzen (siehe Aufgabe). In seinem Buch Underweysung in der
messung mit dem zirckel und richtscheyt in Linien ebnen und gantzen corporen
gibt der bekannte fränkische Künstler Albrecht Dürer (∗ 1471 - † 1528) mit
expliziten Konstruktionen des regulären Fünfecks und approximativen Methoden für beliebige reguläre n-Ecke seinen Einstand als Mathematiker. Weitere
Themen, die er behandelt sind die Zentralperspektive und Kegelschnitte (zwei
Gebiete, die wir später noch untersuchen werden). Als Achtzehnjähriger gelang
Gauß schließlich die Charakterisierung all der natürlichen Zahlen n, zu denen
ein reguläres n-Eck mit Zirkel und Lineal konstruiert werden kann: nämlich
genau für die n, die sich darstellen lassen als Produkt einer Zweierpotenz und
k
verschiedener so genannter Fermatscher Primzahlen p = 22 + 1, wobei k eine
nicht negative ganze Zahl bezeichne. Bislang sind mit
3 = 21 + 1,
5 = 22 + 1, 17 = 24 + 1, 65 537 = 216 + 1
nur insgesamt vier solche Fermatsche Primzahlen bekannt und es wird vermutet,
dass es keine weiteren gibt.¶
Bevor wir weitere Konstruktionsprobleme ansprechen, präzisieren wir
zunächst, welche Operationen überhaupt zur Konstruktion herangezogen werden dürfen:
¶
Ein reguläres Siebzehneck ziert die Gauß-Statue am Gauß-Berg in Braunschweig.
26
Abbildung 17. Ein regelmäßiges Fünfeck aus Dürers underweysung; für
die Konstruktion konsultiere man etwa Stilwells Buch.
• Zwei verschiedene Punkte P, Q lassen sich (mit dem Lineal) durch eine
eindeutig bestimmte Gerade P Q verbinden.
• Der Abstand |P Q| von zwei verschiedenen Punkten P, Q lässt sich (mit
dem Zirkel abgreifen und) übertragen
• Zu jeder Geraden g und jedem Punkt P (auf oder außerhalb von g) lässt
sich eine zu g orthogonale (senkrechte) Gerade h durch P konstruieren. Durch
Wiederholung entsteht das Mittellot oder die Mittelsenkrechte einer Strecke.
• Gegeben ein Winkel, so lässt sich dieser halbieren; insbesondere können
Winkel der Form 2mn π mit natürlichen Zahlen m, n konstruieren.
• Gegeben eine Gerade g und ein Punkt P 6∈ g, lässt sich eine Gerade h
durch P konstruieren, die g nicht schneidet (also g ∩ h = ∅). Die Existenz einer
solchen Geraden h, die wir natürlich eine Parallele von g nennen, folgt aus
Euklids Parallelenaxiom (s.o.).
Desweiteren lassen sich Punkt- und Geradenspiegelungen sowie Translationen
als Hintereinanderführung von Spiegelungen an parallelen Geraden und Drehungen konstruieren; dies werden wir aber ausführlich im folgenden Kapitel behandeln. Eine wichtige Anmerkung: All diese Konstruktionen sind ausschließlich
mit Zirkel und Lineal auszuführen!
Die folgenden weiteren klassischen Konstruktionsprobleme gehen wohl auf
Anaxagoras und Hippokrates zurück:
• Quadratur des Kreises: Gegeben ein Kreis, konstruiere man ein
flächengleiches Quadrat.
• Verdopplung des Würfels: Gegeben ein Würfel, konstruiere einen
Würfel mit doppeltem Volumen (auch als Delisches Problem bekannt).
27
• Dreiteilung des Winkels: Gegeben ein Winkel, konstruiere man einen
Winkel der ein Drittel des gegebenen Winkels ist.
Die letzten beiden Probleme wurden erstmals durch Pierre Wantzel im Jahre
1837 negativ beantwortet.k Die negative Lösung der Kreisquadratur geht auf
Lindemann zurück,∗∗ welcher zeigte, dass π sogar transzendent ist, also keiner
polynomiellen Gleichung genügt, welches wiederum nachsichzieht, dass eben
kein zu einem gegebenen Kreis flächengleiches Quadrat konstruiert werden kann.
Mascheroni bewies übrigens, dass alle Kosntruktionen mit Zirkel und Lineal sich
bereits einzig mit Zirkel realisieren lassen (siehe hierzu das Buch von Courant &
Robbins). Unter Zuhilfenahme gewisser algebraischer Kurven lassen sich jedoch
einige der oben genannten Konstruktionsprobleme positiv lösen.
Aufgaben
Aufgabe 20. Konstruieren Sie ein reguläre Fünf-, Zehn- und Zwölfecke.
Aufgabe 21. Lösen Sie die Konstruktionsaufgabe, ein Rechteck zu quadrieren, d.h. zu
einem gegebenen Rechteck ist unter Verwendung von ausschließlich Zirkel und Lineal
ein flächengleiches Quadrat zu konstruieren. (Dies ist Proposition 14 aus Band II aus
Euklids Elementen.)
Abbildung 18. Das Möndchen des Hippokrates
Aufgabe 22. In einen Halbkreis zeichne man ein gleichschenkliges Dreieck und erichte
weitere Halbkreise über den Katheten des Dreieckes (wie in Abbildung 18). Das Möndchen des Hippokrates ist dann die durch die beiden Kreisbögen begrenzte Figur.
Berechnen Sie den Flächeninhalt des Möndchens. Inwiefern kann man dies als ein
Versuch der Quadratur des Kreises interpretieren?
k
Die Unmöglichkeit der Würfelverdopplung wird ein Thema der Veranstaltung Vertiefung
Mathematik im WS 2012/13 sein.
∗∗
welcher um 1875 an der Würzburger Universität tätig war!
28
9. Die Algebraisierung der Geometrie durch Descartes und Fermat
Gegeben sei eine Strecke AB, gesucht ist ein Punkt C auf dieser Strecke
mit der Eigenschaft, dass
|AB| · |BC| = |AC|2 .
(1)
Wir wollen diese Konstruktionsaufgabe geometrisch lösen, also ausschließlich
unter Verwendung von Zirkle und Lineal! Hierzu bilden wir das Quadrat der
Strecke |AB|, nennen den diagonal B gegenüberliegenden Punkt D, halbieren
daraufhin die Strecke AD und nennen den entsprechenden Punkt E. Dann schlagen wir einen Kreis vom Radius |EB| um E und finden einen Schnittpunkt F
auf der Geraden durch A und D oberhalb von A. Schließlich gibt der Schnittpunkt des Kreises vom Radius |AF | um A mit AB den gesuchten Punkt C
(vgl. Abbildung 19). Zur Verifikation bilden wir zu den Punkten A, C, F ein
Rechteck und nennen den A diagonal gegenüberliegenden Eckpunkt G. Mit der
Satzgruppe des Pythagoras errechnet sich
|F D| · |F G| + |AE|2 = |EF |2 = |EB|2 = |AB|2 + |AE|2
und
|F D| · |F G| = |AB|2 ,
woraus sich |AC|2 = |AD| · |BC| = |AB| · |BC|, also (1) ergibt. Dies ist
tatsächlich eine Lösung einer quadratischen Gleichung im Sinne der griechischen
Mathematik!
Abbildung 19. Geometrische Lösungen quadratischer Gleichungen;
rechts ein Beispiel quadratischer Ergänzung.
Das Rechnen mit Buchstaben verdanken wir Francois Vieta (∗ 1540 - †
1603).∗ Schreiben wir a = |AB| und x = |AC|, so überträgt sich (1) in die
∗
Vokale für unbekannte Größen und Konsonanten für bekannte
29
algebraische Gleichung
a(a − x) = x2
bzw.
x2 + ax − a2 = 0,
welche in der Unbekannten
x zu lösen ist. Hier finden sich unschwer die Lösun√
a
gen x = 2 (−1 ± 5), ein unverhofftes Wiedersehen mit dem goldenen Schnitt,
welches auch zur Konstruktion des regelmäßigen Fünfecks herangezogen werden
kann. Tatsächlich finden sich solche Aufgaben (wenngleich auch nicht in Form
von Buchstaben) bereits in der Arithmetica von Diophant† und bei diversen arabischen Mathematikern des Mittelalters. Tatsächlich befand sich Europa nach
dem Untergang des römischen Reiches in einem lange anhaltenden kulturellen
Tiefschlaf, während in der arabischen Welt die Wissenschaft blühte. Der Mathematiker al-Hwārizmı̄‡ entdeckte, wie sich beliebige quadratische Gleichungen
¯
geometrisch explizit lösen lassen: Sei die Gleichung
X 2 + 10X − 144 = 0
gegeben. Dann interpretieren wir die Terme X 2 und 10X als Flächen eines Quadrates bzw. zweier Rechtecke mit Seitenlängen X bzw. 5 und X und ergänzen
deren Summe zu einem Quadrat mit Seitenlänge X + 5 (gemäß Abbildung 19).
Diese geometrische Idee nennt man (aus nahe liegenden Gründen) quadratische Ergänzung, wird aber oft leider nur noch als eine algebraische Umformung wahrgenommen (vgl. Elementare Zahlentheorie).
Bis hierhin ist Geometrie im Wesentlichen eine Kulturleistung der alten
griechischen Mathematik! Natürlich ist unsere Zusammenstellung dabei nicht
erschöpfend gewesen; gewisse Errungenschaften sind sicherlich unerwähnt geblieben und auch haben wir die Leistungen der arabischen Mathematik nicht
hinreichend gewürdigt. Nun wollen wir jedoch die Renaissance der Geometrie
zu Beginn der Neuzeit etwas genauer betrachten.
Der berühmte Philosoph§ und Mathematiker René Descartes (∗ 1596 - †
1650) veröffentlichte sein Buch ’La geométrie’ im Jahre 1637, welches bis heute als die Geburtsstunde der analytischen Geometrie gilt. Hier führt Descartes
Koordinaten ein: Damit können Punkte in der Ebene (oder im Raum) durch
Paare (oder Tripel) von Zahlen beschrieben werden. Mit Hilfe dieser Koordinaten kann nun Geometrie mit den mächtigen Werkzeugen der Algebra behandelt
werden. Descartes zu Ehren heißt jedes Koordinatensystem mit senkrecht aufeinander stehenden Achsen kartesisch. Bereits 1629 hat Pierre de Fermat (∗
1607/08(?) - † 1665) einen ähnlichen Ansatz verfolgt, doch der Hobbymathematiker hat seine Ideen nicht veröffentlicht. Beide Ansätze versuchen das Bildhafte
und Anschauliche durch das Konkrete und Örtliche zu ersetzen.
”Geometry is the science of correct reasoning on incorrect
figures.” (George Pólya)
†
der wohl im dritten Jahrhundert lebte, über den aber leider nur wenig bekannt ist
gilt als Begründer der Algebra und Namensgeber für das Wort ’Algorithmus’
§
’cogito, ergo sum!’
‡
30
Dieses berühmte Zitat verliert durch den analytischen Ansatz seine Bedeutung.
Jedes geometrische Objekt und jede geometrische Operation wird auf ein Zahlensystem bezogen und damit quantifiziert! Die entscheidende technische Invention hierzu ist die Beschreibung durch Koordinaten. Beispielsweise lässt sich ein
Kreis in der Ebene um den Mittelpunkt (x0 , y0 ) vom Radius r durch die Menge
aller Punkte (x, y) beschreiben, die der algebraischen Gleichung
(x − x0 )2 + (y − y0 )2 = r 2
genügen. Mit dieser Algebraisierung der Geometrie lassen sich beispielsweise
die Schnittpunkte eines Kreises mit einer Geraden bestimmen (ein triviales Beispiel mit dem wir bereits die rationalen Punkte auf dem Einheistkreis bestimmt
hatten). Und der Satz von Pick über den Flächeninhalt von Polygonen ist ein
weiteres Beispiel vom Nutzen von Koordinaten oder auch die rationalen Punkte
auf dem Einheitskreis.
Abbildung 20. Dieses vierblättrige Kleeblatt ist gegeben durch die Gleichung (X 2 + Y 2 )2 − 4X 2 Y 2 = 0.
Weitere Vorläufer von Fermat und Descartes sind Vieta und bereits Nicolas
Oresme (∗ 1320 - † 1382). Einen immensen Ausbau dieses Ansatz leistete Euler;
einen späteren wichtigen Impuls war die durch Grassmann geschaffene lineare
Algebra (um ca. 1844) und die damit verbundenen Begriffe Vektoren, Basis,
Dimension, und vieles mehr mit dem wir uns im folgenden Kapitel beschäftigen
werden...
31
Aufgaben
Aufgabe 23. Leiten Sie die obige Kreisgleichung aus Ihren Kenntnissen der Schulgeometrie her!
10. Sangakus
Während sich in Europa die analytische Geometrie entwickelte, ist eine
völlig andere Art von Geometrie in Japan entstanden. In der so gennanten EdoPeriode von 1603 bis 1868 isolierte sich Japan weitgehend. Nachdem ein jahrhundertelanger Brgerkrieg berstanden war, befriedete Shōgun Tokugawa Japan
durch drastische Maßnahmen. Die zerstrittenen Fürsten wurden entmachtet,
Handelsbeziehungen wurden extrem eingeschränkt, das Christentum verboten
und der Aufenthalt europäischer Ausländer komplett untersagt. Die Kriegerkaste der Samuari nutzte ihre gewonnene Freizeit und erstellte mathematische,
meist geometrische Rätsel, die auf kleinen Holztafeln – so genannten sangakus
– in Tempeln oder Schreinen ausgestellt wurden und zum Lösen derselben einluden. Trotzdem sei erwähnt, dass diese kulturelle Hochphase großartige professionelle Mathematiker hervorgebracht hat. Beispielsweise gelangen Seki Kowa (∗
1640 - † 1702) diverse Entdeckungen vor europäischen Zeitgenossen: die Determinante vor Leibniz, die Bernoulli-Zahlen vor den Bernoullis; auch entwickelte
er Differential- und Integralrechnung zeitgleich zu Leibniz und Newton.
Hier nun ein Beispiel der japanischen Tempelgeometrie: In Abbildung 21
sind die Radien r < R der Kreise in Abhängigkeit von der Kantenlänge a des
Quadrates gesucht. Die Lösung ergibt sich leicht durch Anwenden des Satzes von
Abbildung 21. Ein bekanntes sangaku von 1895 aus dem Distrikt Fukushima.
1
39
Pythagoras als r = 16
a und R = 320
a. Tatsächlich sind auf diesem spielerischen
Wege auch gewisse tiefere Sätze der Geometrie entdeckt worden, die zeitgleich
32
oder sogar später in der europäischen, mehr der wissenschaftlichen Entwicklung
verschreibenen Geometrie gefunden wurden (z.B. der Satz von Casey).∗
Aufgaben
Aufgabe 24. Für die Radien r1 , r2 , r3 der Kreise in Abbildung 22 (von links nach
rechts) ist √1r2 = √1r1 + √1r3 zu zeigen!
Abbildung 22. Ein schönes sangaku von 1824.
Aufgabe 25. Denken Sie sich ein eigenes sangaku aus und stellen Sie dies als Aufgabe
in Ihrem Freundeskreis!
∗
Für dies und weitere Beispiele dieser auf Ästhetik fokussierten Geometrie ohne praktischen Nutzen verweisen wir auf die Zulassungsarbeit von Christiane Hartmann, Sangaku –
Japanische Tempelgeometrie, www.mathematik.uni-wuerzburg.de/∼steuding/sonstiges.html.
KAPITEL 2
Analytische Geometrie in euklidischen Räumen
Ein zentrales Thema der linearen Algebra und analytischen Geometrie sind
die euklidischen Vektorräume; in diesen ist Längen- und Winkelmessung und
damit ein sehr konkreter Zugang zur Geometrie möglich. Der allgemeine Begriff
des Vektorraumes wurde erst im 19. Jahrhundert durch Graßmann eingeführt,
während die Untersuchungen zur analytischen Geometrie (wie auch im ersten
Kapitel erwähnt) bereits mit der Einführung von Koordinaten durch Descartes
und Fermat einsetzen. Unser Zugang ist im Folgenden eher stromlinienförmig
und also weniger historisch motiviert. Wir beginnen deshalb mit einer kurzen
Wiederholung linearer Algebra...
Unsere Universen sind dabei die reellen Vektorräume Rn := R ×. . .× R (also
das n-fache kartesische Produkt der Menge der reellen Zahlen). Die Elemente
sind Vektoren, die als Zeilenvektoren (x1 , . . . , xn ) oder auch als Spaltenvektoren
auftreten, welche wir komponentenweise addieren können und mit einem reellen
Skalar multiplizieren können:
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ),
λ · (x1 , . . . , xn ) := (λx1 , . . . , λxn )
(λ ∈ R).
Mit dieser Vektoraddition und skalaren Multiplikation ist Rn ein ndimensionaler Vektorraum (vgl. Lineare Algebra). Punkte im Rn werden wir
(meist) durch Angabe von Koordinaten identifizieren; wir mögen sie auch als
Vektoren interpretieren, wobei ein Vektor aber auch als Äquivalenzklasse von
gerichteten Strecken (genauer: Pfeile gleicher Länge und gleicher Richtung) aufgefasst werden kann, die an jeden Punkt anzuheften sind. Allerdings wollen wir
diese verschiedenen Sichtweisen nicht thematisieren.
1. Lineare Gleichungssysteme
Gegeben sei ein System zweier linearer Gleichungen in zwei veränderlichen
Größen x und y:
a11 x + a12 y = b1 ,
a21 x + a22 y = b2 ,
wobei die Zahlen aij , bi allesamt reell seien. Dann lässt sich dieses lineare Gleichungssystem bekanntlich in die Form
x
A
=b
y
33
34
umschreiben, wobei A = (aij ) die 2 × 2-Matrix mit den Koeffizienten aij ist
und b der Spaltenvektor gebildet aus den Zahlen bi . Die lineare Algebra zeigte,
dass dieses System genau dann eine Lösung ( xy ) besitzt, wenn die Ränge von A
und der um b erweiterten Matrix (A, b) gleich sind (bzw. wenn b im Erzeugnis
der Spaltenvektoren von A liegt). Ferner existiert genau dann eine eindeutige
Lösung, wenn der Rang von A gleich zwei ist, bzw. wenn die Determinante von
A nicht verschwindet.
Nun wollen wir dieses lineare Gleichungssystem geometrisch interpretieren.
Eine jeder der individuellen Gleichungen beschreibt eine Gerade im R2 (wobei
wir davon ausgehen wollen, dass nicht beide Koeffizienten verschwinden). Damit
besteht die Lösungsmenge des Gleichungssystems genau aus den Punkten, die
auf beiden Geraden liegen. Nun können zwei Geraden in der Ebene
• identisch sein,
• sich in genau einem Punkt schneiden,
• parallel liegen (ohne gemeinsamen Punkt).
Also tritt der zweite Fall genau dann ein, wenn die Koeffizientenmatrix A eine nicht-verschwindende Determinante besitzt. In den anderen beiden Fällen
besitzen die Geraden dieselbe Steigung und die zugehörigen Koeffizienten bilden linear abhängige Spaltenvektoren von A. Mit der Determinante können also
lineare Abhängigkeiten entdeckt werden!
Übrigens sind auch lineare Ungleichungssysteme interessant. Ihre Lösungsmengen (wenn existent) lassen sich mit Hilfe von Polygonen beschreiben; mit
der Simplexmethode (siehe Fischers Buch) lassen sich die Randpunkte finden,
welche ein Extremwertproblem lösen. Solcher Art Anwendungen spielen bei Optimierungsfragestellungen eine wichtige Rolle.
Aufgaben
Aufgabe 26 (Staatsexamen: Frühjahr 2003, Thema 1, Aufgabe 2).
2
a) Zeigen Sie, dass die Menge ℓ aller (s, t) ∈ R , für die das lineare Gleichungssystem
x1 + x2 − 2x3
2x1 + x2 − 3x3
3x1 − 3x2
=
s2
=
st
=
t2
lösbar ist, eine Gerade ist!
b) Bestimmen Sie für (s, t) ∈ ℓ die allgemeine Lösung des obigen Gleichungssystems!
Aufgabe 27. Welche Lösungen besitzt das folgende lineare Ungleichungssystem:
3x − 5y
−x + 2y
≤
≤
Welches geometrische Objekt steckt dahinter?
1,
2.
35
2. Geraden und Ebenen
Wir präzisieren und ergänzen einige Aussagen des vorangegangenen Paragraphen. Wir beginnen mit der Definition einer Geraden (obwohl wir bereits
regen Umgang mit denselben hatten): Eine Teilmenge G ⊂ Rn heißt Gerade,
wenn es Vektoren v, w ∈ Rn existieren mit w 6= 0 und
G = v + Rw := {u ∈ Rn : u = v + λw mit λ ∈ R}.
Dabei ist die Abbildung λ 7→ λw bijektiv, weil w nicht der Nullvektor ist. In
dieser Parameterform der Geraden heißt v Ortsvektor und w Richtungsvektor von G. Tatsächlich stehen hier u und v für spezielle Punkte im Rn ,
wogegen w einen Vektor im Sinne einer gerichteten Strecke ist: der Punkt u ist
dann durch Anhängen eines Vielfachens λw dieser Strecke an den Fußpunkt v
gegeben.
Satz 2.1.
(i) Sei G = v + Rw eine Gerade und v ′ ∈ G, dann gilt G = v ′ + Rw.
(ii) Zwei Geraden G = v + Rw und G′ = v ′ + Rw′ stimmen genau dann
überein, wenn ihr Schnitt nicht-leer ist und ihre Richtungsvektoren
linear abhängig sind (d.h. ein β ∈ R mit w′ = βw existiert).
Beweis. Zu Aussage (i): Nach Vorausetzung gibt es ein λ′ ∈ R mit v ′ = v +λ′ w.
Für x = v + λw ∈ G gilt dann
′
x = v + λw + λ
− λ′ w} = |v +{zλ′ w} +(λ − λ′ )w ∈ v ′ + Rw,
| w {z
=v′
=0
v′
und somit G ⊂
+ Rw. Für die umgekehrte Inklusion sei x = v ′ + λw mit
beliebigem λ ∈ R gegeben, dann gilt
x = v + λ′ w + λw = v + (λ + λ′ )w ∈ G.
Für den Nachweis von (ii) gehen wir zunächst von G = G′ aus. Dann gilt
sicherlich G ∩ G′ 6= ∅. Wegen v ′ ∈ G′ = G gibt es ein λ′ ∈ R mit v ′ = v + λ′ w
und ähnlich folgt über v ′ + w′ ∈ G′ = G dann v ′ + w′ = v + λ′′ w für ein λ′′ ∈ R.
Dies liefert
w′ = v + λ′′ w − v ′ = v + λ′′ w − (v + λ′ w) = (λ′′ − λ′ )w.
Also gilt w′ = βw mit β = λ′′ − λ′ ∈ R, welches von null verschieden ist,
da w′ nicht der Nullvektor ist. Für die umgekehrte Implikation existiert ein
u ∈ G ∩ G′ und nach (i) gilt G = u + Rw sowie G′ = u + Rw′ . Daraus folgt nun
für x = u + λw ∈ G leicht
λ
λ
x = u + λw = u + · βw = u + w′ ∈ G′ ,
β |{z}
β
=w ′
also G ⊂
G′ .
Analog zeigt sich
G′
⊂ G, womit die Gleichheit G = G′ folgt. •
Als Nächstes beweisen wir ein Resultat, welches anschaulich trivial sein mag:
Korollar 2.2. Durch zwei verschiedene Punkte geht genau eine Gerade.
36
Abbildung 1. Orts- und Richtungsvektoren einer Geraden.
Beweis. Seien v1 , v2 zwei verschiedene Punkte des Rn . Setze w := v2 − v1 6= 0,
dann ist G = v1 + Rw sicherlich eine solche gesuchte Gerade (siehe Abbildung 1).
Es verbleibt die Eindeutigkeit zu zeigen: Sei G′ = v ′ + Rw′ eine weitere Gerade
durch v1 und v2 , dann folgt aus dem vorangegangenen Satz, dass G′ = v1 + Rw′
gilt. Wegen v2 ∈ G′ existiert ein reelles λ mit v2 = v1 + λw′ und zusammen mit
v2 = v1 + w folgt 0 = λw′ − w mit λ 6= 0 (da w 6= 0). Also gilt w = λw′ und
G = G′ . •
Wir nennen Punkte A, B, C, . . . kollinear, wenn sie auf einer Geraden liegen
bzw. die Vektoren A − B, A − C, . . . linear abhängig sind. (In Zukunft werden
wir jedoch nur selten zwischen Punkten und Vektoren unterscheiden.)
Korollar 2.3. Drei Punkte A, B, C in der Ebene sind genau dann kollinear,
wenn es reelle Konstanten α, β, γ gibt, nicht alle gleich null, so dass
αA + βB + γC = 0
bzw. wenn
det
mit
1 1 1
A B C
α + β + γ = 0;
= 0,
wobei für die Punkte A, B, C hier die Koordinaten einzutragen sind.
Der Beweis basiert auf dem vorangegangenen Satz und ist eine gute Übungsaufgabe zum Training der Begrifflichkeiten und dem Rechnen mit Vektoren.
Satz 2.4. Eine Teilmenge G ⊂ R2 ist genau dann eine Gerade, wenn es a, b, c ∈
R mit (a, b) 6= (0, 0) gibt, so dass
G = {(x, y) ∈ R2 : ax + by = c}.
Wir erinnern uns hier an die Schulmathematik, wo Geraden oft in der Form
y = αx + β mit Steigung α und y-Achsenabschnitt β dargestellt wurden.
37
Beweis. Sei G = v + Rw eine Gerade mit w = (x1 , y1 ) 6= (0, 0) und v = (x0 , y0 ).
Für einen generischen Punkt u = (x, y) ∈ G gilt dann
x − x0
x1
=
y − y0
y1
bzw.
xy1 − x0 y1 = x1 y − x1 y0 ;
dies liefert die gesuchte lineare Gleichung in x und y falls y1 6= 0. Trotzdem
definieren wir für den allgemeinen Fall entsprechend a = y1 , b = −x1 und c =
x0 y1 − x1 y0 und setzen
(1)
L = {(x, y) ∈ R2 : ax + by = c}.
Für u = v + λw = (x0 + λx1 , y0 + λy1 ) ∈ G errechnet sich dann
a(x0 + λx1 ) + b(y0 + λy1 ) = y1 x0 + λx1 y1 − xx 1y0 − λx1 y1 = x0 y1 − x1 y0 = c,
also G ⊂ L. Für den Nachweis der Inklusion L ⊂ G nehmen wir zunächst
0
a = y1 6= 0 und u = (x, y) ∈ L an. Dann folgt mit λ = y−y
y1
y = y0 +
y − y0
y1 = y0 +λy1
y1
und x =
c − by
x0 y 1 − x1 y 0 + x1 y
=
= x0 +λx1 ,
a
y1
also u = (x, y) = v + λw ∈ G. Im Falle a = y1 = 0 ist b = −x1 6= 0 (da w 6= 0)
0
und ein analoges Argument mit λ = x−x
x1 führt zum Ziel.
Es verbleibt zu zeigen, dass die Menge (1) eine Gerade definiert; hierbei
dürfen wir (a, b) 6= (0, 0) annehmen. Falls a 6= 0 (der Fall b 6= 0 kann ähnlich
behandelt werden), ergibt sich mit v = (c/a, 0) und w = (−b, a) nach ein wenig
Rechnerei L = v + Rw, womit also L als Gerade nachgewiesen ist. •
Beispiel: Der konstruktive Beweis zeigt, dass die Geraden
−2
1
G=
+R
−3
2
ebenso durch die lineare Gleichung 2x − y = −1 beschrieben werden kann.
Eine Teilmenge E ⊂ Rn heißt Ebene, falls Vektoren v, w1 , w2 ∈ Rn existieren, so dass w1 und w2 linear unabhängig sind und
E = v + Rw1 + Rw2 ;
auch hier nennen wir v einen Ortsvektor und w1 , w2 Richtungsvektoren von
E (siehe Abbildung 2). Analog zu Satz 2.1 gilt hier für einen beliebigen Punkt
v ′ ∈ E ebenso E = v ′ + Rw1 + Rw2 sowie Korollar 2.2 entsprechend
Satz 2.5. Gegeben drei verschiedene Punkte v1 , v2 , v3 ∈ Rn , die nicht auf einer
Geraden liegen (also kollinear sind), existiert stets genau eine Ebene durch v1 , v2
und v3 .
Drei Punkte legen also eine Ebene im euklidischen Raum eindeutig fest!
Schließlich sei noch angemerkt, dass Ebenen wie Geraden durch eine lineare
Gleichung beschrieben werden können:
38
Abbildung 2. Orts- und Richtungsvektoren einer Ebene.
Satz 2.6. Eine Teilmenge E ⊂ R3 ist genau dann eine Ebene, wenn es Zahlen
a, b, c, d ∈ R mit (a, b, c) 6= (0, 0, 0) gibt, so dass
E = {(x, y, z) ∈ R3 : ax + by + cz = d}.
Auch hier erfolgt der Beweis analog zum Fall von Geraden (siehe etwa das Buch
von Koecher & Krieg).
Aufgaben
2
Aufgabe 28. Drei Punkte A, B, C ∈ R sind genau dann kollinear, wenn det(A −
C, B − C) = 0, wobei hier die Koordinaten von A, B, C einzusetzen sind.
Aufgabe 29. Zur Erinnerung an die Elementare Zahlentheorie: Gegeben eine Gerade
aX + bY = c in der euklidischen Ebene, wobei a, b, c ganze Zahlen sind. Gibt es Punkte
mit ganzzahligen Koordinaten x, y auf dieser Geraden? Wenn ja, beschreiben Sie diese.
Aufgabe 30. Beweisen Sie Korollar 2.3 sowie Satz 2.5.
3
3
Aufgabe 31. Gegeben seien drei Punkte a, b, c des R , gesucht ist der Punkt d ∈ R ,
so dass abcd ein Parallelogramm ist.
3. Das Skalarprodukt
In R lässt sich der Abstand zwischen zwei Punkten durch den Betrag der
Differenz angeben. Wir verallgemeinern nun diesen Distanzbegriff auf euklidische Räume Rn . Hierzu stellen wir uns den zweidimensionalen euklidischen
Raum R2 als Ebene vor. Nach dem Satz des Pythagoras ist der Abstand zweier
Punkte P1 = (x1 , y1 ) und P2 = (x2 , y2 ) des R2
p
d(P1 , P2 ) = (x1 − x2 )2 + (y1 − y2 )2 .
39
Dieser Abstand hängt nur von der Differenz P1 −P2 ab und wir schreiben deshalb
auch kP1 − P2 k bzw.
p
k(x, y)k := x2 + y 2 .
Dieser Abstandsbegriff lässt sich problemlos auf den drei- bzw. sogar ndimensionalen Raum übertragen: Für den Rn definieren wir die euklidische
Norm eines Vektors x = (x1 , . . . , xn ) als
q
kxk := x21 + . . . + x2n .
Die wichtigsten Eigenschaften der euklidischen Norm sind uns bereits aus der
Analysis mehrerer Veränderlicher bekannt:
Satz 2.7. Für die euklidische Norm gelten
(i) kxk ≥ 0 für alle x ∈ Rn und Gleichheit genau für x = 0;
(ii) kλxk = |λ| · kxk für alle x ∈ Rn und λ ∈ R;
(iii) kx + yk ≤ kxk + kyk für alle x, y ∈ Rn .
Beweisskizze. Der Nachweis von (i) und (ii) ist trivial. Seien x
(x1 , . . . , xn ), y := (y1 , . . . , yn ) ∈ Rn . Mit
A :=
n
X
x2j ,
B :=
n
X
xj y j ,
n
X
yj2
j=1
j=1
j=1
C :=
=
und variablem λ ∈ R gilt
n
X
(xj − λyj )2 = A − 2λB + λ2 C.
0≤
j=1
Ist C = 0, so auch B = 0. Ist hingegen C 6= 0, so definiert die obige rechte
Seite ein quadratisches Polynom in λ, welches keine negativen Werte annimmt;
damit sind die Nullstellen
p
1
λ1,2 = (B ± B 2 − AC)
C
entweder identisch oder nicht-reell, d.h. B 2 − AC ≤ 0 (was auch den Fall C =
B = 0 beinhaltet). Nun übersetzt sich B 2 ≤ AC zu
2
X
n
n
X
X
n
2
yj2 .
x
·
x
y
≤
j j
j
j=1
j=1
j=1
Einsetzen dieser Ungleichung in
n
n
n
X
X
X
2
2
yj2
xj y j +
xj + 2
kx + yk2 =
j=1
j=1
j=1
und Ziehen der Quadratwurzel liefert die Dreiecksungleichung (iii). •
Dies lässt sich verallgemeinern: Eine Abbildung k . k : Rn → R, die (i), (ii) und
(iii) des Satzes genügt, heißt Norm auf Rn . (Beispiele derselben haben wir in
der Analysis mehrerer Veränderlicher kennen gelernt.) Ein Vektor v ∈ Rn mit
Norm kvk = 1 wird normiert bzw. Einheitsvektor genannt.
40
Den euklidischen Abstand zwischen x, y ∈ Rn definieren wir als
d(x, y) := kx − yk (s.o.). Natürlich definieren wir diese Größen ebenso für Spaltenvektoren. Offensichtlich gilt
d(x, y) = d(y, x) ≥ 0
mit Gleichheit rechts, wenn und nur wenn x = y. Die Dreiecksungleichung
nimmt dann die Form
d(x, y) ≤ d(x, z) + d(z, y)
an, wobei x, y, z beliebige Punkte bzw. Vektoren sind.
Im Folgenden wollen wir etwas allgemeiner arbeiten. Sei hierzu nun V ein
Vektorraum über dem Skalarenkörper R (wie etwa V = Rn ). Dann nennen wir
eine Abbildung
h . , . i : V × V → R, (x, y) 7→ hx, yi
eine Bilinearform, wenn sie linear in beiden Argumenten ist, d.h. für alle
x, y, z ∈ V und λ ∈ R
(B1)
(B2)
(B3)
(B4)
hx + y, zi = hx, zi + hy, zi,
hλx, yi = λhx, yi,
hx, y + zi = hx, yi + hx, zi,
hx, λyi = λhx, yi.
Eine solche Abbildung heißt symmetrisch, falls stets
(S) hx, yi = hy, xi;
wir nennen sie positiv definit, falls
(PD) hx, xi ≥ 0 und Gleichheit genau für x = 0.
Eine symmetrische, positiv definite Bilinearform heißt Skalarprodukt.∗ Ein
Paar (Rn , h , i) bestehend aus einem Vektorraum V = Rn und einem dazugehörigen Skalarprodukt nennen wir einen euklidischen Raum. Im Folgenden
werden wir – wenn nicht ausdrücklich auf einen anderen Vektorraum verwiesen
wird – in euklidischen Räumen arbeiten.
Legen wir statt der reellen Zahlen die komplexen Zahlen zugrunde (vgl.
Elementare Zahlentheorie), so nennen wir
h . , . i : Cn × Cn → C,
(x, y) 7→ hx, yi
eine Sesquilinearform, falls neben (B1), (B3) und (B4) noch
(B2’) hλx, yi = λhx, yi
√
besteht, wobei hier λ = α + iβ ∈ C gilt (also α, β ∈ R sowie i := −1) und
λ = α − iβ für das Konjugierte von λ steht. Eine solche Sesquilinearform heißt
hermitesch,† falls
hv, wi = hw, vi.
Der Begriff der positiven Definitheit bleibt unverändert.
∗
In einiger Literatur wird statt hx, yi auch x · y geschrieben; allerdings ist hier Vorsicht
geboten (insbesondere weil es verschiedene Produkte von Vektoren gibt).
†
nach dem Mathematiker Charles Hermite
41
Ein erstes Beispiel für ein Skalarprodukt liefert der folgende Satz:
Satz 2.8. Die durch
t
hx, yi = x · y =
n
X
xj y j
j=1
n
für xt = (x1 , . . . , xn ), y t = (y1 , . . . , yn ) ∈ R erklärte Abbildung ist ein Skalarprodukt auf Rn und heißt Standardskalarprodukt.
Hier und im Folgenden schreiben
wir Vektoren üblicherweise als Spaltenvek
x1
toren, wie etwa x = x2 und notieren mit xt = (x1 , x2 ) den zugehörigen
transponierten Zeilenvektor.
Beweis. Mit zusätzlich z t = (z1 , . . . , zn ) ∈ Rn rechnet man leicht nach:
hx + y, zi =
n
n
n
X
X
X
yj zj = hx, zi + hy, zi.
xj zj +
(xj + yj )zj =
j=1
j=1
j=1
Die weiteren definierenden Eigenschaften weist man ganz ähnlich nach. Für
(PD) sei bemerkt, dass Quadrate reeller Zahlen nicht-negativ sind und also
hx, xi = x21 + . . . + x2n ≥ 0 gilt; hierbei herrscht genau dann Gleichheit, wenn
alle xj verschwinden, also x = 0 ist. •
Ein exotisches Beispiel für ein Skalarprodukt ist die Abbildung
Z 1
f (t)g(t)dt
(f, g) 7→ hf, gi :=
0
auf dem Vektorraum aller auf dem Einheitsintervall erklärten stetigen, reellwertigen Funktionen. Weitere Beispiele von Skalarprodukten folgen im nächsten
Paragraphen.
p
Zu einem jeden solchen Skalarprodukt können wir vermöge kxk := hx, xi
eine Norm und damit einen Abstand definieren; im Falle des Standardskalarproduktes entstehen so die euklidische Norm und Abstand (s.o.).
Satz 2.9 (Cauchy-Schwarzsche Ungleichung). Sei h . , . i ein Skalarprodukt
auf Rn und k . k die zugehörige Norm. Dann gilt für beliebige x, y ∈ Rn
|hx, yi| ≤ kxk · kyk;
hier besteht genau dann Gleichheit, wenn x und y linear abhängig sind.
Beweis. Für y = 0 ist die Aussage trivialerweise erfüllt; sei also y 6= 0. Dann
sei λ := hy, yi und µ = −hx, yi. Wir berechnen
0 ≤ hλx + µy, λx + µyi = λ2 hx, xi + 2λµhx, yi + µ2 hy, yi
= λ(hy, yihx, xi − hx, yi2 ).
Wegen λ > 0 folgt hieraus
hy, yihx, xi ≥ hx, yi2
und durch Ziehen der Wurzel ergibt sich die Ungleichung. Diese ist genau dann
eine Gleichung, wenn λx + µy = 0 gilt, also x und y linear abhängig sind. •
42
Übrigens ergibt sich die Dreiecksungleichung aus Satz 2.7 als einfache Konsequenz der Cauchy-Schwarzschen Ungleichung.
Wir notieren weitere interessante Eigenschaften von allgemeinen Skalarprodukten:
Satz 2.10. Sei h . , . i ein Skalarprodukt auf Rn und k . k die zugehörige Norm.
Dann gelten für x, y ∈ Rn
(i) Satz des Pythagoras: kx + yk2 = kxk2 + kyk2 + 2hx, yi,
(ii) Parallelogrammgleichung: kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 .
Beweis durch Nachrechnen:
kx + yk2 = hx + y, x + yi = hx, x + yi + hy, x + yi
= hx, xi + hx, yi + hy, xi + hy, yi
= kxk2 + 2hx, yi + kyk2 ,
was für (i) zu zeigen war; der Nachweis von (ii) geht analog. •
Abbildung 3. Eine geometrische Interpretation der Parallelogrammgleichung. Man mache sich klar, dass die kürzere Diagonale durch den Vektor
x − y beschrieben wird.
Insbesondere liefert die Aussage in (i) mit dem Standardskalarprodukt und der
euklidischen Norm einen Beweis von Satz 1.8; allerdings wird hierfür noch die
Definition des Winkels über das Skalarprodukt benötigt – dies ist Gegenstand
des übernächsten Paragraphen.
Die Parallelogrammgleichung gilt übrigens nicht in normierten Vektorräumen, in denen die Norm nicht durch ein Skalarprodukt definiert ist. Ein solches
Beispiel liefert die Maximumnorm, welche für xt = (x1 , . . . , xn ) durch
kxk∞ := max{|xj | : j = 1, . . . , n}
definiert ist. Hier rechnet sich sofort nach, dass die Parallelogrammgleichung
i.A. nicht gültig ist.
Aufgaben
43
Aufgabe 32. Zeigen Sie, dass für ein beliebiges Skalarprodukt stets h0, xi = hx, 0i = 0
gilt. Beweisen Sie ferner, dass genau dann ha, xi = 0 mit dem Standardskalarprodukt
0 −1
⊥
⊥
. Geben Sie eine
besteht, wenn x ∈ Ra mit einem a 6= 0 gilt, wobei a :=
1 0
geometrische Interpretation dieses Sachverhaltes!
Aufgabe 33. Beweisen Sie den Diagonalensatz: In einem Parallelogramm halbieren
sich die Diagonalen gegenseitig. Und zeigen Sie folgende Tischlerregel: Ein Parallelogramm ist genau dann ein Rechteck, wenn beide Diagonalen gleich lang sind.
4. Symmetrische Matrizen
Eine Matrix A ∈ Rn×n mit der Eigenschaft At = A heißt symmetrisch; gilt
A = (aij )i,j , so lässt sich dies auch äquivalent durch aji = aij für alle 1 ≤ i, j ≤ n
ausdrücken (denn Vertauschen der Indizes bedeutet Vertauschen von Zeilen und
Spalten, also letztlich Transposition). Zu einer solchen symmetrischen Matrix
A definieren wir die Abbildung
h . , . iA : Rn × Rn → R,
(x, y) 7→ hx, yiA := xt Ay,
bzw. hx, yiA = hx, Ayi mit dem Standardskalarprodukt; selbiges entsteht im
Falle A = E, wobei E hier und im Folgenden die Einheitsmatrix bezeichne. Die
obige Definition liefert eine Vielzahl von Bilinearformen:
Satz 2.11. Es sei A ∈ Rn×n symmetrisch. Dann ist die assoziierte Abbildung
h . , . iA eine symmetrische Bilinearform auf Rn × Rn .
Beweis. Wir prüfen die einzelnen Eigenschaften nach: Für Vektoren x, y ∈ Rn
sowie Skalaren λ, µ ∈ R gilt
hλx + µz, yi = (λx + µz)t Ay = λxt Ay + µz t Ay = λhx, yiA + µhz, yiA ,
womit die Linearität im ersten Argument gezeigt ist; die im zweiten folgt analog.
Zur Erinnerung: beim Transponieren werden Zeilen und Spalten ausgetauscht,
entsprechend dreht sich die Reihenfolge der Faktoren in einem Produkt um:
(ab)t = bt at . Damit zeigt sich
hy, xiA = y t Ax = (Ax)t (y t )t = xt At y = xt Ay = hx, yiA ,
wobei wir hier die Eigenschaft von A, symmetrisch zu sein, benutzt haben. •
Tatsächlich lässt sich zeigen, dass symmetrische Matrizen eineindeutig symmetrischen Bilinearformen entsprechen (siehe Fischers Buch).
Unter welchen Umständen handelt es sich bei h . , . iA um ein Skalarprodukt?
Hierzu ist positive Definitheit nachzuprüfen. Diese hängt interessanterweise von
den Eigenwerten von A ab.
Satz 2.12. Eine symmetrische Matrix A ∈ Rn×n besitzt n (nicht notwendig
verschiedene) reelle Eigenwerte.
44
Beweis. Wir erinnern an den Fundamentalsatz der Algebra (vgl. Elementare
Zahlentheorie): Jedes nichtkonstantes Polynom zerfällt über dem Körper C der
komplexen Zahlen in Linearfaktoren. Angewandt auf das charakteristische Polynom von A folgt die Existenz von n (nicht notwendig verschiedenen) komplexen
Eigenwerten λ von A. Wir haben zu zeigen, dass λ reell ist. Wir beobachten,
dass mit λ auch das Konjugierte λ ein Eigenwert von A ist, denn mit Av = λv
gilt ebenso
Av = Av = λv;
insbesondere für Eigenvektoren v zum Eigenwert λ. Aufgrund der Symmetrie
von A ergibt sich
v t Av = v t Av
bzw.
λkvk = v t λv = v t λv = λkvk.
Nach Kürzen von kvk (was ungleich null ist, da v 6= 0) folgt λ = λ, was impliziert, dass λ reell ist. •
Für das Weitere definieren wir: Eine symmetrische Matrix A ∈ Rn×n heißt
•
•
•
•
•
Dann gilt
positiv definit, wenn hx, xiA > 0 für alle x ∈ Rn \ {0},
positiv semidefinit, wenn hx, xiA ≥ 0 für alle x ∈ Rn \ {0},
negativ definit, wenn hx, xiA < 0 für alle x ∈ Rn \ {0},
negativ semidefinit, wenn hx, xiA ≤ 0 für alle x ∈ Rn \ {0},
indefinit, wenn es x, y ∈ Rn gibt mit hx, xiA < 0 < hy, yiA .
Satz 2.13. Eine symmetrische Matrix A ∈ Rn×n ist genau dann
•
•
•
•
•
positiv definit, wenn sämtliche Eigenwerte positiv sind,
positiv semidefinit, wenn sämtliche Eigenwerte nicht-negative sind,
negativ definit, wenn sämtliche Eigenwerte negativ sind,
negativ semidefinit, wenn sämtliche Eigenwerte nicht-positiv sind,,
indefinit, wenn es mindestens einen positiven und mindestens einen
negativen Eigenwert gibt.
Wir verschieben den Beweis auf das nächste Kapitel und begnügen uns hier mit
einem
Beispiel: Die Matrix
B=
1 1
1 4
∈ R2×2
ist symmetrisch, definiert also eine symmetrische Bilinearform
y1
1 1
t
(x, y) 7→ hx, yiB = x By = (x1 , x2 )
y2
1 4
= x21 + x1 y2 + x2 y1 + 4y22 .
Zum Nachweis der positiven Definitheit berechnen wir die Eigenwerte
von B
√
über das charakteristische Polynom λ2 − 5λ + 3 als λ± = 21 (5 ± 13). Damit
handelt es sich hier also um ein Skalarprodukt.
45
Das folgende Kriterium erlaubt eine schnelle Entscheidung über die Definitheit, welches ohne die explizite Berechnung der Eigenwerte auskommt:
Satz 2.14 (Hurwitz-Kriterium). Eine symmetrische Matrix A
(αij )1≤i,j≤n ∈ Rn×n ist genau dann positiv definit, wenn
det Ak > 0
wobei Ak := (αij )1≤i,j≤k
α21 usw.).
=
für
k = 1, . . . , n,
α11 α12
mit α12 =
(also A1 = (α11 ) und A2 =
α21 α22
Beweis für den Spezialfall n = 2: Eine symmetrische 2 × 2-Matrix mit reellen
Einträgen ist von der Gestalt
α β
mit α, β, γ ∈ R;
A=
β γ
wir haben zu zeigen, dass A genau dann positiv definit ist, wenn α > 0 und
αγ − β 2 > 0. Hierzu berechnen wir
x
= α2 x2 + 2αβxy + αγy 2
α(x, y)A
y
= (αx + βy)2 + (αγ − β 2 )y 2 ,
woraus sich das Kriterium leicht ablesen lässt. Für den Beweis des allgemeinen
Falles verweisen wir wiederum auf das Buch von Fischer. •
Wir schließen unsere Untersuchungen zu symmetrischen Matrizen mit einigen weiteren strukturellen Eigenschaften:
Satz 2.15. Es bezeichne Symn (R) die Menge der symmetrischen Matrizen A ∈
Rn×n .
(i) Symn (R) ist ein Vektorraum der Dimension 21 n(n + 1).
(ii) Für W ∈ Rn×n ist A 7→ W t AW ein Endomorphismus von Symn (R);
dieser ist genau dann bijektiv, wenn W invertierbar ist.
(iii) Ist A ∈ Symn (R) positiv definit und W invertierbar ist, dann ist auch
W t AW positiv definit.
Wir stellen den leichten Beweis als Übungsaufgabe.
Aufgaben
Aufgabe 34 (Frühjahr 2002, Thema 3, Aufgabe 4). a) Man zeige, dass durch
y1
x1
2
∈R ,
, y=
hx, yi := x1 y1 + 2x1 y2 + 2x2 y1 + 5x2 y2 , x =
y2
x2
2
eine positiv definite symmetrische Bilinearform, d.h. ein Skalarprodukt im R definiert
ist.
b) Man berechne den Abstand des Punktes 01 von der Geraden R · 10 bezüglich
p
der Abstandsfunktion d(x, y) = hx − y, x − yi, die durch das Skalarprodukt aus a)
definiert wird.
46
Aufgabe 35. Finden Sie Eigenvektoren und Diagonalisieren Sie die Matrix B aus dem
obigen Beispiel.
Aufgabe 36. Beweisen Sie Satz 2.15. Zeigen Sie ferner, dass durch
A∼B
:⇐⇒
B = W t AW
eine Äquivalenzrelation auf Symn (R) definiert wird.
Aufgabe 37. Welche Bedingungen muss eine Matrix A mit komplexen Einträgen
erfüllen, so dass (x, y) 7→ xt Ay eine hermitesche Sesquilinearfrom ist? Geben Sie auch
Beispiele an!
5. Winkel und die trigonometrischen Funktionen
Im Folgenden sei h . , . i das Standardskalarprodukt. Gegeben zwei vom Nullvektor verschiedene Vektoren x, y ∈ Rn , definieren wir nun den Winkel zwischen
ebendiesen bzw. zwischen den Strecken 0x und 0y (wo 0 für den Ursprung bzw.
Nullvektor steht). Mit der Cauchy-Schwarzschen Ungleichung gilt
−1 ≤
hx, yi
≤ +1.
kxk · kyk
Es existieren genau zwei Winkel α und α′ mit der Eigenschaft α + α′ = 2π und
hx, yi
(1)
cos α = cos α′ =
.
kxk · kyk
Mit der Forderung α ∈ [0, π] ist α der eindeutig bestimmte Winkel zwischen x
und y; in Zeichen: α = ∠(x, y). Der Kosinus ist hierbei natürlich die uns aus der
Analysis bekannte 2π-periodische Funktion mit Werten zwischen −1 und +1.
Im Falle zweier Geraden G = v + Rw und G′ = v + Rw′ mit gemeinsamen
Ortsvektor (welches also ein Schnittpunkt von G und G′ ist) definieren wir
den Winkel zwischen den Geraden G und G′ als Minimum der Winkel der
Richtungsvektoren:
∠(G, G′ ) = min{∠(w, w′ ), ∠(w, −w′ )}.
Abbildung 4. Die Winkel zwischen zwei sich schneidenden Geraden.
Punkte und Vektoren des Rn werden oft durch Koordinaten, also letztlich
mit Hilfe einer gewählten Basis beschrieben. In der Linearen Algebra wurde
47
bereits gezeigt, dass es keine eindeutige Basis, sondern vielmehr eine große Auswahl von Basen gibt (insbesondere im Rn ), welche allesamt gleichberechtigt sind.
Auch berechnen wir beispielsweise das Standardskalarprodukt in Abhängigkeit
der Koordinaten (bzw. der gewählten Basis). Allerdings zeigt obige Formel (1)
umgeschrieben als
hx, yi = kxk · kyk · cos ∠(x, y),
dass ein Skalarprodukt im Falle eines kartesischen Koordinatensystems von der
Wahl der Basis unabhängige Werte liefert! Hierbei heißt ein Koordinatensystem kartesisch, wenn die Basisvektoren senkrecht aufeinander stehen (also
hx, yi = 0 gilt; siehe nächster Paragraph) und auf Länge eins normiert sind.
Diese Unabhängigkeit von solcherlei Basen zeigt auf, was für eine wichtige Invariante wir hier vorliegen haben!
Weitere einfache Eigenschaften des Winkels sind
(i) ∠(x, y) = ∠(y, x);
(ii) ∠(λx, µy) = ∠(x, y) für λ, µ > 0;
(iii) ∠(x, y) = 0 ⇐⇒ x = λy für ein λ > 0.
Bekanntlich lässt sich der Einheitskreis durch die trigonometrischen Funktion Kosinus cos und Sinus sin parametrisieren:‡
x = cos α, y = sin α
für 0 ≤ α < 2π
erfüllt mit dem Satz des Pythagoras die algebraische Gleichung x2 + y 2 = 1
(siehe Abbildung 6). Allgemeiner gelten in einem rechtwinkligen Dreieck ABC
Abbildung 5. Die trigonometrischen Funktionen cos, sin und tan.
mit Hypothenuse AC die Beziehungen
cos ∠(BAC) =
‡
|AB|
|AC|
und
sin ∠(BAC) =
|BC|
,
|AC|
Übrigens: Was heisst Trigonometrie? τ ριγωνoν steht für Dreieck und µǫτ ρoν für Maß.
48
bzw. in Schulsprache: der Kosinus des Winkels bei A ist gleich dem Quotienten
der Längen von Ankathete und Hypothenuse, während der Sinus besagten Winkels gleich dem Quotienten der Längen von Gegenkathete und Hypothenuse ist.
Sofort ergibt sich hieraus die 2π-Periodizität von Kosinus und Sinus
cos(α + 2π) = cos(α)
und
sin(α + 2π) = sin(α).
Aber wir wollen auch noch eine Brücke zu den komplexen Zahlen schlagen
Abbildung 6. Links: Kosinus und Sinus am Kreis. Rechts: Das Bild zum
Beweis des Additionstheorems.
(vgl. Elementare Zahlentheorie). Wir denken uns einen Kreis vom Radius r und
Mittelpunkt im Ursprung des R2 . Dann gelten allgemein für die Koordinaten
eines Punktes z = (x, y) die Gleichungen x = r cos α und y = r sin α, wenn α
den Winkel zwischen der x-Achse und dem Richtungsvektor nach z bezeichnet.
Fassen wir den R2 als Gaußsche Zahlenebene auf, so ist z = x + iy eine komple√
xe Zahl mit der imaginären Einheit i = −1 (vgl. Elementare Zahlentheorie);
der Übergang von der Menge C der komplexen Zahlen zur euklidischen Ebene R2 erklärt sich dann einfach durch Abtragen des Realteils einer komplexen
Zahl auf der x-Achse und des Imaginärteils auf der y-Achse. Neben dieser kartesischen Darstellung komplexer Zahlen lassen sich diese auch alternativ durch
Polarkoordinaten wiedergeben: Für 0 6= z ∈ C schreiben wir dazu
z = r exp(iα),
woraus wir |z| = r und die Formeln von Euler – de Moivre
exp(iα) = cos α + i sin α,
cos(nα) + i sin(nα) = (cos α + i sin α)n
für beliebige α ∈ R und n ∈ Z ablesen. Ferner gewinnt man hieraus auch noch
cos α = 21 (exp(iα) + exp(−iα))
und
sin α =
1
2i (exp(iα)
− exp(−iα))
49
Mit Hilfe dieser Formeln lässt sich unschwer folgender Satz beweisen:
Satz 2.16 (Additionstheorem). Für beliebige reelle α, β gelten
cos(α + β) = cos α cos β − sin α sin β,
sin(α + β) = sin α cos β + cos α sin β.
Wir geben aber ein geometrisches Argument:
Beweis. Wir betrachten Dreiecke ABC und AEB mit rechten Winkeln bei B
bzw. E; die Winkel bei A seien α bzw. β (wie in Abbildung 6). Setzen wir
voraus, dass die Strecke AC Länge eins besitzt, so ergeben sich
|AB| = cos α
und
|BC| = sin α.
Als Nächstes bilden wir den Punkt D so, dass BCD ein rechtwinkliges Dreieck
Abbildung 7. Dieses Bild zeigt einen PolarPlot der Funktion t 7→ cos 3t
mit t ∈ [0, π]; hierbei werden die Werte cos 3t in Richtung des Winkels t vom
Ursprung aus abgetragen. Was passiert, wenn man stattdessen cos 5t be-
trachtet?
mit Hypothenuse BC ist. Dann ist der Winkel dieses Dreiecks bei C wegen des
Winkelsummensatzes und dem rechten Winkel des Dreiecks ABC bei B gleich
dem Winkel β bei A im Dreieck AEB. Der Punkt F entsteht als Schnittpunkt
der Geraden CD und AE. Dies liefert nun
|BD| = sin α sin β
und
|AE| = cos α cos β,
woraus sich
cos(α + β) = |AF | = |AE| − |F E| = cos α cos β − sin α sin β
ergibt. Damit ist das erste Additionstheorem bewiesen; das zweite lässt sich auf
ähnliche Weise herleiten. •
Aufgaben
50
Aufgabe 38. Geben Sie einen neuen Beweis des Winkelsummensatzes 1.3 mit Hilfe
des Standardskalarproduktes.
Aufgabe 39. Zeigen Sie: Zu gegebenen α, β ∈ R existiert ein φ ∈ R mit
α cos φ + β sin φ = 0.
Berechnen Sie ferner (ohne Taschenrechner!) die Werte
cos π6 , sin π6 , cos π4 , sin π4 , cos π3 , sin π3 ;
was können sie über andere Werte cos πn , sin nπ mit n ∈ N sagen?
Aufgabe 40. Beweisen Sie mit geometrischen Argumenten
cos(φ + π) = − cos(φ)
und
sin(φ + π) = − sin(φ).
Aufgabe 41. Beweisen Sie folgendes Additionstheorem für den Tangens tan =
tan(α + β) =
sin
cos :
tan α + tan β
1 − tan α tan β
für alle reellen α, β, für die diese Formel Sinn macht.
Aufgabe 42. Sei n ≥ 4. Zeigen Sie: Winkel zwischen Diagonalen im n-dimensionalen
Einheitswürfel können verschieden sein. (vgl. mit einem Satz von Thales in Aufgabe 1)
Aufgabe 43. Zeigen Sie, dass es kein gleichseitiges Dreieck mit Eckpunkten in Z
gibt!
2
6. Orthogonalität
Nach Definition des Winkels gilt für das Standardskalarprodukt
π
∠(x, y) =
⇐⇒
hx, yi = 0.
2
Entsprechend heißen zwei Vektoren x, y ∈ Rn orthogonal bzgl. eines (allgemeinen) Skalarproduktes h . , . i, falls hx, yi = 0; in Zeichen: x⊥y. In einem
euklidischen Raum Rn stehen orthogonale Vektoren also senkrecht aufeinander.
Insbesondere gilt für den Nullvektor 0⊥x mit jedem Vektor x. Der Satz des
Pythagoras formuliert sich dementsprechend als
kx + yk2 = kxk2 + kyk2
für x⊥y.
Gegeben eine Teilmenge U ⊂ Rn , heißt
U ⊥ := {v ∈ Rn : hu, vi = 0 für alle u ∈ U }
das orthogonale Komplement von U . Ist etwa U = Rv eine Gerade durch
den Ursprung in der euklidischen Ebene mit v 6= 0, so ist U ⊥ die zu U senkrechte
Gerade durch den Ursprung. Das orthogonale Komplement des Nullvektors ist
der gesamte Raum; umgekehrt ist das orthogonale Komplement des gesamten
Raums ausschließlich der Nullvektor, also {0}⊥ = Rn und (Rn )⊥ = {0}. Ferner
gilt:
Lemma 2.17. Das orthogonale Komplement U ⊥ eines Unterraums U ⊂ Rn
bzgl. eines Skalarproduktes h . , . i ist wieder ein Unterraum.
51
Beweis durch Verifizieren der Unterraumaxiome. Beispielsweise gilt für x, y ∈
U ⊥ auch x + λy ∈ U ⊥ mit λ ∈ R, denn mit hx, ui = hy, ui = 0 für beliebige
u ∈ U gilt
hx + λy, ui = hx, ui + λhy, ui = 0.
Die weiteren Eigenschaften zeigen sich ähnlich. •
Tatsächlich ist U ⊥ stets ein Unterraum (unabhängig davon, ob U ein Unterraum
ist oder nicht).
Zwei Vektoren v, w ∈ Rn heißen parallel, in Zeichen vkw, wenn v oder
w = 0 oder wenn ein λ ∈ R existiert, so dass v = λw. (Man mache sich klar,
dass dies genau zu Satz 2.1 über parallele Geraden passt!) Sei nun v, w ∈ Rn
mit w 6= 0. Dann nennen wir einen Vektor v ′ ∈ Rn die Orthogonalprojektion
von v auf w, wenn v ′ parallel zu w ist und wenn die Normalenkomponente
v⊥ := v − v ′
von v bzgl. w orthogonal zu w ist. Mit der Orthogonalität v⊥ ⊥w ergibt sich
0 = hv − v ′ , wi = hv, wi − λhw, wi
woraus
mit λ =
hv, wi
,
hw, wi
hv, wi
w
hw, wi
folgt. Eine Familie von Vektoren {vj } heißt orthogonal, falls hvj , vi i = 0 für
v′ =
Abbildung 8. Die Orthogonalprojektion v′ von v auf w.
i 6= j; eine solche Familie heißt orthonormal, wenn darüber hinaus stets
kvj k = 1 gilt. Eine orthogonale (orthonormale) Familie, welche eine Basis des
zugrunde liegenden Vektorraumes bildet, nennen wir eine Orthogonalbasis
(Orthonormalbasis).
Beispiel: Die n Standardeinheitsvektoren ej = (0, . . . , 0, 1, 0, . . . 0)t mit einer
1 in der j-ten Komponente und 0 sonst, bilden eine Orthonormalbasis des Rn
bzgl. des Standardskalarproduktes.
52
Satz 2.18. Sei V ein endlich-dimensionaler euklidischer Raum mit Skalarprodukt h . , . i und W ⊂ V ein Unterraum mit Orthonormalbasis {w1 , . . . , wm }.
Dann lässt sich diese zu einer Orthonormalbasis {w1 , . . . , wm , wm+1 , . . . , wn }
von V ergänzen.
Der Beweis ist konstruktiv mit dem Orthonormalisierungsverfahren von
Gram-Schmidt: OBdA sei W eine echte Teilmenge von V und v ∈ V \ W .
Wir definieren
v ′ := hv, w1 iw1 + . . . + hv, wm iwm .
Der Vektor v ′ ist hier die Orthogonalprojektion von v auf W (s.o.) Mit w := v−v ′
ist w 6= 0 (da v ′ ∈ W und v ∈ V \ W ). Es gilt
1 falls k = ℓ,
(2)
hwk , wℓ i =
0 sonst.
Damit folgt nun
hw, wk i = hv, wk i − hv ′ , wk i = hv, wk i − hhv, w1 iw1 + . . . + hv, wm iwm , wk i
= hv, wk i − (hv, w1 ihw1 , wk i + . . . + hv, wm ihwm , wk i)
= hv, wk i − hv, wk i · 1 = 0
und also w ∈ W ⊥ . Mit wm+1 :=
w
kwk
gilt
w 1
kwm+1 k = kwk = kwk · kwk = 1
und also ist {w1 , . . . , wm , wm+1 } eine orthonormale Familie. Außerdem ist diese
Familie linear unabhängig, denn aus λ1 w1 + . . . + λm+1 wm+1 = 0 mit Skalaren
λj folgt durch Einsetzen und (2)
0 = h0, wk i = hλ1 w1 + . . . + λm+1 wm+1 , wk i
= λ1 hw1 , wk i + . . . + λm+1 hwm+1 , wk i = λk .
Damit bildet {w1 , . . . , wm , wm+1 } eine Orthonormalbasis der linearen Hülle
W ′ := LIN(w1 , . . . , wm , wm+1 ) von w1 , . . . , wm , wm+1 (also dem von diesen Vektoren erzeugte Unterraum; siehe Lineare Algebra). Falls W ′ = V sind wir fertig;
andernfalls liefert eine Fortführung dieser Konstruktion mit W ′ statt W nach
endlich vielen Schritten eine solche Orthonormalbasis für V . •
Beispiel: Wir betrachten den R3 mit dem Standardskalarprodukt. Es sei
 
√
1
1  
12 + 12 + 02
√
= 1.
w1 := √
mit
kw1 k =
1
2
2
0
Wählen wir etwa

0
6 LIN(w1 ) = Rw1 =: W,
v :=  0  ∈
1

53
so erhalten wir gemäß dem Gram-Schmidtschen Orthonormalisierungsverfahren
 
0
v ′ = 0 und w = v − v ′ =  0  mit kwk = 1.
1
Entsprechend sei w2 := w und wir fahren fort mit
 
1
′′

v :=
0  6∈ LIN(w1 , w2 ) =: W ′ .
0
Mit der orthogonalen Projektion auf W ′ ,
 +
  *   +  
* 1 
1
1
1
0
0
1
1
 0 , √  1  · √  1  +  0 , 0  ·  0 
v ′′′ :=
2
2
0
0
0
0
1
1
 
1
1 
=
1
2
0
ergibt sich


1
1
1
mit kw′ k = √ .
w′ := v ′′ − v ′′′ =  −1 
2
2
0
√
Zusammen mit w3 = 2w′ bilden w1 und w2 eine Orthonormalbasis des R3 .
Ein euklidischer Raum V ist die orthogonale Summe der Unterräume
V1 , . . . , Vk , falls
V = V1 + . . . + Vk
mit Vi ⊥Vj für i 6= j;
in diesem Fall schreiben wir auch V = V1 ⊥ . . . ⊥Vk . Hierbei steht die Summe
links für die Menge aller Vektoren der Gestalt v = v1 + . . . + vj mit vj ∈ Vj und
Vi ⊥Vj bedeutet, dass vi ⊥vj für alle vi ∈ Vi und vj ∈ Vj gilt. Damit gilt
Satz 2.19. Sei V ein endlich-dimensionaler euklidischer Raum und W ⊂ V
ein Unterraum. Dann gilt
V = W ⊥W ⊥;
dabei ist die Summe sogar direkt, d.h. W ∩ W ⊥ = {0}. Insbesondere gilt
dim V = dim W + dim W ⊥ .
Beweis. Hierzu ergänze man eine Orthonormalbasis B von W mit Hilfe des
Satzes 2.18 zu einer Orthonormalbasis B ′ von V . Dann bilden die Vektoren aus
B ′ \ B eine Orthonormalbasis von V \ W und jeder Vektor dieser Menge ist
offensichtlich orthogonal zu W . •
Aufgaben
54
Aufgabe 44 (Staatsexamen: Frühjahr 2007, Thema 2,
4
Vektorraum R seien die drei Vektoren

 
 
1
1

 2 
 2 


 
v1 = 
 3  , v2 =  2  , v3 = 
3
4
4
Aufgabe 1). Im reellen

1
2 

5 
6
gegeben. Weiter sei V = hv1 , v2 , v3 i ⊂ R der von diesen Vektoren aufgespannte Unterraum.
a) Zeigen Sie, dass v1 , v2 eine Basis von V ist und stellen Sie v3 als Linearkombination von v1 und v3 dar.
4
b) Ergänzen Sie v1 , v2 zu einer Basis von R .
4
c) Bestimmen Sie (bezüglich des Standardskalarprodukts auf R ) eine Ortho4
⊥
normalbasis für das orthogonale Komplement V von V in R .
Aufgabe 45. Zeigen Sie, dass die Menge C der auf dem Einheitsintervall erklärten
Polynome mit reellen Koeffizienten von einem Grad ≤ 5 einen Vektorraum mit der
wie folgt erklärten Addition und skalaren Multiplikation einen Vektorraum bilden: Für
f, g ∈ C und λ ∈ R sei
(f + g)(x) := f (x) + g(x)
(λ · f )(x) := λ · f (x)
und
Was ist die Dimension dieses Vektorraums? Beweisen Sie ferner, dass durch
Z 1
C 2 ∋ (f, g) 7→ hf, gi :=
f (x)g(x) dx
0
ein Skalarprodukt erklärt ist und geben Sie eine Orthonormalbasis an.
n
Aufgabe 46. Seien U, V ⊂ R Untervektorräume. Zeigen sie, dass U ∪ V i.A. kein
Untervektorraum ist, wohl aber U ∩ V und U + V . Gelten diese Aussagen auch in
n
anderen Vektorräumen als R ?
Aufgabe 47. Beweisen Sie (W ⊥ )⊥ = W .
7. Hessesche Normalform
Die Hessesche Normalform hat nichts mit dem Land Hessen zu tun: Otto
Hesse war ein im 19. Jahrhundert lebender, in Königsberg (dem heutigen Kaliningrad) geborener und in München verstorbener Mathematiker, der mit seinen
Vorlesungen und Arbeiten zur analytischen Geometrie dieses Gebiet befruchtete.
Wir erinnern zunächst an den Orthogonalitätsbegriff: Ein Vektor z ∈ Rn
heißt orthogonal zu einer Geraden G ⊂ Rn , falls hz, v1 − v2 i = 0 für alle
v1 , v2 ∈ G. Hier und im Folgenden bezeichne h . , . i stets das Standardskalarprodukt. Wir greifen die Ergebnisse aus Paragraph 2.2 wieder auf.
Beispiel: Die Gerade G sei in der euklidischen Ebene gegeben durch die Gleichung 2x − y = 1 bzw. alternativ durch
0
1
G=
+R·
.
−1
2
55
Ein zum Richtungsvektor w = ( 12 ) orthogonaler Vektor ist offensichtlich w⊥ =
2
( −1
). Es ist kein Zufall, dass dieser aus den Koeffizienten der G definierenden
Abbildung 9. Die Gerade zur Gleichung 2x − y = 1 mit dem Richtungsvektor w und dem hierzu orthogonalen Vektor w⊥ . Das orthognale
Komplement von G ist die Ursprungsgerade G⊥ = IR · w⊥ .
Gleichung abgelesen werden kann, wie der folgende Satz zeigt:
Satz 2.20.
(i) Sei G = v + Rw eine Gerade, dann ist z genau dann orthogonal zu G,
wenn z⊥w.
(ii) Ist G = {(x, y) ∈ R2 : ax + by = c} mit (a, b) =
6 (0, 0), so ist
a
z = ( b )⊥G.
Beweis. Wir beginnen mit (i): Angenommen z⊥G. Mit v, v + w ∈ G folgt dann
z⊥(v + w) − v = w. Umgekehrt gilt für v1 = v + λw, v2 = v + µw ∈ G
hz, v1 − v2 i = hz, λw − µwi = (λ − µ)hz, wi = 0.
Nun zu (ii): Für v1 = ( xy11 ), v2 = ( xy22 ) ∈ G berechnet sich
hz, v1 − v2 i = hz, v1 i − hz, v2 i = (ax1 + by1 ) − (ax2 + by2 ) = c − c = 0,
womit der Satz vollständig bewiesen ist. •
Damit gelingt nun
Satz 2.21 (Normalengleichung). Für 0 6= z ∈ R2 und u ∈ R2 beschreibt
(3)
G := {v ∈ R2 : hz, v − ui = 0}
eine Gerade durch u, die orthogonal zu z ist. Ist umgekehrt G ⊂ R2 eine Gerade,
u ∈ G und z 6= 0 orthogonal zu G, so gilt (3).
56
Der Vektor z heißt dann Normalenvektor zu G; speziell mit dem Normalenz
ergibt sich die bis aufs Vorzeichen eindeutig bestimmte
einheitsvektor n := kzk
Hessesche Normalform
hn, v − ui = 0
welche in der Literatur oft auch als n · (v − u) = 0 geschrieben wird.
Beweis. Sei z = ( ab ), v = ( xy ) und c = hz, ui. Dann gilt
hz, v − ui = hz, vi − hz, ui = ax + by − c.
Nach Satz 2.4 ist G damit eine Gerade. Wegen hz, u − ui = hz, 0i = 0 ist u ∈ G.
Gilt ferner v ∈ G mit v 6= u, so ist w := v − u ein Richtungsvektor von G nach
Satz 2.1 und hz, wi = hz, v − ui = 0, womit z orthogonal zu w und nach Satz
2.20 damit auch zu G ist.
Für den Nachweis der zweiten Aussage sei v ∈ G mit v 6= u. Dann ist
G = v + Rw mit w := u − v. Da z orthogonal zu G ist, gilt hz, wi = 0 nach Satz
2.20. Ferner gilt mit dem bereits Bewiesenen, dass
G′ := {v ′ ∈ R2 : hz, v ′ − ui = 0}
eine Gerade mit u ∈ G′ ist; außerdem zeigt hz, v − ui = −hz, wi = 0, dass v ∈ G′
gilt. Da eine Gerade durch zwei Punkte nach Korollar 2.3 eindeutig bestimmt
ist, folgt G = G′ . •
Nun möchten wir Abstände messen. Wir definieren den Abstand eines
Punktes p von einer Menge (wie etwa einer Geraden) G durch
d(p, G) := inf{d(p, v) : v ∈ G};
dieses Infimum ist im Fall einer Geraden ein Minimum (d.h. das Extremum wird
tatsächlich angenommen), wie folgender Satz zeigt:
Satz 2.22. Sei G ⊂ Rn eine Gerade und p ∈ Rn . Dann existiert genau ein
u ∈ G, so dass p − u orthogonal zu G ist und ferner gilt d(p, G) = d(p, u).
Der senkrechte Abstand ist also minimal!
Beweis. Sei G = v + Rw. Für u = v + λw mit einem reellen λ ist p − u nach
Satz 2.20 genau dann orthogonal zu G, wenn
0 = hp − u, wi = hp − v − λw, wi = hp − v, wi − λhw, wi,
wenn also
hp − v, wi
;
kwk2
an dieser Stelle erinnern wir uns an die Orthogonalprojektion und das GramSchmidtsche Orthogonalisierungsverfahren aus dem vorangegangenen Paragraphen! Damit ist λ und also auch u eindeutig bestimmt und für beliebiges v ∈ G
gilt (p − u)⊥(v − u). Mit dem Satz des Pythagoras folgt
λ=
kp − vk2 = kp − uk2 + ku − vk2 ≥ kp − uk2 ;
die linke Seite ist also genau für v = u minimal. •
57
Der Beweis liefert eine Formel für den Abstand d(p, G): Wegen
(4)
u = v + λw = v +
gilt nämlich
hp − v, wi
w
kwk2
hp − v, wi w
d(p, G) = d(p, u) = kp − uk = p − v −
.
kwk2
Speziell für eine Gerade in der Ebene vereinfacht sich dies folgendermaßen: Sei
z 6= 0 orthogonal zu G ⊂ R2 und u ∈ G, so besteht die Normalengleichung
G = {v ∈ R2 : hz, v − ui = 0}.
Gesucht ist nun ein λ ∈ R, so dass p + λz ∈ G, weil dann
d(p, G) = d(p, p + λz) = kλzk = |λ| · kzk
besteht. Hierbei ist p + λz ∈ G äquivalent zu
0 = hz, p + λz − ui = hz, p − ui + λhz, zi
und damit
|hz, p − ui|
.
kzk
Ist die Gerade gegeben durch G = {(x, y)t ∈ R2 : ax + by = c}, so ergibt sich
via z = ( ab ) 6= 0 und c = hz, ui der minimale Abstand als
|ax0 + by0 − c|
x0
√
d(p, G) =
für p =
.
2
2
y0
a +b
d(p, G) =
Den Abstand eines Punktes von einer Geraden kann man also durch Einsetzen
in die Hessesche
Normalform berechnen! Normieren wir noch z auf Länge eins,
√
kzk = a2 + b2 = 1, so ergibt sich noch einfacher d(p, G) = |ax0 + by0 − c|. Wir
definieren ferner : Das Lot eines Punktes p auf eine Gerade G ist die Gerade
durch p, welche auf G senkrecht steht. Der Fußpunkt f ist der Schnittpunkt
von G und dem Lot (siehe Abbildung 10). Zur Berechnung dieser Größen ist
u.a. (4) nützlich!
Beispiel: Sei G = {(x, y)t ∈ R2 : 2x − y = 1}. Der Punkt (1, 0) hat Abstand
√1 von der Geraden G. In der obigen Form sind übrigens die Achsenabschnitte,
5
also die Schnittpunkte der Geraden mit den Koordinatenachsen leicht als (0, −1)
und ( 21 , 0) abzulesen.
Es gibt auch Normalformen zu Ebenen im R3 . Hier heißt ein Vektor z ∈ Rn
orthogonal zu einer Ebene E ⊂ Rn , falls hz, v1 − v2 i = 0 für alle v1 , v2 ∈ E
gilt. Dabei ist z offensichtlich genau dann orthogonal zu E = v + Rw1 + Rw2 ,
wenn z⊥w1 und z⊥w2 . Ganz ähnlich wie bei Geraden gilt hier
Satz 2.23 (Hessesche Normalform). Sei 0 6= z ∈ R3 und u ∈ R3 , so ist
E = {v ∈ R3 : hz, v − ui = 0}
eine Ebene durch u, welche orthogonal zu z ist. Ist umgekehrt E eine Ebene,
welche u enthält und orthogonal zu z ist, so ist E von obiger Form.
58
Abbildung 10. Punkt p und sein Lot auf eine Gerade G mit Fußpunkt f .
Satz 2.24. Ist E ⊂ R3 eine Ebene durch u, die orthogonal zu z ist, so gilt für
p ∈ R3
|hz, u − pi|
.
d(p, E) =
kzk
Ist speziell
E = {(x, y, z)t ∈ R3 : ax + by + cz = d}
mit gewissen a, b, c, d ∈ R, so gilt
d(p, E) =
|ax0 + by0 + cz0 − d|
√
a2 + b2 + c2
für


x0
p =  y0  .
z0
Für die Beweise verweisen wir auf das Buch von Scheid & Schwarz und diskutieren nun Anwendungen. Die eindeutige Achsenabschnittsform der Ebene
E ist von der Form
E = {(x, y, z)t ∈ R3 : αx + βy + γz = 1}
mit entsprechenden Koeffizienten α, β, γ. Diese Darstellung liefert unmittelbar
die Schnittpunkte von E mit den Koordinatenachsen: Gilt etwa α, β, γ 6= 0, so
sind diese gegeben durch ( α1 , 0, 0), (0, β1 , 0) und (0, 0, γ1 ); falls etwa α = 0 gülte,
verliefe E parallel zur x-Achse.
Beispiel (Herbst 2005, Thema 1, Aufgabe 3): Im euklidischen Raum R3 mit
den Koordinaten x, y, z seien zwei Ebenen E1 und E2 gegeben durch ihre Gleichungen
E1 : x + y = 1,
E2 : y + z = 1.
Bestimmen Sie den Abstand des Nullpunktes (0, 0, 0) ∈ R3
a) von der Ebene E1 ,
b) von der Schnittgerade L = E1 ∩ E2 .
59
Kurze Beweisskizze: Zu a): Die Ebene E1 besitzt die Darstellung




 
2
1
0





E1 =
+R
+R 0 
−1
−1
0
0
1
und also den
Normalenvektor

1
 1 
0

der Länge kzk =
√
2.
Nach entsprechender Normierung ist also die Hessesche Normalform von E1
gegeben durch die folgende lineare Gleichung
1
√ (x + y − 1) = 0.
2
Damit errechnet sich der Abstand des Nullpunktes von E1 als
1
1
d(0, E1 ) = √ |0 + 0 − 1| = √ .
2
2
Zu b): Die Schnittgerade L berechnet sich durch Lösen des durch L = E1 ∩ E2
definierten Gleichungssystems explizit als


 
1
0
L =  1  + R  −1  .
1
0
 
1
1
Der Fußpunkt des Lotes berechnet sich als 3
2 , womit sich der gesuchte
1
Abstand d(0, L) =
√
6
3
ergibt.
Aufgaben
Aufgabe 48. Gegeben eine Parabel und ein Punkt P außerhalb der Parabel. Bestimmen
Sie den Punkt Q auf der Parabel, der minimalen Abstand zum Punkt P hat. Wie groß
ist die Länge der Strecke P Q? (alte Aufgabe aus dem vergangenen Semester!)
Aufgabe 49 (Herbst 2008, Thema 3, Aufgabe 5). In der euklidischen Ebene R
werde das Dreieck mit den Eckenanzahl
A = (0, 0),
B = (4, 0),
2
C = (0, 3)
betrachtet.
2
a) Es sei t ∈ R und P = (t, t) ∈ R . Bestimmen Sie die Hessesche Normalform der Geradengleichung für die Gerade BC und damit den Abstand d des
Punktes P von der Geraden BC als Funktion von t.
b) Berechnen Sie den Inkreismittelpunkt I des Dreiecks ABC.
c) Berechnen Sie die Berührpunkte A′ ∈ BC, B ′ ∈ CA und C ′ ∈ AB des
Inkreises mit den Dreiecksseiten.
d) Zeigen Sie: Die drei Geraden AA′ , BB ′ und CC ′ treffen sich in einem Punkt.
Aufgabe 50. Beweisen Sie die Sätze 2.23 und 2.24.
60
8. Vektorprodukt und Spatprodukt
Im euklidischen Raum R3 erklären wir ein weiteres Produkt von Vektoren
durch






x2 y 3 − x3 y 2
x1
y1
x × y =  x3 y 1 − x1 y 3 
für x =  x2  , y =  y2  ∈ R3 ;
x1 y 2 − x2 y 1
x3
y3
wir nennen x × y das Vektorprodukt (bzw. Kreuzprodukt) von x und y.
Man verifiziert leicht, dass dieses Produkt schiefsymmetrisch ist:
x × y = −y × x.
Mit dem Vektorprodukt lassen sich lineare Abhängigkeiten entdecken.
Satz 2.25. Es gilt genau dann x × y = 0 mit x, y ∈ R3 , wenn x und y linear
abhängig sind.
Beweis. Mit den üblichen Bezeichnungen für die Koordinaten von x und y ist
x × y = 0 äquivalent zu
x2 y3 − x3 y2 = x3 y1 − x1 y3 = x1 y2 − x2 y1 = 0.
Angenommen, keine der Koordinaten xj , yk verschwindet, so können wir die
drei vorangegangenen Gleichungen umschreiben zu
x3
x1
x2
=
=
,
y2
y3
y1
was aber bedeutet, dass x ein Vielfaches von y ist, so dass die beiden also linear
abhängig sind. Im Falle x = 0 oder y = 0 sind x und y linear abhängig und
ebenso x × y = 0. Es verbleibt nur noch der Fall, dass oBdA x 6= 0, aber x1 = 0.
Aus x × y = 0 folgt dann aber sofort y1 = 0 (da weder x2 noch x3 gleichzeitig
verschwinden). Nun folgt aus x × y = 0 aber
x2 y 2
= 0,
det
x3 y 3
was bekanntlich die lineare Abhängigkeit nach sich zieht, welches wiederum die
lineare Abhängigkeit von x und y impliziert. •
Das Vektorprodukt ist nicht assoziativ, aber bilinear (wie das Skalarprodukt). Neben diesen strukturellen Eigenschaften besitzt es aber noch eine interessante geometrische Eigenschaft:
Satz 2.26. Es seien x, y ∈ R3 .
(i) Sind x und y linear unabhängig, so steht x × y orthogonal zu der von
x und y aufgespannten Ebene.
(ii) Es gilt kx × yk = kxk · kyk · sin φ, wobei φ = ∠(x, y); insbesondere ist
kx × yk der Flächeninhalt des von x und y aufgespannten Parallelogramms.
61
Aussage (i) lässt sich gut bei der Findung Hessescher Normalformen einsetzen!
Ist etwa E = u + Rw1 + Rw2 gegeben, so ist z = w1 × w2 ein zu E orthogonaz
ler Vektor und mit dem Normaleneinheitsvektor n = kzk
entsteht die bis aufs
Vorzeichen eindeutige Hessesche Normalform hn, v − ui = 0.
Beweis. Wir berechnen
hx, x × yi = x1 (x2 y3 − x3 y2 ) + x2 (x3 y1 − x1 y3 ) + x3 (x1 y2 − x2 y1 );
denselben Wert erhalten wir für die Determinante der 3 × 3-Matrix gebildet
von den linear abhängigen Vektoren x, x und y. Entsprechend verschwindet die
Determinante und so auch hx, x × yi = 0. Ganz analog zeigt sich hx × y, yi = 0.
Ferner ist mit seiner Bilinearität das Vektorprodukt auch orthogonal zu jeder
Linearkombination von x und y, was Aussage (i) beweist.
Abbildung 11. Die Berechnung des Flächeninhaltes eines Parallelogramms mit Hilfe des Vektorproduktes.
Für den Beweis von (ii) rechnen wir
kx × yk2 = (x2 y3 − x3 y2 )2 + (x3 y1 − x1 y3 )2 + (x1 y2 − x2 y1 )2
= (x21 + x22 + x23 )(y12 + y22 + y32 ) − (x1 y1 + x2 y2 + x3 y3 )2 )
= kxk2 kyk2 − (kxk · kyk · cos φ)2
= kxk2 kyk2 (1 − (cos φ)2 );
mit dem Satz des Pythagoras für trigonometrische Funktionen, cos2 + sin2 = 1,
ergibt sich die Formel aus (ii). Betrachten wir das von x und y aufgespannte Parallelogramm, so berechnet sich dessen Flächeninhalt über die bekannte
Formel Länge der Grundlinie multipliziert mit der Länge der Höhe als
kxk · kyk sin φ = kx × yk
mit Hilfe des bereits Bewiesenen. •
Beispiel: Gegeben die Vektoren
 
1

x=
2 
0
und

3
y =  4 .
0

62
Dann gilt

 

2·0−0·4
0
x×y =  0·3−1·0  =  0 
1·4−2·3
−2
und
kx × yk = 2.
Damit sind x und y also linear unabhängig. Offensichtlich steht auch x × y
orthogonal auf sowohl x als auch auf y. Ferner ist 2 = kx × yk der Flächeninhalt
des von x und y aufgespannten Parallelogramms. Dieses liegt offensichtlich in
der Ebene
 
 
0
1
E = R  0  + R  1 ;
0
0
hier reduziert sich also das Vektorprodukt auf die Determinante und es gilt die
übliche Formel für den Flächeninhalt des von zwei Vektoren x = ( xx12 ), y = ( yy12 )
in der euklidischen Ebene R2 aufgespannten Parallelogramms, nämlich bis auf
das Vorzeichen

 
 

x1
0
y
1
x1 y 1






± det
=
= x2
×
0
y2 .
x2 y 2
x y −x y
0
0
1 2
2 1
Abbildung 12. Mit Determinante und Vektorprodukt lassen sich
Flächen berechnen. Das
1
| det( −1
)| = 4.
2 2
eingezeichnete
Parallelogramm
hat
Fläche
Wir kommen zu einem weiteren Produkt von Vektoren: Das Spatprodukt
ist definiert durch


x1 y1 z1
det(x, y, z) = det  x2 y2 z2 
x3 y3 z3
63
für






x1
y1
z1
x =  x2  , y =  y2  , z =  z2  ∈ R3 ;
x3
y3
z3
Mit den uns bekannten Rechenregeln für die Determinante (siehe Lineare Algebra) ergeben sich leicht diverse Eigenschaften:
•
•
•
•
det(x, y, z) = 0 wenn und nur wenn x, y, z linear abhängig sind;
det(x, y, z) = det(y, z, x) = det(z, x, y) = − det(z, y, x);
das Spatprodukt ist trilinear;
det(x, y, z) = hx, y × zi = hx × y, zi.
Die letzten Identitäten mit dem Vektorpordukt rechnet man leicht nach. Eine
weitere interessante, vom Koordinatensystem unabhängige und damit geometrische Eigenschaft liefert
Satz 2.27. Der Absolutbetrag des Spatproduktes | det(x, y, z)| ist gleich dem
Volumen des von den Vektoren x, y, z ∈ R3 aufgespannten Parallelepipeds
(bzw. Spates)
Π = {λx + µy + νz ∈ R3 : 0 ≤ λ, µ, ν ≤ 1}.
Beweis. Das Parallelepiped Π ensteht als der konvexe Körper der durch die
Eckpunkte 0, x, y, x + y, z, x + z, y + z, x + y + z definiert ist; die Seitenflächen
sind entsprechende Parallelogramme. Wiederum gemäß der Formel Grundfläche
multipliziert mit der Höhe ergibt sich das Volumen von Π mit Hilfe von Satz
2.26 als
kx × yk · kzk cos φ,
wobei φ der Winkel zwischen z und einer zur Grundfläche orthogonalen Gerade
ist. Damit folgt nunmehr
kx × yk · kzk cos φ = |hx × y, zi| = | det(x, y, z)|,
was zu zeigen war. •
Beispiel: Gegeben seien die Vektoren
 


 
2
0
0





x=
0 ,y =
−3 , z =
1  ∈ R3 ;
0
0
4
diese bilden die Eckpunkte eines Parallelepipeds mit Eckpunkten 0, x, y, x +
y, z, x + z, y + z, x + y + z und Volumen 24 = − det(x, y, z) (siehe Abbildung
13).
Das Spatprodukt kann noch mehr. Seien zwei Geraden Gj = vj + Rwj ⊂ R3
(j = 1, 2) gegeben. Wir wollen den Abstand der beiden Geraden voneinander
messen, also
d(G1 , G2 ) = min{d(u1 , u2 ) : uj ∈ Gj }
64
Abbildung 13. Versuch einer Zeichnung eines dreidimensionalen Objektes auf zweidimensionalem Grund.
bestimmen; es ist anschaulich klar, dass es Punkte uj ∈ Gj gibt, deren Distanz
minimal ist (so dass wir nicht ein Infimum zu bilden haben). Wir berechnen
nun
d(u1 , u2 )2 = kv1 + λ1 w1 − (v2 + λ2 w2 )k2
= hv1 − v1 + λ1 w1 − λ2 w2 , v1 − v1 + λ1 w1 − λ2 w2 i
= kv1 − v2 k2 + 2hv1 − v2 , λ1 w1 − λ2 w2 i − 2λ1 λ2 hw1 , w2 i
+λ21 kw1 k2 + λ22 kw2 k2 .
Wir betrachten diesen Ausdruck als Funktion f zweier Veränderlicher λ1 , λ2
und suchen das Minimum dieser Funktion mit Hilfe der Methoden der Analysis
mehrerer Veränderlicher. Hierzu setzen wir also die partiellen Ableitungen von
f gleich null und erhalten so potentielle Werte für Extrema. Einsetzen derselben
in die Hesse-Matrix, bestehend aus den zweiten partiellen Ableitungen von f ,
liefert dann die Punkte uj ∈ Gj , für die deren Abstand minimal ist. Die Rechnungen gestalten sich jedoch als recht aufwendig! Ein einfaches geometrisches
Argument mit Hilfe des Spatproduktes liefert ebenso
(5)
d(G1 , G2 ) := min{d(u1 , u2 ) : uj ∈ Gj } =
(siehe Aufgabe 53).
| det(v1 − v2 , w1 , w2 )|
kw1 × w2 k
Aufgaben
Aufgabe 51. Zeigen Sie: Die vier Punkte




0
±2
a1,2 =  0  , a3,4 =  ±2 
√
√
2
− 2
65
bilden die Eckpunkte eines regulären Tetraeders. Bestimmen Sie ferner Normalenvektoren zu den vier Seitenflächen. Zeigen Sie außerdem, dass das Tetraeder durch die
folgenden vier Ungleichungen beschrieben wird:
√
√
2x2 + x3 − 2 < 0,
√
√
− 2x2 + x3 − 2 < 0,
√
√
2x1 − x3 − 2 < 0,
√
√
− 2x2 − x3 − 2 < 0.
Aufgabe 52. Beweisen Sie die Grassmann-Identität
x × (y × z) = hx, ziy − hx, yiz
sowie
(x × y) × (z × w) = det(x, z, w)y − det(y, z, w)x.
3
Aufgabe 53. Sei G = v + Rw eine Gerade im R . Zeigen Sie, dass für den Abstand
eines Punktes p von G folgende Formel gilt:
d(p, G) =
k(p − v) × wk
.
kwk
Zeigen Sie ferner Formel (5) für den Abstand zweier Geraden Gj = vj Rwj .
3
Aufgabe 54. Es seien x, y, z ∈ R kollineare Punkte. Zeigen Sie, dass dann
1
6 |h(x
× y, zi|
gleich dem Volumen des Tetraeders mit den Eckpunkten 0, x, y, z ist.
KAPITEL 3
Kegelschnitte
Apollonius (ca. ∗ 262 - † 190 v.Chr.) studierte wohl als Erster die Kegelschnitte. Die drei Kurven, die durch Schnitte eines geraden Kreiskegels mit einer
Ebene entstehen, sind bekanntlich Ellipse, Parabel und Hyperbel. Bei Apollonius finden sich bereits sehr tiefe Resultate zu diesen geometrischen Objekten.
Die Relevanz derselben offenbarte nicht zuletzt Johannes Kepler (ca. ∗ 1571 † 1630) mit seinem ersten Keplerschen Gesetz, welches besagt, dass sich Himmelskörper auf Ellipsen, Hyperbeln und Parabeln bewegen. Und natürlich sind
diese Kegelschnitte Gegenstand der Schulmathematik — ein weiterer Grund
sich mit diesen gut auszukennen!
Abbildung 1. Einige Kreise und Ellipsen – Gegenstände dieser Vorlesung und des täglichen Lebens! Wie lassen sich diese Objekte geometrisch
bzw. algebraisch beschreiben?
1. Quadratische Formen
Ein Polynom q(X) heißt homogen, wenn q(λX) = λd q(X) mit einer nichtnegativen ganzen Zahl d gilt; offensichtlich ist dann d der Grad von q. Ein
homogenes quadratisches Polynom nennen wir eine quadratische Form.
Ein Beispiel einer quadratischen Form ist etwa (x, y) 7→ x2 + 3y 2 . Die Niveaumengen (vgl. Analysis mehrerer Veränderlicher)
Nc = {(x, y) ∈ R2 : x2 + 3y 2 = c}
sind für c > 0 Ellipsen (siehe Abbildung 2).
66
67
Abbildung 2. Kein Stein in einer Pfütze sondern Ellipsen x2 + 3y 2 = c
mit c = 1, 2, . . . , 6
Gegeben ein Skalarprodukt h . , . i, erklären wir durch
q : Rn → R
x 7→ q(x) := hx, xi
die assoziierte quadratische Form. Ist hier n = 2, spricht man von einer
binären quadratischen Form; bei n = 3 von einer ternären, der Anzahl der
Unbekannten (Koordinaten) entsprechend. Wenn q bekannt ist, so lässt sich das
zugehörige Skalarprodukt durch Polarisierung (wie man leicht nachrechnet)
wie folgt gewinnen:
hx, yi = 41 (q(x + y) − q(x − y)).
Beispiel: Gegeben sei die Abbildung
x1
x=
7→ q(x) = x21 + 2x1 x2 + 4x22 .
x2
Polarisierung liefert mit y = ( yy12 ) nach einer länglichen Rechnung
1
4 (q(x
=
+ y) − q(x − y))
1
4 ((x1
+ y1 )2 + 2(x1 + y1 )(x2 + y2 ) + 4(x2 + y2 )2
−((x1 − y1 )2 + 2(x1 − y1 )(x2 − y2 ) + 4(x2 − y2 )2 ))
1 1
y1
;
= (x1 , x2 )
y2
1 4
der letzte Ausdruck definiert gerade das Skalarprodukt aus Beispiel §2.4.
Was für ein geometrisches Objekt steckt hinter der Menge aller x ∈ R2 ,
welche q(x) = 0 genügen? Und welche hinter den Lösungen der Gleichung q(x) =
68
10 etwa? Eine Antwort finden wir (vorerst noch) mit Hilfe eines Computers;
siehe Abbildung 3.
Abbildung 3. Die Menge der (x1 , x2 ), welche der Gleichung x21 +2x1 x2 +
4x22 = 10 genügt: eine Ellipse! Die Gleichung mit rechter Seite = 0 besitzt
nur den Nullpunkt als Lösung.
Übrigens interessiert man sich bei quadratischen Formen oft für das Bild der
Punkte mit ganzzahligen Koordinaten, also q(Zn ). Der Satz von Lagrange (vgl.
Elementare Zahlentheorie?) besagt, dass jede natürliche Zahl sich darstellen
lässt als Summe von vier Quadraten ganzer Zahlen:
N ⊂ q(Z4 )
für q(x) = hx, xi = x21 + x22 + x23 + x24 .
Beispielsweise
2011 = 212 + 272 + 292 = 432 + 2 · 92 .
(die Darstellung ist i.A. nicht eindeutig).
Aufgaben
Aufgabe 55. Zeigen Sie, dass zu jeder quadratischen Form q eine symmetrische Matrix
A gefunden werden kann, so dass q(x) = xt Ax gilt. Geben sie ferner ein Skalarprodukt
an, so dass q die zu diesem Skalarprodukt assoziierte quadratische Form ist. Führen sie
die weiteren Details zu Beispiel 2 aus.
Aufgabe 56. Welche geometrischen Objekte verbergen sich hinter der Menge aller
2
( xy ) ∈ R , welche der Gleichung
x2 + 6λxy + 9y 2 = 0
für λ = −1, 0, +1?
69
2. Kreise und Ellipsen
Kreise sind neben Rechtecken die vielleicht am häufigsten in der Realität
vorkommenden geometrischen Objekte. Während Rechtecke ihrer rechten Winkel wegen maßgebend für Stabilität und Ordnung sind, finden wir Kreise oftmals
im Zusammenhang mit Bewegung. Aber nicht notwendig: Eine gute Frage, die
tatsächlich sehr viel mit Geometrie zu tun hat, ist:
Warum sind Gullydeckel rund?
Ein Kreis ist die Menge aller Punkte, die von einem gewissen Punkt einen
gewissen Abstand besitzt; diesen ausgezeichneten Punkt nennen wir Mittelpunkt und besagter Abstand ist der Radius des Kreises. In der euklidischen
Ebene gilt also für jeden Punkt x = ( xx12 ) auf einem Kreis um den Mittelpunkt
p = ( pp12 ) damit
p
kx − pk = (x1 − p1 )2 + (x2 − p2 )2 ;
nennen wir diesen Abstand bzw. Radius ρ, so gilt also die Kreisgleichung:
(x1 − p1 )2 + (x2 − p2 )2 = ρ2 .
Abbildung 4. Fliesen auf Kreta: Zählen der Steine innerhalb des Viertelkreises und im gesamten Quadrat liefert
3, 04225 . . .
π
4
≈
54
54+17
bzw. π ≈
216
71
=
Die Menge E aller Punkte x ∈ R2 , für welche die Summe der Abstände zu
zwei gegebenen Punkten p, q ∈ R2 konstant gleich 2ρ mit einer positiven reellen
Zahl ρ ist, heißt eine Ellipse. Die Punkte p, q nennt man die Brennpunkte
und 12 (p + q) bezeichnet den Mittelpunkt der Ellipse. Nach Definition ist E
durch die Gleichung
kx − pk + kx − qk = 2ρ
70
beschrieben. Hier und im Folgenden bezeichne h . , . i bis auf Weiteres das Standardskalarprodukt und k . k die zugehörige euklidische Norm. Mit der Dreiecksungleichung folgt aus obigem kp − qk ≤ 2ρ. Im Falle p = q fallen die beiden
Brennpunkte zusammen und wir erhalten einen Kreis mit Mittelpunkt p (bzw.
q) vom Radius ρ (s.o.). Falls kp − qk = 2ρ gilt, so entartet unsere Ellipse zur
Verbindungsstrecke der Punkte p und q. Im Folgenden nehmen wir deshalb
kp − qk < 2ρ
(6)
an. Ferner können wir durch eine Translation stets unsere Ellipse so verschieben,
dass der Mittelpunkt im Ursprung zu liegen kommt (dass also q = −p gilt).
Satz 3.1. Die Ellipse E = {x ∈ R2 : kx − pk + kx + pk = 2ρ} besteht genau
aus den Punkten x ∈ R2 , für die
ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 )
(7)
gilt. Insbesondere ist kxk ≤ ρ.
Beweis. Quadrieren der E definierenden Gleichung liefert
kx − pk · kx + pk = 2ρ2 − kxk2 − kpk2 ;
man beachte, dass der Ausdruck rechts nicht-negativ ist. Erneutes Quadrieren
liefert
(kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 ,
welches nach Ausmultiplizieren der Terme auf die Gleichung (7) führt. Hierbei
ist aber die Nebenbedingung
kxk2 + kpk2 ≤ 2ρ2
zu beachten (um eine positive rechte Seite in der allerersten Formel zu haben).
Mit Hilfe der Cauchy-Schwarzschen Ungleichung für das Skalarprodukt
hp, xi2 ≤ kpk2 kxk2
ergibt sich aus (7)
kxk2 (ρ2 − kpk2 ) ≤ ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 ),
und wegen kpk < ρ ebenso kxk ≤ ρ, so dass also die Nebenbedingung bereits
aus der E definierenden Gleichung folgt. •
Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den
Mittelpunkt nennen wir die Achsen der Ellipse. Die Schnittpunkte derselben
mit der Ellipsen heißen Scheitelpunkte und die Strecken zum Mittelpunkt
werden Halbachsen genannt. Die Ellipse kann in einem kartesischen Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu
liegen kommen. Hierbei verstehen wir unter einer Bewegung eine Abbildung, die
den Abstand zwischen beliebigen Punkten invariant lässt (wie etwa Translationen oder Drehungen; solche Abbildungen werden uns später noch eingehend
71
beschäftigen). In diesem Fall lässt sich die Ellipse auch durch eine quadratische Gleichung beschreiben: Mittels x = ( xx12 ) und p = ( σ0 ) liefert eine einfache
Rechnung
Korollar 3.2. Nach einer geeigneten Bewegung kann eine Ellipse E beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung
2 2
x1
x2
+
= 1;
α1
α2
p
genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = ρ2 − σ 2 und die
Brennpunkte sind ±( σ0 ).
Man beachte, dass auf der linken Seite eine quadratische Form steht.
Abbildung 5. Und noch eine Ellipse.
Einen Kreis zeichnet man mit einem Zirkel. Aber wie zeichnet man eine
Ellipse? Gemäß der Definition besteht eine Ellipse aus der Menge aller Punkte,
deren Abstandssumme zu zwei ausgezeichneten Punkten konstant ist. Entsprechend spannen wir einen geschlossenen Faden der Länge 2σ + 2ρ durch einen
Bleistift um die Punkte p und q in der euklidischen Ebene und lassen den
Bleistift wandern. Dies liefert damit eine Ellipse mit Brennpunkten p, q und
Abstandssumme 2ρ und σ = 12 kp − qk. Die Fadenkonstruktion, auch Gärtnerkonstruktion genannt, wird Anthemios (im fünften Jahrhundert n. Chr.) zugeschrieben. (Siehe auch Abbildung 5.)
Sei nun α1 ≥ α2 . Die Exzentrizität
s
2
α2
ǫ := 1 −
α1
misst die Abweichung einer Ellipse von einem Kreis. Es gilt 0 ≤ ǫ < 1 und ǫ = 0
steht für die Gleichheit der Längen der beiden Halbachsen, also den Fall eines
Kreises.
72
Der Umfang U einer Ellipse lässt sich i.A. nicht explizit angeben. Was
im Spezialfall des Kreises eine leichte Übungsaufgabe in der Analysis ist (vgl.
Analysis mehrerer Veränderlicher), führt bei der Ellipse mit Hilfe der Parametrisierung durch trigonometrische Funktionen
x1 = α1 cos φ,
x2 = α2 sin φ
auf ein so genanntes elliptisches Integral
Z
Z πq
2
2
2
2
α1 (sin φ) + α2 (cos φ) dφ = 4α1
U =4
0
0
π
2
p
1 − (ǫ sin φ)2 dφ,
welches i.A. keine elementare Stammfunktion besitzt! Für den Flächeninhalt A
einer Ellipse gilt die Formel∗
A = πab.
Noch kurz sei hier auf das wohl älteste Problem der Analysis verwiesen:
Das Problem der Dido fragt nach dem maximalen Flächeninhalt, den eine
geschlossene Kurve in der Ebene umschließen kann. Die so genannte isoperimetrische Ungleichung besagt
4πA ≤ ℓ2 ,
wobei ℓ die Bogenlänge der geschlossenen Kurve ist und A die Fläche des hiervon
berandeten Gebietes (vgl. Analysis mehrerer Veränderlicher).† Im Spezialfall
eines Kreises besteht Gleichheit. Dido war die legendäre Gründerin und erste
Königin von Karthago (bei Tunis im heutigen Tunesien).
Aufgaben
Aufgabe 57. Recherchieren Sie den mathematischen Begriff kissing number und
2
geben Sie einen geometrischen Beweis, dass diese Größe im R gleich sechs ist!
Aufgabe 58. Es sei E eine Ellipse und Q ein Quadrat mit Kanten parallel zu den
Achsen von E und Eckpunkten auf E. Berechnen Sie den Flächeninhalt von Q.
Aufgabe 59. Sei die Ellipse E gegeben als die Menge aller ( xy ), welcher der Gleichung
y2
x2
+ 2 =1
2
α
β
genügen, wobei α ≥ β > 0 gelte. Zeigen Sie, dass die Tangente an den Punkt u = ( wv ) ∈
E gegeben ist durch die Gerade
!
w
−α
β
u+R
.
β
αv
Aufgabe 60. Suchen Sie im Internet nach dem Begriff Gleichdick und geben Sie eine
kurze Erläuterung dieses mathematischen Begriffes!
∗
Der Nachweis läuft über den Integrationssatz von Green und ist nicht trivial.
Der Beweis ist schwierig und wurde erst im neunzehnten Jahrhundert erbracht
†
73
3. Hyperbeln und Parabeln
Die Hyperbel ist eine nahe Verwandte der Ellipse. Die Hyperbel ist definiert als die Menge H aller Punkte x ∈ R2 , für welche der Betrag der Differenz
der Abstände zu zwei verschiedenen Punkten p, q ∈ R2 konstant gleich 2ρ ist.
Also
kx − pk − kx − qk = ±2ρ.
Die Punkte p, q heißen wiederum Brennpunkte und 21 (p + q) ist der Mittelpunkt. Sofern H nicht die leere Menge ist, gilt vermöge der Dreiecksungleichung
2ρ ≤ kp − qk =: 2σ.
Gilt kp − qk = 2ρ bzw. ρ = 0, so entartet die Hyperbel zur Geraden pq durch p
und q. Im Folgenden nehmen wir deshalb
0 < 2ρ < kp − qk
(8)
an. Wie bei der Ellipse können wir durch eine geeignete Bewegung unsere Hyperbel so verschieben, dass der Mittelpunkt im Ursprung zu liegen kommt (dass
also q = −p gilt).
Satz 3.3. Die Hyperbel H = {x ∈ R2 : kx − pk − kx + pk = ±2ρ} besteht genau
aus den Punkten x ∈ R2 , für die
(9)
ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 )
gilt. Insbesondere ist kxk ≥ ρ.
Man beachte, dass die Gleichungen für die Ellipse (7) und für die Hyperbel (9)
identisch sind, jedoch wegen der unterschiedlichen Bedingungen (6) und (8) zu
unterschiedlichen geometrischen Objekten führt!
Beweis. Die H definierende Gleichung quadriert schreibt sich als
−kx − pkkx + pk = 2ρ2 − kpk2 − kxk2 ;
die rechte Seite ist also nicht positiv. Weiteres Quadrieren liefert
(kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 ,
wobei nun die Nebenbedingung also (entsprechend der ersten Formel)
2ρ2 ≤ kxk2 + kpk2
lautet. Durch Termumformung entsteht hieraus nun (9). Aus (9) folgt wiederum
mit der Cauchy-Schwarzschen Ungleichung
kxk2 (ρ2 − kpk2 ) ≤ ρ2 (ρ2 − kpk2 );
wegen 0 < ρ < kpk nach (8), ergibt sich nun ρ ≤ kxk und die Nebenbedingung
folgt also wiederum aus der definierenden Gleichung. •
Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den
Mittelpunkt nennen wir die Achsen der Hyperbel. Die Schnittpunkte derselben
mit der Hyperbel heißen Scheitelpunkte die Strecken zum Mittelpunkt werden Halbachsen genannt. Natürlich kann die Hyperbel in einem kartesischen
74
Abbildung
6. Die Hyperbel x2 − 3y 2 = 1 mit ihren beiden Asymptoten
√
x±
3y = 0. Wo liegen die Brennpunkte?
Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu liegen kommen. In diesem Fall lässt sich die Hyperbel auch durch eine
quadratische Gleichung beschreiben:
Korollar 3.4. Nach einer geeigneten Bewegung kann eine Hyperbel H beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung
2 2
x2
x1
−
= 1;
α1
α2
p
genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = σ 2 − ρ2 und die
Brennpunkte sind ±( σ0 ).
Man beachte, dass auf der linken Seite wiederum eine quadratische Form steht.
Im Gegensatz zur Ellipse steht hier (der Definition entsprechend) die Differenz
zweier Quadrate!
Die Hyperbel ist ein unbeschränktes Objekt in dem Sinne, dass sie nicht
Teilmenge einer beschränkten Menge ist (wie die Ellipse). Die Asymptoten
der Hyperbel ergeben sich als die Geraden, die den Lösungen der verwandten
Gleichgung
2 2 x2
x1
x1
x2
x2
x1
−
=
−
+
0=
α1
α2
α1 α2
α1 α2
75
15
10
5
-5
5
15
10
20
-5
-10
-15
Abbildung 7. Die Hyperbel X 2 − 2Y 2 = 1; die ganzzahligen Punkte
sind fett eingezeichnet, wie etwa (x, y) = (3, 2).
entsprechen, also
A± :
α2 x1 ± α1 x2 = 1.
An diese schmiegen sich die Hyperbeläste nämlich mit wachsendem x1 bzw.
x2 zusehends an. Beim Zeichnen von Hyperbeln ist es sinnvoll, zunächst die
Asymptoten zu zeichnen und dann erst die sich anschmiegenden Hyperbeläste.
Wir hatten beobachtet, dass die trigonometrischen Funktionen sin und cos
die Ellipse parametrisieren. Deren hyperbolische Varianten, der Sinus hyperbolicus und der Kosinus hyperbolicus
sinh φ = 12 (exp(φ) − exp(−φ))
und
cosh φ = 21 (exp(φ) + exp(−φ)),
führen via x1 = α1 cosh φ und x2 = α2 sinh φ auf die Gleichung:
2 2
x2
x1
−
= (sinh φ)2 − (cosh φ)2 = 1.
α1
α2
Die algebraische Gleichung links beschreibt eine Hyperbel gemäß Korollar 3.4.
Mit der Pellschen Gleichung X 2 − dY 2 = 1 hatten wir tatsächlich Beispiele
von Hyperbeln in der Elementaren Zahlentheorie kennen gelernt. Dort hatten
wir bewiesen, dass auf solchen Hyperbeln stets unendlich viele Punkte mit ganzzahligen Koordinaten liegen sofern d ∈ N kein Quadrat ist, wie etwa (3, 2) auf
der Hyperbel
X 2 − 2Y 2 = 1
76
(siehe Abbildung 7). Durch Quadrieren ergeben sich weitere Lösungen:
√
√
(3 + 2 2)2 = 17 + 12 2,
und durch Potenzieren sogar alle Lösungen, u.a. auch die Lösung√x = 99 und
2 gewinnen
y = 70, aus der man die rationale Approximation xy = 99
70 an
kann. Diese wird beim Din A4-Format benutzt, um annähernd die gewünschte
Inavrianz des Längenverhältnis beim Falten zu realisieren!
Die Parabel P ist die Menge aller Punkte x ∈ R2 , die gleichen Abstand
von einer Geraden G und einem Punkt p ∈ R2 \ G haben, d.h.
P := {x ∈ R2 : d(x, G) = kx − pk}
und 2ρ := d(p, G) > 0.
Dabei heißt G die Leitlinie und p der Brennpunkt von P . Ist G als die
Menge aller x gegeben, die he, xi = c mit einem Einheitsvektor e ∈ G (also der
Länge kek = 1) und einer gewissen Konstanten c erfüllt, so lässt sich P mit der
Hesseschen Normalform wie folgt darstellen:
|he, xi − c| = kx − pk
mit 2ρ = |he, pi − c|.
Der Scheitelpunkt ist die Mitte des Lotes von p auf G; mit Hilfe einer geeigneten Translation liegt dieser im Nullpunkt und die Parabel P besitzt die
Darstellung
kxk2 − he, xi2 = 4ρhe, xi.
Hieraus gewinnt man nun die Normalform
x2 = αx21
für die Punkte x = ( xx12 ) ∈ P .
Abbildung 8. Eine Parabel P mit Leitlinie G; Lichtstrahlen durch den
Brennpunkt p werden an P orthogonal zur Leitlinie reflektiert.
Ellipsen und Parabeln besitzen interessante optische Eigenschaften, welche
u.a. den Begriff Brennpunkt erklären. Sei E eine Ellipse mit Brennpunkten p
und q. Dann wird jeder von q ausgehende Lichtstrahl an E so reflektiert, dass er
schließlich durch p geht (gemäß dem physikalischen Gesetz, dass Ausfalls- und
77
Einfallswinkel identisch sind). Bei der Parabel P gibt es eine erstaunliche Reflexionseigenschaft zu vermerken: Alle Lichtsrahlen, die orthogonal zur Leitlinie
einfallen, werden an P so reflektiert, dass sie durch den Brennpunkt gehen. Dies
wird insbesondere bei Parabolantennen ausgenutzt!
Aufgaben
Aufgabe 61. Wie könnte eine Fadenkonstruktion der Hyperbel bzw. der Parabel aussehen?
Aufgabe 62. Beweisen Sie die Aussagen über die Eigenschaften von Lichtstrahlen aus
einem Brennpunkt einer Ellipse bzw. aus einer Parabel.
2
Aufgabe 63. Gegeben sei die Parabel durch die Gleichung y = αx2 in R mit einem
0 6= α ∈ R. Berechnen Sie die Leitlinie und den Brennpunkt.
4. Die orthogonale Gruppe
”Geometrie ist die Invariantentheorie von Transformationen.”
schrieb Felix Klein in seinem Erlanger Programm. Entsprechend interessieren
wir uns im Folgenden für spezielle Abbildungen, welche die Lage eines geometrischen Objektes in der Ebene oder im Raum verändern, dabei jedoch das Objekt
an sich unverändert lassen (wie etwa eine Translation um einen Vektor). Wir
beginnen hierzu mit einem Beispiel in der Ebene: Die Abbildung
x1
−x2
f : R2 ∋ x =
7→ f (x) := x⊥ =
x2
x1
0 −1
∈ R2×2 beschreiben:
lässt sich durch die Matrix A :=
1 0
x1
x1
x1
−x2
0 −1
x=
7→ A
=
=
= f (x).
1 0
x2
x2
x2
x1
Insbesondere ist also f eine lineare Abbildung. Was geschieht mit Vektoren
unter f ? Speziell für die Standardeinheitsvektoren e1 = ( 10 ) und e2 = ( 01 ) des
R2 beobachten wir
Ae1 = e2
und
Ae2 = −e1 ,
bzw.
f (Re1 ) = Re2
und
f (Re2 ) = −Re1 = Re1 .
Da eine lineare Abbildung bereits durch die Bilder einer Basis eindeutig festgelegt ist (siehe lineare Algebra), folgt, dass f eine Drehung um einen rechten
Winkel im mathematischen Umlaufsinn (entgegen dem Uhrzeigersinn) mit Fixpunkt im Ursprung ist (siehe Abbildung 9). Insbesondere werden Ursprungsgeraden auf Ursprungsgeraden abgebildet. Übrigens folgt hieraus sofort, dass
A keine reellen Eigenwerte besitzen kann, denn für einen reellen Eigenwert λ
gäbe es nach Av = λv mit passenden Eigenvektoren v 6= 0 eine Gerade, nämlich
Rv, die invariant unter Anwendung von A wäre, was aber für unsere Drehung
unmöglich ist.
78
Abbildung 9. Eine Drehung f um 90 Grad um den Ursprung; jede Ursprungsgerade G wird auf eine um einen rechten Winkel gedrehte Ursprungsgerade f (G) abgebildet.
Tatsächlich ist die Matrix A der Prototyp einer orthogonalen Matrix,
welche also AAt = E (mit der passenden Einheitsmatrix E) erfüllt. Es gilt
nämlich:
1 0
0 0
0 −1
t
= E.
=
AA =
0 1
−1 0
1 0
Wir wiederholen Wissenswertes über solche Matrizen aus der linearen Algebra:
Satz 3.5. Für A ∈ Rn×n sind äquivalent:
(i)
(ii)
(iii)
(iv)
(v)
(vi)
A ist orthogonal,
At ist orthogonal,
A ist invertierbar und es gilt A−1 = At ,
die Spaltenvektoren von A haben Länge eins und sind orthogonal,
es gilt kAvk = kvk für alle v ∈ Rn ,
es gilt hAv, Awi = hv, wi für alle v, w ∈ Rn .
Ist dies der Fall, dann gilt det A = ±1 und reelle Eigenwerte von A sind ∈ {±1}.
Wir wiederholen den Beweis: Ist A orthogonal, dann gilt AAt = E und mit
dem Determinantenmultiplikationssatz folgt
1 = det E = det(AAt ) = det A · det At = (det A)2
und also det A = ±1. Also ist jede orthogonale Matrix A invertierbar und wegen
AAt gilt A−1 = At , was (iii) impliziert. Ferner ergibt sich durch Transposition
E = (AAt )t = (At )t At .
Also ist At ebenso orthogonal und (ii) folgt somit aus (i) bzw. die umgekehrte
Implikation aus dem bereits Gezeigten. Ebenso impliziert (ii) unmittelbar (iii).
Die Äquivalenz von (i) und (iv) beweisen wir nur für den Spezialfall n = 2 und
79
K = R: Wir schreiben A = (w1 , w2 ) mit Spaltenvektoren wj ∈ R2 . Mit den
Rechenregeln für Matrizen zeigt sich dann
t
t kw1 k2 hw1 , w2 i
w1 w1 w1t w2
w1
t
=
.
(w1 , w2 ) =
E = AA =
hw1 , w2 i kw2 k2
w2t w1 w2t w2
w2t
Also folgt kwj k = 1 und hw1 , w2 i = 0. (Der allgemeine Fall geht analog.) Ferner
impliziert (i) auch (v), denn
kAvk2 = (Av)t (Av) = v t At Av = vv t = kvk2 .
Aus (v) folgt (vi), denn eine kurze Rechnung zeigt
kAvk2 + 2hAv, Awi + kAwk2 = kA(v + w)k2 = kv + wk2 = kvk2 + 2hv, wi + kwk2 .
Nach Subtraktion von kAvk2 = kvk2 und kAwk2 = kwk2 ergibt sich die Aussage.
Schließlich folgert man noch (i) aus (vi) mit Wahl der kanonischen Einheitsvektoren. Gilt nun eine dieser Eiegnschaften, ist also A orthogonal, so gilt nach
(iv) für einen Eigenwert λ von A wegen Av = λv mit einem Eigenvektor v
insbesondere
kvk = kAvk = kλvk = |λ| · kvk;
wegen v 6= 0 folgt hieraus |λ| = 1, was den Beweis abschließt. •
Sei O(Rn ) die Menge aller orthogonalen n × n-Matrizen A mit Einträgen
aus R; es gilt also At A = E. Nach dem gerade bewiesenen Satz ist O(Rn ) eine
multiplikative Gruppe, die so genannte orthogonale Gruppe des Vektorraums
Rn (vgl. Lineare Algebra). Tatsächlich wird mit dieser Notation die Aktion der
orthogonalen Matrizen auf Vektoren des Rn gemäß Aussage (v) des Satzes betont: Matrizen induzieren lineare Abbildungen und – umgekehrt – existiert zu
jeder linearen Abbildung f eine Matrix A, so dass
f (v) = Av
für v ∈ Rn .
Tatsächlich gibt nun jede orthogonale Matrix A vermöge dieser Vorschrift Anlass
zu einer linearen Abbildung f , welche die Eigenschaft
(10)
hf (v), f (w)i = hv, wi
für alle
v, w ∈ Rn
besitzt. Entsprechend nennen wir einen Endomorphismus f : Rn → Rn orthogonal, falls die vorangegangene Bedingung (10) erfüllt ist. Es gilt folgender
Satz 3.6. Für eine orthogonale Abbildung f : Rn → Rn gelten:
(i) kf (v)k = kvk für alle v ∈ V ;
(ii) ist λ ein Eigenwert von f (d.h. f (v) = λv für ein v 6= 0), so ist
|λ| = 1;
(iii) es ist genau dann v⊥w, wenn f (v)⊥f (w);
(iv) f ist injektiv.
Gemäß (iii) sind die Bilder orthogonaler Vektoren unter solchen Abbildungen f
wieder orthogonal, welches die Namensgebung orthogonale Abbildung rechtfertigt.
80
Der Beweis ergibt sich leicht aus Satz 3.5: Beispielsweise entspricht (i) Aussage (v) aus Satz 3.5 (und die weiteren Details seien dem Leser/der Leserin
überlassen). Alternativ kann man aber auch einfach die Definition orthogonaler
Abbildungen benutzen: So gilt wegen (10)
kf (v)k2 = hf (v), f (v)i = hv, vi = kvk2
für beliebiges v. Wurzelziehen liefert nun (i). Ähnliches gilt für die anderen
Behauptungen. •
Aufgaben
n×n
Aufgabe 64. Eine Matrix A ∈ R
ist genau dann orthogonal, wenn mit jeder
n
Orthonormalbasis {v1 , . . . , vn } auch {Av1 , . . . , Avn } eine Orthonormalbasis des R ist.
Beweisen Sie dies für den Fall n = 2.
Aufgabe 65. Komplettiere den Beweis von Satz 3.6.
5. Drehungen in der Ebene und im Raum
Wir kehren nun zunächst zum Spezialfall orthogonaler 2×2-Matrizen zurück
und untersuchen die etwas allgemeinere Abbildung x 7→ D(α)x mit der Matrix
cos α − sin α
D(α) :=
,
sin α cos α
wobei α ∈ R ein fester Parameter sei. Tatsächlich ist D(α) eine orthogonale
Matrix:
cos α − sin α
cos α sin α
t
D(α)D(α) =
=E
sin α cos α
− sin α cos α
mit Hilfe des Satzes von Pythagoras; ferner gilt det D(α) = +1 unabhängig von
α. Wir definieren
cos α
e(α) =
.
sin α
Dann gilt offensichtlich e(α)⊥e(α ± π2 ) und es besteht die Polarkoordinatendarstellung x = kxke(α) für Vektoren 0 6= x ∈ R2 mit einem Winkel α ∈ [0, 2π).
Allgemeiner liefert das Additionstheorem 2.16 (mit −β statt β)
he(α), e(β)i = cos(α − β).
Nun sei noch
cos α sin α
S(α) :=
sin α − cos α
für α ∈ R. Offensichtlich ist auch S(α) eine orthogonale Matrix, jedoch mit
Determinante det Sα = −1. Wir berechnen wiederum mit Hilfe des Additionstheorems 2.16
D(α)e(β) = e(α + β)
und
D(α)D(β) = D(α + β)
und
D(α)S(β) = S(α + β)
und
S(α)e(β) = e(α − β),
S(α)S(β) = D(α − β),
S(α)D(β) = S(α − β).
81
Abbildung 10. Links: eine Drehung um den Winkel α durch Anwendung der Drehmatrix D(α) auf den Vektor e(β) auf dem Einheistkreis.
Rechts: Eine Spiegelung an der y-Achse vermöge S(π).
Diese Berechnungen führen zu
Satz 3.7. Die Abbildung x 7→ D(α)x beschreibt eine Drehung in R2 um den
Winkel α (im mathematischen Umlaufsinn‡) mit Fixpunkt im Nullpunkt; ferner
beschreibt x 7→ S(α)x eine Spiegelung in R2 an der Geraden Re( α2 ). Ferner ist
jede orthogonale 2 × 2-Matrix A von dieser Form und es gilt
det A = +1
det A = −1
⇐⇒
A = D(α),
⇐⇒
A = S(α)
mit einem passendem α ∈ [0, 2π).
Beweis. Es verbleibt lediglich noch zu zeigen, dass jede orthogonale Matrix
A ∈ R2×2 entweder von der Form D(α) oder von der Form S(α) mit einem passenden Parameter α ist, je nachdem ob det A = +1 oder −1; die Determinantenbedingung ergibt sich hierbei sofort aus der Definition von D(α) und S(α).
Nach Satz 3.5 (iv) besitzt A orthogonale Spaltenvektoren w1 , w2 der Länge eins.
Mit w1 = ( xy ) folgt aus kw1 k = 1 zunächst x2 + y 2 = 1 und mit Hilfe der Stetigkeit der trigonometrischen Funktionen ergibt sich die Existenz eines reellen
α, so dass die Darstellung w1 = e(α) besteht. Hieraus folgt
∓ sin α
⊥
π
,
w2 = w1 = e(α ± 2 ) =
± cos α
was wegen A = (w1 , w2 ) auf A = S(α) oder A = D(α) führt und den Beweis
abschließt. •
Die orthogonalen A ∈ O(Rn ) mit det A = +1 bildet eine Untergruppe, die
spezielle orthogonale Gruppe SO(Rn ). Speziell im euklidischen Raum R3
werden Drehungen um die z-Achse vermöge der Matrizen


cos α − sin α 0
∆(α) =  sin α cos α 0 
0
‡
also entgegen dem Uhrzeigersinn
0
1
82
realisiert, wobei α ∈ R der Drehwinkel ist. Mit
f : R3 → R3 ,
x 7→ f (x) = ∆(α)x
berechnet sich nämlich leicht f (Re3 ) = Re3 mit dem Standardeinheitsvektor
et3 = (0, 0, 1); d.h. die z-Achse wird tatsächlich von f fest gelassen und die
Projektion auf die xy-Ebene ist nichts anderes als die Drehung D(α) in der
Ebene. Ganz ähnlich lassen sich Drehungen um die x- bzw. y-Achse beschreiben.
Tatsächlich gibt es für eine Drehung des R3 insgesamt drei Freiheitsgrade: zwei
für die Drehachse und einen für den Drehwinkel. Für die spezielle orthogonale
Gruppe SO(R3 ) aller Matrizen A ∈ O(R3 ) mit det A = 1 gilt
Satz 3.8. Jede Drehung in R3 um eine Ursprungsgerade lässt sich darstellen
als x 7→ Ax mit A ∈ SO(R3 ) (also det A = +1). Ist A ∈ SO(R3 ), so gibt es
Winkel α, β, γ ∈ [0, 2π), so dass




cos α − sin α 0
1
0
0
cos γ − sin γ 0
A =  sin α cos α 0   0 cos β − sin β   sin γ cos γ 0  .
0
0
1
0 sin β cos β
0
0
1
Ferner induziert jedes A ∈ SO(R3 ) eine Drehung in R3 .
Für den Beweis sei jeweils auf das Buch von Fischer verwiesen.
Beispiel (Frühjahr 2007, Thema 1, Aufgabe 3): Es seien ϕ1 und ϕ2 die Drehungen um die x-Achse bzw. um die z-Achse des R3 mit
 
 
 
 
0
0
1
1
1
1
ϕ1 :  0  7→ √  1  und ϕ2 :  0  7→ √  1  .
2
2
1
1
0
0
a) Zeigen Sie, dass die Hintereinanderausführung ϕ1 ◦ ϕ2 eine Drehung
ist.
b) Zeigen Sie, dass ϕ1 ◦ ϕ2 durch die Matrix

 1
√
√1
−
0
2
2
 1
1
√1 
 2
2
2 
− 21 − 12 √12
gegeben wird.
c) Bestimmen Sie die Drehachse von ϕ1 ◦ϕ2 sowie den Cosinus des Drehwinkels α.
Die den Drehungen ϕj assoziierten Abbildungsmatrizen Aj ∈ R3×3 sind orthogonal mit det Aj = 1. Insbesondere ist die Abbildungsmatrix A = A1 · A2
der Komposition ϕ := ϕ1 ◦ ϕ2 wiederum orthogonal mit det A = 1 (nach dem
Determinantenmultiplikationssatz (vgl. Lineare Algebra bzw. mit der Gruppeneigenschaft). Entsprechend ist ϕ eine Drehung, was für a) zu zeigen war. Für
die Drehung ϕ1 um die x-Achse ist die zugehörige Abbildungsmatrix von der
83
Gestalt


1
0
0
A1 =  0 cos α1 − sin α1 
0 sin α1 cos α1
mit einem Drehwinkel α1 . Wegen
 
 
  

0
0
0
0
1
√  1  = ϕ1  0  = A1  0  =  − sin α1 
2
1
1
cos α1
1
ergibt sich

1
0
 0 √1
A1 = 
2
0 − √12
0
√1
2
√1
2



(und α1 = − π4 ). Da ϕ2 eine Drehung um die z-Achse ist, besitzt A2 die Gestalt


cos α2 − sin α2 0
A2 =  sin α2 cos α2 0 
0
0
1
mit einem Drehwinkel α2 . Hier berechnet sich
 1
√
− √12
 √12
√1
A2 =  2
2
0
0
ganz analog

0

0 
1
(und also α2 = π4 ), womit sich nun leicht die explizite Form von A aus b)
errechnen lässt. Es verbleibt c): Die Drehachse GA besteht aus den Fixpunkten
von ϕ; aus der entsprechenden Gleichung ϕ(v) = v bzw. Av = v folgt, dass die
Drehachse also mit dem Eigenraum zum Eigenwert 1 von A übereinstimmt (vgl.
lineare Algebra). Wir berechnen demzufolge diesen Eigenraum durch Lösen des
homogenen linearen Gleichungssystems (A − 1 · E)v = 0 als


−1√
GA = R ·  −1 + 2  .
1
Für den Drehwinkel α von ϕ gilt nun (vgl. nachstehenden Satz 3.9)
1 1
1
1
1
1
1
cos α = (Spur(A) − 1) = ( √ + + √ − 1) = √ − .
2
2 2 2
2
2 4
Eine weitere orthogonale 3 × 3-Matrix ist für α ∈ R gegeben durch


−1
0
0
∇(α) :=  0 cos α − sin α  .
0 sin α cos α
Diese liegt offensichtlich nicht in SO(R3 ), sondern vielmehr induziert sie
vermöge f : x 7→ f (x) = ∇(α)x eine Drehspiegelung, d.h. eine Drehung
um die x-Achse um einen Winkel α und Spiegelung an der Ebene yz-Ebene.
84
Legen wir übrigens eine Orthonormalbasis {v1 , v2 , v3 } des R3 zugrunde, so beschreiben die obigen Matrizen




cos α − sin α 0
−1
0
0
∆(α) =  sin α cos α 0 
und
∇(α) :=  0 cos α − sin α  .
0
0
1
0 sin α cos α
eine Drehung um den Winkel α mit Drehachse Rv1 bzw. eine Drehspiegelung
um Rv1 und Spiegelung an der Ebene Rv2 + Rv3 . Durch einen geeigneten Basiswechsel lassen sich Drehungen und Spiegelungen also mit sehr einfachen Matrizen beschreiben! Tatsächlich wird eine Drehung um den Winkel α um eine
Ursprungsgerade GA = Rn in R3 mit einem Einheitsvektor nt = (n1 , n2 , n3 )
durch x 7→ Ax beschreiben, wobei
(11)
A=
cos α + n21 (1 − cos α)
n2 n1 (1 − cos α) + n3 sin α
n3 n1 (1 − cos α) − n2 sin α
n1 n2 (1 − cos α) − n3 sin α
cos α + n22 (1 − cos α)
n3 n2 (1 − cos α) + n1 sin α
n1 n3 (1 − cos α) + n2 sin α
n2 n3 (1 − cos α) − n1 sin α
cos α + n23 (1 − cos α)
.
Abschließend betrachten wir Drehungen in höherdimensionalen Räumen;
dabei wird auch die Argumentation zu Ende des vorangegangenen Beispiels
erläutert: Allgemeiner als in Ebenen und dem dreidimensionalem Raum gilt
nämlich
Satz 3.9. Jede Drehung in R3 um eine Ursprungsgerade GA lässt sich darstellen
vermöge x 7→ Ax mit einer Matrix A ∈ SO(R3 ) (also det A = +1); dabei ergibt
sich die Drehachse GA als der Eigenraum zum Eigenwert λ = 1 von A:
GA = {v ∈ R3 : (A − E)v = 0}
und der Drehwinkel α vermöge
hw, Awi = kwk · kAwk cos α,
wobei w⊥GA , bzw. alternativ aus der Spur der Drehmatrix 1 + 2 cos α.
Beweis. (Wie bereits in dem obigen Beispiel angedeutet:) Die Drehachse GA
einer Drehung x 7→ Ax besteht aus den Vektoren v, die unter A festgelassen
werden, für die also
Av = v = 1 · v
gilt; jedes solche v 6= 0 ist also ein Eigenvektor zum Eigenwert λ = 1 von A.
Diese Gerade GA ist also identisch dem Eigenraum von A zum Eigenwert 1:
GA = {v ∈ R3 : (A − E)v = 0}.
Die Aussage über den Drehwinkel ergibt sich leicht aus den Eigenschaften des
Skalarproduktes und für den restlichen Beweis verweisen wir auf das Buch von
Fischer. •
Insbesondere besitzt nach dem vorangegangenen Beweis jede Matrix A ∈
SO(R3 ) also den Eigenwert 1 (aus rein geometrischen Gründen!). Man beachte
aber, dass der zugehörige Eigenraum nicht notwendig eindimensional ist, also
85
keine eindeutige Drehachse existieren muss, denn beispielsweise ist auch die Eingeitsmatrix (welche den ganzen Raum invariant lässt) eine spezielle orthogonale
Matrix: E ∈ SO(Rn ).
Wir schließen mit einer sportlichen Anwendung :-)
Korollar 3.10 (Satz vom Fußball). Beim Anstoß zur ersten und zur zweiten Halbzeit eines jeden Fussballspiels gibt es mindestens zwei Punkte auf der
Oberfläche des Spielgerätes, die identisch im Raum liegen!
Beweis. Die Lage des Balles zu Beginn der zweiten Halbzeit hat sich gegenüber
seiner Lage zu Beginn der ersten durch eine Drehung des Raumes verändert,
welche sich durch eine Matrix A ∈ SO(R3 ) beschreiben lässt. Nach Satz 3.9
besitzt A den Eigenwert 1, so dass die Drehung also eine Gerade Rv mit einem
Eigenvektor v zum Eigenwert 1 fest lässt. Der Schnitt dieser Gerade mit der
Oberfläche des Fußballes liefert die gesuchten Fixpunkte. •
Aufgaben
Aufgabe 66. Verifizieren Sie D(α)D(β) = D(α + β) und schlussfolgern Sie die Additionstheoreme aus Satz 2.16.
Aufgabe 67 (Frühjahr 2000, Thema 1, Aufgabe 2). Es ist

1 −8
1
A=
−8 1
9
−4 −4
3

−4
−4 
7
3
und ϕ : R → R , x 7→ Ax, die zu A gehörige lineare Abbildung. Zeigen Sie, dass ϕ
a) orthogonal ist,
b) eine Spiegelung an einer Ebene ist.
Aufgabe 68 (Frühjahr 2004, Thema 3, Aufgabe 5). Gegeben sei die Abbildung
3
3
ρ : R →R ,




x
y+1
 y →
7  x .
z
1−z
Zerlegen Sie ρ in eine Drehung δ und eine Translation τ so, dass ρ = τ ◦ δ. Bestimmen
Sie die Achse der Drehung δ und den Kosinus des Drehwinkels von δ.
n
Aufgabe 69. Zeigen Sie: Die spezielle orthogonale Gruppe SO(R ) bildet einen RVektorraum der Dimension 21 n(n − 1).
Aufgabe 70. Beweisen Sie Formel (11). Zeigen Sie für die entsprechende Drehung
ebenso die Darstellung
x 7→ nhn, xi + cos α(n × x) × n + sin α(n × x).
86
6. Euklidische Bewegungen
Sei Rn zusammen mit einem Skalarprodukt h . , . i ein euklidischer Raum.
Wir wollen zwei geometrische Objekte als nicht wesentlich verschieden ansehen,
wenn sie durch eine Abbildung f : Rn → Rn ineinander überführt werden
können (vgl. etwa die Bewegungen der Ellipse in Satz 3.1, so dass der Mittelpunkt im Nullpunkt zu liegen kommt). Entsprechend nennen wir eine solche
Abbildung f eine (euklidische) Bewegung (bzw. Isometrie oder Kongruenzabbildung in einiger Literatur), falls
kf (x) − f (y)k = kx − yk
für alle
x, y ∈ Rn ,
wenn also die Abstände zwischen irgendwelchen Punkten invariant bleibt.
Ein erstes und auch offensichtliches Beispiel sind Translationen (bzw. affine Abbildungen), welche vermöge
tb : Rn → Rn , x 7→ x + b
mit einem beliebigen Punkt b ∈ Rn definiert sind. Weitere spezielle Bewegungen
sind Drehungen und Spiegelungen (siehe §3.5). Der nachstehende Satz klassifiziert euklidische Bewegungen:
Satz 3.11. Die Bewegungen der euklidischen Ebene Rn sind genau die Abbildungen
f : Rn → Rn ,
x 7→ f (x) = Ax + b
mit einer orthogonalen Matrix A ∈ O(Rn ) und b ∈ Rn .
Bis auf Translationen sind Bewegungen also orthogonale und insbesondere lineare Abbildungen!
Beweis. Zunächst ist jede Abbildung der obigen Gestalt sicherlich eine Bewegung, denn für f (x) = Ax + b mit A ∈ O(Rn ) rechnet sich mit Satz 3.5 leicht
nach:
kf (x) − f (y)k = kAx + b − (Ay + b)k = kA(x − y)k = kx − yk
für beliebige x, y ∈ Rn . Ist nun g irgendeine Bewegung von Rn , so dürfen wir
oBdA annehmen, dass g(0) = 0 gilt (nach Anwendung einer entsprechenden
Translation). Dann folgt aus der Definition
(12)
kg(x)k = kxk
und
hg(x), g(y)i = hx, yi;
erstes gewinnt man aus der Definition mit g(y) = g(0) = 0 = y und letzteres
gewinnt man aus dem Satz des Pythagoras
−h< g(x), g(y)i = hg(x), −g(y)i
=
=
2
2
1
2 (kg(x) − g(y)k − kg(x)k
2
2
2
1
2 (kx − yk − kxk − kyk )
= hx, −yi = −hx, yi
− kg(y)k2 )
87
und anschließender Multiplikation mit −1. Hieraus ergibt sich wiederum mit
dem Satz des Pythagoras und mühsamer Rechnung
kg(x + y) − g(x) − g(y)k2
= kg(x + y)k2 − 2hg(x + y), g(x)i − 2hg(x + y), g(y)i +
+2hg(x), g(y)i + kg(x)k2 + kg(y)k2
= kx + yk2 − 2hx + y, xi − 2hx + y, yi +
+2hx, yi + kxk2 + kyk2
= 0,
was sofort g(x + y) = g(x) + g(y) impliziert. Analog folgt g(λx) = λg(x), womit
g also ein Endomorphismus des Rn ist. Damit existiert eine Matrix A ∈ Rn×n
mit g(x) = Ax und (12) liefert kAxk = kxk für alle x. Mit Satz 3.5 zeigt sich,
dass A orthogonal ist. •
Insbesondere ist wegen der Invertierbarkeit orthogonaler Matrizen eine Bewegung f also stets eine bijektive Abbildung! Ist nämlich f gegeben durch
x 7→ f (x) = Ax + b mit A ∈ O(Rn ), also als Komposition (bzw. Hintereinanderschaltung) f = tb ◦ dA mit der Translation x 7→ tb (x) = x + b und einer
orthogonalen Abbildung x 7→ dA (x) = Ax, so ergibt sich die Umkehrabbildung
−1
−1 = At (bzw.
als f −1 = d−1
A ◦t−b , wobei dA die entgegengesetze Drehung mit A
Umkehrabbildung von dA ) ist, denn
t
−1
= d−1
f −1 (Ax + b) = (d−1
A (Ax) = A Ax = x.
A ◦ t−b )(Ax + b) = f
Bei linearen Abbildungen entspricht die Hintereinanderschaltung von Abbildung
der Multiplikation der Abbildungsmatrizen. Deren Gruppenstruktur im Falle
orthogonaler Matrizen legt folgenden Satz nahe:
Satz 3.12. Die Menge Iso(Rn ) aller euklidischen Bewegungen des Rn bilden eine Gruppe bzgl. der Komposition ◦ von Abbildungen; sie heißt die Bewegungsbzw. Isometriegruppe des Rn . Die Menge aller Translationen bildet eine
kommutative Untergruppe; die Menge der orthogonalen Abbildungen ist eine
nicht-kommutative Unterguppe, nämlich die derjenigen Bewegungen, die den
Ursprung als Fixpunkt besitzen.
Beweis. Gegeben zwei euklidische Bewegungen f, g ∈ Iso(Rn ), dann ist die
Abbildung g ◦ f wohldefiniert und es gilt
k(g ◦ f )(x) − (g ◦ f )(y)k = kg(f (x)) − g(f (y))k = kf (x) − f (y)k = kx − yk
für alle x, y ∈ Rn . Damit ist g ◦ f ∈ Iso(Rn ). Die Identität id : x 7→ x ist
das neutrale Element bzgl. der Komposition: id ◦ f = f ◦ id = f für jedes
f ∈ Iso(Rn ). Ferner ist jede Bewegung f eine bijektive Abbildung, wie wir
bereits oben angemerkt hatten; die somit existente Umkehrabbildung f −1 ist
das zu f inverse Element bzgl. der Komposition, denn
(f ◦ f −1 )(x) = f (f −1 (x)) = x
bzw. f ◦ f −1 = id
88
sowie analog f −1 ◦ f = id. Die restlichen Eigenschaften zum Nachweis, dass
Iso(Rn ) eine Gruppe ist, seien dem Leser/der Leserin zur Übung überlassen.
Ebenso zeigt sich, dass die Menge der Translationen bzw. die Menge der orthogonalen Abbildungen jeweils eine Untergruppe bilden; hier ist die zu tb inverse
Abbildung gegeben durch t−b , welche offenbar wiederum eine Translation ist.
Die Komposition beliebiger Bewegungen ist i.A. nicht kommutativ, wie etwa
das Beispiel einer Drehung f um den Winkel π2 um den Ursprung und einer
Spiegelung g an der Geraden Re1 zeigt: So ist
(f ◦ g)(e1 ) = f (g(e1 ) = f (e1 ) = e2 6= −e2 g(e2 ) = g(f (e1 )) = g ◦ f (e1 ).
Für die Untergruppe der Translationen hingegen gilt offensichtlich
(tb ◦ tc )(x) = tb (x + c) = x + c + b = tc (x + b) = (tc ◦ tb )(x),
womit sich die Kommutativität ergibt. •
Abschließend untersuchen wir geometrische Abbildungseigenschaften von
Bewegungen: Offensichtlich bleiben Distanzen zwischen Punkten und dsomit
auch Längen unverändert. Wie sieht es mit Winkeln aus? Wir erinnern, dass
der Winkel α = ∠(v, w) zwischen zwei Vektoren v, w ∈ Rn durch
cos α =
hv, wi
kvk · kwk
gegeben ist (siehe §2.5). Entsprechend nennen wir eine Abbildung f winkeltreu, wenn sie die Winkel zwischen Geraden invariant lässt, also stets
hf (v), f (w)i
hv, wi
=
kf (v)k · kf (w)k
kvk · kwk
(13)
erfüllt ist. Eine unmittelbare Konsequenz dieser Definition ist
Korollar 3.13. Eine Bewegung ist winkeltreu.
Beweis folgt sofort mit f statt g aus (13) und (12) im Beweis von Satz 3.11. •
Aufgaben
n
n
Aufgabe 71. Zeigen Sie: f : R → R ist genau dann eine Bewegung, wenn f bijektiv
ist, die längentreu und geradentreu ist, also Längen invariant lässt und Geraden auf
Geraden abbildet.
Aufgabe 72 (Frühjahr 2006, Thema 2, Aufgabe 4). Gegeben seien die Vektoren
 
 
 
1
0
0
3
e1 =  0  , e2 =  1  , e3 =  0  ∈ R .
0
0
1
3
3
Weiter sei f : R → R linear mit
f (e1 ) = e2 ,
f (e2 ) = e3 ,
f (e3 ) = e1 .
a) Zeigen Sie, dass f eine Drehung ist. Bestimmen Sie die Drehachse von f
und den Cosinus des Drehwinkels α von f .
89
b) Bestimmen Sie das Bild von e1 unter der Spiegelung g1 an der Ebene
 
1
E1 = Re3 + R  1  .
1
c) Schreiben Sie f als Produkt von zwei Spiegelungen an Ebenen.
n
n
Aufgabe 73. Zeigen Sie: Eine lineare Abbildung f : R → R ist genau dann winkeltreu, wenn λf orthogonal ist für ein λ > 0.
n
Aufgabe 74. Vervollständigen Sie den Beweis von Satz 3.12. Warum ist O(R ) keine
kommutative Untergruppe?
* Wiederholung: Eigenwerte und Diagonalisierbarkeit *
Wir wiederholen aus der linearen Algebra: Gegeben eine quadratische Matrix A ∈ Rn×n , heißt λ ∈ R (bzw. C) ein Eigenwert von A, falls
Av = λv
für ein
v ∈ Rn \ {0};
in diesem Fall nennt man v einen Eigenvektor zum Eigenwert λ. Man beachte
hier, dass der Nullvektor v = 0 ausgeschlossen ist (weil die Gleichung Av = λv
sonst mit beliebigem λ lösbar ist). Weil
Av = λv
⇐⇒
(A − λE)v = 0
mit
v 6= 0
äquivalent dazu ist, dass A−λE keinen vollen Rang besitzt, sind die Eigenwerte
genau die Nullstellen des charalteristischen Polynoms
χA (λ) = det(λE − A).
Beispiel: Die Drehmatrizen D(α) besitzen das charakteristische Polynom
χD(α) (λ) = λ2 − 2λ cos α + 1, und nur für ganzzahlige Vielfache von π existieren
reelle Nullstellen, wenn also die Drehung die Identität oder eine Spiegelung ist
(vgl. §3.5). Es gibt aber komplexe Eigenwerte: im Fall α = π2 etwa λ = ±i.
Ist λ ein Eigenwert von A, so berechen sich die die Eigenvektoren zu λ
durch das Lösen des homogenen linearen Gleichungssystems (A − λE)v = 0.
Der Lösungsraum ist mindestens eindimensional (bereits aufgrund der Existenz
eines v 6= 0) und heißt Eigenraum zum Eigenwert λ:
EigA (λ) = {v ∈ Rn : (A − λE)v = 0},
und genau die vom Nullvektor verschiedenen Elemente des Eigenraumes sind
Eigenvektoren zu λ. Es gibt also stets viele Eigenvektoren!
Beispiel: Sei


10
5
10
1 
A=
5 −14
2 .
15
10
2
−11
90
Dann rechnet man leicht nach, dass A eine orthogonale Matrix ist (also AAt = E
gilt). Insbesondere bedeutet dies, dass die Spaltenvektoren von A eine Orthonormalbasis des R3 bilden! Das charakteristische Polynom berechnet sich (mühsam)
als


λ − 32
− 31
− 23
14
2
 = (λ − 1)(λ + 1)2 .
χA (λ) = det  − 31
λ + 15
− 15
2
11
2
− 15
λ + 15
−3
Wir sagen: A besitzt die Eigenwerte λ1 = +1 und λ2 = −1 mit der algebraischen Vielfachheit 1 bzw. 2 je nachdem mit welcher Vielfachheit der
Linearfaktor λ − λj im charakteristischen Polynom auftritt. Die Eigenräume zu
diesen Eigenwerten berechnen sich mit Hilfe der Gauß-Elimination leicht als
 




5
0
1
EigA (+1) = R  1 
und
EigA (−1) = R  −2  + R  −1  ,
2
1
−2
sind also eine Gerade und eine Ebene, also mit geometrischer Vielfachheit
dim EigA (λj ) = 1 bzw. 2. Da diese geometrischen Vielfachheiten mit den algebraischen übereinstimmen, ist A diagonalisierbar.
Hierbei heißt eine Matrix A ∈ Rn×n diagonalisierbar, wenn eine invertierbare Matrix S ∈ Rn×n existiert, so dass


λ1


..
S −1 AS = 
;
.
λn
hierbei stehen in der Diagonalen rechts die Eigenwerte λj von A und sonst
lauter Nullen. Aber nicht jede Matrix kann in diese Gestalt gebracht werden:
Beispielsweise sind Drehmatrizen D(α) nur in den Spezialfällen α = mπ mit
m ∈ Z diagonalisierbar (weil keine reellen Eigenwerte existieren). Tatsächlich
ist A genau dann diagonalisierbar, wenn es eine Basis des Rn bestehend aus
Eigenvektoren von A gibt; in diesem Fall bilden die Spalten der Transformationsmatrix S eine Orthonormalbasis!
Beispiel (von oben): Wir finden eine Orthonormalbasis des R3 von Eigenvektoren
 




5
0
1
1
1
1
√  1  , √  −2  , √  −1 
30
5
6
2
1
−2
und bilden entsprechend die Matrix
 5
√

S=
30
√1
30
√2
30
0
− √25
√1
5
√1
6
− √16
− √26


;
91
Dann berechnet sich tatsächlich


+1 0
0
S −1 AS = S t AS =  0 −1 0  .
0
0 −1
Hier durften wir S −1 durch S t ersetzen, weil S orthogonal ist.
7. Bewegungen in der Ebene
Wir wollen die spezielle Situation in der Ebene etwas genauer betrachten:
Zunächst fragen wir nach Punkten, die unter einer Bewegung invariant sind.
Beispielsweise lässt die Punktpiegelung an p ∈ R2 , gegeben durch
f : x 7→ 2p − x
(bzw. in der Form f (x) = −Ex + 2p in der Form von Satz 3.11), genau den
Punkt x = p fest. Andererseits fixiert eine Translation x 7→ x + b mit b 6= 0
keinen Punkt. Für eine genauere Analyse nennen wir eine Bewegung x 7→ Ax+b
eigentlich, wenn A ∈ SO(Rn ) (also det A = 1) gilt; ansonsten, wenn also
det A = −1 gilt, heißt die Bewegung uneigentlich. Eigentliche Bewegungen
bewahren die natürliche Orientierung des Rn , uneigentliche drehen sie um.
Satz 3.14. Sei f : R2 → R2 eine eigentliche Bewegung gegeben durch x 7→
f (x) = Ax + b.
(i) Ist f keine Translation, so besitzt f genau einen Fixpunkt p, nämlich
p = (E − A)−1 b; die Bewegung beschreibt in diesem Fall eine Drehung
um den Punkt p.
(ii) f ist durch die Bilder zweier verschiedener Punkte eindeutig festgelegt.
Beweis. Nach Satz 3.11 und Satz 3.7 ist
cos α − sin α
A = D(α) =
sin α cos α
für ein α ∈ [0, 2π). Für Ap + b = p bzw. (E − A)p = b ist ein lineares Gleichungssystem zu lösen, welches genau dann lösbar ist, wenn 0 6= det(E − A) =
2(1 − cos α) bzw. α 6= 0 gilt. In diesem Fall ist E − A invertierbar und es gilt
p = (E − A)−1 b. Dies beweist (i).
Für den Nachweis von (ii) seien f und g zwei eigentliche Bewegungen mit
f (p) = g(p) und f (q) = g(q) für p, q ∈ R2 mit p 6= q. Wir betrachten die
eigentliche Bewegung
h = g−1 ◦ f
mit
h(x) = Ax + b;
hierbei benutzen wir Satz 3.11 und, dass jede Bewegung umkehrbar ist, also die
Umkehrabbildung g−1 existiert. Dann gilt h(p) = g −1 (f (p)) = p und ebenso
h(q) = q. Damit folgt
p − q = h(p) − h(q) = Ap + b − (Aq + b) = A(p − q).
92
Weil A nach Annahme eine Drehung ist und p − q 6= 0, ergibt sich A = E. Somit
ist b = 0 und also h = id bzw. f = g. •
Für uneigentliche Bewegungen ist die Aussage des Korollars offensichtlich falsch,
denn eine Spiegelung an einer Geraden lässt jeden Punkt dieser Gerade fest.
Auch gelten nicht die analogen Aussagen im R3 , wie etwa die Drehmatrizen
∆(α) aus §3.5 zeigt, welche die komplette Gerade Re3 festlassen.
Satz 3.15 (Dreispiegelungssatz). Die Bewegungsgruppe Iso(R2 ) aller euklidischen Bewegungen der Ebene R2 wird von Spiegelungen erzeugt; genauer gilt:
jedes f ∈ Iso(R2 ) ist eine Komposition von höchstens drei Spiegelungen.
Beweis. Eine Bewegung f ∈ Iso(R2 ) ist eindeutig durch f (0) und die orthogonalen Spaltenvektoren in ihrer Abbildungsmatrix A = (w1 , w2 ) bestimmt. Ist f
gemäß Satz 3.11 gegeben durch f (x) = Ax+b mit orthogonalen Spaltenvektoren
w1 , w2 , also A = (w1 , w2 ), dann gelten
f (0) = b
und
f (ej ) = (w1 , w2 )ej + b = wj + b
für j = 1, 2 (mit den üblichen Standardbasiseinheitsvektoren e1 , e2 des R2 ).
Nun spiegeln wir zunächst die Ebene R2 an der Mittelsenkrechten von 0 und
f (0). Dann wird das abgebildete Orthonormalsystem e1 , e2 durch eine oder zwei
Abbildung 11. Bilder zum Dreispiegelungssatz.
Spiegelungen an Geraden durch f (0) = b in das Orthogonalsystem f (e1 ) =
w1 + b, f (e2 ) = w2 + b überführt (siehe Abbildung 11). •
Nun klassifizieren wir die Bewegungen der Ebene:
Satz 3.16. Jede Bewegungen der Ebene lässt sich einem der folgenden Typen
zuordnen:
• die Identität: id : x 7→ x,
• Translation: tb : x 7→ x + b mit einem b ∈ R2 ,
93
• Drehung: x 7→ D(α)x mit D(α) ∈ SO(R2 ),
• Spiegelung an einer Geraden,
• Gleitspiegelung, d.h. einer Kombinationen einer Spiegelung an einer Geraden G und einer Translation um einen Vektor b 6= 0 parallel
zu G.
Beweis. Die jeweiligen Typen sind disjunkt.§ Wir betrachten die Menge der
Fixpunkte einer Bewegung f ; es gelten:
• f lässt alle Punkte des R2 fest
⇐⇒ f = id,
• die Menge der Fixpunkte von f ist eine Gerade
⇐⇒ f ist eine Spiegelung an einer Geraden,
• f lässt die Geraden einer Schar von Parallelen fest, besitzt aber keine
Fixpunkte
⇐⇒ f ist eine Translation,
• f besitzt genau einen Fixpunkt
⇐⇒ f ist eine Drehung um den Ursprung,
• f führt genau eine Gerade in sich über, besitzt aber keine Fixpunkte
⇐⇒ f ist eine Gleitspiegelung.
Diese Äquivalenzen gelten, weil f als Bewegung Abstände, Parallelität und Orthogonalität erhält. Es verbleibt also zu zeigen, dass auch stets mindestens einer
dieser Typen auftritt. Hierzu verwenden wir den vorangegangenen Satz: Ist f
eine Komposition von null Spiegelungen, so ist f die Identität, ist f hingegen die
Komposition von einer Spiegelung, so ist f eine Spiegelung an einer Geraden. Ist
f Komposition von zwei Spiegelungen, so ist f vom Typ eine Translation oder
Drehung. Es verbleibt der Fall, dass f eine Komposition von drei Spiegelungen
ist; dabei dürfen wir annehmen, dass die Geraden, an denen gespiegelt wird,
keinen gemeinsamen Punkt besitzen und nicht parallel sind Dann lässt sich f
aber darstellen als f = d ◦ s, wobei s eine Spiegelung an einer Geraden G ist
und d eine Drehung um einen Punkt p 6∈ G mit Drehwinkel 2α. Dann lassen
sich zwei Geraden G1 , G2 konstruieren, für die s(G1 ) = G2 und d(G2 ) = G1
gelten, woraus f (G1 ) = G1 folgt: Diese Geraden schneiden sich in einem Punkt
q ∈ G, dem Fußpunkt des Lotes von p auf G und schneiden beide die Gerade
G unter dem Winkel α. Wegen f (q) 6= q fixiert f die Gerade G1 aber nicht
punktweise; sie hat damit insebsondere keinen Fixpunkt auf G1 . Weil zudem f
nicht orientierungserhaltend ist, kann f keine Translation sein, weshalb f also
eine Gleitspiegelung ist. •
Wir räumen noch mehr auf: Eigentliche Bewegungen der Ebene sind jede Parallelverschiebung, jede Drehung um einen Punkt der Ebene und die Punktspiegelung als Sonderfall einer Drehung um π. Uneigentliche Bewegungen sind
§
Hierbei gibt es jedoch Beispiele von Bewegungen, die verschiedenen Typen zugehören,
wie etwa eine Drehung um 2π um den Ursprung gleich der Identität ist; jedoch sind die Typen
trotzdem disjunkt.
94
demzufolge jede Achsenspiegelung und jede Gleitspiegelung bestehend aus eine
Achsenspiegelung gefolgt von einer Translation längs dieser Achse.
Identifizieren wir einmal mehr die euklidische Ebene R2 mit der komplexen
Zahlenebene C (wie schon desöfteren), so können wir fragen, welche komplexen
Funktionen f die euklidischen Bewegungen liefern? Translationen sind hier er√
klärt durch Abbildungen z 7→ tb (z) := z + b, wobei nun z = x + iy mit i = −1
für eine komplexe Veränderliche steht und b ∈ C eine beliebige komplexe Zahl
sei. Drehungen um einen Winkel α um den Ursprung (die komplexe Zahl null)
ergeben sich vermöge z 7→ dα (z) := z exp(iα) (wie man unschwer mit Hilfe
der Polarkoordinaten sieht). Eine Rotation um einen Punkt w ∈ C mit einem
Winkel α ergibt sich durch Hintereinanderschaltung
tw ◦ dα ◦ t−w
und die Translationen und Rotationen der euklidischen Ebene lassen sich also
durch die komplexen Funktionen
z 7→ f (z) := az + b
mit
a, b ∈ C, |a| = 1
charakterisieren.
Aufgaben
Aufgabe 75. Gegeben ein reguläres Sechseck, wieviele Bewegungen existieren, die dieses Sechseck auf sich abbilden?
Aufgabe 76. Zeigen Sie, dass die Abbildung
f : x 7→ x − 2
hx − a, w⊥ i ⊥
w
hw, wi
eine Geradenspiegelung an der Geraden G = a+Rw ist (wobei w⊥ ein zu w orthogonaler
Vektor ist). Beschreiben Sie f ferner in der Form von Satz 3.11.
Aufgabe 77. Beweisen Sie, dass eine eigentliche Bewegung f genau dann eine Drehung um den Punkt p ist, wenn
2
kf (x) − pk = kx − pk
für alle x ∈ R gilt.
Aufgabe 78. Für welche Bewegungen f der Ebene gilt f ◦ f = id?
Aufgabe 79. Gegeben reelle Zahlen a, b, c, d mit ad−bc = 1 betrachten wir für komplexe
Zahlen z die Abbildungen
z 7→ M (z) :=
az + b
cz + d
für
z 6= −
d
c
(falls c 6= 0). Wie werden Kreise bzw. Geraden in C unter M abgebildet? Was können
Sie über die Hintereinanderschaltung von zwei solchen Abbildungen sagen? Zeigen Sie,
dass die Abbildung M umkehrbar ist und die Umkehrabbildung von ähnlicher Gestalt
ist!
95
*** Weihnachtsvorlesung ***
Wieso vertauschen Spiegel links und rechts, aber nicht oben und unten?
Diese Frage stellt sich beim morgendlichen Blick in den Spiegel. Aber eigentlich
stimmt diese Behauptung überhaupt nicht. Tatsächlich vertauscht ein Spiegel
nämlich vorne und hinten! Um dies einzusehen, mache man sich klar, dass beim
Betrachten des Spiegelbildes sich der Betrachter um die eigene vertikale Achse
um den Winkel π (also 180 Grad) dreht und dabei nach wie vor mit derselben
Hand zuwinkt (wenn denn gewunken wird; siehe Abbildung 12). Hingegen werden vorne und hinten vertauscht, denn unsere Nasenspitze und ihr Spiegelbild
sind sich nun näher als unser Hinterkopf und sein Spiegelbild. Der Spiegel dreht
Abbildung 12. Spieglein, Spieglein an der Wand – wer ist die Schönste
im ganzen Land?
tatsächlich genau die Richtung um, die senkrecht auf seiner Oberfläche steht!
Ein an der Decke angebrachter Spiegel (wie in einigen Aufzügen) vertauscht
oben und unten: Wir sehen dann den Kopf zuerst und darunter die Füße (als
stünden wir auf dem Kopf).
Das war zu einfach; hier ist unsere zweite Frage:
Gibt es eine Fläche mit nur eine Seite?
Ja! Das Möbius-Band wurde 1858 von Johann Benedict Listing und (unabhängig) August Ferdinand Möbius entdeckt. Man erhält ein Möbius-Band aus
einem Streifen Papier, wenn man diesen einmal verdreht und an den Enden miteinander verklebt (siehe Abbildung 13). Das Möbius-Band ist einseitig in dem
Sinne, dass jeder Punkt von jedem anderen Punkt erreichbar ist, ohne über
eine Kante zu gehen (es gibt ja keine!). Aber es gibt noch mehr Erstaunliches
zu berichten: Lässt man einen Spaziergänger auf einem Möbius-Band entlang
laufen, so kehrt sie seitenverkehrt zurück. Damit ist das Möbius-Band nicht
orientierbar!
96
Möbius-Bänder sind recht populär: Der Film Möbius von Gustavo Musquera R. aus dem Jahr 1996 behandelt u.a. eine verschwundene U-Bahn in
Buenos Aires, die auf einem Möbius-Band ähnlichem Parkour verkehrt, und der
Künstler Maurits Escher schuf viele Grafiken, die das Möbius-Band zum Thema haben (z.B. etwa Ameisen statt Spaziergänger auf einem Möbius-Band).
Möbius-Bänder besitzen viele Anwendungen in der Technik:
Abbildung 13. Bastelanleitung für ein Möbius-Band.
• Bei Riemengetrieben wird es verwendet, um eine geringere Abnutzung
zu gewährleisten;
• als Tonträger im Tefifon, um eine längere Spieldauer zu erzielen; dabei
ist ein Tefifon ein Wiedergabegerät für spezielle elektromechanische
Tonträger, welches seit den 1960ern nicht mehr benutzt wird;
• in der Elektrotechnik existiert mit dem Ringzähler mit einer Invertierung ein schaltungstechnisches Analogon;
• als Knotenmoleküle mit besonderen Eigenschaften (gewissen Symmetrien).
(Für Details und Weiteres sei auf wikipedia verwiesen.) Mathematisch lässt sich
ein Möbius-Band im dreidimensionalen Raum zum Beispiel wie folgt parametrisieren:
r
2 cos
(1 + 2r cos
r
α
2 sin 2 ,
x = (1 +
y =
x =
α
2 ) cos α,
α
2 ) sin α,
für −1 ≤ r ≤ 1 und 0 ≤ α < 2π.
Und hier noch eine verwandte Frage:
Was passiert, wenn man ein Möbius-Band
der Länge nach mittig aufschneidet?
Es gibt weitere einseitige Flächen. Eine Kleinsche Flasche entsteht ähnlich wie das Möbius-Band durch kreatives Verkleben von Streifen. Sie ist benannt
97
Abbildung 14. Ein Möbius-Band und eine Kleinsche Flasche.
nach dem Mathematiker Felix Klein, der sie 1882 entdeckte (oder erdachte, je
nachdem, was für einen Blick auf Mathematik wir haben). Eine Kleinsche Flasche ist eine so genannte nicht orientierbare Fläche. Dieser Begriff der NichtOrientierbarkeit bedeutet, dass wir keine Orientierung auf der Kleinschen Flasche einführen können: Wie auch beim Möbius-Band gibt es weder links noch
rechts bzw. vorne oder hinten; jeglicher Versuch eine solche Orientierung einzuführen, muss scheitern. Gegenüber dem Möbius-Band fällt bei der Kleinschen
Flasche zudem noch auf, dass sie keinen Rand besitzt.
Folgender Limerick enthält eine Konstruktionsanleitung:
A mathematician named Klein
Thought the Moebius band was divine.
Said he: ”If you glue
The edges of two,
You’ll get a weird bottle like mine.”
Wir folgen dieser Konstruktion: Hierzu verkleben wir die gegenüberliegenden
Seiten eines Quadrates gemäß Abbildung 15. Dabei entstehen Selbstdurchdringungen, allerdings lässt sich eine Kleinsche Flasche im vierdimensionalen Raum
ohne solche Selbstdurchdringungen realisieren! Eine Kleinsche Flasche enthält
Abbildung 15. Zwei Quadrate: Verkleben der gegenüberliegenden Seiten führt links zu einem Torus (oder doughnut oder Fahrradschlauch) und
rechts zu einer Kleinschen Flasche. Man beachte hierbei die unterschiedliche
Orientierung der Seiten!
98
ein Möbius-Band, wie man der Konstruktionsanleitung entnehmen kann – insofern ist also auch die Kleinsche Flasche nicht orientierbar! Ferner besitzt sie
auch keinen Rand und also kein Innen und kein Außen; trotzdem kann man
aus ihr trinken! Bloß hat sie dabei kein Volumen im mathematischen Sinne.
Abbildung 16. Und noch eine Kleinsche Flasche.
Eine mathematische Beschreibung der Kleinschen Flasche liefert die folgende
Parametrisierung:
x = 2(1 − sin α) cos α + (2 − cos α)(2 exp(−( α2 − π)2 ) − 1) cos β,
y = (2 − cos α) sin β,
z = 6 sin α + 12 (2 − cos α) exp(−(α −
3π 2
2 ) ) sin α cos β,
für 0 ≤ α, β < 2π. Eine sehr ansprechende Animation von Ilkay Sakalli und
Konstantin Weixelbaum zu den verschiedenen oben angeführten und auch weiteren erstaunlichen Eigenschaften findet sich auf der Webseite www.klein-bottlefilm.com.
Und abschließend eine letzte und der festlichen Jahreszeit angemessene Frage, die Anlass geben soll, während der Feiertage nicht nur über euklidische Bewegungen nachzudenken:
Wie kann der Himmel nachts dunkel sein, wo es doch so viele leuchtende
Sterne im Universum gibt?
99
Gehen wir von einer gleichmäßigen Sternenverteilung im Universum aus – dies
ist das so genannte kosmologische Prinzip – und all der Zeit nach dem Urknall, so
muss das Licht der Sterne doch mittlerweile das gesamte Universum erleuchtet
haben?
Frohe Weihnachten und ein gutes neues Jahr!
Nachtrag von Anfang Januar: Letzte Frage behandelt das Olberssche Paradoxon¶ aus der Astronom. Heinrich Wilhelm Olbers formulierte diese Fragestellung im Jahre 1826, sie war u.a. aber bereits Johannes Kepler bekannt, der da
fragte ”Wenn es wahr ist, dass sie (die Sterne) auch Sonnen sind von ähnlicher
Natur wie unsere Sonne, warum übertreffen sie dann nicht alle zusammen die
Sonne an Helligkeit?”k Tatsächlich enthält das Universum zu wenig Energie, um
den Nachthimmel zu erleuchten! Die durchschnittliche Entfernung der Sterne ist
so groß, dass die Zeit, die das sich mit bekanntlich endlicher Geschwindigkeit
ausbreitende Licht zur Sichtbarkeitsgrenze in unserem Universum zurück legen
muss, größer ist als das Alter des Universums (wohl ca. 13 Millarden Jahre)
bzw. die endliche Lebensdauer der Sterne (welche im beobachteten Mittel so
ungefähr in der Größenordnung 1010 Jahre geschätzt wird). Ein zusätzlicher
Effekt für die Dunkelheit des Nachthimmels ist, dass wir uns allem Anschein
nach in einem sich expandierenden Universum befinden. Durch die kosmologische Rotverschiebung reduziert sich die Energie des sich im Raum bewegenden
Lichts und die Hintergrundstrahlung des Urknalls entspricht der eines kalten
schwarzen Körpers, welcher im Mikrowellenbereich liegt und für das menschliche Auge unsichtbar bleibt.∗∗ Unter Astronomen strittig scheint der Punkt, ob
der dunkle Nachthimmel bereits als Indiz angesehen werden kann, dass wir in
einem expandierenden Universum leben: Wäre es stationär oder schrumpfend,
so müsste überall am Himmel ein Stern zu sehen sein (zumindest nach einer gewissen Zeit) und der Nachthimmel wäre taghell! Auch wäre der Himmel letztlich
so heiß wie die Oberfläche eines Sterns.
8. Ähnlichkeitsabbildungen
Nun wollen wir eine weitere Klasse von geometrisch interessanten Abbildungen studieren und einige Anwendungen in der Dreiecksgeometrie geben: Eine
Abbildung f : Rn → Rn heißt Ähnlichkeitsabbildung, falls ein λ > 0 mit
kf (x)k = λkxk
für alle
x ∈ Rn
existiert.
Satz 3.17. Für einen Endomorphismus f : Rn → Rn sind äquivalent:
¶
und ist trotz des Namens kein Paradoxon!
Gern wird auch folgende Analogie bemüht: In einem dichten Wald sieht man in jeder
Richtung schließlich einen Baumstamm.
∗∗
Mehr Informationen in ”Das Olbers’sche Paradoxon” von Rainer Göhring, welches ein leicht auffindbares Skript im Internet ist, sowie der Film von Harald
Lesch in BRα: http://www.br.de/fernsehen/br-alpha/sendungen/alpha-centauri/alpha-centauriuniversum-2000 x102.html.
k
100
(i) f ist eine Ähnlichkeitsabbildung,
(ii) für x, y ∈ Rn folgt aus hx, yi = 0 stets hf (x), f (y)i = 0,
(iii) f ist winkeltreu (siehe (13)).
Die Menge der Ähnlichkeitsabildungen bildet mit der Komposition eine Gruppe,
die so genannte Hauptgruppe.
Wir hatten mit euklidschen Bewegungen bereits winkeltreue Abbildungen kennengelernt (Korollar 3.13); obiger Satz liefert aber eine Charakterisierung sämtlicher winkeltreuer Abbildungen!
Beweis. Wir zeigen zunächst (i) ⇒ (iii): Nach Definition existiert ein λ > 0
mit kf (x)k = λkxk für alle x. Sei nun g(x) = λ1 f (x). Dann ist offensichtlich
g(0) = 0 und
1
kg(x)k = kf (x)k = kxk,
λ
womit also g nach Satz 3.6 eine orthogonale Abbildung, also insbesondere eine
euklidische Bewegung ist. Mit Korollar 3.13 folgt, dass f winkeltreu ist.
Als Nächstes zeigen wir (iii) ⇒ (ii): Gemäßder Definition von Winkeltreue,
also (13) in §3.5, gilt
hf (x), f (y)i
hx, yi
=
;
kf (x)k · kf (y)k
kxk · kyk
offensichtlich impliziert iii) die Behauptung ii).
Es verbleibt (ii) ⇒ (i): Für x, y ∈ Rn mit kxk = kyk gilt
hx + y, x − yi = hx, xi + hy, xi − hx, yi +hy, yi = kxk2 − kyk2 = 0.
|
{z
}
=0
Mit der Linearität von f folgt somit aus der Annahme (ii)
0 = hf (x + y), f (x − y)i = hf (x) + f (y), f (x) − f (y)i = kf (x)k2 − kf (y)k2
und also kf (x)k = kf (y)k. Speziell für z ∈ Rn mit kzk = 1 und λ := kf (z)k
ergibt sich für allgemeines x ∈ Rn wegen kxk = kkzkxk, dass x und y := zkxk
dieselbe Länge besitzen und nach dem bereits Gezeigten also kf (x)k = kf (y)k
gilt. Durch Einsetzen folgt wiederum mittels der Linearität von f nun
kf (x)k = kf (y)k = kf (zkxk)k = kf (z)k · kxk = λkxk,
was zu zeigen war.
Die Gruppeneigenschaft weist man ähnlich zum Beweis von Satz 3.12 nach
(was wir der Leserin/dem Leser als Übungsaufgabe überlassen). •
Solch eine Ähnlichkeitsabbildung f : Rn → Rn nennt man auch eine zentrische Streckung: Wie ein Filmprojektor im Kino vergrößert bzw. verkleinert f alle Strecken in einem bestimmten Verhältnis, dabei sind die Bildstrecken
parallel zu den ursprünglichen Strecken. In diesem Zusammenhang sei noch an
die aus der Schule wohlbekannten Strahlensätze erinnert: Werden zwei durch
einen Punkt Z verlaufende Geraden von zwei Parallelen geschnitten, die Z nicht
enthalten, so gelten (mit den Bezeichnungen aus Abbildung 17):
101
Abbildung 17. Ein Bild zum Strahlensatz.
(1) Je zwei Abschnitte auf der einen Geraden verhalten sich so zueinander
wie die diesen entsprechenden Abschnitte auf der anderen Geraden,
etwa
|ZA|
|ZB|
=
.
′
|AA |
|BB ′ |
(2) Je zwei Abschnitte auf den Parallelen verhalten sich so zueinander
wie die diesen entsprechenden jeweils vom Scheitel Z aus gemessenen
Strecken auf den Geraden, etwa
|ZA|
|AB|
=
.
′
′
|A B |
|ZA′ |
(3) Je zwei Abschnitte auf den Parallelen, welche einander entsprechen,
stehen in gleichem Verhältnis zueinander (wobei hier drei Geraden
vorrausgesetzt seien).
Ferner besteht folgende Umkehrung des ersten Strahlensatzes: Ist (1) erfüllt,
dann liegen parallele Geraden vor; hingegen kann man aus (2) i.A. nicht auf
eine solche Parallelität schließen.
Abbildung 18. Ein Dreieck wird unter einer zentrischen Streckung abgebildet; das Bilddreieck ist ähnlich zu dem Ausgangsdreieck.
102
Im Folgenden begnügen wir uns wieder mit der Ebene R2 . Zwei Figuren heißen ähnlich, wenn sie durch eine Ähnlichkeitsabbildung ineinander überführt
werden können. Hierbei erweitern wir den Begriff der Ähnlichkeitsabbildung
noch dahingehend, dass wir auch noch die Komposition mit Translationen zulassen; solche Abbildungen sind dann also von der Form
x 7→ λAx + b
mit λ > 0, A ∈ O(R2 ), b ∈ R2 ;
Wir geben eine Anwendung dieses Begriffes auf Dreiecke (siehe Abbildung 18),
welche womöglich bereits aus der Schule bekannt ist:
Satz 3.18. Zwei Dreiecke sind ähnlich, wenn sie
• in zwei Winkeln (und somit in allen drei Winkeln) übereinstimmen,
• in allen Verhältnissen entsprechender Seiten übereinstimmen,
• in einem Winkel und im Verhältnis der anliegenden Seiten übereinstimmen,
• im Verhältnis zweier Seiten und im Gegenwinkel der größeren Seite
übereinstimmen.
Beweis. Angenommen, in den Dreiecken ABC und A′ B ′ C ′ sind zwei und somit also (nach dem Winkelsummensatz) sogar alle drei Winkel gleich. OBdA
dürfen wir mit Hilfe einer passenden Translation und Drehung annehmen, dass
die beiden Dreiecke so zur Deckung kommen, dass C und C ′ übereinstimmen,
also Z = C = C ′ , und ferner die Richtungsvektoren von Z zu den Punkten
den Punkten A und A′ bzw. zu B und B ′ wegen der gleichen Winkel jeweils
identisch sind (vgl. Abbildung 17). Nun sind die Winkel β und β ′ bei B bzw.
B ′ Stufenwinkel an AB und A′ B ′ mit ZB ′ und also identisch: β = β ′ . Damit
sind AB und A′ B ′ parallel und es liegt eine zentrische Streckung vor, d.h. die
Dreiecke sind ähnlich. Die weiteren Aussagen beweist man ähnlich. •
Ganz ähnliche Sachverhalte gelten für kongruente Dreiecke, wenn also
die entsprechenden Seitenlängen übereinstimmen; tatsächlich existiert in diesem
Falle eine eindeutig bestimmte Bewegung (Kongruenzabbildung), welche die
beiden Dreiecke ineinander überführt (siehe unten stehende Aufgabe).
Kongruente geometrische Objekte liefern oft Symmetrien und diese erlauben mitunter interessante Konstruktionen. Wir schließen mit einer solchen Anwendung:
Satz 3.19 (Satz von Fermat). Gegeben ein spitzwinkliges Dreieck ABC, werden diesem drei gleichseitige Dreiecke ABC ′ , ACB ′ und BCA′ aufgesetzt. Dann
schneiden sich die drei Verbindungsstrecken AA′ , BB ′ und CC ′ in einem Punkt
F unter dem Winkel π3 , die Längen sind gleich.
Beweis. Sei F der Schnittpunkt der Strecken AA′ und BB ′ . Eine Drehung um
den Winkel π3 um C bildet B ′ auf A und B auf A′ ab und die Strecke BB ′ geht
in AA′ über; insbesondere sind die Längen gleich. Ferner gilt für die Winkel
π
∠(B ′ F A) = ∠(A′ F B) = .
3
103
Abbildung 19. Ein Bild zum Satz von Fermat. Die drei gleichseitigen
Dreiecke sind ähnlich. Der Fermatpunkt F liegt im Inneren des Dreiecks
ABC.
Desweiteren sind ∠(B ′ F A) = ∠(B ′ CA) Peripheriewinkel eines Kreises über
AB ′ . Für denselben Kreis ist auch ∠(B ′ F C) Peripheriewinkel über B ′ C. Damit
sind alle Winkel bei F gleich π3 ; insbesondere liegt F also auch auf CC ′ und der
Beweis ist erbracht. •
Aufgaben
Aufgabe 80. Zeigen Sie, dass eine zentrische Streckung f im Raum
(i) winkeltreu ist,
(ii) eine beliebige geometrische Figur genau dann auf eine Figur mit dem m2 fachen Flächeninhalt abgebildet wird, wenn ein beliebiger Körper auf einen
Körper mit dem |m|3 -fachen Volumen abgebildet wird.
Welche dieser Eigenschaften gelten auch für Ähnlichkeitsabbildungen?
Aufgabe 81. Beweisen Sie die Strahlensätze und auch die erwähnte Umkehrung!
Aufgabe 82. Vier Punkte A, B, C, D heißen harmonisch, falls
|AD|
|AC|
=
.
|CB|
|DB|
Zeigen Sie, dass eine zentrische Streckung von vier harmonischen Punkten wieder auf
vier harmonische Punkte führt.
Aufgabe 83. Zeigen Sie: Zwei Dreiecke ABC und A′ B ′ C ′ sind genau dann kongruent,
wenn es eine Bewegung f gibt, so dass f (A) = A′ , f (B) = B ′ und f (C) = C ′ gilt.
Aufgabe 84. Beweisen Sie den Satz von Napoléon, dass die Mittelpunkte der drei
aufgesetzten Dreiecke im Satz von Fermat ein gleichseitiges Dreieck bilden.
9. Hauptachsentransformation
Wir interessieren uns im Folgenden für die Situation abstandserhaltender
Abbildungen der Ebene R2 im Kontext von Kurven, die durch quadratische
Gleichungen definiert werden.
104
Beispiel: Gegeben sei die Gleichung
41x21 − 24x1 x2 + 34x22 = 25;
welche Menge K steckt hinter all den Punkten x = ( xx12 ) ∈ R2 , die dieser Gleichung genügen? Mit Hilfe der Matrix
41 −12
A=
−12 34
gilt
x1
= 41x21 − 24x1 x2 + 34x22 .
hx, Axi = (x1 , x2 )A
x2
Durch Anwendung einer geeigneten Drehung versuchen wir nun die Kurve K =
{x ∈ R2 : hx, Axi = 25} vereinfachen, so dass wir auf ihren Typ schließen
können: Nach §3.5 werden Drehungen der Ebene um den Ursprung beschrieben
durch spezielle orthogonale Matrizen
cos α − sin α
D := D(α) :=
sin α cos α
mit einem reellen Drehwinkel α. Wir erinnern, dass D(α)−1 = D(−α) = D(α)t .
Schreiben wir x = D(α)y mit y = ( yy12 ), so wird die Kurve K in den Koordinaten
y = D(−α)x durch
hy, Byi = 25
mit
B = D t AD
beschrieben (denn hy, Byi = hD t x, D t ADD −1 xi = hx, Axi). Nun gilt es also
D = D(α) durch geschickte Wahl von α so zu wählen, dass B von möglich
einfacher Gestalt ist – bestenfalls ist B eine Diagonalmatrix. Mit dem Ansatz
λ1 0
B=
0 λ2
mit reellen λj ist hierzu nach einem Koeffizientenvergleich folgendes nichtlineares Gleichungssystem in u = cos α, v = sin α zu lösen:
41u2 − 24uv + 34v 2 = λ1 ,
−12u2 − 7uv + 12v 2 = 0,
342 + 24uv + 41v 2 = λ2 .
Wir können dies auch als ein lineares Gleichungssystem in u2 , uv und v 2 auffassen:

 

41 −24 34
λ1
 −12 −7 12  =  0  .
34
24 41
λ2
Die Lösung berechnet sich als
 2 


u
23λ1 + 2λ2
 uv  = 1  36(λ2 − λ1 )  .
1875
v2
2λ1 + 23λ2
Mit dem Determinantenmultiplikationssatz gilt nebenbei
105
Abbildung 20. Die beiden Ellipsen vor und nach der Hauptachsentransformation. Form und Abstände sind erhalten geblieben, bloß die Lage in der
Ebene hat sich geändert.
λ1 λ2 = det B = det(D t AD) = det A = 1250
sowie u2 + v 2 = 1 (auf Grund der Setzung u = cos α und v = sin α); bringt man
diese Zusatzbedingungen noch mit der Lösungsmenge des obigen Gleichungssystems in Zusammenhang, so ergeben sich
12
25u2 = 9, 25v 2 = 16 und uv = ,
25
was auf eine Lösung u = cos α = 53 , v = sin α = 45 des obigen Gleichungssystems
führt. Einsetzen liefert die spezielle orthogonale Matrix
1 3 −4
D := D(α) :=
;
5 4 3
daraus ergibt sich folglich
t
B = D AD =
25 0
0 50
.
Damit ist K also die um den Winkel α (≈ 53◦ ; siehe Abbildung 20) gegen den
Uhrzeigersinn gedrehte Ellipse
25y12 + 50y22 = 25
bzw.
y12 + 2y22 = 1;
hierbei haben wir die Normalform von Ellipsen gemäß Korollar 3.2 uns zu Nutzen gemacht. Die Achsen der gedrehten Ellipse liegen dabei auf den Koordinatenachsen, weshalb der Typ der Kurve so leicht ablesbar. Da eine Drehung
106
Abstände unverändert lässt, können wir sogar aus den Achsen 1 und
gedrehten Ellipse die Längen der Achsen der Ausgangsellipse ablesen.
√1
2
der
Nun gilt es, dieses Beispiel zu verallgemeinern. Allerdings schweifen wir
zunächst ab und erinnern an die alten Begriffe der Bilinearform (siehe §2.3)
und der symmetrischen Matrix (§2.4). Bekanntlich kann jede symmetrische Bilinearform mit Hilfe einer symmetrischen Matrix beschrieben werden.
Satz 3.20 (Hauptachsentransformation). Es sei A ∈ Rn×n eine symmetrische Matrix und
h . , . i : Rn × Rn → Rn ,
(x, y) 7→ hx, yiA = xt Ay
die zugehörige symmetrische Bilinearform. Dann besitzt A reelle Eigenwerte
λ1 , . . . , λn und A ist diagonalisierbar, d.h. es gibt eine orthogonale Matrix D,
so dass


λ1


..
D −1 AD = D t AD = 

.
λn
eine Diagonalmatrix ist; deren Diagonaleinträge λj sind die Eigenwerte von A,
die weiteren Einträge sind null. Ferner existiert eine Orthonormalbasis B =
{w1 , . . . , wn } mit
λi falls i = j,
hwi , wj iA =
0 falls i 6= j.
Symmetrische Matrizen besitzen also reelle Eigenwerte und können mittels geeigneten orthogonalen Matrizen diagonalisert werden! In die transformierende
Matrix schreibt man hierzu orthonormierte Eigenvektoren.
Beweis. Die Inverse D −1 einer orthogonalen Matrix D ist nach Satz 3.5 gleich
der transponierten Matrix D t . Wir zeigen zunächst, dass D t AD = D −1 AD und
A dasselbe charakteristische Polynom besitzen, womit dann D −1 AD und A
insbesondere dieselben Eigenwerte besitzen. Hierzu berechnen wir mit dem Determinantenmultiplikationssatz und insbesondere det(D −1 ) = (det D)−1 , dass
det(λE − D −1 AD) = det(λD −1 ED − D −1 AD) = det(D −1 (λE − A)D)
= det(D −1 ) · det(λE − A) · det D = det(λE − A);
also stimmen die jeweiligen charakteristischen Polynome überein. Die Eigenwerte symmetrischer Matrizen sind nach Satz 2.12 allesamt reell.
Wir betrachten zunächst den Spezialfall n = 2: In diesem Fall existiert zu
einer symmetrischen Matrix
a b
A=
b c
eine Drehmatrix
D = D(α) =
cos α − sin α
sin α cos α
,
107
so dass D t AD eine Diagonalmatrix ist. Um dies zu sehen, berechnen wir mit
Hilfe der Additionstheoreme für trigonometrische Funktionen den Eintrag neben
der Diagonalen als
(c − a) sin α cos α + b((cos α)2 − (sin α)2 ) =
c−a
sin(2α) + b cos(2α)
2
(die beiden Nebendiagonaleinträge sind auf Grund der Symmetrie und der Orthogonalität identisch). Bei geeigneter Wahl von α verschwindet dieser Aus2b
druck: Wenn nämlich a 6= c gilt, so ist α = 12 arctan a−c
der gesuchte Winkel;
π
andernfalls mag man α = 4 verwenden (alternativ kann man mit dem Zwischenwertsatz argumentieren). Damit ist D eine Drehmatrix und nach Satz 3.5 sind
die Spaltenvektoren von D orthonormiert und es ist eine einfache Rechenaufgabe zu zeigen, dass diese Spaltenvektoren auch Eigenvektoren zu den jeweiligen
Eigenwerten von A sind.
Für den allgemeinen Fall ist etwas mehr lineare Algebra notwendig: Nach
Satz 2.18 lässt sich eine Orthonormalbasis bestehend aus Eigenvektoren zu den
Eigenwerten von A bilden. Sind die Eigenwerte allesamt verschieden, ist dies aus
Dimensionsgründen klar; bei mehrfachen Eigenwerten ist zunächst eine Orthonormalbasis aus Eigenvektoren des entsprechenden Eigenraums zu finden. Die
Eigenräume zu den verschiedenen Eigenwerten bilden dabei eine direkte Summe, deren Gesamtheit Rn ist. Wir schreiben die so gefundenen n normierten
Eigenvektoren in die Spalten einer Matrix D. Mit Hilfe dieses Basiswechsels ist
dann D t AD eine Diagonalmatrix mit den Eigenwerten auf der Diagonalen; die
Aussage über die von A induzierte Bilinearform folgt auf Grund der Orthonormalität der Spaltenvektoren von D. •
Mit dem Satz über die Hauptachsentransformation lässt sich eine beliebige
quadratische Form x 7→ hx, xiA = xt Ax also stets wie folgt umformen
xt Ax =
n
X
λj yj2
j=1
mit x = Dy; die rechte Seite heißt metrische Normalform und ist frei von
gemischten Termen! Dieser Darstellung ist positive Definitheit der von A induzierten symmetrischen Bilinearform unmittelbar abzulesen: (x, y) 7→ xt Ay ist
genau dann positiv definit (also xt Ax > 0 für x 6= 0), wenn alle Eigenwerte von A positiv sind. Diese Aussage von Satz 2.13 folgt somit direkt aus der
Hauptachsentransformation; die weiteren Aussagen ergeben sich ganz ähnlich.
In den Spalten von D stehen orthogonale Eigenvektoren von A; diese werden auch Hauptachsen der quadratischen Form genannt. Die Transformation
x = Dy bzw. y = D 1 x ist die Basistransformation von der Standardbasis zur
Basis bestehend aus den Hauptachsen, weshalb die Überführung in die metrische
Normalform auch Hauptachsentransformation genannt wird.
Beispiel: Gegeben die quadratische Form
(x1 , x2 , x3 ) 7→ q(x1 , x2 , x3 ) = 6x21 + 5x22 + 7x23 − 4x1 x2 + 4x1 x3 ,
108
so gilt



6 −2 2
x1
q(x1 , x2 , x3 ) = (x1 , x2 , x3 )  −2 5 0   x2  .
2
0 7
x3
Die metrische Normalform können wir bereits aus den Eigenwerten λ1 = 3, λ2 =
6 und λ3 = 9 der obigen Matrix herauslesen als
y = (y1 , y2 , y3 ) 7→ 3y12 + 6y22 + 9y32 ;
diese quadratische Form ist also positiv definit. Zur Berechnung der Hauptachsen bestimmen wir Eigenvektoren zu den genannten Eigenwerten, etwa






2
−1
2
w1 =  2  , w2 =  2  , w3 =  −1  .
−1
2
2
Da die zugehörige Matrix symmetrisch ist, sind diese Vektoren bereits orthogonal. Nach deren Normierung schreiben wir diese in die Spalten der Matrix
D


2 −1 2
1
D=
2
2 −1  .
3
−1 2
2
Dann ergibt sich die Basis der Hauptachsen durch x = Dy bzw. y = D −1 x.
Geometrisch beschreibt die Hauptachsentransformation einen geeigneten
Koordinatenwechsel. Um dies noch einmal zu betonen, illustrieren wir den obigen Beweis mit einem Spezialfall gewisser 2 × 2-Matrizen: Ist A gegeben durch
a b
mit a, b ∈ R,
A=
b a
dann berechnet sich das charakteristische Polynom als
λ − a −b
det(λE − A) = det
= λ2 − 2aλ + a2 − b2 ,
−b λ − a
woraus sich die Eigenwerte λ1 = a + b und λ2 = a − b ergeben. Zugehörige Eigenvektoren liest man aus den entsprechenden homogenen linearen Gleichungssytemen ab: x + y = 0 bzw. x − y = 0; nach normieren finden wir etwa
1
1
1
−1
and
w2 = √
.
w1 = √
1
2 1
2
Wir bilden aus diesen die Transformationsmatrix
1
1 −1
D=√
2 1 1
und berechnen (zur Probe)
D
−1
1
1
1 1
a b
1 −1
√
√
AD =
b a
2 −1 1
2 1 1
a+b
0
=
=: B.
0
a−b
109
Wir finden die neuen Koordinaten y1 , y2 vermöge x = Dy bzw. y = D −1 x, also
1
y1
1 1
x1
y=
=√
.
y2
x2
2 −1 1
Die zugehörigen symmetrischen Bilinearformen sind
xt Ax = ax21 + 2bx1 x2 + ax22
und
y t By = (a + b)y12 + (a − b)y22 ;
der gemischte Term ist durch die Koordinatentransformation also beseitigt worden!
Eine wichtige Anwendung der Hauptachsentransformation liegt in der Diskussion der durch eine quadratische Gleichung definierten Kurve. In dem obigen
zweidimensionalen Beispiel sei etwa der Typ der durch xt Ax = 1 festgelegten
Kurve zu bestimmen:
Q = {x = (x1 , x2 ) ∈ R2 : ax21 + 2bx1 x2 + ax22 = 1}.
Nehmen wir an, dass beide Eigenwerte positiv sind, so wird Q in den Koordinaten y1 , y2 durch die Gleichung
2 2
y2
1
y1
+
=1
mit αj = √
α1
α2
a±b
beschrieben; hier liegt also wiederum eine Ellipse mit Hauptachsen αj vor. Ist
hingegen a + b > 0 > a − b, so ergibt sich eine Hyperbel:
2 2
y2
1
y1
−
=1
mit αj = p
.
α1
α2
|a ± b|
Auch hier sind die αj die Hauptachsen von Q. Hierbei haben wir die Sätze
über die Normalformen dieser Kurven aus §3.2 und §3.3 benutzt! Im Fall der
Hyperbel können wir mittels der weiteren Koordinatentransformation
y2
y1
y2
y1
+
und
z2 =
−
z1 =
α1 α2
α1 α2
alternativ auch durch z1 z2 = 1 darstellen, denn
2 2
y2
y1
y1
y1
y2
y2
+
−
−
.
z1 z2 =
=
α1 α2
α1 α2
α1
α2
Die Transformationsmatrix D ist eine orthogonale Matrix; sie beschreibt eine
Drehung um den Winkel π4 = 45◦ (denn cos π4 = sin π4 = √12 ). In beiden Fällen
ist die durch ax21 + 2bx1 x2 + ax22 = 1 definierte Kurve Q also durch eine Drehung
π
4 auf Hauptachsenform gebracht worden.
Aufgaben
Aufgabe 85. Gegeben B ∈ R
n×n
. Zeigen Sie, dass A = 21 (B + B t ) symmetrisch ist.
Aufgabe 86. Für welche Parameter λ ∈ R ist die quadratische Form
(x, y) 7→ (2 − λ)x2 + 3xy + (λ − 1)y 2
negativ definit?
110
Aufgabe 87. Zeigen Sie, dass die Gleichung
√
7x2 + 6 3xy + 13y 2 = 1
eine Ellipse definiert; berechnen Sie deren Hauptachsen! Um welchen Winkel muss für
die Hauptachsenform in welcher Richtung gerdeht werden?
Aufgabe 88. Zeigen Sie, dass für reelle x, y, z stets die Ungleichung
q(x, y, z) := 5x2 + 6y 2 + 7z 2 − 4xy + 4yz > 0
besteht. Hierzu zeige man zunächst, dass die zu q assoziierte symmetrische Matrix drei
positive Eigenwerte besitzt!
10. Allgemeine Kurven zweiter Ordnung
Wir wollen nun systematisch die Kurven untersuchen, die durch quadratische Gleichungen definiert werden. Die allgemeine Gleichung zweiten Grades in
zwei Veränderlichen x, y ist von der Gestalt
(14)
ax21 + 2bx1 x2 + cx22 + 2dx1 + 2ex2 + f = 0
mit a, b, c, . . . , f ∈ R;
hier haben wir einen Faktor 2 bei einigen Termen auf der linken Seite eingebaut,
um diese wie folgt darstellen zu können:
2d
a b
x1
+ (x1 , x2 )
+f
(x1 , x2 )
2e
x2
b c
bzw.
xt Ax + v t x + f
mit
A=
a b
b c
und
v=2
d
e
.
Dann heißt die Menge Q aller x = (x1 , x2 ) ∈ R2 , welche der Gleichung (14)
genügt, eine Quadrik Q in R2 (auch quadratische Hyperfläche), also
Q = {x ∈ R2 : xt Ax + xt v + f = 0}.
Solch eine Quadrik beschreibt eine ebene Kurve zweiter Ordnung. Welche
Kurven können sich hinter einer solchen Quadrik Q verbergen?
Den Spezialfall, wenn keine gemischten Terme vorhanden sind, hatten
wir bereits kennengelernt. Der allgemeine Fall lässt sich durch quadratische
Ergänzung auf diesen zurückführen!
Beispiel 1 (Staatsexamen Frühjahr 2006, Thema 3, Aufgabe 4): Zeigen Sie,
dass die Gleichungen
x2 + 2xy + 2x + 2y = 0
eine Hyperbel im R2 definiert und bestimmen Sie deren Asymptoten.
Zur Lösung bestimmen wir die affine Normalform: Dazu sei Q die durch
x2 + 2xy + 2x + 2y = 0
111
definierte Quadrik. Hierzu finden wir mittels quadratischer Ergänzung die äquivalente Gleichung
(x + y + 1)2 − y 2 = 1
und mit u = x + y + 1 und v = y ergibt sich die affine Normalform u2 − v 2 = 1.
Nach Korollar 3.4 ist Q also eine Hyperbel mit den Asymptoten u = ±v; letztere
Abbildung 21. Die beiden um 45 Grad gedrehten Hyperbeln aus Beispiel 1.
lassen sich auch beschreiben durch
x + y + 1 = u = +v = y
bzw.
x = −1
und
x + y + 1 = u = −v = −y
bzw.
x + 2y = −1
(siehe Abbildung 21).
Beispiel 2: Gegeben sei die Quadrik Q ⊂ R2 durch die folgende Gleichung
x21 + x22 + 6x1 x2 − 2x1 + 6 = 0.
Wir binden die zusätzlichen linearen Terme sowie den konstanten Term in einer
zusätzlichen Dimension ein; hierzu sei


6 −1 0
A′ =  −1 1 3  .
0
3 1
112
Dann gilt



6 −1 0
1
(1, x1 , x2 )  −1 1 3   x1  = x21 + x22 + 6x1 x2 − 2x1 + 6 =: q(x1 , x2 ).
x2
0
3 1
Zunächst diagonalisieren wir die Untermatrix
1 3
A=
3 1
die durch Streichen der ersten Zeile und Spalte von A′ entsteht; diese entspricht
der quadratischen Form x21 + x22 + 6x1 x2 (also genau den quadratischen Termen
in q). Das Charakteristische Polynom ist det(λE − A) = (λ + 2)(λ − 4), die
Eigenwerte sind also λ1,2 = −2, 4 und die jeweiligen Eigenräume berechnen sich
zu
1
−1
R.
R
und
EigA (4) =
EigA (−2) =
1
1
Normieren der Richtungsvektoren liefert die Transformationsmatrix
1
1 −1
D=√
2 1 1
und A wird diagonalisiert durch
1
1 1
1 3
1 −1
4 0
t
D AD =
=
3 1
1 1
0 −2
2 −1 1
(man vergleiche dies mit einem allgemeineren Beispiel aus dem vorigen Paragraphen). Wir ergänzen nun D durch Hinzufügen einer ersten Zeile und Spalte
zu


1 0
0
1
1 

D ′ =  0 √2 − √2 
√1
0 √12
2
(gewissermaßen rückwärts zu dem Schritt von A′ zu A). Dann berechnet sich

6
 − √1
′ t ′ ′
(D ) A D = 
2
√1
2
− √12
4
0
√1
2
0 
.
−2
Wir notieren das Ergebnis ebenso als



c β1 β2
(D ′ )t A′ D ′ =  β1 λ1 0 
β2 0 λ2
113
mit also c = 6, β1 = − √12 und β2 = √12 . Hieraus entsteht durch Multiplikation
von (1, x1 , x2 ) von links und rechts (als Spaltenvektor)



c β1 β2
1
(1, x1 , x2 )  β1 λ1 0   x1 
β2
0
λ2
= c + 2β1 x1 + 2β2 x2 +
x2
λ1 x21
+ λ2 x22
Damit haben wir also den gemischten Term beseitigt. Die linearen Terme lassen
sich hier durch quadratische Ergänzung eliminieren:
2 !
β1
β1 2
2
−
.
2β1 x1 + λ1 x1 = λ1
x1 +
λ1
λ1
Ersetzen wir hierin x1 durch x1 − β1 /λ1 , so beseitigt dies die unerwünschten
linearen Terme mit x1 (und analog verfährt man mit dem linearen Term mit
x2 ). Multiplikation der Matrix


1
0 0
U ′ =  −β1 /λ1 1 0 
−β2 /λ2 0 1
von links mit dem Spaltenvektor

 
1
1
U ′  x1  =  −β1 /λ1
x2
−β2 /λ2
(1, x1 , x2 )t liefert nun

 

0 0
1
1
1 0   x1  =  x1 − β1 /λ1  .
0 1
x2
x2 − β2 /λ2
Wir haben also die Koordinaten x1 , x2 transformiert zu y1 = x1 − β1 /λ1 , y2 =
x2 − β2 /λ2 , was der gewünschten quadratischen Ergänzung entspricht. In unserem Beispiel ergibt sich so


1 0 0
√


U ′ =  √82 1 0 
2
0 1
4
sowie die Hauptachsenform

49
8
(D ′ U ′ )t A′ (D ′ U ′ ) =  0
0
Entsprechend ergibt sich die Gleichung

0 0
4 0 ;
0 −2
49
+ 4y12 − 2y22 = 0.
8
Also ist Q ähnlich zu der hauptachsentransformierten Hyperbel mit Normalform
2 y1
y2 2
√
−
=1
7/4
7/ 24
(siehe Abbildung 22). Gewissermaßen haben wir statt der Quadrik Q die höher-
114
Abbildung 22. Zwei Hyperbeln: vor und nach der Hauptachsentransformation – welche ist welche?
dimensionale Quadrik Q′ im Raum R3 gegeben durch die Gleichung
q ′ (x0 , x1 , x2 ) = 0
mit q(x0 , x1 , x2 ) := x21 + x22 + 6x1 x2 − 2x0 x1 + 6x20 = 0
behandelt. Wir beobachten q(x1 , x2 ) = q ′ (1, x1 , x2 ); Setzen von x0 = 1 entspricht einer Projektion von R3 in die Ebene und also entsteht Q = {(x1 , x2 ) ∈
R2 : q(x1 , x2 ) = 0} durch Schneiden von Q′ = {(x0 , x1 , x2 ) ∈ R3 :
q ′ (x0 , x1 , x2 ) = 0} mit der Ebene x0 = 1 in R3 .
Nun wollen wir das obige Verfahren systematisieren: Hierzu sei eine quadratische Gleichung in n Variablen gegeben durch
(15)
n
X
i=1
aii x2i
+
n
X
1≤i<j≤n
2aij xi xj + 2
n
X
bk xk + c = 0
k=1
mit aij , bk , c ∈ R; dann heißt die Menge Q aller x = (x1 , . . . , xn )t ∈ Rn , welche
dieser Gleichung genügen eine Quadrik in Rn . Unser Anliegen ist es, durch
Hauptachsentransformation (Satz 3.20) den Typ dieser Quadrik zu bestimmen,
bzw. die Frage zu klären, welche geometrischen Objekte auftreten können.
1. Quadratische Terme: Hierzu bilden wir die Matrix A = (aij ) bestehend aus den Koeffizienten aij der Q definierenden quadratischen
Gleichung bei dem quadratischen Term xi xj als Eintrag in der i-ten
Zeile und j-ten Spalte; im Falle i 6= j sei dabei aji = aij . Mittels
Hauptachsentransformation ist die symmetrische Matrix A ∈ Rn×n
zu diagonalisieren: Hierzu berechnet man zunächst deren Eigenwerte
115
λ1 , . . . , λn und eine Orthonormalbasis von zugehörigen Eigenvektoren
w1 , . . . , wn ; diese als Spaltenvektoren in eine Matrix D = (w1 , . . . , wn )
geschrieben, liefert die Diagonalmatrix


λ1
0


..
D −1 AD = D t AD = 
 =: B
.
0
λn
(mit lauter Nullen außerhalb der Diagonalen).
2. Lineare Terme: Zum Beseitigen der linearen Terme sei A′ die symmetrische Matrix, für die
n
n
n
X
X
X
1
t
′
2
bk xk + c = (1, x )A
2aij xi xj + 2
,
aii xi +
x
i=1
1≤i<j≤n
(1, xt )
k=1
n+1
wobei
∈R
der um die Komponente 1 erweitere Zeilenvektor
1
x sei und ( x ) sein transponierter Spaltenvektor; es gilt also
c bt
′
A =
∈ R(n+1)×(n+1)
b A
mit bt = (b1 , . . . , bn ) als Zeilen- bzw. Spaltenvektor. Wir bilden ferner
1 0
′
D =
0 D
mit 0 = (0, . . . , 0) ∈ Rn als dem passenden Zeilen- bzw. Spaltennullvektor sowie D aus Schritt 1. Schließlich seien Zahlen β1 , . . . , βn
definiert durch


c β1 . . . . . . βn
 β1 λ1 0 . . . 0 



.. 
..
′ t ′ ′

.
(D ) A D =  β2 0
. 
.
 ..
..
.
.
. . .. 
 .

.
βn 0 . . . . . . λn
Wir bilden ferner

1
−β1 /λ1
..
.



U′ = 

 −βn−1 /λn−1
−βn /λn
0 ... ...
1 0 ...
.. ..
.
.
1
0 ... 0
0
0
..
.




,

0 
1
wobei der j + 1-te Eintrag in der ersten Spalte gleich −βj /λj sei, falls
λj 6= 0, und andernfalls gleich null sei. Dann ergibt sich


γ


λ1


′ t
′ t ′
′ ′
(U ) (D ) A (D U ) = 
 =: B ′ ,
..


.
λn
116
wobei
γ =c−
n
X
βj2
λj
j=1
λj 6=0
und B ′ eine Diagonalmatrix ist mit den Eigenwerten λj von A auf der
Diagonalen, falls alle diese Eigenwerte ungleich null sind; ist hingegen
λj = 0, so stehen in den j + 1-ten Einträgen der ersten Zeile bzw. der
ersten Spalte nicht notwendig verschwindende reelle Zahlen vj und
Nullen sonst.
3. Metrische Normalform: Die durch (15) definierte Quadrik
Q = {x = (x1 , . . . xn ) ∈ Rn : xt Ax + 2bt x + c = 0}
ist kongruent zu einer Quadrik
Q′ = {y = (y1 , . . . yn ) ∈ Rn : y t By + 2v t y + γ = 0}
mit der Diagonalmatrix B (mit den Eigenwerten von A in der Diagonalen) und einem Vektor v mit Einträgen vj für Λj und Nullen sonst
entsprechend Schritt 2. Damit besitzt Q die metrische Normalform
n
X
j=1
λj yj2 + 2
n
X
vj y j + γ = 0
j=1
λj 6=0
mit den Eigenwerten λj von A und γ aus Schritt 2.
Hierbei heißen zwei geometrische Objekte kongruent, wenn es eine euklidische
Bewegung gibt, welche diese ineinander überführt; dabei bleiben also Form und
Größe erhalten. (Und Q′ mag als die im Raum bewegte Quadrik Q angesehen
werden!)
Einige Bemerkungen: Die spezielle Form für das Produkt (D ′ )t A′ D ′ ergibt sich aus der Hauptachsentransformation D t AD = B als
1 0
c b
1 0
′ t ′ ′
(D ) A D =
0 Dt
b A
0 D
1 0
c
c βt
c
b
bt D
=
=
=
Dtb Dt A
0 D
D t b D t AD
β B
mit β t = (β1 , . . . βn ) = bt D (bzw. β = D t b).†† Die zusätzliche Transformation
mit der Matrix U ′ steht für die quadratische Ergänzung, welche die linearen
Terme beseitigt sofern der zugehörige Eigenwert von null verschieden ist. Geometrisch ist diese quadratische Ergänzung eine Translation. Dabei gilt mit den
Rechenregeln für Transposition:
(U ′ )t (D ′ )t A′ (D ′ U ′ ) = (D ′ U ′ )t A′ (D ′ U ′ ).
††
Hierbei sei darauf hingewiesen, dass die mit dicken Linien unterteilten Matrizen asl
Blockmatrizen zu lesen sind!
117
Wegen
1
x
′
=DU
′
1
y
gilt y = (DU )−1 x, so dass also x 7→ (DU )−1 x die euklidische (und damit abstandserhaltende!) Bewegung ist, welche Q in Q′ überführt.
Mit diesem Kochrezept wollen wir ein weiteres Beispiel rechnen: Die Quadrik Q sei gegeben durch die Gleichung
4x21 + 2x22 + 3x23 + 4x1 x3 − 4x2 x3 + 12x1 + 30x2 + 36x3 + 2 = 0.
Wir bilden die zugehörige symmetrische Matrix


4 0
2
A =  0 2 −2 
2 −2 3
und berechnen über deren charakteristisches Poylnom λ3 − 9λ2 + 18λ die Eigenwerte als λ1 = 0, λ2 = 3 und λ3 = 6. Normierte Eigenvektoren sind hierzu






−1
2
2
1
1
1
w1 =
2  , w2 =  2  , w3 =  −1  .
3
3
3
2
−1
2
Mit der Matrix D = (w1 , w2 , w3 ) ergibt sich die Hauptachsentransformation

−1
1
 2
D t AD =
9
2

0 0
=  0 3
0 0



2
2
4 0
2
−1 2
2
2 −1   0 2 −2   2
2 −1 
−1 2
2 −2 3
2 −1 2

0
0 .
6
Damit ist Q kongruent zu einer Quadrik mit definierender Gleichung ohne gemischte quadratische Terme:
3z22 + 6z32 + 40z1 + 16z2 + 22z3 + 2 = 0;
vermöge quadratischer Ergänzung lässt sich diese letzte Gleichung umschreiben
als
3(z2 + 38 )2 + 6(z3 +
11 2
6 )
+ 40(z1 −
79
80 )
= 0.
Hieraus kann man bereits alle notwendigen Daten zu Q ablesen; wir fahren
aber trotzdem noch mit dem Kochrezept fort: Mittels der Größen c = 2 sowie
b1 = 6, b2 = 15 und b3 = 18, welche man der Q definierenden Gleichung abliest,
bildet man A′ sowie D ′ und berechnet (D ′ )t A′ D ′ und liest hieraus die Größen
118
β1 , β2 , β3 ab:
(D ′ )t A′ D ′

3 0
0
1
0
−1
2

=
2
9 0 2
0 2 −1

2 20 8 11
 20 0 0 0
= 
 8 0 3 0
11 0 0 6

0
2 6 15 18
 6 4 0
2 
2



−1
15 0 2 −2
2
18 2 −2 3



3 0
0
0
  0 −1 2
2 


 0 2
2 −1 
0 2 −1 2

.

Alternativ lassen sich die βj ’s (gemäß unserer Bemerkung) auch berechnen
Abbildung 23. Der noch nicht auf hauptachsentransfomierte Paraboloid.
durch





 
β1
20
−1 2
2
6
1
β =  β2  = D t b =  2
2 −1   15  =  8  .
3
β3
11
2 −1 2
18
Wir bilden nun mit den Einträgen −bj /λj für
ersten Spalte und ansonsten null die Matrix

1
0 0

0
1 0
U′ = 
 −8 0 1
3
− 11
0 0
6
nichtverschwindende λj in der

0
0 

0 
1
119
und berechnen damit

3
0
0
0
1  −9 −1 2
2 

S ′ = D′ U ′ = 
7

2 −1 
−2 2
3
−1 2 −1 2

sowie

− 79
2
 20
′ t ′ ′

(S ) A S = 
0
0
20
0
0
0
0
0
3
0
Daraus lesen wir die Normalform
3y22 + 6y32 + 40y1 −
79
2

0
0 
.
0 
6
=0
ab. Also ist Q kongruent zu einem elliptischen Paraboloid mit Normalform
6 2
79 y2
+
12 2
79 y3
+
80
79 y1
=1
(siehe Abbildung 23); die entsprechende Koordinatentransformation ist in S ′
kodiert.
Zweites Beispiel: Sei Qc die Quadrik des R3 , welche durch die Gleichung
3x21 − 2x1 x2 + 3x22 − 6x23 − 2x1 − 4x2 − 2x3 + c = 0
gegeben sei; hierbei ist c ein reeller Parameter. Von welchem Typ ist Qc ? Es ist
zu erwarten, dass der Typ von der Wahl von c abhängt.
Abbildung 24. c′ = ±1: Ein und zweischalige Hyperboloide.
Wir bestimmen die symmetrische Matrix


3 −1 0
A =  −1 3
0 
0
0 −6
120
gemäß unserem Kochrezept. Das zugehörige charakteristische Polynom berechnet sich als (λ − 2)(λ − 4)(λ + 6), was auf etwa die Transformationsmatrix
 1

√
− √12 0
2


√1
D =  √12
0 
2
0
0
1
führt. Mit den erweiterten Matrizen A′ und D ′ ergibt sich dann
(D ′ )t A′ D ′


1
0
0 0  c −1 −2 −1
 0 √1
√1
0 
−1 3 −1 0


2
2
= 

1
1
0
 0 − √2 √2 0   −2 −1 3
−1 0
0 −6
0
0
0 1


c
− √32 − √12 −1
 − √3
2
0
0 


2
= 
.

 − √1
0
4
0
2
−1
0
0
6
Mit

1
√
3

2
4 √
U′ = 
 −1 2
8
− 61
folgt
0
1
0
0
53
c − 24

0
(D ′ U ′ )t A′ D ′ U ′ = 

0
0
0
√1
2
√1
2
0
0
− √12
√1
2
0
0
0
0
1






0
0 

0 
1
0
0
1
0

 1

0


 0
0
0
2
0
0

0 0
0 0 
.
4 0 
0 −6
53
ergibt sich die Normalform 2x21 + 4x22 − 6x23 = 0 und Qc ist
Speziell für c = 24
ein Ellipsenkegel. Falls c > 53
24 , ist die definierende quadratische Gleichung von
der Gestalt
2 2
c ′ x1
+
4 2
c ′ x2
−
6 2
c ′ x3
= −1
mit
c′ = c −
53
24
> 0;
53
in diesem Fall ist Qc ein zweischaliges Hyperboloid; ist schließlich c < 24
, so
′
ist c < 0 und Qc ist ein einschaliges Hyperboloid (siehe Abbildung 24). Weitere Erscheinungsformen von Quadriken werden wir im nächsten Paragraphen
kennen lernen.
Aufgaben
Aufgabe 89. Welches geometrische Objekt verbirgt sich hinter der Quadrik, welche
durch die Gleichung
x2 − 2y 2 + 3z 2 − 4xy + 5xz − 6yz + 7 = 0
gegeben ist?
121
Aufgabe 90 (Frühjahr 2004, Thema 3, Aufgabe 4). Bestimmen Sie alle Parameter
s ∈ R, für welche die Gleichung
(sx1 )2 + 2x1 x2 + x22 − 2x1 − 2x2 + s + 1 = 0
eine Hyperbel beschreibt.
11. Klassifikation der Quadriken
Mit Hilfe der Hauptachsentransformation und quadratischer Ergänzung
können wir nun die verschiedenen Typen von Quadriken klassifizieren; dabei
wollen wir aber den trivialen Fall ausschließen, dass die definierende Gleichung
keine quadratischen Terme enthält, in welchem die Quadrik eine Hyperebene ist
(eine Gerade im Falle der Ebene) oder gar der gesamte Raum (wenn nämlich
die Gleichung 0 = 0 gegeben ist). Wesentlich interessanter ist:
Satz 3.21 (Metrische Klassifikation der Quadriken). Zu jeder Quadrik Q
in Rn existiert eine euklidische Bewegung f sowie m, k ∈ N0 mit m + k ≥ 1 und
positive reelle Zahlen αj , so dass die bewegte Quadrik f (Q) durch genau eine
der folgenden Gleichungen beschrieben wird.
(I) Es treten keine linearen oder konstanten Terme auf:
2
x1
xm 2
xm+1 2
xm+k 2
+ ... +
−
− ... −
=0
α1
αm
αm+1
αm+k
mit m ≥ k.
(II) Es treten keine linearen Terme auf; der konstante Term ist normiert
gleich eins:
2
xm 2
xm+1 2
xm+k 2
x1
+ ... +
−
− ... −
= 1;
α1
αm
αm+1
αm+k
(III) Es tritt genau ein linearer Term auf:
2
xm 2
xm+1 2
xm+k 2
x1
+ ... +
−
− ... −
= xm+k+1 ,
α1
αm
αm+1
αm+k
wobei m + k < n.
Beweis mittels Hauptachsentransformation und quadratischer Ergänzung (wie
im vorangegangenen Paragraphen). Im Falle eines verschwindenden Eigenwertes
lassen sich die linearen Terme durch eine geeignete zusätzliche, abstandserhaltende Transformation auf einen einzigen reduzieren. (Im R2 tritt dieser letzte
Fall tatsächlich gar nicht auf.) •
Wir wollen nun die verschiedenen Erscheinungsformen insbesondere für die
Ebene und den dreidimensionalen Raum untersuchen. Dabei werden wir mit
der Ellipse, Hyperbel und Parabel alte Bekannte treffen (vgl. §3.2 und 3.3).
Für die Quadriken in der Ebene R2 liefert der Satz die verschiedenen
Typen im Fall (I):
122
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 0, womit f (Q) die
durch x1 = 0 beschriebene Gerade ist;
• für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und
durch Faktorisieren der linken Seite zeigt sich, dass f (Q) das Paar
sich schneidender Geraden x2 = ± αα12 x1 ist;
• für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche nur
durch (x1 , x2 ) = (0, 0) gelöst wird, womit f (Q) gleich dem Nullpunkt
ist.
Die verschiedenen Typen im Fall (II):
• Für m = 0, k = 1 liefert die Normalform −( αx11 )2 = 1, welches keine
Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist;
• für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das
Paar paralleler Geraden x1 = ±α1 ;
• für m = 0, k = 2 entsteht die Gleichung −( αx11 )2 − ( αx22 )2 = 1, womit
f (Q) wiederum leer ist;
• für m = 1, k = 1 ergibt sich für f (Q) die Normalform ( αx11 )2 −( αx22 )2 = 1
einer Hyperbel;
• für m = 2, k = 0 ergibt sich für f (Q) eine durch ( αx11 )2 + ( αx22 )2 = 1
beschriebene Ellipse.
Es verbleibt ein einzelner Typ im Fall (III):
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) eine
Parabel ist.
Die jeweiligen Untertypen lassen sich insbesondere noch über den Rang von A
und A′ gemäß unserem Kochrezept und die jeweilige Anzahl der positiven und
negativen Eigenwerte charakterisieren. In der Ebene genügen sogar Determinantenbedingungen: Beispielsweise liegt genau dann eine Hyperbel vor, wenn
det A < 0 und det A′ 6= 0 gilt.
Die gegebenen metrischen Normalformen enthalten genaue Informationen
über die Quadrik Q. Die Bewegung f aus Satz 3.21 hat Abstände und Winkel
unverändert gelassen (nach Satz 3.5 und 3.1). Aus beispielsweise der hauptachsentransformierten Normalform der Ellipse Q
2 2
x2
x1
+
=1
α1
α2
liest man unmittelbar die Halbachsen α1 und α2 ab (durch Setzen von xj = 0;
vgl. §3.1). Andererseits liefert die Hauptachsentransformation einen Zusammenhang zu den Eigenwerten λ1 , λ2 der zu Q assoziierten Matrix A: Gehen wir von
einer quadratischen Gleichung ohne lineare Terme aus, besteht also etwa die
hauptachsentransformierte Gleichung
λ1 x21 + λ2 x22 = γ
p
mit positiven γ, λ1 , λ2 , so folgt für die Halbachsen der Ellipse αj = γ/λj . Ähnliche Informationen lassen sich aus den metrischen Normalformen der anderen
geometrischen Objekte ziehen.
123
Abbildung 25. Von links nach rechts: Ebenenpaar, Kegel, Hyperbelzylinder
Als Nächstes wollen wir Quadriken im dreidimensionalen Raum R3 untersuchen; in diesem Fall entstehen Flächen! Der Satz liefert die verschiedenen
Typen im Fall (I):
• Für m = 1, k = 0 entsteht wiederum die Normalform ( αx11 )2 = 0 bzw.
x1 = 0, jedoch ist im R3 hierdurch eine Ebene beschrieben (während
in R2 dies auf eine Gerade führt);
• für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und durch
Faktorisieren der linken Seite offenbart sich f (Q) als ein Paar sich
schneidender Ebenen x2 = ± αα21 x1 (statt Geraden);
• für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche die
Gerade Re3 mit dem dritten Standardeinheitsvektor e3 beschreibt;
• für m = 2, k = 1 ist die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 0 und
damit entsteht ein Ellipsenkegel f (Q);
• für m = 3, k = 0 ergibt sich ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 0, welches nur
durch den Nullpunkt (x1 , x2 , x3 ) = (0, 0, 0) gelöst wird.
Abbildung 26. Von links nach rechts: Ellipsenzylinder, Ellipsoid, parabolischer Zylinder
Die verschiedenen Typen im Fall (II):
• Für m = 0, k = 1 liefert die Normalform −( αx11 )2 , welches wiederum
keine Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist;
• für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das
Paar paralleler Ebenen x1 = ±α1 ;
124
• für m = 0, k = 2 kommt −( αx11 )2 − ( αx22 )2 = 1, womit f (Q) wiederum
leer ist;
• für m = 1, k = 1 entsteht die Gleichung ( αx11 )2 − ( αx22 )2 = 1, womit
f (Q) ein Hyperbelzylinder ist;
• für m = 2, k = 0 ergibt sich für f (Q) ein durch ( αx11 )2 + ( αx22 )2 = 1
beschriebener Ellipsenzylinder;
• für m = 0, k = 3 lautet die Normalform −( αx11 )2 − ( αx22 )2 − ( αx33 )2 = 1
und f (Q) ist mal wieder leer;
• für m = 1, k = 2 ergibt sich für f (Q) die Normalform ( αx11 )2 − ( αx22 )2 −
( αx33 )2 = 1 ein zweischaliges Hyperboloid, während
• für m = 2, k = 1 die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 1 und damit
ein einschaliges Hyperboloid f (Q) entsteht;
• für m = 3, k = 0 entsteht ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 1 und f (Q) ist ein
Ellipsoid.
Es verbleiben die Typen im Fall (III):
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) ein
parabolischer Zylinder ist;
• für m = 1, k = 1 entsteht ( αx11 )2 − ( αx22 )2 = x3 und f (Q) ist ein hyperbolisches Paraboloid;
• für m = 2, k = 0 lautet die Normalform ( αx11 )2 + ( αx22 )2 = x3 , womit
f (Q) ein elliptisches Paraboloid ist.
Abbildung 27. Von links nach rechts: hyperbolisches Paraboloid, elliptisches Paraboloid
Etliche der neuen Quadriken haben sich in natürlicher Weise aus deren Analoga
in der Ebene ergeben: Steht x1 = 0 etwa in R2 eine Gerade, nämlich Re2 mit
dem zweiten Standardeinheitsvektor e2 , so existiert mit e3 in R3 ein weiterer
linear unabhängiger Vektor, der dieser Gleichung genügt, womit also im dreidimensionalen Raum die entsprechende Quadrik gleich der Ebene Re2 + Re3 ist.
Ähnlich wurden beispielsweise aus Paare von Geraden nun Paare von Ebenen.
Oder aber aus einer Hyperbel mit der Gleichung x21 − x22 = 1 in der Ebene
125
(Typ (II)) entsteht im Raum ein Hyperbelzylinder (ebenfalls Typ (II)), denn
x3 tritt nicht in der definierenden Gleichung auf, kann also beliebig gewählt
werden). Ferner ergeben sich einige der Quadriken im dreidimensionalen Raum
als so genannte Rotationskörper von ebenen Quadriken: Lassen wir etwa eine
Hyperbel in R3 um ihre Achsen rotieren, so entsteht ein Hyperboloid.
Abbildung 28. Links: Querschnitte eines Kegels; rechts: Längsschnitte.
Aber, gegeben eine quadratische Gleichung, wie erkennt man, welche Fläche
sich hinter der Quadrik verbirgt? – ohne Computer! Greifen wir hierzu noch
einmal das Beispiel des einschaligen Hyperboloids aus dem vergangenen Paragraphen auf, welcher gegeben ist durch die Gleichung
2x21 + 4x22 − 6x23 = 1
(c′ = −1). Wir können die Normalformdarstellungen aus §3.2 und 3.3 für Kurven in der Ebene benutzen, um die Fläche im dreidimensionalen Raum zu bestimmen: Hierzu schneiden wir etwa die Fläche Q mit Ebenen x3 = κ mit
verschiedenen reellen Werten κ. In diesem speziellen Beispiel ergeben sich so
für κ = 0, ±1, ±2, . . . jeweils Ellipsen
!2
!2
x1
x1
2
2
2
p
=1
+ p
2x1 + 4x2 = 1 + 6κ
bzw.
(1 + 6κ2 )/2
(1 + 6κ2 )/4
p
p
mit |κ| wachsenden Halbachsen (1 + 6κ2 )/2 bzw. (1 + 6κ2 )/4 (siehe Abbildung 28). Durch Zusammenfügen all dieser Schnittkurven entsteht die Fläche
Q (ganz ähnlich dem Prinzip von Cavalieri mit dem wir in Analysis mehrerer
Veränderlicher das Volumen der Kugel durch Aufintegrieren der Flächeninhalte
der Kreise, die als Schnitte der Kugel auftraten, berechnet hatten). Hierbei zeigt
sich auch, ob ein ein- oder ein zweischaliges Hyperboloid vorliegt. Zusätzliche Informationen ergeben sich, wenn wir die Schnittkurven mit beispielsweise x2 = κ
und variierendem κ ∈ R betrachten. Die Attribute elliptisch, hyperbolisch, parabolisch in den Klassifikationslisten für Ebene und dreidimensionalen Raum
kennzeichnen entsprechend die Art der Schnittkurven der jeweiligen Quadrik
126
mit einer Ebene. Im folgenden Paragraphen werden wir uns noch überlegen,
welche Schnittkurven bei solchen Schnitten mit Ebenen überhaupt entstehen
können...
Werden die Eigenvektoren bei der Hauptachsentransformation übrigens
nicht normiert, so entsteht zwar noch eine Diagonalmatrix, bloß stehen dann
nicht mehr notwendig die Eigenwerte auf der Diagonalen.
Beispiel 2 aus §10.: Mit den nicht-normierten Eigenvektoren bilden wir
1 −1
D̂ =
1 1
statt D (also ohne den Faktor
(D̂)t AD̂ = A =
√1 ),
2
1 1
−1 1
so berechnet sich
1 3
3 1
1 −1
1 1
=
8 0
0 −4
.
Tatsächlich ergibt sich das Doppelte der zu A gehörigen√Diagonalmatrix (was
nicht überraschend ist hinsichtlich der Normierung 2 = ( 2)2 ). Trotzdem lässt
sich der Typ – nämlich eine Hyperbel – bereits aus dieser Diagonalisierung von
A ablesen!
Ohne Normieren der Eigenvektoren im Kochrezept geht lediglich die Größe,
nicht aber die Form der Quadrik verloren, denn nach den Sätzen 3.5 und 3.1 erhalten Abbildungen der Form x 7→ Dx mit orthogonalen Matrizen D Abstände
und Winkel. Letztlich entscheidend sind also im Wesentlichen wie viele positive und wie viele negative Eigenwerte die Ausgangsmatrix A besitzt; vergleiche
hierzu den Begriff der positiven Definitheit in §2.4. Mit etwas mehr linearer
Algebra (dem Trägheitssatz von Sylvester) lassen sich dann die Quadriken in
beliebigen euklidischen Räumen Rn klassifizieren.
Als illustrierendes Beispiel zeigen wir nun, dass Kreis und Ellipse affin
äquivalent sind, also durch eine invertierbare Abbildung ineinander überführt
werden können: Hierzu sei eine Ellipse E mit metrischer Normalform
2 2
x2
x1
+
=1
α1
α2
gegeben (eine jede Ellipse lässt sich nach obigem ja in diese Gestalt bringen);
ebenso nehmen wir unseren Kreis K als den durch die Gleichung
x21 + x22 = 1
gegeben an. Dann überführt die Abbildung x1 7→ α1 x1 , x2 7→ α2 x2 die Ellipse E
in den Kreis K. So sind also Ellipse und Kreis nicht zu unterscheiden! Darstellungen wie die obige Kreisgleichung mit lauter auf ±1 normierten Koeffizienten
nennen wir die affine Normalform; für eine Hyperbel sieht diese beispielsweise
wie folgt aus
x21 − x22 = 1.
127
Allgemein entstehen die affinen Normalformen durch Setzen von αj = 1 in den
Gleichungen von Satz 3.21 über die metrische Normalform. Den Typ der Quadrik können wir so noch einfacher beschreiben; jedoch verlieren wir sämtliche
metrischen Informationen.
Wir wiederholen: Orthogonale Matrizen D in der Hauptachsentransformation D t AD = B liefern eine Diagonalmatrix B mit den Eigenwerten von A
in der Diagonalen (hierzu sind die Eigenvektoren zu normieren!). Ferner bleiben die Abstände bei x 7→ y := Dx zwischen jeweiligen Punkten erhalten und
die Quadrik ändert weder Form noch Größe, lediglich die Lage im euklidischen
Raum mag sich geändert haben. Insofern liefert die Klassifikation via der metrischen Normalform wesentlich mehr Informationen! Ist D hingegen eine Matrix
aus der SLn (R), so bleiben immerhin noch Volumina und Elemente und bei
D ∈ GLn (R) nur noch Parallelität erhalten.
Aufgaben
Aufgabe 91. Sei c ∈ R. Welches geometrische Objekt verbirgt sich hinter der Menge
aller x = (x1 , x2 , x3 ), die der Gleichung
x21 − 2x22 + 3x33 + c = 0
genügen? Welche Schnittkurven entstehen, wenn x3 konstant einer reellen Zahl gesetzt
wird?
Aufgabe 92. Welche Kurve zweiter Ordnung wird durch
2
{(ℓ2 + 2ℓ, ℓ2 − 2ℓ − 1)t ∈ R : ℓ ∈ R}
dargestellt?
Aufgabe 93 (Staatsexamen: Herbst 2003, Thema 2, Aufgaben 1 & 2). Gegeben
sei das von den Parametern r, s, t ∈ R abhängige lineare Gleichungssystem
x1 + 2x2 + 2x4
=
4
2x1 + 4x2 + rx3
=
1
sx1 + x3 + tx4
=
1
a) Für welche Wahl der Parameter ist die Lösungsmenge des Systems eindimensional, also eine affine Gerade? (Die Antwort ist zu begründen.)
b) Es sei C die Menge der Parametertripel (r, s, t), für welche die Lösungsmenge des Systems keine affine Gerade ist. Als Teilmenge des euklidischen
R3 mit den Koordinaten r, s, t ist C ein Kegelschnitt, der in einer Koordinatenebene liegt. Was ist der affine Typ des Kegelschnitts und in welcher
Koordinatenebene liegt er?
c) Bestimmen Sie die Parameter r, s, t im Gleichungssystem so, dass die
Lösungsmenge zweidimensional, also eine affine Ebene ist. Lösen Sie das
System für diese Wahl der Parameter.
128
12. Kegelschnitte
Nachdem wir die verschiedenen Typen von Quadriken klassifiziert haben,
wollen wir jetzt den Zusammenhang zwischen diesen geometrischen Objekten
in der Ebene und im dreidimensionalen Raum beleuchten. Ein Kreiskegel im
euklidischen Raum R3 lässt sich durch die quadratische Gleichung
x21 + x22 − x23 = 0
beschreiben (s.o.). Sämtliche Quadriken der Ebene ergeben sich als Schnitte von
Ebenen mit einem solchen Kegel im dreidimensionalen Raum, weshalb diese den
Namen Kegelschnitt tragen (siehe Abbildungen 29-31) und Analoges gilt für
den Fall von mehr als dreidimensionalen Kegeln. Schneiden wir etwa mit der
Abbildung 29. Eine Ellipse entsteht als Schnitt eines Kegels mit einer
Ebene im Raum.
Ebene, die durch x3 = r mit einer fixierten positiven reellen Zahl r definiert ist,
so ergibt sich durch Einsetzen in der Kreiskegelgleichung die Gleichung
x21 + x22 = r 2 ,
welches bekanntlich einen Kreis vom Radius r mit Mittelpunkt im Ursprung in
der x1 x2 -Ebene beschreibt. Also ist die Schnittkurve unseres Kegels mit besagter
Ebene eben dieser Kreis. Wählen wir eine etwas geneigte Ebene statt x3 = r, so
129
ergeben sich Ellipse bzw. Parabel als Schnittkurven, wobei die Parabel genau
dann entsteht, wenn die Winkel bei Ebene und Kegel übereinstimmen (siehe
Abbildungen 29 und 31). Schneiden wir hingegen mit einer Ebene x2 = r,
wobei r ≥ 0 sei, so folgt nach Umstellen die Gleichung
x23 − x21 = r 2 ;
damit ist die Schnittkurve in diesem Fall ein Geradenpaar (wenn r = 0) oder
eine Hyperbel (wenn r > 0; siehe Abbildung 30).
Satz 3.22. Die Schnittkurve Q ∩ E einer Quadrik Q ⊂ R3 mit einer Ebene E
ist kongruent zu einer Quadrik Q′ ⊂ R2 (also einem Kegelschnitt). Ist Q ein
Kreiskegel, so existiert zu jeder Quadrik Q′ eine Ebene E, so dass Q′ ähnlich
zu der Schnittkurve Q ∩ E ist.
Beweis. Jede Ebene E in R3 lässt sich durch eine lineare Gleichung
α1 x1 + α2 x2 + α3 x3 + γ = 0
beschreiben; hierbei können nicht alle Koeffizienten αj verschwinden, also sei
oBdA α3 = 1. Auflösen der Ebenengleichung nach x3 und Einsetzen in die Q
definierende quadratische Gleichung liefert eine Gleichung in x1 und x2 von
einem Grad kleiner oder gleich zwei. Also existiert zu Q nach dem Satz über
die metrische Normalform eine Bewegung f , so dass Q′ = f (Q ∩ E). Dass jede
Quadrik Q′ ⊂ R2 ähnlich zu einem Schnitt eines Kegels mit einer passenden
Ebene ist, also die Quadriken der Ebene den Namen Kegelschnitt zu Recht
tragen, hatten wir uns bereits überlegt. •
Ellipsen treten beispielsweise als Schnittkurven einer Ebene mit Ellipsoiden,
elliptischen Paraboloiden, ein- oder auch zweischaligen Hyperboloiden, Kegeln
oder elliptischen Zylindern auf, jedoch nicht als Schnitt einer Ebene mit etwa
einem hyperbolischen Zylinder. Die einzige Quadrik, die alle drei Kegelschnitte,
also Ellipse, Hyperbel und Parabel, als Schnittkurve mit einer geeigneten Ebene
liefert, ist der Kegel!
Abschließend diskutieren wir nun die Frage:
Wieviele Punkte bestimmen einen Kegelschnitt eindeutig?
Wir erinnern: zwei Punkte legen eine Gerade durch ebendiese fest, und mit ein
wenig mehr Mühe zeigt sich, dass drei Punkte, welche nicht auf einer Geraden
liegen, einen Kreis definieren.
Satz 3.23 (Fünfpunktesatz). Durch fünf Punkte, von denen keine vier kollinear sind, gibt es immer einen Kegelschnitt. Ferner existiert zu gegebenen
verschiedenen fünf Punkten, von denen keine drei auf einer Geraden liegen,
existiert ein ein eindeutiger Kegelschnitt durch diese fünf Punkte.
Beweis. Ein Kegelschnitt Q ⊂ R2 ist definiert durch eine quadratische Gleichung:
α1 x2 + α2 y 2 + α3 xy + α4 x + α5 y + α6 = 0.
130
Abbildung 30. Eine Hyperbel als Kegelschnitt.
Wir nehmen an, dass nicht alle quadratischen Terme verschwinden (ansonsten
haben wir es mit einer Gerade zu tun); sei also oBdA α1 verschieden von null.
Nach Division durch α1 entsteht die äquivalente Gleichung
x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0
mit aj = αj+1 /α1 . Diese quadratische Gleichung beschreibt also nach wie vor
unsere gegebenen Kegelschnitt Q! Angenommen, wir wissen nicht, um was für
einen Kegelschnitt es sich bei Q handelt, sondern wir kennen lediglich m Punkte
Pj = (xj , yj ), die auf unserem Kegelschnitt liegen, also Pj ∈ Q für j = 1, . . . , m.
Wie viele solche Punkte m benötigen wir, um den genauen Typ unseres Kegelschnittes bestimmen zu können?
Wir schreiben statt Pj = (xj , yj ) ∈ Q die entsprechenden Gleichungen
nieder:
x21 + a1 y12 + a2 x1 y1 + a3 x1 + a4 y1 + a5
=
0
x22 + a1 y22 + a2 x2 y2 + a3 x2 + a4 y2 + a5
=
0
...
2
x2m + a1 ym
+ a2 xm ym + a3 xm + a4 ym + a5
=
0.
131
Abbildung 31. Eine Parabel als Kegelschnitt.
Dies sind m lineare Gleichungen in fünf Unbekannten: a1 , a2 , . . . , a5 (die Terme
gebildet aus den xj , yj sind hier die Koeffizienten: bei konkreten Punkten Pj sind
dies die Koordinaten, also Skalare). Wir können dieses lineare Gleichungssystem
auch umschreiben zu

 

 2
−x21
a1
y 1 x1 y 1 x1 y 1 1
 ..
..   ..  =  ..  ;
 .
.  .   . 
y m xm y m xm y m 1
a5
−x2m
Die Lösungsmenge dieses inhomogenen linearen Gleichungssystems ist nicht leer
(denn wir gehen ja von Punkten Pj aus, deren Koordinaten dieses lösen). Gehen
wir von vier Punkten Pj aus , also m = 4, so haben wir einen Freiheitsgrad unter
den fünf Unbekannten a1 , . . . , a5 und wir können im Allgemeinen keine eindeutige Lösung finden, die unseren Kegelschnitt festlegt. Aus der linearen Algebra ist
bekannt, dass eine eindeutige Lösung unseres linearen Gleichungssystems genau
dann existiert, wenn der Rang der Koeffizientenmatrix
 2

y 1 x1 y 1 x1 y 1 1

.. 
A =  ...
. 
y m xm y m xm y m 1
132
mit der Anzahl n = 5 der Unbekannten übereinstimmt (bzw. gleich dem Rang
der erwiterten Matrix (A, b) mit der rechten Seite b ist). Wir benötigen im Allgemeinen also fünf Punkte um den Kegelschnitt aus fünf auf diesem liegenden
Punkten exakt bestimmen zu können. Hierbei ist allerdings auszuschließen, dass
drei oder mehr der Punkte Pj auf einer Geraden liegen, ansonsten reduzieren
sich die linear unabhängigen Gleichungen, die wir den Punkten Pj ∈ Q zugeordnet hatten (und entsprechend der Rang). •
Man beachte hier, dass kollinear gelegene Punkte alleine beispielsweise keine
Gerade eindeutig festelegen können!
Wir schließen mit einem illustrierenden Beispiel: In der Ebene sei eine uns
unbekannte Quadrik Q gegeben, die definierende Gleichung sei
x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0,
und wir kennen vier Punkte P1 = (1, 0), P2 = (−1, 0), P3 = (0, 1), P4 = (0, −1),
welche allesamt auf Q liegen. Es bestehen somit die folgenden vier linearen
Gleichungen in den fünf Unbekannten a1 , . . . , a5 :


 a1



0
1 0 1 0 1 

a2  
 1 0 −1 0 1  
  0 

.

=

 0 0 1 0 1   a3 
  −1 
 a4 
0 0 −1 0 1
−1
a5
Lösen dieses linearen Gleichungssystems liefert a1 = 1, a3 = 0, a4 = 0, a5 = −1
und a2 ist ein freier Parameter. Setzen wir als a3 = α mit beliebigem α ∈ R, so
ergibt sich für die Q definierende Gleichung
x2 + y 2 + αxy = 1.
Wir sehen, dass durch Angabe von vier Punkten Pj ∈ Q, die Quadrik noch
nicht eindeutig bestimmt ist. Geben wir einen weiteren Punkt vor, so können
verschiedene Dinge passieren. Der Punkt (0, 0) kann einerseits nicht auf Q liegen,
andererseits läge er auch mit wei weiteren Punkten der vier anderen auf einer
Geraden, was im Fünfpunktesatz ausgeschlossen ist. Hingegen folgt aus der
Forderung P5 = (3, 5) sofort, dass α = − 33
15 , also Q durch
x2 + y 2 −
33
15 xy
1 2
u +
− 12
25 2
12 v
= 1.
11
Mit dem Beispiel aus §3.9 (mit a = 1 und b = − 33
30 = − 10 ) ergibt sich dann die
hauptachsentransformierte Gleichung
= 1,
womit Q also die durch die Punkte P1 , . . . , P5 ∈ Q eindeutig bestimmte Hyperbel ist (siehe Abbildung 32).
133
Abbildung 32. Fünfpunkte auf einer Hyperbel.
Aufgaben
Aufgabe 94. Es sein λ ein reeller Parameter. Welche Kegelschnitte verstecken sich
hinter den Schnitten der Ebene Eλ
 


 
1
0
0
 0  + R λ  + R 0 
0
1
1
mit dem Kreiskegel Q, der gegeben ist durch die Gleichung x2 + y 2 − z 2 = 0?
3
Aufgabe 95. Für welche Quadriken Q ⊂ R kann ein Schnitt mit einer Ebene eine
Hyperbel liefern?
Aufgabe 96. Man zeige, dass der Durchschnitt zweier Kugeloberflächen im Raum
entweder leer, ein Punkt oder ein Kreis ist, der in einer orthogonal zur Geraden durch
die zwei Kugelmittelpunkte liegenden Ebene enthalten ist.
Aufgabe 97. Beweisen Sie, dass sich stets ein Kreis durch drei nicht kollineare Punkte
legen lässt und dieser eindeutig bestimmt ist.
Herunterladen