Analytische Geometrie - Universität Würzburg

Analytische Geometrie
für Lehramtstudierende der Schulformen Grund-, Haupt- und Realschule
Jörn Steuding
Universität Würzburg, Wintersemester 2011/12
Geometrie steht wörtlich für die Vermessung der Erde, entspringt also einem
praktischen Anliegen, hat sich aber natürlich im Laufe ihrer über fünf Jahrtausende währenden Geschichte zu einer sehr vielfältigen mathematischen Disziplin
entwickelt. In der Schule spielt die Geometrie eine zentrale Rolle, insbesondere
in der Mittel- und Oberstufe. In dieser Vorlesung werden wir insbesondere jene Aspekte eingehend studieren, die sich mit Hilfe der Methoden der linearen
Algebra untersuchen lassen: Neben der Klassifikation der Quadriken (insbesondere der Kegelschnitte) werden wir auch ein wenig klassische Geometrie kennen
lernen, aber auch japanische Geometrierätsel (so genannte sangakus) lösen...
Ein herzlicher Dank an Nicola Oswald für das Erstellen diverser Bilder und
kritische Lektüre. Trotzdem ist dieses Skript - wie fast jeder längere geschriebene Text - wohl nicht ohne Druckfehler. Vielen Dank für weitere Korrekturen
einer früheren Version dieses Skriptes gebühren meinem Koellegen Prof. Dr. Fabian Wirth. Weitere Berichtigungen und Verbesserungsvorschläge sind herzlich
willkommen. Viel Spaß!
Jörn Steuding, Würzburg im April 2013.
Empfehlenswerte Literatur zum Thema:
• T. Arens, F. Hettlich, C. Karpfinger, U. Kockelkorn, K. Lichtenegger, H. Stachel, Mathematik, Spektrum 2008 (ein umfangreiches Buch mit den wichtigsten Resultaten
zur Analysis und linearen Algebra)
• Rolf Brandl, Vorlesungen über analytische Geometrie, Brandl Verlag, 1997 (hält, was
es verspricht)
• D.M. Burton, The history of Mathematics, McGraw-Hill, 2011 (Geschichte!)
• R. Courant, H. Robbins, Was ist Mathematik?, Springer 1993, 4. Auflage (ein Klassiker!)
• G. Fischer, Analytische Geometrie, Vieweg 2001, 7. Auflage (die Standardreferenz!)
• A. Holme, Geometry. Our cultural heritage, Springer 2010, 2nd ed. (sehr schön geschriebenes Buch zur Geschichte der Geometrie)
• K. Johannson, Geometrie für das Lehramt, www.mathematik.uni-frankfurt.de/∼johannson
(schönes Vorlesungsskript!)
• F. Klein, Elementarmathematik vom höheren Standpunkt, Teil II: Geometrie, Teubner
1909 (setzte seinerzeit Maßstäbe für das Lehramt)
• M. Koecher, A. Krieg, Ebene Geometrie, Springer 2007, 3. Auflage (alles Wissenswerte
zur Geometrie in der Ebene)
• J. Kratz, K. Wörle, Geometrie, Bayerischer Schulbuchverlag München 1972 (ein älteres
Schulbuch)
• H. Scheid, W. Schwarz, Elemente der Geometrie, Spektrum 2007, 4. Auflage (uneingeschränkt empfehlenswert!)
• C.J. Scriba, P. Schreiber, 5000 Jahre Geometrie, Springer 2001 (umfangreiches Geschichtswerk)
• J.
Steuding,
Elementare
Zahlentheorie,
Vorlesungsskript
WS
2009/10,
www.mathematik.uni-wuerzburg.de/∼steuding/elzt.pdf
• J. Stilwell, Numbers and Geometry, Springer 2001 (Zahlentheorie und Geometrie gut
erklärt und mit geschichtlichem Hintergrund)
Inhaltsverzeichnis
Kapitel 1. Eine kurze Geschichte der Geometrie
1. Thales und die Ursprünge der Geometrie
2. Eratosthenes und die Messung des Erdumfangs
3. Der Satz des Pythagoras und seine Verwandten
4. Pythagoräische Tripel
5. Die Entdeckung der Inkommensurabilität
6. Platonische Körper und die Polyederformel
7. Euklids Elemente und die Axiomatisierung der Mathematik
8. Was lässt sich mit Zirkel und Lineal konstruieren?
9. Die Algebraisierung der Geometrie durch Descartes und Fermat
10. Sangakus
4
4
7
9
11
15
18
22
25
28
31
Kapitel 2. Analytische Geometrie in euklidischen Räumen
1. Lineare Gleichungssysteme
2. Geraden und Ebenen
3. Das Skalarprodukt
4. Symmetrische Matrizen
5. Winkel und die trigonometrischen Funktionen
6. Orthogonalität
7. Hessesche Normalform
8. Vektorprodukt und Spatprodukt
33
33
35
38
43
46
50
54
60
Kapitel 3. Kegelschnitte
1. Quadratische Formen
2. Kreise und Ellipsen
3. Hyperbeln und Parabeln
4. Die orthogonale Gruppe
5. Drehungen in der Ebene und im Raum
6. Euklidische Bewegungen
* Wiederholung: Eigenwerte und Diagonalisierbarkeit *
7. Bewegungen in der Ebene
*** Weihnachtsvorlesung ***
8. Ähnlichkeitsabbildungen
9. Hauptachsentransformation
10. Allgemeine Kurven zweiter Ordnung
11. Klassifikation der Quadriken
12. Kegelschnitte
3
66
66
69
73
77
80
86
89
91
95
99
103
110
121
128
KAPITEL 1
Eine kurze Geschichte der Geometrie
Geometrie ist mit einer Tradition von über fünftausend Jahren eine der
ältesten mathematischen Disziplinen überhaupt. Wir geben im Folgenden einen
sehr kurzen Abriss ihrer Entwicklung mit Fokus auf die ebene Elementargeometrie und diejenigen Aspekte, welche insbesondere für die analytische Geometrie
relevant sind (und darüber hinaus auch viel für den Schulunterricht zu bieten
haben).
1. Thales und die Ursprünge der Geometrie
Bereits im alten Mesopotamien und Ägypten finden sich bemerkenswerte
geometrische Einsichten wie etwa die Formel für die Fläche eines Dreiecks sowie Näherungen für die Kreisfläche. Auf dem ägyptischen Papyrus Rhind findet
sich beispielsweise bereits ca. 1700 v.Chr. die Approximation 4( 89 )2 = 3, 16 . . .
an die Kreiszahl π. Über den Kenntnisstand und den Hintergrund ihrer mathematischen Untersuchungen ist mangels Überlieferungen oft leider nur wenig bekannt. So ist auch die Herleitung der genannten Näherung an π nicht klar; sie ist
aber recht nahe an der exzellenten Kettenbruchnäherung 3 71 (während die alten
Babylonier und Hebräer hatten noch die wesentlich schlechtere Approximation
3 benutzt haben). Es wird heutzutage davon ausgegangen, dass die Mathematik, die in diesen Kulturen betrieben wurde, sehr an praktischen Problemen
orientiert war und Rechenmethoden phänomenologisch entdeckt wurden. Das
Konzept des Beweises, welches die Mathematik zu einer exakten Wissenschaft
macht (der einzigen!), hat wohl erst mit den alten griechischen Denkern Einzug
in die Mathematik genommen!
Der Beginn der Geometrie ist nur bedingt auf einen Zeitpunkt bzw. auf eine Kultur oder gar eine Person datierbar. Als erster griechische Geometer mag
vielleicht Thales von Milet (∗ 622 - † 547) gelten. Viele seiner Erkenntnisse
erwarb er in Ägypten und Babylonien, jedoch entwickelte er zusätzlich eigene
bahnbrechende Ideen in Philosophie und Mathematik. Thales größter geometrischer Verdienst ist die Einführung von Winkeln und erste Untersuchungen
ebendieser. Ein Winkel entsteht demzufolge durch den Schnitt zweier Geraden;
ein rechter Winkel ist dabei ein solcher, wenn die beiden Geraden sich ’symmetrisch’ schneiden. Für ebensolche gibt Thales folgende Konstruktion an: Zu zwei
verschiedenen Punkten P, Q bilde man die Verbindungsstrecke P Q und schlage
jeweils einen Kreis von einem Radius größer als die Hälfte der Länge von P Q;
dann schneiden sich diese Kreise in zwei verschiedenen Punkten P ′ , Q′ und deren Verbindungsstrecke P ′ Q′ steht auf Grund der Symmetrie senkrecht auf P Q,
so dass ein rechter Winkel entstanden ist (bzw. mehrere rechte Winkel).
4
5
Wir geben einige weitere repräsentative Beispiele seines Schaffens:
Satz 1.1. In einem gleichschenkligen Dreieck sind die Basiswinkel gleich.
Beweis (nach Pappus). Wir führen implizit grundsätzliche Notation ein. Sei
ABC ein gleichschenkliges Dreieck mit Eckpunkten A, B und C; dabei gelte
für die Längen der Strecken AB von A nach B und BC von B nach C Gleichheit: |AB| = |BC|. Jetzt spiegeln wir das Dreieck so, dass AB auf BC zu liegen kommt und BC auf AB. Wegen der Symmetrie gleichschenkliger Dreiecke
nimmt das gespiegelte Dreieck genauso viel Fläche ein wie das Ausgangsdreieck
und insbesondere sind die Basiswinkel gleich. •
Übrigens: An Bildern lassen sich mathematische Schlussweisen manchmal
gut illustrieren, allerdings kann ein Bild keinen mathematischen Beweis ersetzen. Das logische Begründen eines jeden Schrittes ist notwendig! Ein Bild stellt
oftmals nur einen bestimmten Spezialfall eines viel allgemeineren Sachverhaltes
dar.
Abbildung 1. Links Thales’ Konstruktion eines rechten Winkels. Aus
der rechten Figur lassen sich viele von Thales’ Ergebnissen entwickeln, z.B.:
der Durchmesser halbiert den Kreis. Entdecken Sie weitere Gesetzmäßigkeiten?
Satz 1.2. Der Durchmesser halbiert den Kreis.
Beweis. Der Durchmesser zerlegt den Kreis in zwei Teile. Wir denken uns den
einen Teil auf den anderen gelegt. Sind die beiden nicht gleich, so liegt der
obere Teil entweder innerhalb oder außerhalb des unteren. Da alle Linien vom
Mittelpunkt zur Kreislinie einander gleich sind, folgt in beiden Fällen, dass die
kürzere Gerade gleich der längeren ist, der gewünschte Widerspruch. •
Dieser Beweis geht auf Proklos (im fünften Jahrhundert n.Chr.) zurück und ist
einer der ersten überlieferten indirekten Beweise überhaupt!
Satz 1.3 (Winkelsummensatz). Die Winkelsumme im Dreieck ist zwei Rechte (beträgt also π bzw. 180 Grad).
6
Bevor wir den Beweis in Angriff nehmen, erinnern wir: Schneidet eine Gerade
zwei andere Geraden g und h, so nennt man die auf den gleichen Seiten liegenden
Winkel Stufenwinkel; diese sind genau dann gleich, wenn die Geraden g und h
parallel sind. Die gegenüber sitzenden Winkel nennt man oft Wechselwinkel
und auch diese sind natürlich genau dann gleich, wenn die Geraden parallel
sind.
Beweis. Gegeben ein Dreieck ABC, ziehen wir eine Parallele zur Seite AB
durch den Punkt C. Weil die Wechselwinkel an parallelen Geraden gleich sind,
finden wir die Innenwinkel an den Ecken A und B zwischen der Parallelen und
den Schenkeln an C wieder. Es folgt also, dass die Summe der Innenwinkel gleich
zwei rechten Winkeln ist. •
Abbildung 2. Beispiels zum Winkelsummensatz (links) und dem Satz
des Thales (rechts); zur Übung wird empfohlen, rechts die Bezeichnungen
des Beweises einzufügen und den Beweis noch einmal am Bild nachzuvollziehen.
Und natürlich zeigte Thales seinen berühmten
Satz 1.4 (Satz des Thales). Der Peripheriewinkel im Halbkreis ist ein rechter.
Ein Dreieck in einem Halbkreis beinhaltet also stets einen rechten Winkel. Es
heißt, dass Thales aus Dank für diese Erkenntnis den Göttern einen Ochsen
opferte!
Beweis (nach Euklid). Sei ABC das Dreieck mit den Eckpunkten A, B, C über
einem Kreisdurchmesser AB, so ist zu zeigen, dass für den Winkel ∠(ACB) bei
C im Bogenmaß die Gleichung ∠(ACB) = π2 gilt. Sei M der Mittelpunkt des
Kreises, dann sind AM C und CM B gleichschenklige Dreiecke mit also gleichen
Winkeln ∠(M AC) = ∠(M CA) =: ϕ und ∠(M CB) = ∠(M BC) =: ψ. Mit dem
Winkelsummensatz folgt
π = ∠(CM A) + ∠(BM C) = (π − 2ϕ) + (π − 2ψ)
und daraus ergibt sich daraus ∠(ACB) = ϕ + ψ = π2 . •
Thales befasste sich auch mit Navigationsproblemen in der Schifffahrt. Die
Seefahrer des Altertums orientierten sich soweit möglich an der Küstenlinie∗
und Thales benutzte seine Winkel zur Bestimmung der Entfernung von Schiffen
von der Küste. Aber Thales betätigte sich auch als Astronom und sagte die
∗
was vielleicht Odysseus’ lange Irrfahrt erklärt?
7
Sonnenfinsternis am 22. Mai 585 v.Chr. (nach unserer Zeitrechnung) voraus. In
erster Linie wird Thales aber (seit Aristoteles) als Philosoph verstanden, fragte
er doch als Erster nach dem Urgund des Seins und Geschehens; seine Naturphilosophie basiert auf der Überlegung, dass alles in der einen oder anderen Weise
aus dem Wasser entstanden ist.
Aufgaben
Aufgabe 1. Beweisen Sie folgende Sätze von Thales:
• Die Scheitelwinkel zwischen zwei sich schneidenden Geraden sind gleich.
• Die Diagonalen eines Rechtecks sind gleich und halbieren einander.
Aufgabe 2. Welche geometrische Methode mag Thales für die Messung der Entfernung
eines Schiffes von der Küste benutzt haben? (Hinweis: Das Buch von Hulme.)
2. Eratosthenes und die Messung des Erdumfangs
Geometrie steht für die die Messung der Erde. Lokal sieht unsere Umwelt
(abgesehen von den Weinbergen) eben aus, tatsächlich ist unsere Erde aber
eine abgeflachte Kugel. Bei den alten Griechen war die Meinung, dass die Erde
eine Kugel sei, bereits seit den Arbeiten von Pythagoras und seinen Schülern
(s.u.), sowie Parmenides und Plato vertreten. Aristoteles gab als einen Grund
an, dass bei sich von der Küste entfernenden Schiffen zunächst der Rumpf und
erst später die Segel und der Mast verschwinden; auch sei der Erdschatten bei
einer Mondfinsternis kreisförmig. Diese Idee hat Eratosthenes von Syrene (∗ 276
- † 194 v.Chr.) noch wesentlich weiter gesponnen und in einem beeindruckenden
Experiment eine Näherung für die Größe der Erdkugel angegeben.
Eratosthenes beobachtete mittags am Tag der Sonnenwende (21. Juni) die
Reflexion der Sonne in einem tiefen Brunnen in Syrene (dem heutigen Assuan),
also steht die Sonne zu diesem Zeitpunkt nahezu senkrecht. Eratosthenes ließ an
diesem Tag des darauf folgenden Jahres zwei Winkel messen: einmal den Winkel
des Schattens, den die Sonne am Obelisken in Alexandria warf, sowie den rechten Winkel in besagtem Brunnen in Syrene. Ferner geht die Sonne in Syrene und
Alexandria fast zur selben Zeit auf (sie liegen auf nahezu demselben Längengrad). Die Distanz zwischen Syrene und Alexandria beträgt 5000 Stadien; ein
Stadion war eine im Mittelmeerraum zur damaligen Zeit übliche Längeneinheit,
die regional zwischen 150 und 180 Metern schwankte. Der Winkel des Schattens betrug 7◦ 12′ Grad, bzw. 2π
50 als Bogenmaß. Entsprechend ergibt sich ein
Erdumfang von
360◦
× 5 000 = 50 × 5 000 = 250 000
7◦ 12′
Stadien. Legen wir eine Länge von 160 Metern für ein Stadion zu Grunde, ergeben sich 40 000 Kilometer für den Erdumfang. Wie gelangte Eratosthenes zu
letzter Formel? Als Stufenwinkel paralleler Geraden sind die Winkel α und α′
in Abbildung 3 gleich, also α = α′ = 2π
50 , woraus für die Länge des Kreisbogens
von Alexandria nach Syrene eben die 25 000 Stadien resultieren. Tatsächlich
8
Abbildung 3. Die Sonne scheint auf Eratosthenes Experiment.
beträgt der Erdumfang über die Pole 40 007, 76 Kilometer. Für eine Korrektur
der Rechnung des Eratosthenes sei bemerkt, dass die wirkliche Entfernung von
Syrene zu Alexandria 729 Kilometer beträgt und der Winkel des Schattens in
Alexandria 7◦ 5′ ist. Ferner liegen Alexandria und Syrene nicht auf demselben
Längenkreis, sondern um drei Grad verschoben. Eine weitere Annahme in Eratosthenes Experiment ist, dass die Sonnenstrahlen parallel verlaufen, was wir
hier aber nicht weiter erörtern wollen...
Eratosthenes war nicht nur Erdvermesser, sondern auch Mathematiker,
Astronom und Direktor der legendären Bibliothek von Alexandria. In der Philosophie war er ein Anhänger Platos (dem wir später noch kurz begegnen werden); in der Mathematik ist das Sieb des Eratosthenes ein wichtiges Werkzeug
zur Auflistung der Primzahlen (vgl. das Skript Elementare Zahlentheorie). Die
Liste der prominenten mathematischen Landvermesser ließe sich weiter ausdehnen. Beispielsweise vermaß Gauß von 1821 bis 1825 das Königreich Hannover;
seine Triangulationsmethode bildet einen Meilenstein in der Kartographie.†
Aufgaben
Aufgabe 3. Bereits Thales nutzte Geometrie zur Vermessung der Welt. So benutzte er
den Schattenwurf einer Pyramide zu zwei verschiedenen Zeitpunkten, um deren Höhe
zu messen! Konsultieren Sie Burtons Buch (Seite 88) für eine Anleitung. Illustrieren
Sie die Methode mit einem praktischen Beispiel.
Aufgabe 4. Versuchen Sie Eratosthenes’ Berechnung unter Verwendung der angegebenen präzisierten Daten zu verbessern!
Aufgabe 5. Sie peilen abwechselnd über einen 20 cm entfernten Bleistift mit dem
rechten Auge das Haus und mit dem linken Auge den Baum in Abbildung 4 an. Wenn
†
und wurde auf der früheren 10 DM-Note verewigt; sehr lesenswert ist der Roman ’Die
Vermessung der Welt’ von Daniel Kehlmann.
9
Abbildung 4. Geometrie in action!
Ihre Augen acht Zentimeter auseinanderliegen und Sie vom Haus 50 Meter entfernt
sind, wie weit ist der Baum vom Haus entfernt? Testen Sie dieses Verfahren in ihrer
Umwelt!
3. Der Satz des Pythagoras und seine Verwandten
Wir gehen etwas zurück in der Zeit und widmen uns Pythagoras von Samos
(ca. ∗ 569 -† 475 v.Chr.) und seiner Schule, die man als einen Vorläufer heutiger Universitäten ansehen kann. Die Pythagoräer befreiten die Mathematik von
der Notwendigkeit praktischer Anwendungen; die Motivation ihrer Mathematik
war, dem Göttlichen näher zu kommen (um es mit den Worten von van der
Waerden zu sagen).‡ Aber für Pythagoras und seine Schüler galten auch einige
auf uns heute seltsam anmutende, selbst auferlegte Regeln wie etwa das Verbot,
Bohnen zu essen. Eine mögliche Erklärung für dieses sonderliche Gebot mag in
dem Selbstverständnis der griechischen Denker liegen: Gemäßigte Lebensweise
und Mathematik wurden als der Weg angesehen, die unsterbliche Seele zu reinigen. Ein anderer, für uns relevanter, wenngleich ebenso kontroverser Grundsatz
der Pythagoräer lautete: Alles ist Zahl, wobei das Zahlenuniversum der damaligen Zeit aus den positiven rationalen Zahlen bestand. Diese Behauptung sollte
zur ersten Grundlagenkrise der Mathematik führen (die wir im anschließenden
Paragraphen diskutieren werden).
Aber zuerst behandeln wir den vielleicht bekanntesten Satz der Mathematik
überhaupt:
Satz 1.5 (Satz des Pythagoras). In einem rechtwinkligen Dreieck ist die
Summe der Quadrate der Katheten gleich dem Quadrat der Hypothenuse.
‡
Das äußerst lesenswerte Buch Als die Götter lachen lernten von H. Heuser (Piper 1992)
gibt einen amüsanten Einblick in die Gedankenwelt der alten Griechen.
10
Abbildung 5. Links der Satz des Pythagoras ”a2 + b2 = c2 ”, rechts ein
Bild, welches zu einem Beweis desselben ausgebaut werden kann.
Beweis. Wir berechnen den Flächeninhalt des Quadrates mit Kantenlänge a +
b in Abbildung 5 auf zwei verschiedene Arten. Zunächst einmal ist besagte
Fläche gleich dem Quadrat der Seitenlänge; andererseits können wir besagtes
Quadrat auch in ein Quadrat der Kantenlänge c und vier kongruente, also
deckungsgleiche rechtwinklige Dreiecke mit Kathetenlängen a und b disjunkt
zerlegen. Also gilt
(a + b)2 = c2 + 4 · 12 ab.
Mit dem binomischen Satz folgt hieraus unmittelbar die Formel des Satzes. •
Es sei bemerkt, dass der binomische Satz geometrisch im Sinne von Abbildung
6 gedeutet werden kann. Es gibt eine Vielzahl von weiteren Beweisen des Sat-
Abbildung 6. Der binomische Lehrsatz (a + b)2 = a2 + 2ab + b2 .
zes des Pythagoras; z.B. von Leonardo da Vinci, dem indischen Mathematiker
Bhaskara II aus dem 12 Jhd. oder vom US-Präsidenten Garfield (siehe hierzu
die Bücher von Scheid & Schwarz bzw. Stilwell).
Der Satz des Pythagoras und die folgenden beiden Sätze bilden die so genannte Satzgruppe des Pythagoras:
11
Satz 1.6 (Kathetensatz). In einem rechtwinkligen Dreieck ist das Quadrat
über eine Kathete gleich dem Rechteck aus der Hypothenuse und dem der Kathete anliegenden Hypothenusenabschnitt.
Abbildung 7. Links eine Illustration des Kathetensatzes, rechts des
Höhensatzes: Bezeichnen q und p die Längen der Hypothenuse links bzw.
rechts der Höhe h, so gelten a2 = pc und h2 = qp.
Satz 1.7 (Höhensatz). In einem rechtwinkligen Dreieck ist das Quadrat über
der Höhe zur Hypothenuse gleich dem Rechteck aus den Hypothenusenabschnitten.
Jeder Satz der Satzgruppe des Pythagoras ist gleichwertig, d.h. jeder Satz
ist aus jedem anderen der Sätze herleitbar: Kathetensatz, Höhensatz und der
Satz des Pythagoras sind äquivalent (siehe entsprechende Übungsaufgabe).
Aufgaben
Aufgabe 6. Zeigen Sie folgende Implikationen: Kathetensatz ⇒ Satz des Pythagoras
⇒ Höhensatz ⇒ Kathetensatz.
Aufgabe 7. Parallel zur Grundlinie eines Dreieckes werden Linien gezeichnet, die die
beiden anderen Seiten des Dreiecks in jeweils zehn gleich große Teile zerlegen. Jeder
zweite sich so ergebende Streifen wird schwarz eingefärbt. Wie viel Prozent der Fläche
des Dreiecks können schwarz sein?
Aufgabe 8. Zeigen Sie folgende Verallgemeinerung des Satzes des Pythagoras: Wir
zeichnen über den Seiten eines rechtwinkligen Dreiecks gleichsinnig ähnliche Dreiecke
(mit also gleichen Winkeln in den entsprechenden Ecken) wie in Abbildung 8. Zeigen
Sie, dass dann die Flächensumme der Kathetendreiecke mit der Fläche des Hypothenusendreiecks übereinstimmt.
4. Pythagoräische Tripel
Der Satz des Pythagoras lässt sich auf nicht notwendig rechtwinklige Dreiecke verallgemeinern:
12
Abbildung 8. Der pythagoräische Lehrsatz gilt auch mit ähnlichen Dreiecken statt der üblichen Quadrate.
Satz 1.8 (Cosinussatz). Gegeben ein Dreieck ABC mit Seitenlängen a, b und
c (gegenüber den Ecken A, B und C wie in Abbildung 9). Dann gilt
a2 + b2 = c2 + 2ab cos γ,
wobei γ = ∠(ACB) der Winkel bei C ist.
Abbildung 9. Nicht jedes Dreieck ist rechtwinklig!
Wir werden diesen Satz erst im nächsten Kapitel beweisen.§ Als unmittelbare
Konsequenz ergibt sich
§
Der/Die ungeduldige LeserIn sei auf das Skript von Johannson verwiesen.
13
Korollar 1.9 (Umkehrung des pythagoräischen Satzes). Gegeben ein
Dreieck mit Seitenlängen a, b und c. Gilt a2 + b2 = c2 , so ist das Dreieck rechtwinklig.
Der Satz des Pythagoras und seine Verallgemeinerung haben enorme Konsequenzen. Von diesen wollen wir zuerst mit den pythagoräischen Tripeln eine
arithmetische Anwendung mit durchaus praktischen Nutzen betrachten: Die pythagoräischen Tripel erlauben die Konstruktion von rechten Winkeln, die in der
Baukunst so wichtig sind und welche bereits den alten Babyloniern vor ca. 3500
Jahren bekannt waren. Auch die Aussage des Satzes des Pythagoras war wohl zu
diesen Zeiten bereits bekannt, wenngleich es in der babylonischen Mathematik
wohl noch keine Beweise gab. Hier einige Beispiele:
32 + 42 = 52 ,
52 + 122 = 132 ,
652 + 722 = 972 ,
...
Wegen des Cosinussatzes 1.9 führen diese Identitäten tatsächlich auf rechtwinklige Dreiecke mit ganzzahligen Seitenlängen; gerade wegen der Ganzzahligkeit
der seiten, sind diese Dreiecke damit leicht zu konstruieren!
Aber wie gelangt man zu Identitäten wie die oben erwähnten? Gegeben sei
die Gleichung
X 2 + Y 2 = Z 2;
Lösungen (x, y, z) in natürlichen Zahlen heißen pythagoräische Tripel zu Ehren von Pythagoras. Mit einer solchen Lösung (x, y, z) ist offensichtlich auch
jedes Tripel (ax, ay, az) mit a ∈ N eine Lösung, wenn auch keine sonderlich
interessante. Deshalb heißen Tripel (x, y, z), für die ggT(x, y, z) = 1 gilt, primitiv; die Teilerfremdheitsbedingung ist dabei äquivalent zur Forderung, dass die
Zahlen x, y, z paarweise teilerfremd sind. Beispiele primitiver pythagoräischer
Tripel sind gegeben durch
32 + 42 = 52 ,
52 + 122 = 132 ,
82 + 152 = 172 ,
während die folgenden Tripel offensichtlich nicht primitiv sind:
15222 + 28522 = 32322
und
31522 + 10822 = 33322 .
Pythagoras fand eine unendliche Familie von primitiven pythagoräischen Tripeln basierend auf der Identität
(2n + 1)2 + (2n2 + 2n)2 = (2n2 + 2n + 1)2 .
Euklid gelang die komplette Charakterisierung primitiver pythagoräischer Tripel:
Satz 1.10. Es seien a und b teilerfremde natürliche Zahlen unterschiedlicher
Parität (d.h. entweder ist a gerade und b ungerade oder umgekehrt) und es gelte
a > b. Dann ist (x, y, z), gegeben durch
x = a 2 − b2 ,
y = 2ab,
z = a2 + b2 ,
ein primitives pythagoräisches Tripel. Ferner ist jedes primitives pythagoräische
Tripel von dieser Form.
14
Abbildung 10. Links: Der Einheitskreis geschnitten mit der Sekante
durch die Punkte (−1, 0) und ( 53 , − 45 ) (mit Steigung m = − 21 ); dem zweiten Schnittpunkt entspricht das pythagoräische Tripel (3, 4, 5). Man beachte,
dass die Zuordnung zwischen rationalen Punkten und pythagoräischen Tripeln nicht bijektiv ist (man denke an Vorzeichensymmetrien).
Wir geben hiervon einen geometrischen
Beweis (nach Bachet). Mittels U = cos t und V = sin t für 0 ≤ t < 2π lässt
sich der Einheitskreis in der euklidischen Ebene parametrisieren (aus der Schule
bekannt?) und der Satz des Pythagoras liefert damit via cos2 + sin2 = 1 die
algebraische Gleichung
C : U 2 + V 2 = 1.
Wir schneiden nun diesen Einheitskreis mit der Geradenschar
Lm : V = m(U + 1)
für m ∈ Q.
Jede Gerade Lm schneidet den Kreis in dem Punkt (−1, 0) sowie in einem
weiteren Schnittpunkt, dessen Koordinaten sich vermöge Einsetzen über
1 = U 2 + (m(U + 1))2
⇐⇒
(1 + m2 )U 2 + 2m2 U + m2 − 1 = 0
leicht berechnen als
1 − m2
2m .
1 + m 1 + m2
Tatsächlich ist also dieser zweite Schnittpunkt genau dann rational, wenn die
Steigung m der Geraden Lm rational ist. Das ist für rationale m sofort einsichtig;
√
für irrationale m der Form r mit einer rationalen Zahl r, die kein Quadrat ist,
schaue man auf die v-Koordinate. Auf diese Weise erhalten wir nicht nur viele
rationale Punkte auf dem Kreis, sondern sogar sämtliche: Die Sekante durch
(−1, 0) und (u, v) ∈ C ∩ Q2 \ {(−1, 0)} besitzt nämlich eine rationale Steigung
(u, v) =
,
2
15
b
a
für ganzzahlige a, b ergibt sich so
a 2 − b2
2ab ,
∈ C.
(u, v) =
a2 + b2 a2 + b2
Den Punkt (−1, 0) erhalten wir vermöge m → ∞ (dem Fall der Tangente an
(−1, 0)). Weil nun u2 + v 2 = 1 mit rationalen u = xz und v = yz auf x2 + y 2 = z 2
mit ganzzahligen x, y und z führt, und auch jedes solche einem rationalen Punkt
entspricht, ergibt sich nun der euklidische Satz 1.10, allerdings zunächst ohne
die Unterscheidung primitiver pythagoräischer Tripel (welche aber leicht mit
elementaren Teilbarkeitsargumenten hinzugefügt werden kann). •
und mittels m =
Die pythagoräischen Tripel parametrisieren also die rationalen Punkte auf dem
Einheitskreis! (was wir bereits in der Elementaren Zahlentheorie gesehen hatten.)
Aufgaben
Aufgabe 9. Heron von Alexandria lebte im ersten Jahrhundert nach Christus und
bewies die so genannte Heronsche Formel: Ein Dreieck mit Seitenlängen a, b, c besitzt
den Flächeninhalt
p
s(s − a)(s − b)(s − c),
wobei s := 21 (a + b + c).
Aufgabe 10. Es seien a1 = 3, c1 = 5 und
an+1 = 3an + 2cn + 1
und
cn+1 = 4an + 3cn + 2
für n ∈ N. Zeigen Sie, dass dann (an , an + 1, cn ) ein pythagoräisches Tripel ist.
5. Die Entdeckung der Inkommensurabilität
Nun kommen wir zur angekündigten Grundlagenkrise der griechischen Mathematik. Nach dem√pythagoräischen Satz ist die Länge einer Diagonale im Einheitsquadrat gleich 2, welches bekanntlich keine rationale Zahl ist und damit
nicht in das Weltbild der Pythagorärer passte. Diese Beobachtung geht wohl auf
den Pythagoras-Schüler Hippasos von Metapont zurück; die Legende berichtet,
dass Hippasos für den Verrat dieses Geheimnisses vom pythagoräischen Geheimbundes ausgestoßen und womöglich sogar ertränkt wurde. Die Einführung der
reellen Irrationalzahlen blieb den griechischen Denkern verwehrt; sie behoben
ihr mathematisches Dilemma auf einem anderen Wege. Eudoxos (ca. ∗ 408 - †
347 v.Chr.) entwickelte seine Proportionenlehre, welche auf geniale Weise die
Schwierigkeit keine irrationalen Zahlen zu kennen, aus dem Wege räumt.
Zwei Strecken heißen kommensurabel, falls es eine Strecke gibt, so dass
beide Strecken jeweils ein ganzzahliges Vielfaches dieser sind (also deren Proportion rational ist); andernfalls sind die Strecken inkommensurabel. Kommensurabilität lässt sich mit Hilfe der geometrischen Wechselwegnahme –
das ist eine Form des euklidischen Algorithmus bzw. sukzessiver Division mit
Rest (vgl. Elementare Zahlentheorie) –, entscheiden.
Zur Illustration betrachten wir ein Quadrat. Bezeichnen wir in Abbildung
12 die Ecken des großen Quadrates mit A, B, C und D und ziehen wir um A
16
Abbildung 11. Eine geometrische Variante des euklidischen Algorithmus: 33 = 3 · 10 + 3, 10 = 3 · 3 + 1
Abbildung 12. Erste Schritte zur Inkommensurabilität von Diagonale
und Basis des Quadrates. Beschriften der Eck- und Schniottpunkte hilft beim
Verständnis!
einen Kreis durch B, so schneidet dieser die Diagonale von A nach C in einem
Punkt E. Dabei gilt für die jeweiligen Längen
|AC| = |AB| + |EC|.
Wir bilden ein Quadrat zur Strecke EC und definieren F als den Eckpunkt auf
der Geraden BC (verschieden von C) und nennen G den weiteren Eckpunkt.
Dann ist das Dreieck BF E gleichschenklig und also |BF | = |F E|. Damit folgt
|AB| = |BC| = |EC| + |F C|.
Diese beiden Gleichungen bilden den Beginn des euklidischen Algorithmus für
die Längen |AC| und |AB|, wobei vom großen Quadrat ABCD zum kleineren
Quadrat EF GC übergegangen wurde. Setzen wir diese Konstruktion nun fort
(zunächst mit dem Schlagen eines Kreises um F vom Radius |EF |), so ergeben
sich sukzessive weitere, immer kleinere Quadrate; der euklidische Algorithmus
terminiert nicht, d.h. die Längen |AC| und |AB| sind inkommensurabel. Wir
haben also gezeigt:
17
Satz 1.11. Diagonale und Basis eines Quadrates sind inkommensurabel.
Wir können diese Inkommensurabilität auch quantifizieren: Nach dem Satz des
Pythagoras beträgt das Verhältnis von Diagonale und Seite eines Quadrates
√
|AC|/|AB| = 2
√
und obiger Satz beweist die Irrationalität von 2 geometrisch!¶ Der nichtdeterminierende euklidische Algorithmus liefert übrigens einen unendlichen Kettenbruch:
√
2 = |AC|/|AB| = 1 + |EC|/|AB|
1
1
=1+
= 1 + |AB|/|EC|
1 + |F C|/|EC|
...
=
1+
1
2+
1
2+ 1
;
..
.
es ergibt sich der unendliche Kettenbruch mit lauter Zweien als Teilnennern.
Abbildung 13. Die Seitenlängen zweier Quadrate, deren Flächen sich
wie 2 : 1 verhalten sind nicht kommensurabel.
Aufgaben
Aufgabe 11. Zeigen Sie an einem regelmäßigen Fünfeck (Pentagramm), dass das
Verhältnis von Diagonale und Seite inkommensurabel bzw. irrational ist.
Aufgabe 12. Beweisen Sie,
• dass die Seitenlängen zweier Quadrate, deren Flächen sich wie 2 : 1 verhalten
nicht kommensurabel sind (leicht);
• dass die Flächen zweier Kreise mit rationalen Radien kommensurabel sind
(schwierig – und natürlich ohne die bekannte Formel für die Kreisfläche zu
benutzen).
¶
für einen algebraischen Beweis sei an die Elementare Zahlentheorie erinnert!
18
6. Platonische Körper und die Polyederformel
Den Pythagoräern folgte die Schule des großen Philosophen Sokrates. Einer
dessen Schüler war Plato (oder Platon) (∗ 427 - † 347), welcher wiederum auch
für die Mathematik bedeutsam war. Er gründete eine Akademie über deren
Eingang stand geschrieben:
Kein der Geometrie Unkundiger trete ein!
Eines der berühmtesten Mitglieder der Akademie war Aristoteles, Philosoph und
u.a. Erzieher des jungen Alexander, der sich später den Beinamen der Große
gab. Aristoteles’ Ideen beeinflussten die Wissensschaft bis in die Renaissance;
erst zu Zeiten von Kopernikus und Galilei wurden die aristotelischen Schriften
teilweise widerlegt. Ein weiterer Schüler Platos war Theaitetos, dem bedeutende
Einsichten in der räumlichen Geometrie gelangen.
Abbildung 14. Die fünf platonischen Körper von links nach rechts: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder.
Unter einem (dreidimensionalen) Polyeder verstehen wir einen von ausschließlich geraden Flächen (Ebenen) begrenztem Körper. Ein Polyeder heißt
regulär bzw. platonischer Körper, falls alle Seitenflächen kongruente reguläre Vielecke sind und an jeder Ecke gleich viele von ihnen zusammen treffen.
Einige Beispiele solcher sind uns wohlbekannt.
Satz 1.12. Es gibt genau fünf platonische Körper, nämlich Tetraeder, Würfel,
Oktaeder, Dodekaeder und Ikosaeder.∗
Die Entdeckung von Dodekaeder und Ikosaeder sind bemerkenswert und werden
Theaitetos (ca. ∗ 417 - † 369 v.Chr.) zugesprochen; ihre Konstruktion in Buch
XIII bildet einen der Höhepunkte in Euklids Elementen (s.u.). Den Beweis der
Eindeutigkeitsaussage erbringen wir hier auf einem anderen Wege als Euklid,
nämlich mit kombinatorischen Methoden einer Idee Eulers aus dem 18. Jahrhundert folgend. Dieser untersuchte, welche kombinatorischen Gesetzmäßigkeiten Polyeder im dreidimensionalen Raum besitzen. Kann es beispielsweise einen
Polyeder mit 10 Ecken, 25 Kanten und 18 Flächen geben? Nein! Denn:
Satz 1.13 (Eulersche Polyederformel). Gegeben sei ein Polyeder mit genau
e Ecken, f Flächen und k Kanten. Dann gilt
e + f = k + 2.
∗
Eine Bastelanleitung
bayreuth.de//mmlu/gzu
findet
man
im
Internet,
z.B.
auf
http://did.mat.uni-
19
Euler formulierte seine Polyederformel erstmals im Jahre 1750 in einem Brief
an Goldbach. Tatsächlich war diese Formel im Wesentlichen bereits Descartes bekannt. Leibniz sichtete nämlich den Nachlass von Descartes und notierte
eine verwandte Formel; während Descartes’ Papiere verschollen sind, wurden
Leibnizs Aufzeichnungen im 19. Jahrhunder in der Königlich Hannoverschen
Bibliothek wiedergefunden.
Beweis (nach Thurston†). Wir stellen das gegebene Polyeder so in eine leere
Badewanne, dass keine zwei Ecken auf gleicher Höhe sind, womit auch keine
waagerechten Kanten auftreten. Nun lassen wir Wasser in die Wanne fließen.
Immer, wenn der Wasserspiegel eine Ecke übersteigt, werden neue Kanten und
Flächen nass; handelt es sich dabei nicht um die unterste oder oberste Ecke,
werden dabei stets eine Kante mehr nass als Flächen. Bei der untersten Ecke
hingegen sind es gleich viele Kanten wie Flächen; bei der obersten wird gar nichts
Neues nass. Damit ergibt sich nach vollständigem Wassereinlass die Anzahl der
Kanten als Anzahl der Flächen plus einer zusätzlichen Kante pro Ecke, wobei
die oberste und unterste Ecke auszuschließen ist. Also: k = f + e − 2, was zu
zeigen war. •
Nun gelingt der
Beweis von Satz 1.12. Unser Polyeder besitze f Flächen, e Ecken und k
Kanten. Wir erinnern an die Definition eines regulären Polyeders: Jede Fläche ist
ein reguläres n-Eck und von jeder Ecke gehen genau m Kanten aus; jede Kante
berandet zwei Flächen und verbindet zwei Ecken. Also bestehen die Gleichungen
2k = nf und 2k = me. Mit der Eulerschen Polyederformel ergibt sich
2
2
−1+
.
2=f −k+e=k
n
m
1
Also muss die Ungleichung n1 + m
> 12 bestehen. Damit kommen nur 3 ≤ m, n ≤
5 in Frage. Wir notieren für die fünf platonischen Körper:
Tetraeder
Würfel
Oktaeder
Dodekaeder
Ikosaeder
f
4
6
8
12
20
k e m n
6 4 3 3
12 8 3 4
12 6 4 3
30 20 3 5
30 12 5 3
Es ist nicht schwierig zu sehen, dass für andere Werte von m, n besagte Ungleichung nicht besteht, womit die Existenz von genau den oben angeführten fünf
platonischen Körpern erbracht ist. •
Der Beweis ist sehr interessant, benutzt er doch eine kombinatorische Beschreibung von Gestalt und Form. Geometrische Objekte werden auf gewisse mathematische Größen reduziert; die Schlussweise basiert letztendlich auf einer
†
siehe hierzu auch C. Blatter, G.M. Ziegler, Eulers Polederformel, und die Arithmetisierung der Gestalt, www.math.eth.ch/∼blatter/Mathesis.pdf
20
Ungleichung für eben diese Kenngrößen. Diese Idee, sich auf die wesentlichen
Daten eines geometrischen Objektes zu konzentrieren, wurde von Euler auch
bei seiner Behandlung des Königsberger Brückenproblems gewinnbringend eingesetzt, womit er u.a. die Topologie begründete.
Abbildung 15. Das Königsberger Brückenproblem: Existiert ein Rundweg durch Königsberg (heute Kaliningrad), welcher jede der sieben Brücken
über den Fluss Pregel genau einmal überquert?
Übrigens: Der Architekt und Designer Buckminster Fuller konstruierte
geodätische Kuppeln wie etwa den buckyball C60 , ein abgestumpftes Ikosaeder
mit einer Oberfläche bestehend aus zwölf regulären Fünf- und zwanzig regulären
Sechsecken.‡ Den Hintergrund bilden die so genannten Fullerene, also sphärische Moleküle von Kohlenstoffen, welche zuerst von Osawa 1970 vorausgesagt
wurden.
Zur weiteren Flächen- und Volumenberechnung von regelmäßigen Körpern
haben wir in der Analysis mit dem Integralkalkül ein wichtiges Konzept kennen gelernt. Oft genug hilft aber auch elementare Geometrie: Ein regelmäßiges
Sechseck mit Seitenlänge a lässt sich in sechs gleichseitige Dreiecke zerlegen. Da
für deren Höhe h jeweils
a 2 3
= a2
h2 = a2 −
2
4
√
gilt, ergibt sich für den Flächeninhalt des regelmäßigen Sechsecks 3 2 3 a2 . Selbiges für das regelmäßige Fünfeck zu berechnen ist bereits schwieriger (hier
gibt es ein Wiedersehen mit dem aus der elementaren Zahlentheorie bekannten
goldenen Schnitt).
Der Satz von Pick aus dem Jahre 1899 erlaubt eine einfache Berechnung
des Flächeninhaltes von Polygonen durch Abzählen von Gitterpunkten. Dazu
‡
welchem gewisse Fußbälle nachempfunden sind!
21
sei P ein Polygon, welches nur Eckpunkte mit ganzzahligen Koordinaten in der
Ebene besitze. Der Rand des Polygons sei so beschaffen, dass das Innere eine
zusammenhängende Menge sei. Es bezeichne i(P ) die Anzahl der Gitterpunkte
(x, y) ∈ Z2 im Inneren von P und r(P ) die Anzahl der Gitterpunkte auf dem
Rand von P . Dann gilt der erstaunliche Satz
Satz 1.14 (Satz von Pick). Ein Polygon, welches den obigen Voraussetzungen
genügt, besitzt Flächeninhalt
Fläche(P ) = i(P ) + 12 r(P ) − 1.
Beweisskizze. Zunächst verifiziert man leicht die Formel des Satzes für achsenparallele Rechtecke. Ebenso gilt die Aussage für rechtwinklige Dreiecke mit
achsenparallelen Katheten. Als Nächstes mache man sich klar, dass im Falle von
zwei Polygonen P1 und P2 , die beiden den Voraussetzungen des Satzes genügen,
und welche eine Strecke als gemeinsame Schnittmenge besitzen, die Formel auch
für die Vereinigung P = P1 ∪P2 gilt. Nun ergibt sich so, dass der Satz für beliebige Dreiecke richtig ist, solange die Voraussetzungen erfüllt sind. Schließlich folgt
die allgemeine Aussage per Induktion nach der Anzahl der Ecken von P ; beim
Induktionsschritt zerlegt man P dabei in zwei geeignete Polygone mit weniger
Ecken. •
Abschließend wollen wir noch die Arbeit des womöglich innovativsten griechischen Mathematikers betrachten. Archimedes (ca. ∗ 287 - † 212 v.Chr.) ist
bekannt für sein vielfältiges Wirken in Physik, Ingenieurswesen und natürlich
Mathematik. Unvergessen ist sein Eureka! im Bad, welches der Physik das archimedische Prinzip bescherte und ebenso legendär sein bonmot Störe meine
Kreise nicht!, adressiert an einen römischen Soldaten, der ihn der Überlieferung
zufolge hierfür ins Jenseits beförderte. Wir wollen hier Archimedes’ Arbeit zur
Kreisfläche beleuchten.
Archimedes’ Idee zur Kreismessung basiert auf einer Zerlegung des Kreises
in Sektoren gleichen Winkels und Approximation derselben durch entsprechende Dreiecke; damit wird der Kreis also durch ein reguläres Vieleck angenähert!
So sind beispielsweise beim regulären Achteck die Winkel der jeweiligen acht
Dreiecke π4 und (zweimal) 3π
8 . Legen wir einen Kreis vom Radius 1 zu Grunde.
√
2
ergibt sich so
2 und dem Cosinussatz√
2
4 . Damit erhalten wir 2 2 = 2, 82 . . .
Unter Verwendung von sin π4 = cos π4 =√
die Fläche eines solchen Dreiecks als
als Approximation an die Einheitskreisfläche. Insofern wird also die Kreisfläche
durch die Fläche des einbeschriebenen Polygons approximiert und mit wachsender Eckenanzahl des Polygons ergibt sich eine beliebige Genauigkeit. Ebenso
kann man natürlich auch mit einem umschreibenden Polygon arbeiten, welches
den Kreis berührt. Auf diese Art und Weise erzielt Archimedes mit regulären
96-Ecken die Näherungen
10
= 3, 14084 . . . <
3 71
π = 3, 14159 . . .
< 3 17 = 3, 14285 . . .
22
Abbildung 16. Ein einem Kreis einbeschriebenes regelmäßiges Achteck.
Erst Jahrhunderte später wurden bessere rationale Näherungen an die Kreiszahl
π gefunden (mit Hilfe von Kettenbrüchen; vgl. Elementare Zahlentheorie). Archimedes’ Exhaustionsmethode kann als ein Vorläufer der Integrationsrechnung
angesehen werden.
Aufgaben
Aufgabe 13. Mit welchen regelmäßigen n-Ecken kann eine Ebene parkettiert werden?
Aufgabe 14. Untersuchen Sie, ob beim Fußball (gebildet aus regelmäßigen Fünf- und
Sechsecken) die Eulersche Polyederformel Bestand hat!
Aufgabe 15. In wie viele Pyramiden zerlegen die Diagonalen zwischen gegenüber liegenden Ecken eines Würfels denselben?
Aufgabe 16. Ein so genanntes Möbiusband besteht aus einer Fläche und einer Kante, aber keiner Ecke, ist also kein Polyeder. Können Sie ein solches Möbiusband basteln?
Forschen Sie ferner in der Bibliothek oder im Internet nach der Kleinschen Flasche...
Aufgabe 17. Auf Archimedes’ Grabstein sollen der Überlieferung nach ineinander
geschachtelt ein Zylinder, eine Kugel und ein Kegel von jeweils gleicher Höhe und gleicher Kreisgrundfläche eingemeisselt gewesen sein. In welchem Verhältnis stehen diese
Körper?
7. Euklids Elemente und die Axiomatisierung der Mathematik
Während über das Leben des Euklid von Alexandria (ca. ∗ 325 - † 265
v.Chr.) nur wenig bekannt ist, bilden seine aus 13 Bänden bestehenden Elemente das meistverbreitetste und einflussreichste Mathematiklehrbuch aller Zeiten.
Euklid systematisierte mit seinen Elementen das mathematische Wissen seiner
23
Zeit (soweit wir es heute beurteilen können). Die Elemente bilden damit das
Fundament für die moderne Mathematik. Vieles von dem was wir bislang behandelt haben, ist in den Elementen zu finden (z.B. ist Satz 32, Buch I, der
Satz über die Winkelsumme): Euklid behandelt
• Planimetrie: Geometrie der Ebene und der Figuren in der Ebene
(enthält beispielsweise die Satzgruppe des Pythagoras).
• Stereometrie: Geometrie im Raum sowie krperlicher Figuren; hier werden die platonischen Körper mit Zirkel und Lineal konstruiert (ein
Thema, dem wir uns anschließend noch widmen werden).
• Arithmetik: Dies ist elementare Zahlentheorie (inkl. dem euklidischen
Algorithmus und dem Beweis der Existenz unendlich vieler Primzahlen).
• Proportionenlehre: Hier verbirgt sich Eudoxos’ Theorie der kommensurable und inkommensurablen Größen.
Das Revolutionäre seines Werkes jedoch ist die strenge axiomatische Begründung der Geometrie. Neben Definitionen kommen zu Anfang so genannte
Axiome, also Aussagen, die nicht bewiesen werden, aus denen heraus aber alles
weitere folgt, nämlich Definitionen sowie Sätze und deren Beweise; in jedem
Beweis darf dabei (außer den Axiomen) nur verwendet werden, was zuvor bewiesen wurde. Dieser deduktive Aufbau der Mathematik ist bis in die heutige
Zeit richtungsweisend! Die Elemente waren nicht umsonst für lange Zeit der
Prototyp für ein mathematisches Lehrbuch schlechthin.
Beispielsweise beginnt der erste Band der Elemente mit folgenden Definitionen:
(i)
(ii)
(iii)
(iv)
(v)
(vi)
(vii)
(viii)
(ix)
(x)
(xi)
(xii)
Ein Punkt ist, was keine Teile hat.
Eine Linie breitenlose Länge.
Die Ende einer Linie sind Punkte.
Eine gerade Linie (Strecke) ist eine solche, die zu den Punkten auf
ihr gleichmäßig liegt.
Eine Fläche ist, was nur Länge und Breite hat.
Die Enden einer Fläche sind Linien.
Eine ebene Fläche ist eine solche, die zu den geraden Linien
gleichmäßig liegt.
Ein ebener Winkel ist die Neigung zweier Linien in einer Ebene gegeneinander, die einander treffen, ohne einander gerade fortzusetzen.
Wenn die den Winkel umfassenden Linien gerade sind, heißt der Winkel geradlinig.
Wenn eine gerade Linie, auf eine gerade Linie gestellt, einander gleiche
Nebenwinkel bildet, dann ist jeder der beiden gleichen Winkel ein
rechter; und die stehende gerade Linie heißt senkrecht zu (Lot auf)
der, auf der sie steht.
Stumpf ist ein Winkel, wenn er größer als ein rechter ist.
Spitz, wenn kleiner als ein rechter.
24
Es folgen noch weitere Definitionen, die jedoch für das Weitere unerheblich sind.
Es schließen sich Postulate an. In diesen wird gefordert
(i) dass man von jedem Punkt nach jedem Punkt die Strecke ziehen kann,
(ii) dass man eine begrenzte gerade Linie zusammenhängend gerade
verlängern kann,
(iii) dass man mit jedem Mittelpunkt und Abstand den Kreis zeichnen
kann,
(iv) dass alle rechten Winkel gleich sind, und
(v) das Parallelenaxiom, dass nämlich, wenn eine gerade Linie beim
Schnitt mit zwei geraden Linien bewirkt, dass innen auf derselben
Seite entstehende Winkel zusammen kleiner als zwei Rechte werden,
dann die zwei geraden Linien bei Verlängerung ins Unendliche sich
treffen auf der Seite, auf der die Winkel liegen, die zusammen kleiner
als zwei Rechte sind.
Hier sei insbesondere auf das Parallelenaxiom hingewiesen; seine Formulierung
ist wesentlich länger als die der anderen. Sämtliche Versuche, dieses aus den
anderen herzuleiten, scheiterten, so dass schließlich über Modelle nachgedacht
wurden, wie eine Geometrie ohne dieses aussehen könnte.§
Und es folgen weitere Axiome:
(i) Was demselben gleich ist, ist auch einander gleich.
(ii) Wenn Gleichem Gleiches hinzugefügt wird, sind die Ganzen gleich.
(iii) Wenn von Gleichem Gleiches weggenommen wird, sind die Reste
gleich.
Auch hier folgen noch einige weitere Axiome, die wir aber nicht angeben wollen.
Lange Zeit blieb die Geometrie trotz der Elemente stark der Anschaulichkeit verhaftet. Erst mit Hilberts Grundlagen der Geometrie von 1899 wurde eine vollständige moderne axiomatische Begründung der euklidischen Geometrie
gegeben. Er entwarf hierzu ein vollständiges Axiomensystem und entwicklete
hieraus das Gesamtgebäude der Geometrie (soweit damals bekannt). Die Begriffe, die Hilbert verwendet, heißen zwar noch Punkt, Gerade, Ebene, besitzen
jedoch im Gegensatz zu Euklids Elementen keinerlei Bezug zur Anschauung;
hatte es bei letzterem doch z.B. ’Ein Punkt ist, was keine Teile hat’ geheißen.
Hilberts Begriffe Punkt, Gerade, Ebene könnten also durch beliebige Ausdrücke
wie Tisch, Stuhl, Bierseidel ersetzt werden. Hilbert war einer der bedeutendsten Vertreter des so genannten Formalismus, wonach Mathematik aus einem
gegebenen Axiomen- und Regelwerk durch striktes logisches Schlussfolgern entsteht. Dem gegenüber behauptet der Realismus bzw. Platonismus mit prominenten Vertretern wie Plato, Erdös und Gödel, dass Mathematik nicht erfunden
sondern vielmehr entdeckt wird.
§
womit wir uns in der Vorlesung Vertiefung Mathematik im WS 2012/13 noch beschäftigen
wollen
25
Aufgaben
Aufgabe 18. Euklids Proposition 1 in Buch I fragt nach der Konstruktion eines gleichseitigen Dreiecks über einer gegebenen Strecke mit ausschließlich Zirkel und Lineal.
Realisieren Sie dies!
Aufgabe 19. Bereits im Schulunterricht lernt man: Sind von einem Dreieck bekannt
die Längen bzw. Größen
(sss)
(sws)
(wsw)
(Ssw)
dreier Seiten,
zweier Seiten und des eingeschlossenen Winkels,
einer Seite und der beiden anliegenden Winkel,
zweier Seiten und des der größeren Seite gegenüberliegenden Winkels,
so kann dieses Dreieck eindeutig konstruiert werden (vgl. das Schulbuch von Kratz &
Wörle bzw. die Monographie von Scheid & Schwarz, §I.3). Führen Sie diese Konstruktionen explizit durch!
8. Was lässt sich mit Zirkel und Lineal konstruieren?
Bereits Pythagoras und seine Schule konstruierte das reguläre Fünfeck. Euklid gibt in seinen Elementen ebenfalls diese Konstruktion an und zeigt, dass
sich die Seiten im Pentagramm im Verhältnis des goldenen Schnittes teilen (siehe Aufgabe 10 und auch das Skript von Johannson). In diesem Kontext sei
folgende allgemeinere Aufgabe gestellt:
•
Gegeben eine ganze Zahl n ≥ 3, konstruiere ein reguläres n-Eck.
Für n = 3 und n = 4 ist dies trivial; ebenso für Produkte dieser n mit beliebigen Zweierpotenzen (siehe Aufgabe). In seinem Buch Underweysung in der
messung mit dem zirckel und richtscheyt in Linien ebnen und gantzen corporen
gibt der bekannte fränkische Künstler Albrecht Dürer (∗ 1471 - † 1528) mit
expliziten Konstruktionen des regulären Fünfecks und approximativen Methoden für beliebige reguläre n-Ecke seinen Einstand als Mathematiker. Weitere
Themen, die er behandelt sind die Zentralperspektive und Kegelschnitte (zwei
Gebiete, die wir später noch untersuchen werden). Als Achtzehnjähriger gelang
Gauß schließlich die Charakterisierung all der natürlichen Zahlen n, zu denen
ein reguläres n-Eck mit Zirkel und Lineal konstruiert werden kann: nämlich
genau für die n, die sich darstellen lassen als Produkt einer Zweierpotenz und
k
verschiedener so genannter Fermatscher Primzahlen p = 22 + 1, wobei k eine
nicht negative ganze Zahl bezeichne. Bislang sind mit
3 = 21 + 1,
5 = 22 + 1, 17 = 24 + 1, 65 537 = 216 + 1
nur insgesamt vier solche Fermatsche Primzahlen bekannt und es wird vermutet,
dass es keine weiteren gibt.¶
Bevor wir weitere Konstruktionsprobleme ansprechen, präzisieren wir
zunächst, welche Operationen überhaupt zur Konstruktion herangezogen werden dürfen:
¶
Ein reguläres Siebzehneck ziert die Gauß-Statue am Gauß-Berg in Braunschweig.
26
Abbildung 17. Ein regelmäßiges Fünfeck aus Dürers underweysung; für
die Konstruktion konsultiere man etwa Stilwells Buch.
• Zwei verschiedene Punkte P, Q lassen sich (mit dem Lineal) durch eine
eindeutig bestimmte Gerade P Q verbinden.
• Der Abstand |P Q| von zwei verschiedenen Punkten P, Q lässt sich (mit
dem Zirkel abgreifen und) übertragen
• Zu jeder Geraden g und jedem Punkt P (auf oder außerhalb von g) lässt
sich eine zu g orthogonale (senkrechte) Gerade h durch P konstruieren. Durch
Wiederholung entsteht das Mittellot oder die Mittelsenkrechte einer Strecke.
• Gegeben ein Winkel, so lässt sich dieser halbieren; insbesondere können
Winkel der Form 2mn π mit natürlichen Zahlen m, n konstruieren.
• Gegeben eine Gerade g und ein Punkt P 6∈ g, lässt sich eine Gerade h
durch P konstruieren, die g nicht schneidet (also g ∩ h = ∅). Die Existenz einer
solchen Geraden h, die wir natürlich eine Parallele von g nennen, folgt aus
Euklids Parallelenaxiom (s.o.).
Desweiteren lassen sich Punkt- und Geradenspiegelungen sowie Translationen
als Hintereinanderführung von Spiegelungen an parallelen Geraden und Drehungen konstruieren; dies werden wir aber ausführlich im folgenden Kapitel behandeln. Eine wichtige Anmerkung: All diese Konstruktionen sind ausschließlich
mit Zirkel und Lineal auszuführen!
Die folgenden weiteren klassischen Konstruktionsprobleme gehen wohl auf
Anaxagoras und Hippokrates zurück:
• Quadratur des Kreises: Gegeben ein Kreis, konstruiere man ein
flächengleiches Quadrat.
• Verdopplung des Würfels: Gegeben ein Würfel, konstruiere einen
Würfel mit doppeltem Volumen (auch als Delisches Problem bekannt).
27
• Dreiteilung des Winkels: Gegeben ein Winkel, konstruiere man einen
Winkel der ein Drittel des gegebenen Winkels ist.
Die letzten beiden Probleme wurden erstmals durch Pierre Wantzel im Jahre
1837 negativ beantwortet.k Die negative Lösung der Kreisquadratur geht auf
Lindemann zurück,∗∗ welcher zeigte, dass π sogar transzendent ist, also keiner
polynomiellen Gleichung genügt, welches wiederum nachsichzieht, dass eben
kein zu einem gegebenen Kreis flächengleiches Quadrat konstruiert werden kann.
Mascheroni bewies übrigens, dass alle Kosntruktionen mit Zirkel und Lineal sich
bereits einzig mit Zirkel realisieren lassen (siehe hierzu das Buch von Courant &
Robbins). Unter Zuhilfenahme gewisser algebraischer Kurven lassen sich jedoch
einige der oben genannten Konstruktionsprobleme positiv lösen.
Aufgaben
Aufgabe 20. Konstruieren Sie ein reguläre Fünf-, Zehn- und Zwölfecke.
Aufgabe 21. Lösen Sie die Konstruktionsaufgabe, ein Rechteck zu quadrieren, d.h. zu
einem gegebenen Rechteck ist unter Verwendung von ausschließlich Zirkel und Lineal
ein flächengleiches Quadrat zu konstruieren. (Dies ist Proposition 14 aus Band II aus
Euklids Elementen.)
Abbildung 18. Das Möndchen des Hippokrates
Aufgabe 22. In einen Halbkreis zeichne man ein gleichschenkliges Dreieck und erichte
weitere Halbkreise über den Katheten des Dreieckes (wie in Abbildung 18). Das Möndchen des Hippokrates ist dann die durch die beiden Kreisbögen begrenzte Figur.
Berechnen Sie den Flächeninhalt des Möndchens. Inwiefern kann man dies als ein
Versuch der Quadratur des Kreises interpretieren?
k
Die Unmöglichkeit der Würfelverdopplung wird ein Thema der Veranstaltung Vertiefung
Mathematik im WS 2012/13 sein.
∗∗
welcher um 1875 an der Würzburger Universität tätig war!
28
9. Die Algebraisierung der Geometrie durch Descartes und Fermat
Gegeben sei eine Strecke AB, gesucht ist ein Punkt C auf dieser Strecke
mit der Eigenschaft, dass
|AB| · |BC| = |AC|2 .
(1)
Wir wollen diese Konstruktionsaufgabe geometrisch lösen, also ausschließlich
unter Verwendung von Zirkle und Lineal! Hierzu bilden wir das Quadrat der
Strecke |AB|, nennen den diagonal B gegenüberliegenden Punkt D, halbieren
daraufhin die Strecke AD und nennen den entsprechenden Punkt E. Dann schlagen wir einen Kreis vom Radius |EB| um E und finden einen Schnittpunkt F
auf der Geraden durch A und D oberhalb von A. Schließlich gibt der Schnittpunkt des Kreises vom Radius |AF | um A mit AB den gesuchten Punkt C
(vgl. Abbildung 19). Zur Verifikation bilden wir zu den Punkten A, C, F ein
Rechteck und nennen den A diagonal gegenüberliegenden Eckpunkt G. Mit der
Satzgruppe des Pythagoras errechnet sich
|F D| · |F G| + |AE|2 = |EF |2 = |EB|2 = |AB|2 + |AE|2
und
|F D| · |F G| = |AB|2 ,
woraus sich |AC|2 = |AD| · |BC| = |AB| · |BC|, also (1) ergibt. Dies ist
tatsächlich eine Lösung einer quadratischen Gleichung im Sinne der griechischen
Mathematik!
Abbildung 19. Geometrische Lösungen quadratischer Gleichungen;
rechts ein Beispiel quadratischer Ergänzung.
Das Rechnen mit Buchstaben verdanken wir Francois Vieta (∗ 1540 - †
1603).∗ Schreiben wir a = |AB| und x = |AC|, so überträgt sich (1) in die
∗
Vokale für unbekannte Größen und Konsonanten für bekannte
29
algebraische Gleichung
a(a − x) = x2
bzw.
x2 + ax − a2 = 0,
welche in der Unbekannten
x zu lösen ist. Hier finden sich unschwer die Lösun√
a
gen x = 2 (−1 ± 5), ein unverhofftes Wiedersehen mit dem goldenen Schnitt,
welches auch zur Konstruktion des regelmäßigen Fünfecks herangezogen werden
kann. Tatsächlich finden sich solche Aufgaben (wenngleich auch nicht in Form
von Buchstaben) bereits in der Arithmetica von Diophant† und bei diversen arabischen Mathematikern des Mittelalters. Tatsächlich befand sich Europa nach
dem Untergang des römischen Reiches in einem lange anhaltenden kulturellen
Tiefschlaf, während in der arabischen Welt die Wissenschaft blühte. Der Mathematiker al-Hwārizmı̄‡ entdeckte, wie sich beliebige quadratische Gleichungen
¯
geometrisch explizit lösen lassen: Sei die Gleichung
X 2 + 10X − 144 = 0
gegeben. Dann interpretieren wir die Terme X 2 und 10X als Flächen eines Quadrates bzw. zweier Rechtecke mit Seitenlängen X bzw. 5 und X und ergänzen
deren Summe zu einem Quadrat mit Seitenlänge X + 5 (gemäß Abbildung 19).
Diese geometrische Idee nennt man (aus nahe liegenden Gründen) quadratische Ergänzung, wird aber oft leider nur noch als eine algebraische Umformung wahrgenommen (vgl. Elementare Zahlentheorie).
Bis hierhin ist Geometrie im Wesentlichen eine Kulturleistung der alten
griechischen Mathematik! Natürlich ist unsere Zusammenstellung dabei nicht
erschöpfend gewesen; gewisse Errungenschaften sind sicherlich unerwähnt geblieben und auch haben wir die Leistungen der arabischen Mathematik nicht
hinreichend gewürdigt. Nun wollen wir jedoch die Renaissance der Geometrie
zu Beginn der Neuzeit etwas genauer betrachten.
Der berühmte Philosoph§ und Mathematiker René Descartes (∗ 1596 - †
1650) veröffentlichte sein Buch ’La geométrie’ im Jahre 1637, welches bis heute als die Geburtsstunde der analytischen Geometrie gilt. Hier führt Descartes
Koordinaten ein: Damit können Punkte in der Ebene (oder im Raum) durch
Paare (oder Tripel) von Zahlen beschrieben werden. Mit Hilfe dieser Koordinaten kann nun Geometrie mit den mächtigen Werkzeugen der Algebra behandelt
werden. Descartes zu Ehren heißt jedes Koordinatensystem mit senkrecht aufeinander stehenden Achsen kartesisch. Bereits 1629 hat Pierre de Fermat (∗
1607/08(?) - † 1665) einen ähnlichen Ansatz verfolgt, doch der Hobbymathematiker hat seine Ideen nicht veröffentlicht. Beide Ansätze versuchen das Bildhafte
und Anschauliche durch das Konkrete und Örtliche zu ersetzen.
”Geometry is the science of correct reasoning on incorrect
figures.” (George Pólya)
†
der wohl im dritten Jahrhundert lebte, über den aber leider nur wenig bekannt ist
gilt als Begründer der Algebra und Namensgeber für das Wort ’Algorithmus’
§
’cogito, ergo sum!’
‡
30
Dieses berühmte Zitat verliert durch den analytischen Ansatz seine Bedeutung.
Jedes geometrische Objekt und jede geometrische Operation wird auf ein Zahlensystem bezogen und damit quantifiziert! Die entscheidende technische Invention hierzu ist die Beschreibung durch Koordinaten. Beispielsweise lässt sich ein
Kreis in der Ebene um den Mittelpunkt (x0 , y0 ) vom Radius r durch die Menge
aller Punkte (x, y) beschreiben, die der algebraischen Gleichung
(x − x0 )2 + (y − y0 )2 = r 2
genügen. Mit dieser Algebraisierung der Geometrie lassen sich beispielsweise
die Schnittpunkte eines Kreises mit einer Geraden bestimmen (ein triviales Beispiel mit dem wir bereits die rationalen Punkte auf dem Einheistkreis bestimmt
hatten). Und der Satz von Pick über den Flächeninhalt von Polygonen ist ein
weiteres Beispiel vom Nutzen von Koordinaten oder auch die rationalen Punkte
auf dem Einheitskreis.
Abbildung 20. Dieses vierblättrige Kleeblatt ist gegeben durch die Gleichung (X 2 + Y 2 )2 − 4X 2 Y 2 = 0.
Weitere Vorläufer von Fermat und Descartes sind Vieta und bereits Nicolas
Oresme (∗ 1320 - † 1382). Einen immensen Ausbau dieses Ansatz leistete Euler;
einen späteren wichtigen Impuls war die durch Grassmann geschaffene lineare
Algebra (um ca. 1844) und die damit verbundenen Begriffe Vektoren, Basis,
Dimension, und vieles mehr mit dem wir uns im folgenden Kapitel beschäftigen
werden...
31
Aufgaben
Aufgabe 23. Leiten Sie die obige Kreisgleichung aus Ihren Kenntnissen der Schulgeometrie her!
10. Sangakus
Während sich in Europa die analytische Geometrie entwickelte, ist eine
völlig andere Art von Geometrie in Japan entstanden. In der so gennanten EdoPeriode von 1603 bis 1868 isolierte sich Japan weitgehend. Nachdem ein jahrhundertelanger Brgerkrieg berstanden war, befriedete Shōgun Tokugawa Japan
durch drastische Maßnahmen. Die zerstrittenen Fürsten wurden entmachtet,
Handelsbeziehungen wurden extrem eingeschränkt, das Christentum verboten
und der Aufenthalt europäischer Ausländer komplett untersagt. Die Kriegerkaste der Samuari nutzte ihre gewonnene Freizeit und erstellte mathematische,
meist geometrische Rätsel, die auf kleinen Holztafeln – so genannten sangakus
– in Tempeln oder Schreinen ausgestellt wurden und zum Lösen derselben einluden. Trotzdem sei erwähnt, dass diese kulturelle Hochphase großartige professionelle Mathematiker hervorgebracht hat. Beispielsweise gelangen Seki Kowa (∗
1640 - † 1702) diverse Entdeckungen vor europäischen Zeitgenossen: die Determinante vor Leibniz, die Bernoulli-Zahlen vor den Bernoullis; auch entwickelte
er Differential- und Integralrechnung zeitgleich zu Leibniz und Newton.
Hier nun ein Beispiel der japanischen Tempelgeometrie: In Abbildung 21
sind die Radien r < R der Kreise in Abhängigkeit von der Kantenlänge a des
Quadrates gesucht. Die Lösung ergibt sich leicht durch Anwenden des Satzes von
Abbildung 21. Ein bekanntes sangaku von 1895 aus dem Distrikt Fukushima.
1
39
Pythagoras als r = 16
a und R = 320
a. Tatsächlich sind auf diesem spielerischen
Wege auch gewisse tiefere Sätze der Geometrie entdeckt worden, die zeitgleich
32
oder sogar später in der europäischen, mehr der wissenschaftlichen Entwicklung
verschreibenen Geometrie gefunden wurden (z.B. der Satz von Casey).∗
Aufgaben
Aufgabe 24. Für die Radien r1 , r2 , r3 der Kreise in Abbildung 22 (von links nach
rechts) ist √1r2 = √1r1 + √1r3 zu zeigen!
Abbildung 22. Ein schönes sangaku von 1824.
Aufgabe 25. Denken Sie sich ein eigenes sangaku aus und stellen Sie dies als Aufgabe
in Ihrem Freundeskreis!
∗
Für dies und weitere Beispiele dieser auf Ästhetik fokussierten Geometrie ohne praktischen Nutzen verweisen wir auf die Zulassungsarbeit von Christiane Hartmann, Sangaku –
Japanische Tempelgeometrie, www.mathematik.uni-wuerzburg.de/∼steuding/sonstiges.html.
KAPITEL 2
Analytische Geometrie in euklidischen Räumen
Ein zentrales Thema der linearen Algebra und analytischen Geometrie sind
die euklidischen Vektorräume; in diesen ist Längen- und Winkelmessung und
damit ein sehr konkreter Zugang zur Geometrie möglich. Der allgemeine Begriff
des Vektorraumes wurde erst im 19. Jahrhundert durch Graßmann eingeführt,
während die Untersuchungen zur analytischen Geometrie (wie auch im ersten
Kapitel erwähnt) bereits mit der Einführung von Koordinaten durch Descartes
und Fermat einsetzen. Unser Zugang ist im Folgenden eher stromlinienförmig
und also weniger historisch motiviert. Wir beginnen deshalb mit einer kurzen
Wiederholung linearer Algebra...
Unsere Universen sind dabei die reellen Vektorräume Rn := R ×. . .× R (also
das n-fache kartesische Produkt der Menge der reellen Zahlen). Die Elemente
sind Vektoren, die als Zeilenvektoren (x1 , . . . , xn ) oder auch als Spaltenvektoren
auftreten, welche wir komponentenweise addieren können und mit einem reellen
Skalar multiplizieren können:
(x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ),
λ · (x1 , . . . , xn ) := (λx1 , . . . , λxn )
(λ ∈ R).
Mit dieser Vektoraddition und skalaren Multiplikation ist Rn ein ndimensionaler Vektorraum (vgl. Lineare Algebra). Punkte im Rn werden wir
(meist) durch Angabe von Koordinaten identifizieren; wir mögen sie auch als
Vektoren interpretieren, wobei ein Vektor aber auch als Äquivalenzklasse von
gerichteten Strecken (genauer: Pfeile gleicher Länge und gleicher Richtung) aufgefasst werden kann, die an jeden Punkt anzuheften sind. Allerdings wollen wir
diese verschiedenen Sichtweisen nicht thematisieren.
1. Lineare Gleichungssysteme
Gegeben sei ein System zweier linearer Gleichungen in zwei veränderlichen
Größen x und y:
a11 x + a12 y = b1 ,
a21 x + a22 y = b2 ,
wobei die Zahlen aij , bi allesamt reell seien. Dann lässt sich dieses lineare Gleichungssystem bekanntlich in die Form
x
A
=b
y
33
34
umschreiben, wobei A = (aij ) die 2 × 2-Matrix mit den Koeffizienten aij ist
und b der Spaltenvektor gebildet aus den Zahlen bi . Die lineare Algebra zeigte,
dass dieses System genau dann eine Lösung ( xy ) besitzt, wenn die Ränge von A
und der um b erweiterten Matrix (A, b) gleich sind (bzw. wenn b im Erzeugnis
der Spaltenvektoren von A liegt). Ferner existiert genau dann eine eindeutige
Lösung, wenn der Rang von A gleich zwei ist, bzw. wenn die Determinante von
A nicht verschwindet.
Nun wollen wir dieses lineare Gleichungssystem geometrisch interpretieren.
Eine jeder der individuellen Gleichungen beschreibt eine Gerade im R2 (wobei
wir davon ausgehen wollen, dass nicht beide Koeffizienten verschwinden). Damit
besteht die Lösungsmenge des Gleichungssystems genau aus den Punkten, die
auf beiden Geraden liegen. Nun können zwei Geraden in der Ebene
• identisch sein,
• sich in genau einem Punkt schneiden,
• parallel liegen (ohne gemeinsamen Punkt).
Also tritt der zweite Fall genau dann ein, wenn die Koeffizientenmatrix A eine nicht-verschwindende Determinante besitzt. In den anderen beiden Fällen
besitzen die Geraden dieselbe Steigung und die zugehörigen Koeffizienten bilden linear abhängige Spaltenvektoren von A. Mit der Determinante können also
lineare Abhängigkeiten entdeckt werden!
Übrigens sind auch lineare Ungleichungssysteme interessant. Ihre Lösungsmengen (wenn existent) lassen sich mit Hilfe von Polygonen beschreiben; mit
der Simplexmethode (siehe Fischers Buch) lassen sich die Randpunkte finden,
welche ein Extremwertproblem lösen. Solcher Art Anwendungen spielen bei Optimierungsfragestellungen eine wichtige Rolle.
Aufgaben
Aufgabe 26 (Staatsexamen: Frühjahr 2003, Thema 1, Aufgabe 2).
2
a) Zeigen Sie, dass die Menge ℓ aller (s, t) ∈ R , für die das lineare Gleichungssystem
x1 + x2 − 2x3
2x1 + x2 − 3x3
3x1 − 3x2
=
s2
=
st
=
t2
lösbar ist, eine Gerade ist!
b) Bestimmen Sie für (s, t) ∈ ℓ die allgemeine Lösung des obigen Gleichungssystems!
Aufgabe 27. Welche Lösungen besitzt das folgende lineare Ungleichungssystem:
3x − 5y
−x + 2y
≤
≤
Welches geometrische Objekt steckt dahinter?
1,
2.
35
2. Geraden und Ebenen
Wir präzisieren und ergänzen einige Aussagen des vorangegangenen Paragraphen. Wir beginnen mit der Definition einer Geraden (obwohl wir bereits
regen Umgang mit denselben hatten): Eine Teilmenge G ⊂ Rn heißt Gerade,
wenn es Vektoren v, w ∈ Rn existieren mit w 6= 0 und
G = v + Rw := {u ∈ Rn : u = v + λw mit λ ∈ R}.
Dabei ist die Abbildung λ 7→ λw bijektiv, weil w nicht der Nullvektor ist. In
dieser Parameterform der Geraden heißt v Ortsvektor und w Richtungsvektor von G. Tatsächlich stehen hier u und v für spezielle Punkte im Rn ,
wogegen w einen Vektor im Sinne einer gerichteten Strecke ist: der Punkt u ist
dann durch Anhängen eines Vielfachens λw dieser Strecke an den Fußpunkt v
gegeben.
Satz 2.1.
(i) Sei G = v + Rw eine Gerade und v ′ ∈ G, dann gilt G = v ′ + Rw.
(ii) Zwei Geraden G = v + Rw und G′ = v ′ + Rw′ stimmen genau dann
überein, wenn ihr Schnitt nicht-leer ist und ihre Richtungsvektoren
linear abhängig sind (d.h. ein β ∈ R mit w′ = βw existiert).
Beweis. Zu Aussage (i): Nach Vorausetzung gibt es ein λ′ ∈ R mit v ′ = v +λ′ w.
Für x = v + λw ∈ G gilt dann
′
x = v + λw + λ
− λ′ w} = |v +{zλ′ w} +(λ − λ′ )w ∈ v ′ + Rw,
| w {z
=v′
=0
v′
und somit G ⊂
+ Rw. Für die umgekehrte Inklusion sei x = v ′ + λw mit
beliebigem λ ∈ R gegeben, dann gilt
x = v + λ′ w + λw = v + (λ + λ′ )w ∈ G.
Für den Nachweis von (ii) gehen wir zunächst von G = G′ aus. Dann gilt
sicherlich G ∩ G′ 6= ∅. Wegen v ′ ∈ G′ = G gibt es ein λ′ ∈ R mit v ′ = v + λ′ w
und ähnlich folgt über v ′ + w′ ∈ G′ = G dann v ′ + w′ = v + λ′′ w für ein λ′′ ∈ R.
Dies liefert
w′ = v + λ′′ w − v ′ = v + λ′′ w − (v + λ′ w) = (λ′′ − λ′ )w.
Also gilt w′ = βw mit β = λ′′ − λ′ ∈ R, welches von null verschieden ist,
da w′ nicht der Nullvektor ist. Für die umgekehrte Implikation existiert ein
u ∈ G ∩ G′ und nach (i) gilt G = u + Rw sowie G′ = u + Rw′ . Daraus folgt nun
für x = u + λw ∈ G leicht
λ
λ
x = u + λw = u + · βw = u + w′ ∈ G′ ,
β |{z}
β
=w ′
also G ⊂
G′ .
Analog zeigt sich
G′
⊂ G, womit die Gleichheit G = G′ folgt. •
Als Nächstes beweisen wir ein Resultat, welches anschaulich trivial sein mag:
Korollar 2.2. Durch zwei verschiedene Punkte geht genau eine Gerade.
36
Abbildung 1. Orts- und Richtungsvektoren einer Geraden.
Beweis. Seien v1 , v2 zwei verschiedene Punkte des Rn . Setze w := v2 − v1 6= 0,
dann ist G = v1 + Rw sicherlich eine solche gesuchte Gerade (siehe Abbildung 1).
Es verbleibt die Eindeutigkeit zu zeigen: Sei G′ = v ′ + Rw′ eine weitere Gerade
durch v1 und v2 , dann folgt aus dem vorangegangenen Satz, dass G′ = v1 + Rw′
gilt. Wegen v2 ∈ G′ existiert ein reelles λ mit v2 = v1 + λw′ und zusammen mit
v2 = v1 + w folgt 0 = λw′ − w mit λ 6= 0 (da w 6= 0). Also gilt w = λw′ und
G = G′ . •
Wir nennen Punkte A, B, C, . . . kollinear, wenn sie auf einer Geraden liegen
bzw. die Vektoren A − B, A − C, . . . linear abhängig sind. (In Zukunft werden
wir jedoch nur selten zwischen Punkten und Vektoren unterscheiden.)
Korollar 2.3. Drei Punkte A, B, C in der Ebene sind genau dann kollinear,
wenn es reelle Konstanten α, β, γ gibt, nicht alle gleich null, so dass
αA + βB + γC = 0
bzw. wenn
det
mit
1 1 1
A B C
α + β + γ = 0;
= 0,
wobei für die Punkte A, B, C hier die Koordinaten einzutragen sind.
Der Beweis basiert auf dem vorangegangenen Satz und ist eine gute Übungsaufgabe zum Training der Begrifflichkeiten und dem Rechnen mit Vektoren.
Satz 2.4. Eine Teilmenge G ⊂ R2 ist genau dann eine Gerade, wenn es a, b, c ∈
R mit (a, b) 6= (0, 0) gibt, so dass
G = {(x, y) ∈ R2 : ax + by = c}.
Wir erinnern uns hier an die Schulmathematik, wo Geraden oft in der Form
y = αx + β mit Steigung α und y-Achsenabschnitt β dargestellt wurden.
37
Beweis. Sei G = v + Rw eine Gerade mit w = (x1 , y1 ) 6= (0, 0) und v = (x0 , y0 ).
Für einen generischen Punkt u = (x, y) ∈ G gilt dann
x − x0
x1
=
y − y0
y1
bzw.
xy1 − x0 y1 = x1 y − x1 y0 ;
dies liefert die gesuchte lineare Gleichung in x und y falls y1 6= 0. Trotzdem
definieren wir für den allgemeinen Fall entsprechend a = y1 , b = −x1 und c =
x0 y1 − x1 y0 und setzen
(1)
L = {(x, y) ∈ R2 : ax + by = c}.
Für u = v + λw = (x0 + λx1 , y0 + λy1 ) ∈ G errechnet sich dann
a(x0 + λx1 ) + b(y0 + λy1 ) = y1 x0 + λx1 y1 − xx 1y0 − λx1 y1 = x0 y1 − x1 y0 = c,
also G ⊂ L. Für den Nachweis der Inklusion L ⊂ G nehmen wir zunächst
0
a = y1 6= 0 und u = (x, y) ∈ L an. Dann folgt mit λ = y−y
y1
y = y0 +
y − y0
y1 = y0 +λy1
y1
und x =
c − by
x0 y 1 − x1 y 0 + x1 y
=
= x0 +λx1 ,
a
y1
also u = (x, y) = v + λw ∈ G. Im Falle a = y1 = 0 ist b = −x1 6= 0 (da w 6= 0)
0
und ein analoges Argument mit λ = x−x
x1 führt zum Ziel.
Es verbleibt zu zeigen, dass die Menge (1) eine Gerade definiert; hierbei
dürfen wir (a, b) 6= (0, 0) annehmen. Falls a 6= 0 (der Fall b 6= 0 kann ähnlich
behandelt werden), ergibt sich mit v = (c/a, 0) und w = (−b, a) nach ein wenig
Rechnerei L = v + Rw, womit also L als Gerade nachgewiesen ist. •
Beispiel: Der konstruktive Beweis zeigt, dass die Geraden
−2
1
G=
+R
−3
2
ebenso durch die lineare Gleichung 2x − y = −1 beschrieben werden kann.
Eine Teilmenge E ⊂ Rn heißt Ebene, falls Vektoren v, w1 , w2 ∈ Rn existieren, so dass w1 und w2 linear unabhängig sind und
E = v + Rw1 + Rw2 ;
auch hier nennen wir v einen Ortsvektor und w1 , w2 Richtungsvektoren von
E (siehe Abbildung 2). Analog zu Satz 2.1 gilt hier für einen beliebigen Punkt
v ′ ∈ E ebenso E = v ′ + Rw1 + Rw2 sowie Korollar 2.2 entsprechend
Satz 2.5. Gegeben drei verschiedene Punkte v1 , v2 , v3 ∈ Rn , die nicht auf einer
Geraden liegen (also kollinear sind), existiert stets genau eine Ebene durch v1 , v2
und v3 .
Drei Punkte legen also eine Ebene im euklidischen Raum eindeutig fest!
Schließlich sei noch angemerkt, dass Ebenen wie Geraden durch eine lineare
Gleichung beschrieben werden können:
38
Abbildung 2. Orts- und Richtungsvektoren einer Ebene.
Satz 2.6. Eine Teilmenge E ⊂ R3 ist genau dann eine Ebene, wenn es Zahlen
a, b, c, d ∈ R mit (a, b, c) 6= (0, 0, 0) gibt, so dass
E = {(x, y, z) ∈ R3 : ax + by + cz = d}.
Auch hier erfolgt der Beweis analog zum Fall von Geraden (siehe etwa das Buch
von Koecher & Krieg).
Aufgaben
2
Aufgabe 28. Drei Punkte A, B, C ∈ R sind genau dann kollinear, wenn det(A −
C, B − C) = 0, wobei hier die Koordinaten von A, B, C einzusetzen sind.
Aufgabe 29. Zur Erinnerung an die Elementare Zahlentheorie: Gegeben eine Gerade
aX + bY = c in der euklidischen Ebene, wobei a, b, c ganze Zahlen sind. Gibt es Punkte
mit ganzzahligen Koordinaten x, y auf dieser Geraden? Wenn ja, beschreiben Sie diese.
Aufgabe 30. Beweisen Sie Korollar 2.3 sowie Satz 2.5.
3
3
Aufgabe 31. Gegeben seien drei Punkte a, b, c des R , gesucht ist der Punkt d ∈ R ,
so dass abcd ein Parallelogramm ist.
3. Das Skalarprodukt
In R lässt sich der Abstand zwischen zwei Punkten durch den Betrag der
Differenz angeben. Wir verallgemeinern nun diesen Distanzbegriff auf euklidische Räume Rn . Hierzu stellen wir uns den zweidimensionalen euklidischen
Raum R2 als Ebene vor. Nach dem Satz des Pythagoras ist der Abstand zweier
Punkte P1 = (x1 , y1 ) und P2 = (x2 , y2 ) des R2
p
d(P1 , P2 ) = (x1 − x2 )2 + (y1 − y2 )2 .
39
Dieser Abstand hängt nur von der Differenz P1 −P2 ab und wir schreiben deshalb
auch kP1 − P2 k bzw.
p
k(x, y)k := x2 + y 2 .
Dieser Abstandsbegriff lässt sich problemlos auf den drei- bzw. sogar ndimensionalen Raum übertragen: Für den Rn definieren wir die euklidische
Norm eines Vektors x = (x1 , . . . , xn ) als
q
kxk := x21 + . . . + x2n .
Die wichtigsten Eigenschaften der euklidischen Norm sind uns bereits aus der
Analysis mehrerer Veränderlicher bekannt:
Satz 2.7. Für die euklidische Norm gelten
(i) kxk ≥ 0 für alle x ∈ Rn und Gleichheit genau für x = 0;
(ii) kλxk = |λ| · kxk für alle x ∈ Rn und λ ∈ R;
(iii) kx + yk ≤ kxk + kyk für alle x, y ∈ Rn .
Beweisskizze. Der Nachweis von (i) und (ii) ist trivial. Seien x
(x1 , . . . , xn ), y := (y1 , . . . , yn ) ∈ Rn . Mit
A :=
n
X
x2j ,
B :=
n
X
xj y j ,
n
X
yj2
j=1
j=1
j=1
C :=
=
und variablem λ ∈ R gilt
n
X
(xj − λyj )2 = A − 2λB + λ2 C.
0≤
j=1
Ist C = 0, so auch B = 0. Ist hingegen C 6= 0, so definiert die obige rechte
Seite ein quadratisches Polynom in λ, welches keine negativen Werte annimmt;
damit sind die Nullstellen
p
1
λ1,2 = (B ± B 2 − AC)
C
entweder identisch oder nicht-reell, d.h. B 2 − AC ≤ 0 (was auch den Fall C =
B = 0 beinhaltet). Nun übersetzt sich B 2 ≤ AC zu
2
X
n
n
X
X
n
2
yj2 .
x
·
x
y
≤
j j
j
j=1
j=1
j=1
Einsetzen dieser Ungleichung in
n
n
n
X
X
X
2
2
yj2
xj y j +
xj + 2
kx + yk2 =
j=1
j=1
j=1
und Ziehen der Quadratwurzel liefert die Dreiecksungleichung (iii). •
Dies lässt sich verallgemeinern: Eine Abbildung k . k : Rn → R, die (i), (ii) und
(iii) des Satzes genügt, heißt Norm auf Rn . (Beispiele derselben haben wir in
der Analysis mehrerer Veränderlicher kennen gelernt.) Ein Vektor v ∈ Rn mit
Norm kvk = 1 wird normiert bzw. Einheitsvektor genannt.
40
Den euklidischen Abstand zwischen x, y ∈ Rn definieren wir als
d(x, y) := kx − yk (s.o.). Natürlich definieren wir diese Größen ebenso für Spaltenvektoren. Offensichtlich gilt
d(x, y) = d(y, x) ≥ 0
mit Gleichheit rechts, wenn und nur wenn x = y. Die Dreiecksungleichung
nimmt dann die Form
d(x, y) ≤ d(x, z) + d(z, y)
an, wobei x, y, z beliebige Punkte bzw. Vektoren sind.
Im Folgenden wollen wir etwas allgemeiner arbeiten. Sei hierzu nun V ein
Vektorraum über dem Skalarenkörper R (wie etwa V = Rn ). Dann nennen wir
eine Abbildung
h . , . i : V × V → R, (x, y) 7→ hx, yi
eine Bilinearform, wenn sie linear in beiden Argumenten ist, d.h. für alle
x, y, z ∈ V und λ ∈ R
(B1)
(B2)
(B3)
(B4)
hx + y, zi = hx, zi + hy, zi,
hλx, yi = λhx, yi,
hx, y + zi = hx, yi + hx, zi,
hx, λyi = λhx, yi.
Eine solche Abbildung heißt symmetrisch, falls stets
(S) hx, yi = hy, xi;
wir nennen sie positiv definit, falls
(PD) hx, xi ≥ 0 und Gleichheit genau für x = 0.
Eine symmetrische, positiv definite Bilinearform heißt Skalarprodukt.∗ Ein
Paar (Rn , h , i) bestehend aus einem Vektorraum V = Rn und einem dazugehörigen Skalarprodukt nennen wir einen euklidischen Raum. Im Folgenden
werden wir – wenn nicht ausdrücklich auf einen anderen Vektorraum verwiesen
wird – in euklidischen Räumen arbeiten.
Legen wir statt der reellen Zahlen die komplexen Zahlen zugrunde (vgl.
Elementare Zahlentheorie), so nennen wir
h . , . i : Cn × Cn → C,
(x, y) 7→ hx, yi
eine Sesquilinearform, falls neben (B1), (B3) und (B4) noch
(B2’) hλx, yi = λhx, yi
√
besteht, wobei hier λ = α + iβ ∈ C gilt (also α, β ∈ R sowie i := −1) und
λ = α − iβ für das Konjugierte von λ steht. Eine solche Sesquilinearform heißt
hermitesch,† falls
hv, wi = hw, vi.
Der Begriff der positiven Definitheit bleibt unverändert.
∗
In einiger Literatur wird statt hx, yi auch x · y geschrieben; allerdings ist hier Vorsicht
geboten (insbesondere weil es verschiedene Produkte von Vektoren gibt).
†
nach dem Mathematiker Charles Hermite
41
Ein erstes Beispiel für ein Skalarprodukt liefert der folgende Satz:
Satz 2.8. Die durch
t
hx, yi = x · y =
n
X
xj y j
j=1
n
für xt = (x1 , . . . , xn ), y t = (y1 , . . . , yn ) ∈ R erklärte Abbildung ist ein Skalarprodukt auf Rn und heißt Standardskalarprodukt.
Hier und im Folgenden schreiben
wir Vektoren üblicherweise als Spaltenvek
x1
toren, wie etwa x = x2 und notieren mit xt = (x1 , x2 ) den zugehörigen
transponierten Zeilenvektor.
Beweis. Mit zusätzlich z t = (z1 , . . . , zn ) ∈ Rn rechnet man leicht nach:
hx + y, zi =
n
n
n
X
X
X
yj zj = hx, zi + hy, zi.
xj zj +
(xj + yj )zj =
j=1
j=1
j=1
Die weiteren definierenden Eigenschaften weist man ganz ähnlich nach. Für
(PD) sei bemerkt, dass Quadrate reeller Zahlen nicht-negativ sind und also
hx, xi = x21 + . . . + x2n ≥ 0 gilt; hierbei herrscht genau dann Gleichheit, wenn
alle xj verschwinden, also x = 0 ist. •
Ein exotisches Beispiel für ein Skalarprodukt ist die Abbildung
Z 1
f (t)g(t)dt
(f, g) 7→ hf, gi :=
0
auf dem Vektorraum aller auf dem Einheitsintervall erklärten stetigen, reellwertigen Funktionen. Weitere Beispiele von Skalarprodukten folgen im nächsten
Paragraphen.
p
Zu einem jeden solchen Skalarprodukt können wir vermöge kxk := hx, xi
eine Norm und damit einen Abstand definieren; im Falle des Standardskalarproduktes entstehen so die euklidische Norm und Abstand (s.o.).
Satz 2.9 (Cauchy-Schwarzsche Ungleichung). Sei h . , . i ein Skalarprodukt
auf Rn und k . k die zugehörige Norm. Dann gilt für beliebige x, y ∈ Rn
|hx, yi| ≤ kxk · kyk;
hier besteht genau dann Gleichheit, wenn x und y linear abhängig sind.
Beweis. Für y = 0 ist die Aussage trivialerweise erfüllt; sei also y 6= 0. Dann
sei λ := hy, yi und µ = −hx, yi. Wir berechnen
0 ≤ hλx + µy, λx + µyi = λ2 hx, xi + 2λµhx, yi + µ2 hy, yi
= λ(hy, yihx, xi − hx, yi2 ).
Wegen λ > 0 folgt hieraus
hy, yihx, xi ≥ hx, yi2
und durch Ziehen der Wurzel ergibt sich die Ungleichung. Diese ist genau dann
eine Gleichung, wenn λx + µy = 0 gilt, also x und y linear abhängig sind. •
42
Übrigens ergibt sich die Dreiecksungleichung aus Satz 2.7 als einfache Konsequenz der Cauchy-Schwarzschen Ungleichung.
Wir notieren weitere interessante Eigenschaften von allgemeinen Skalarprodukten:
Satz 2.10. Sei h . , . i ein Skalarprodukt auf Rn und k . k die zugehörige Norm.
Dann gelten für x, y ∈ Rn
(i) Satz des Pythagoras: kx + yk2 = kxk2 + kyk2 + 2hx, yi,
(ii) Parallelogrammgleichung: kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 .
Beweis durch Nachrechnen:
kx + yk2 = hx + y, x + yi = hx, x + yi + hy, x + yi
= hx, xi + hx, yi + hy, xi + hy, yi
= kxk2 + 2hx, yi + kyk2 ,
was für (i) zu zeigen war; der Nachweis von (ii) geht analog. •
Abbildung 3. Eine geometrische Interpretation der Parallelogrammgleichung. Man mache sich klar, dass die kürzere Diagonale durch den Vektor
x − y beschrieben wird.
Insbesondere liefert die Aussage in (i) mit dem Standardskalarprodukt und der
euklidischen Norm einen Beweis von Satz 1.8; allerdings wird hierfür noch die
Definition des Winkels über das Skalarprodukt benötigt – dies ist Gegenstand
des übernächsten Paragraphen.
Die Parallelogrammgleichung gilt übrigens nicht in normierten Vektorräumen, in denen die Norm nicht durch ein Skalarprodukt definiert ist. Ein solches
Beispiel liefert die Maximumnorm, welche für xt = (x1 , . . . , xn ) durch
kxk∞ := max{|xj | : j = 1, . . . , n}
definiert ist. Hier rechnet sich sofort nach, dass die Parallelogrammgleichung
i.A. nicht gültig ist.
Aufgaben
43
Aufgabe 32. Zeigen Sie, dass für ein beliebiges Skalarprodukt stets h0, xi = hx, 0i = 0
gilt. Beweisen Sie ferner, dass genau dann ha, xi = 0 mit dem Standardskalarprodukt
0 −1
⊥
⊥
. Geben Sie eine
besteht, wenn x ∈ Ra mit einem a 6= 0 gilt, wobei a :=
1 0
geometrische Interpretation dieses Sachverhaltes!
Aufgabe 33. Beweisen Sie den Diagonalensatz: In einem Parallelogramm halbieren
sich die Diagonalen gegenseitig. Und zeigen Sie folgende Tischlerregel: Ein Parallelogramm ist genau dann ein Rechteck, wenn beide Diagonalen gleich lang sind.
4. Symmetrische Matrizen
Eine Matrix A ∈ Rn×n mit der Eigenschaft At = A heißt symmetrisch; gilt
A = (aij )i,j , so lässt sich dies auch äquivalent durch aji = aij für alle 1 ≤ i, j ≤ n
ausdrücken (denn Vertauschen der Indizes bedeutet Vertauschen von Zeilen und
Spalten, also letztlich Transposition). Zu einer solchen symmetrischen Matrix
A definieren wir die Abbildung
h . , . iA : Rn × Rn → R,
(x, y) 7→ hx, yiA := xt Ay,
bzw. hx, yiA = hx, Ayi mit dem Standardskalarprodukt; selbiges entsteht im
Falle A = E, wobei E hier und im Folgenden die Einheitsmatrix bezeichne. Die
obige Definition liefert eine Vielzahl von Bilinearformen:
Satz 2.11. Es sei A ∈ Rn×n symmetrisch. Dann ist die assoziierte Abbildung
h . , . iA eine symmetrische Bilinearform auf Rn × Rn .
Beweis. Wir prüfen die einzelnen Eigenschaften nach: Für Vektoren x, y ∈ Rn
sowie Skalaren λ, µ ∈ R gilt
hλx + µz, yi = (λx + µz)t Ay = λxt Ay + µz t Ay = λhx, yiA + µhz, yiA ,
womit die Linearität im ersten Argument gezeigt ist; die im zweiten folgt analog.
Zur Erinnerung: beim Transponieren werden Zeilen und Spalten ausgetauscht,
entsprechend dreht sich die Reihenfolge der Faktoren in einem Produkt um:
(ab)t = bt at . Damit zeigt sich
hy, xiA = y t Ax = (Ax)t (y t )t = xt At y = xt Ay = hx, yiA ,
wobei wir hier die Eigenschaft von A, symmetrisch zu sein, benutzt haben. •
Tatsächlich lässt sich zeigen, dass symmetrische Matrizen eineindeutig symmetrischen Bilinearformen entsprechen (siehe Fischers Buch).
Unter welchen Umständen handelt es sich bei h . , . iA um ein Skalarprodukt?
Hierzu ist positive Definitheit nachzuprüfen. Diese hängt interessanterweise von
den Eigenwerten von A ab.
Satz 2.12. Eine symmetrische Matrix A ∈ Rn×n besitzt n (nicht notwendig
verschiedene) reelle Eigenwerte.
44
Beweis. Wir erinnern an den Fundamentalsatz der Algebra (vgl. Elementare
Zahlentheorie): Jedes nichtkonstantes Polynom zerfällt über dem Körper C der
komplexen Zahlen in Linearfaktoren. Angewandt auf das charakteristische Polynom von A folgt die Existenz von n (nicht notwendig verschiedenen) komplexen
Eigenwerten λ von A. Wir haben zu zeigen, dass λ reell ist. Wir beobachten,
dass mit λ auch das Konjugierte λ ein Eigenwert von A ist, denn mit Av = λv
gilt ebenso
Av = Av = λv;
insbesondere für Eigenvektoren v zum Eigenwert λ. Aufgrund der Symmetrie
von A ergibt sich
v t Av = v t Av
bzw.
λkvk = v t λv = v t λv = λkvk.
Nach Kürzen von kvk (was ungleich null ist, da v 6= 0) folgt λ = λ, was impliziert, dass λ reell ist. •
Für das Weitere definieren wir: Eine symmetrische Matrix A ∈ Rn×n heißt
•
•
•
•
•
Dann gilt
positiv definit, wenn hx, xiA > 0 für alle x ∈ Rn \ {0},
positiv semidefinit, wenn hx, xiA ≥ 0 für alle x ∈ Rn \ {0},
negativ definit, wenn hx, xiA < 0 für alle x ∈ Rn \ {0},
negativ semidefinit, wenn hx, xiA ≤ 0 für alle x ∈ Rn \ {0},
indefinit, wenn es x, y ∈ Rn gibt mit hx, xiA < 0 < hy, yiA .
Satz 2.13. Eine symmetrische Matrix A ∈ Rn×n ist genau dann
•
•
•
•
•
positiv definit, wenn sämtliche Eigenwerte positiv sind,
positiv semidefinit, wenn sämtliche Eigenwerte nicht-negative sind,
negativ definit, wenn sämtliche Eigenwerte negativ sind,
negativ semidefinit, wenn sämtliche Eigenwerte nicht-positiv sind,,
indefinit, wenn es mindestens einen positiven und mindestens einen
negativen Eigenwert gibt.
Wir verschieben den Beweis auf das nächste Kapitel und begnügen uns hier mit
einem
Beispiel: Die Matrix
B=
1 1
1 4
∈ R2×2
ist symmetrisch, definiert also eine symmetrische Bilinearform
y1
1 1
t
(x, y) 7→ hx, yiB = x By = (x1 , x2 )
y2
1 4
= x21 + x1 y2 + x2 y1 + 4y22 .
Zum Nachweis der positiven Definitheit berechnen wir die Eigenwerte
von B
√
über das charakteristische Polynom λ2 − 5λ + 3 als λ± = 21 (5 ± 13). Damit
handelt es sich hier also um ein Skalarprodukt.
45
Das folgende Kriterium erlaubt eine schnelle Entscheidung über die Definitheit, welches ohne die explizite Berechnung der Eigenwerte auskommt:
Satz 2.14 (Hurwitz-Kriterium). Eine symmetrische Matrix A
(αij )1≤i,j≤n ∈ Rn×n ist genau dann positiv definit, wenn
det Ak > 0
wobei Ak := (αij )1≤i,j≤k
α21 usw.).
=
für
k = 1, . . . , n,
α11 α12
mit α12 =
(also A1 = (α11 ) und A2 =
α21 α22
Beweis für den Spezialfall n = 2: Eine symmetrische 2 × 2-Matrix mit reellen
Einträgen ist von der Gestalt
α β
mit α, β, γ ∈ R;
A=
β γ
wir haben zu zeigen, dass A genau dann positiv definit ist, wenn α > 0 und
αγ − β 2 > 0. Hierzu berechnen wir
x
= α2 x2 + 2αβxy + αγy 2
α(x, y)A
y
= (αx + βy)2 + (αγ − β 2 )y 2 ,
woraus sich das Kriterium leicht ablesen lässt. Für den Beweis des allgemeinen
Falles verweisen wir wiederum auf das Buch von Fischer. •
Wir schließen unsere Untersuchungen zu symmetrischen Matrizen mit einigen weiteren strukturellen Eigenschaften:
Satz 2.15. Es bezeichne Symn (R) die Menge der symmetrischen Matrizen A ∈
Rn×n .
(i) Symn (R) ist ein Vektorraum der Dimension 21 n(n + 1).
(ii) Für W ∈ Rn×n ist A 7→ W t AW ein Endomorphismus von Symn (R);
dieser ist genau dann bijektiv, wenn W invertierbar ist.
(iii) Ist A ∈ Symn (R) positiv definit und W invertierbar ist, dann ist auch
W t AW positiv definit.
Wir stellen den leichten Beweis als Übungsaufgabe.
Aufgaben
Aufgabe 34 (Frühjahr 2002, Thema 3, Aufgabe 4). a) Man zeige, dass durch
y1
x1
2
∈R ,
, y=
hx, yi := x1 y1 + 2x1 y2 + 2x2 y1 + 5x2 y2 , x =
y2
x2
2
eine positiv definite symmetrische Bilinearform, d.h. ein Skalarprodukt im R definiert
ist.
b) Man berechne den Abstand des Punktes 01 von der Geraden R · 10 bezüglich
p
der Abstandsfunktion d(x, y) = hx − y, x − yi, die durch das Skalarprodukt aus a)
definiert wird.
46
Aufgabe 35. Finden Sie Eigenvektoren und Diagonalisieren Sie die Matrix B aus dem
obigen Beispiel.
Aufgabe 36. Beweisen Sie Satz 2.15. Zeigen Sie ferner, dass durch
A∼B
:⇐⇒
B = W t AW
eine Äquivalenzrelation auf Symn (R) definiert wird.
Aufgabe 37. Welche Bedingungen muss eine Matrix A mit komplexen Einträgen
erfüllen, so dass (x, y) 7→ xt Ay eine hermitesche Sesquilinearfrom ist? Geben Sie auch
Beispiele an!
5. Winkel und die trigonometrischen Funktionen
Im Folgenden sei h . , . i das Standardskalarprodukt. Gegeben zwei vom Nullvektor verschiedene Vektoren x, y ∈ Rn , definieren wir nun den Winkel zwischen
ebendiesen bzw. zwischen den Strecken 0x und 0y (wo 0 für den Ursprung bzw.
Nullvektor steht). Mit der Cauchy-Schwarzschen Ungleichung gilt
−1 ≤
hx, yi
≤ +1.
kxk · kyk
Es existieren genau zwei Winkel α und α′ mit der Eigenschaft α + α′ = 2π und
hx, yi
(1)
cos α = cos α′ =
.
kxk · kyk
Mit der Forderung α ∈ [0, π] ist α der eindeutig bestimmte Winkel zwischen x
und y; in Zeichen: α = ∠(x, y). Der Kosinus ist hierbei natürlich die uns aus der
Analysis bekannte 2π-periodische Funktion mit Werten zwischen −1 und +1.
Im Falle zweier Geraden G = v + Rw und G′ = v + Rw′ mit gemeinsamen
Ortsvektor (welches also ein Schnittpunkt von G und G′ ist) definieren wir
den Winkel zwischen den Geraden G und G′ als Minimum der Winkel der
Richtungsvektoren:
∠(G, G′ ) = min{∠(w, w′ ), ∠(w, −w′ )}.
Abbildung 4. Die Winkel zwischen zwei sich schneidenden Geraden.
Punkte und Vektoren des Rn werden oft durch Koordinaten, also letztlich
mit Hilfe einer gewählten Basis beschrieben. In der Linearen Algebra wurde
47
bereits gezeigt, dass es keine eindeutige Basis, sondern vielmehr eine große Auswahl von Basen gibt (insbesondere im Rn ), welche allesamt gleichberechtigt sind.
Auch berechnen wir beispielsweise das Standardskalarprodukt in Abhängigkeit
der Koordinaten (bzw. der gewählten Basis). Allerdings zeigt obige Formel (1)
umgeschrieben als
hx, yi = kxk · kyk · cos ∠(x, y),
dass ein Skalarprodukt im Falle eines kartesischen Koordinatensystems von der
Wahl der Basis unabhängige Werte liefert! Hierbei heißt ein Koordinatensystem kartesisch, wenn die Basisvektoren senkrecht aufeinander stehen (also
hx, yi = 0 gilt; siehe nächster Paragraph) und auf Länge eins normiert sind.
Diese Unabhängigkeit von solcherlei Basen zeigt auf, was für eine wichtige Invariante wir hier vorliegen haben!
Weitere einfache Eigenschaften des Winkels sind
(i) ∠(x, y) = ∠(y, x);
(ii) ∠(λx, µy) = ∠(x, y) für λ, µ > 0;
(iii) ∠(x, y) = 0 ⇐⇒ x = λy für ein λ > 0.
Bekanntlich lässt sich der Einheitskreis durch die trigonometrischen Funktion Kosinus cos und Sinus sin parametrisieren:‡
x = cos α, y = sin α
für 0 ≤ α < 2π
erfüllt mit dem Satz des Pythagoras die algebraische Gleichung x2 + y 2 = 1
(siehe Abbildung 6). Allgemeiner gelten in einem rechtwinkligen Dreieck ABC
Abbildung 5. Die trigonometrischen Funktionen cos, sin und tan.
mit Hypothenuse AC die Beziehungen
cos ∠(BAC) =
‡
|AB|
|AC|
und
sin ∠(BAC) =
|BC|
,
|AC|
Übrigens: Was heisst Trigonometrie? τ ριγωνoν steht für Dreieck und µǫτ ρoν für Maß.
48
bzw. in Schulsprache: der Kosinus des Winkels bei A ist gleich dem Quotienten
der Längen von Ankathete und Hypothenuse, während der Sinus besagten Winkels gleich dem Quotienten der Längen von Gegenkathete und Hypothenuse ist.
Sofort ergibt sich hieraus die 2π-Periodizität von Kosinus und Sinus
cos(α + 2π) = cos(α)
und
sin(α + 2π) = sin(α).
Aber wir wollen auch noch eine Brücke zu den komplexen Zahlen schlagen
Abbildung 6. Links: Kosinus und Sinus am Kreis. Rechts: Das Bild zum
Beweis des Additionstheorems.
(vgl. Elementare Zahlentheorie). Wir denken uns einen Kreis vom Radius r und
Mittelpunkt im Ursprung des R2 . Dann gelten allgemein für die Koordinaten
eines Punktes z = (x, y) die Gleichungen x = r cos α und y = r sin α, wenn α
den Winkel zwischen der x-Achse und dem Richtungsvektor nach z bezeichnet.
Fassen wir den R2 als Gaußsche Zahlenebene auf, so ist z = x + iy eine komple√
xe Zahl mit der imaginären Einheit i = −1 (vgl. Elementare Zahlentheorie);
der Übergang von der Menge C der komplexen Zahlen zur euklidischen Ebene R2 erklärt sich dann einfach durch Abtragen des Realteils einer komplexen
Zahl auf der x-Achse und des Imaginärteils auf der y-Achse. Neben dieser kartesischen Darstellung komplexer Zahlen lassen sich diese auch alternativ durch
Polarkoordinaten wiedergeben: Für 0 6= z ∈ C schreiben wir dazu
z = r exp(iα),
woraus wir |z| = r und die Formeln von Euler – de Moivre
exp(iα) = cos α + i sin α,
cos(nα) + i sin(nα) = (cos α + i sin α)n
für beliebige α ∈ R und n ∈ Z ablesen. Ferner gewinnt man hieraus auch noch
cos α = 21 (exp(iα) + exp(−iα))
und
sin α =
1
2i (exp(iα)
− exp(−iα))
49
Mit Hilfe dieser Formeln lässt sich unschwer folgender Satz beweisen:
Satz 2.16 (Additionstheorem). Für beliebige reelle α, β gelten
cos(α + β) = cos α cos β − sin α sin β,
sin(α + β) = sin α cos β + cos α sin β.
Wir geben aber ein geometrisches Argument:
Beweis. Wir betrachten Dreiecke ABC und AEB mit rechten Winkeln bei B
bzw. E; die Winkel bei A seien α bzw. β (wie in Abbildung 6). Setzen wir
voraus, dass die Strecke AC Länge eins besitzt, so ergeben sich
|AB| = cos α
und
|BC| = sin α.
Als Nächstes bilden wir den Punkt D so, dass BCD ein rechtwinkliges Dreieck
Abbildung 7. Dieses Bild zeigt einen PolarPlot der Funktion t 7→ cos 3t
mit t ∈ [0, π]; hierbei werden die Werte cos 3t in Richtung des Winkels t vom
Ursprung aus abgetragen. Was passiert, wenn man stattdessen cos 5t be-
trachtet?
mit Hypothenuse BC ist. Dann ist der Winkel dieses Dreiecks bei C wegen des
Winkelsummensatzes und dem rechten Winkel des Dreiecks ABC bei B gleich
dem Winkel β bei A im Dreieck AEB. Der Punkt F entsteht als Schnittpunkt
der Geraden CD und AE. Dies liefert nun
|BD| = sin α sin β
und
|AE| = cos α cos β,
woraus sich
cos(α + β) = |AF | = |AE| − |F E| = cos α cos β − sin α sin β
ergibt. Damit ist das erste Additionstheorem bewiesen; das zweite lässt sich auf
ähnliche Weise herleiten. •
Aufgaben
50
Aufgabe 38. Geben Sie einen neuen Beweis des Winkelsummensatzes 1.3 mit Hilfe
des Standardskalarproduktes.
Aufgabe 39. Zeigen Sie: Zu gegebenen α, β ∈ R existiert ein φ ∈ R mit
α cos φ + β sin φ = 0.
Berechnen Sie ferner (ohne Taschenrechner!) die Werte
cos π6 , sin π6 , cos π4 , sin π4 , cos π3 , sin π3 ;
was können sie über andere Werte cos πn , sin nπ mit n ∈ N sagen?
Aufgabe 40. Beweisen Sie mit geometrischen Argumenten
cos(φ + π) = − cos(φ)
und
sin(φ + π) = − sin(φ).
Aufgabe 41. Beweisen Sie folgendes Additionstheorem für den Tangens tan =
tan(α + β) =
sin
cos :
tan α + tan β
1 − tan α tan β
für alle reellen α, β, für die diese Formel Sinn macht.
Aufgabe 42. Sei n ≥ 4. Zeigen Sie: Winkel zwischen Diagonalen im n-dimensionalen
Einheitswürfel können verschieden sein. (vgl. mit einem Satz von Thales in Aufgabe 1)
Aufgabe 43. Zeigen Sie, dass es kein gleichseitiges Dreieck mit Eckpunkten in Z
gibt!
2
6. Orthogonalität
Nach Definition des Winkels gilt für das Standardskalarprodukt
π
∠(x, y) =
⇐⇒
hx, yi = 0.
2
Entsprechend heißen zwei Vektoren x, y ∈ Rn orthogonal bzgl. eines (allgemeinen) Skalarproduktes h . , . i, falls hx, yi = 0; in Zeichen: x⊥y. In einem
euklidischen Raum Rn stehen orthogonale Vektoren also senkrecht aufeinander.
Insbesondere gilt für den Nullvektor 0⊥x mit jedem Vektor x. Der Satz des
Pythagoras formuliert sich dementsprechend als
kx + yk2 = kxk2 + kyk2
für x⊥y.
Gegeben eine Teilmenge U ⊂ Rn , heißt
U ⊥ := {v ∈ Rn : hu, vi = 0 für alle u ∈ U }
das orthogonale Komplement von U . Ist etwa U = Rv eine Gerade durch
den Ursprung in der euklidischen Ebene mit v 6= 0, so ist U ⊥ die zu U senkrechte
Gerade durch den Ursprung. Das orthogonale Komplement des Nullvektors ist
der gesamte Raum; umgekehrt ist das orthogonale Komplement des gesamten
Raums ausschließlich der Nullvektor, also {0}⊥ = Rn und (Rn )⊥ = {0}. Ferner
gilt:
Lemma 2.17. Das orthogonale Komplement U ⊥ eines Unterraums U ⊂ Rn
bzgl. eines Skalarproduktes h . , . i ist wieder ein Unterraum.
51
Beweis durch Verifizieren der Unterraumaxiome. Beispielsweise gilt für x, y ∈
U ⊥ auch x + λy ∈ U ⊥ mit λ ∈ R, denn mit hx, ui = hy, ui = 0 für beliebige
u ∈ U gilt
hx + λy, ui = hx, ui + λhy, ui = 0.
Die weiteren Eigenschaften zeigen sich ähnlich. •
Tatsächlich ist U ⊥ stets ein Unterraum (unabhängig davon, ob U ein Unterraum
ist oder nicht).
Zwei Vektoren v, w ∈ Rn heißen parallel, in Zeichen vkw, wenn v oder
w = 0 oder wenn ein λ ∈ R existiert, so dass v = λw. (Man mache sich klar,
dass dies genau zu Satz 2.1 über parallele Geraden passt!) Sei nun v, w ∈ Rn
mit w 6= 0. Dann nennen wir einen Vektor v ′ ∈ Rn die Orthogonalprojektion
von v auf w, wenn v ′ parallel zu w ist und wenn die Normalenkomponente
v⊥ := v − v ′
von v bzgl. w orthogonal zu w ist. Mit der Orthogonalität v⊥ ⊥w ergibt sich
0 = hv − v ′ , wi = hv, wi − λhw, wi
woraus
mit λ =
hv, wi
,
hw, wi
hv, wi
w
hw, wi
folgt. Eine Familie von Vektoren {vj } heißt orthogonal, falls hvj , vi i = 0 für
v′ =
Abbildung 8. Die Orthogonalprojektion v′ von v auf w.
i 6= j; eine solche Familie heißt orthonormal, wenn darüber hinaus stets
kvj k = 1 gilt. Eine orthogonale (orthonormale) Familie, welche eine Basis des
zugrunde liegenden Vektorraumes bildet, nennen wir eine Orthogonalbasis
(Orthonormalbasis).
Beispiel: Die n Standardeinheitsvektoren ej = (0, . . . , 0, 1, 0, . . . 0)t mit einer
1 in der j-ten Komponente und 0 sonst, bilden eine Orthonormalbasis des Rn
bzgl. des Standardskalarproduktes.
52
Satz 2.18. Sei V ein endlich-dimensionaler euklidischer Raum mit Skalarprodukt h . , . i und W ⊂ V ein Unterraum mit Orthonormalbasis {w1 , . . . , wm }.
Dann lässt sich diese zu einer Orthonormalbasis {w1 , . . . , wm , wm+1 , . . . , wn }
von V ergänzen.
Der Beweis ist konstruktiv mit dem Orthonormalisierungsverfahren von
Gram-Schmidt: OBdA sei W eine echte Teilmenge von V und v ∈ V \ W .
Wir definieren
v ′ := hv, w1 iw1 + . . . + hv, wm iwm .
Der Vektor v ′ ist hier die Orthogonalprojektion von v auf W (s.o.) Mit w := v−v ′
ist w 6= 0 (da v ′ ∈ W und v ∈ V \ W ). Es gilt
1 falls k = ℓ,
(2)
hwk , wℓ i =
0 sonst.
Damit folgt nun
hw, wk i = hv, wk i − hv ′ , wk i = hv, wk i − hhv, w1 iw1 + . . . + hv, wm iwm , wk i
= hv, wk i − (hv, w1 ihw1 , wk i + . . . + hv, wm ihwm , wk i)
= hv, wk i − hv, wk i · 1 = 0
und also w ∈ W ⊥ . Mit wm+1 :=
w
kwk
gilt
w 1
kwm+1 k = kwk = kwk · kwk = 1
und also ist {w1 , . . . , wm , wm+1 } eine orthonormale Familie. Außerdem ist diese
Familie linear unabhängig, denn aus λ1 w1 + . . . + λm+1 wm+1 = 0 mit Skalaren
λj folgt durch Einsetzen und (2)
0 = h0, wk i = hλ1 w1 + . . . + λm+1 wm+1 , wk i
= λ1 hw1 , wk i + . . . + λm+1 hwm+1 , wk i = λk .
Damit bildet {w1 , . . . , wm , wm+1 } eine Orthonormalbasis der linearen Hülle
W ′ := LIN(w1 , . . . , wm , wm+1 ) von w1 , . . . , wm , wm+1 (also dem von diesen Vektoren erzeugte Unterraum; siehe Lineare Algebra). Falls W ′ = V sind wir fertig;
andernfalls liefert eine Fortführung dieser Konstruktion mit W ′ statt W nach
endlich vielen Schritten eine solche Orthonormalbasis für V . •
Beispiel: Wir betrachten den R3 mit dem Standardskalarprodukt. Es sei
 
√
1
1  
12 + 12 + 02
√
= 1.
w1 := √
mit
kw1 k =
1
2
2
0
Wählen wir etwa

0
6 LIN(w1 ) = Rw1 =: W,
v :=  0  ∈
1

53
so erhalten wir gemäß dem Gram-Schmidtschen Orthonormalisierungsverfahren
 
0
v ′ = 0 und w = v − v ′ =  0  mit kwk = 1.
1
Entsprechend sei w2 := w und wir fahren fort mit
 
1
′′

v :=
0  6∈ LIN(w1 , w2 ) =: W ′ .
0
Mit der orthogonalen Projektion auf W ′ ,
 +
  *   +  
* 1 
1
1
1
0
0
1
1
 0 , √  1  · √  1  +  0 , 0  ·  0 
v ′′′ :=
2
2
0
0
0
0
1
1
 
1
1 
=
1
2
0
ergibt sich


1
1
1
mit kw′ k = √ .
w′ := v ′′ − v ′′′ =  −1 
2
2
0
√
Zusammen mit w3 = 2w′ bilden w1 und w2 eine Orthonormalbasis des R3 .
Ein euklidischer Raum V ist die orthogonale Summe der Unterräume
V1 , . . . , Vk , falls
V = V1 + . . . + Vk
mit Vi ⊥Vj für i 6= j;
in diesem Fall schreiben wir auch V = V1 ⊥ . . . ⊥Vk . Hierbei steht die Summe
links für die Menge aller Vektoren der Gestalt v = v1 + . . . + vj mit vj ∈ Vj und
Vi ⊥Vj bedeutet, dass vi ⊥vj für alle vi ∈ Vi und vj ∈ Vj gilt. Damit gilt
Satz 2.19. Sei V ein endlich-dimensionaler euklidischer Raum und W ⊂ V
ein Unterraum. Dann gilt
V = W ⊥W ⊥;
dabei ist die Summe sogar direkt, d.h. W ∩ W ⊥ = {0}. Insbesondere gilt
dim V = dim W + dim W ⊥ .
Beweis. Hierzu ergänze man eine Orthonormalbasis B von W mit Hilfe des
Satzes 2.18 zu einer Orthonormalbasis B ′ von V . Dann bilden die Vektoren aus
B ′ \ B eine Orthonormalbasis von V \ W und jeder Vektor dieser Menge ist
offensichtlich orthogonal zu W . •
Aufgaben
54
Aufgabe 44 (Staatsexamen: Frühjahr 2007, Thema 2,
4
Vektorraum R seien die drei Vektoren

 
 
1
1

 2 
 2 


 
v1 = 
 3  , v2 =  2  , v3 = 
3
4
4
Aufgabe 1). Im reellen

1
2 

5 
6
gegeben. Weiter sei V = hv1 , v2 , v3 i ⊂ R der von diesen Vektoren aufgespannte Unterraum.
a) Zeigen Sie, dass v1 , v2 eine Basis von V ist und stellen Sie v3 als Linearkombination von v1 und v3 dar.
4
b) Ergänzen Sie v1 , v2 zu einer Basis von R .
4
c) Bestimmen Sie (bezüglich des Standardskalarprodukts auf R ) eine Ortho4
⊥
normalbasis für das orthogonale Komplement V von V in R .
Aufgabe 45. Zeigen Sie, dass die Menge C der auf dem Einheitsintervall erklärten
Polynome mit reellen Koeffizienten von einem Grad ≤ 5 einen Vektorraum mit der
wie folgt erklärten Addition und skalaren Multiplikation einen Vektorraum bilden: Für
f, g ∈ C und λ ∈ R sei
(f + g)(x) := f (x) + g(x)
(λ · f )(x) := λ · f (x)
und
Was ist die Dimension dieses Vektorraums? Beweisen Sie ferner, dass durch
Z 1
C 2 ∋ (f, g) 7→ hf, gi :=
f (x)g(x) dx
0
ein Skalarprodukt erklärt ist und geben Sie eine Orthonormalbasis an.
n
Aufgabe 46. Seien U, V ⊂ R Untervektorräume. Zeigen sie, dass U ∪ V i.A. kein
Untervektorraum ist, wohl aber U ∩ V und U + V . Gelten diese Aussagen auch in
n
anderen Vektorräumen als R ?
Aufgabe 47. Beweisen Sie (W ⊥ )⊥ = W .
7. Hessesche Normalform
Die Hessesche Normalform hat nichts mit dem Land Hessen zu tun: Otto
Hesse war ein im 19. Jahrhundert lebender, in Königsberg (dem heutigen Kaliningrad) geborener und in München verstorbener Mathematiker, der mit seinen
Vorlesungen und Arbeiten zur analytischen Geometrie dieses Gebiet befruchtete.
Wir erinnern zunächst an den Orthogonalitätsbegriff: Ein Vektor z ∈ Rn
heißt orthogonal zu einer Geraden G ⊂ Rn , falls hz, v1 − v2 i = 0 für alle
v1 , v2 ∈ G. Hier und im Folgenden bezeichne h . , . i stets das Standardskalarprodukt. Wir greifen die Ergebnisse aus Paragraph 2.2 wieder auf.
Beispiel: Die Gerade G sei in der euklidischen Ebene gegeben durch die Gleichung 2x − y = 1 bzw. alternativ durch
0
1
G=
+R·
.
−1
2
55
Ein zum Richtungsvektor w = ( 12 ) orthogonaler Vektor ist offensichtlich w⊥ =
2
( −1
). Es ist kein Zufall, dass dieser aus den Koeffizienten der G definierenden
Abbildung 9. Die Gerade zur Gleichung 2x − y = 1 mit dem Richtungsvektor w und dem hierzu orthogonalen Vektor w⊥ . Das orthognale
Komplement von G ist die Ursprungsgerade G⊥ = IR · w⊥ .
Gleichung abgelesen werden kann, wie der folgende Satz zeigt:
Satz 2.20.
(i) Sei G = v + Rw eine Gerade, dann ist z genau dann orthogonal zu G,
wenn z⊥w.
(ii) Ist G = {(x, y) ∈ R2 : ax + by = c} mit (a, b) =
6 (0, 0), so ist
a
z = ( b )⊥G.
Beweis. Wir beginnen mit (i): Angenommen z⊥G. Mit v, v + w ∈ G folgt dann
z⊥(v + w) − v = w. Umgekehrt gilt für v1 = v + λw, v2 = v + µw ∈ G
hz, v1 − v2 i = hz, λw − µwi = (λ − µ)hz, wi = 0.
Nun zu (ii): Für v1 = ( xy11 ), v2 = ( xy22 ) ∈ G berechnet sich
hz, v1 − v2 i = hz, v1 i − hz, v2 i = (ax1 + by1 ) − (ax2 + by2 ) = c − c = 0,
womit der Satz vollständig bewiesen ist. •
Damit gelingt nun
Satz 2.21 (Normalengleichung). Für 0 6= z ∈ R2 und u ∈ R2 beschreibt
(3)
G := {v ∈ R2 : hz, v − ui = 0}
eine Gerade durch u, die orthogonal zu z ist. Ist umgekehrt G ⊂ R2 eine Gerade,
u ∈ G und z 6= 0 orthogonal zu G, so gilt (3).
56
Der Vektor z heißt dann Normalenvektor zu G; speziell mit dem Normalenz
ergibt sich die bis aufs Vorzeichen eindeutig bestimmte
einheitsvektor n := kzk
Hessesche Normalform
hn, v − ui = 0
welche in der Literatur oft auch als n · (v − u) = 0 geschrieben wird.
Beweis. Sei z = ( ab ), v = ( xy ) und c = hz, ui. Dann gilt
hz, v − ui = hz, vi − hz, ui = ax + by − c.
Nach Satz 2.4 ist G damit eine Gerade. Wegen hz, u − ui = hz, 0i = 0 ist u ∈ G.
Gilt ferner v ∈ G mit v 6= u, so ist w := v − u ein Richtungsvektor von G nach
Satz 2.1 und hz, wi = hz, v − ui = 0, womit z orthogonal zu w und nach Satz
2.20 damit auch zu G ist.
Für den Nachweis der zweiten Aussage sei v ∈ G mit v 6= u. Dann ist
G = v + Rw mit w := u − v. Da z orthogonal zu G ist, gilt hz, wi = 0 nach Satz
2.20. Ferner gilt mit dem bereits Bewiesenen, dass
G′ := {v ′ ∈ R2 : hz, v ′ − ui = 0}
eine Gerade mit u ∈ G′ ist; außerdem zeigt hz, v − ui = −hz, wi = 0, dass v ∈ G′
gilt. Da eine Gerade durch zwei Punkte nach Korollar 2.3 eindeutig bestimmt
ist, folgt G = G′ . •
Nun möchten wir Abstände messen. Wir definieren den Abstand eines
Punktes p von einer Menge (wie etwa einer Geraden) G durch
d(p, G) := inf{d(p, v) : v ∈ G};
dieses Infimum ist im Fall einer Geraden ein Minimum (d.h. das Extremum wird
tatsächlich angenommen), wie folgender Satz zeigt:
Satz 2.22. Sei G ⊂ Rn eine Gerade und p ∈ Rn . Dann existiert genau ein
u ∈ G, so dass p − u orthogonal zu G ist und ferner gilt d(p, G) = d(p, u).
Der senkrechte Abstand ist also minimal!
Beweis. Sei G = v + Rw. Für u = v + λw mit einem reellen λ ist p − u nach
Satz 2.20 genau dann orthogonal zu G, wenn
0 = hp − u, wi = hp − v − λw, wi = hp − v, wi − λhw, wi,
wenn also
hp − v, wi
;
kwk2
an dieser Stelle erinnern wir uns an die Orthogonalprojektion und das GramSchmidtsche Orthogonalisierungsverfahren aus dem vorangegangenen Paragraphen! Damit ist λ und also auch u eindeutig bestimmt und für beliebiges v ∈ G
gilt (p − u)⊥(v − u). Mit dem Satz des Pythagoras folgt
λ=
kp − vk2 = kp − uk2 + ku − vk2 ≥ kp − uk2 ;
die linke Seite ist also genau für v = u minimal. •
57
Der Beweis liefert eine Formel für den Abstand d(p, G): Wegen
(4)
u = v + λw = v +
gilt nämlich
hp − v, wi
w
kwk2
hp − v, wi w
d(p, G) = d(p, u) = kp − uk = p − v −
.
kwk2
Speziell für eine Gerade in der Ebene vereinfacht sich dies folgendermaßen: Sei
z 6= 0 orthogonal zu G ⊂ R2 und u ∈ G, so besteht die Normalengleichung
G = {v ∈ R2 : hz, v − ui = 0}.
Gesucht ist nun ein λ ∈ R, so dass p + λz ∈ G, weil dann
d(p, G) = d(p, p + λz) = kλzk = |λ| · kzk
besteht. Hierbei ist p + λz ∈ G äquivalent zu
0 = hz, p + λz − ui = hz, p − ui + λhz, zi
und damit
|hz, p − ui|
.
kzk
Ist die Gerade gegeben durch G = {(x, y)t ∈ R2 : ax + by = c}, so ergibt sich
via z = ( ab ) 6= 0 und c = hz, ui der minimale Abstand als
|ax0 + by0 − c|
x0
√
d(p, G) =
für p =
.
2
2
y0
a +b
d(p, G) =
Den Abstand eines Punktes von einer Geraden kann man also durch Einsetzen
in die Hessesche
Normalform berechnen! Normieren wir noch z auf Länge eins,
√
kzk = a2 + b2 = 1, so ergibt sich noch einfacher d(p, G) = |ax0 + by0 − c|. Wir
definieren ferner : Das Lot eines Punktes p auf eine Gerade G ist die Gerade
durch p, welche auf G senkrecht steht. Der Fußpunkt f ist der Schnittpunkt
von G und dem Lot (siehe Abbildung 10). Zur Berechnung dieser Größen ist
u.a. (4) nützlich!
Beispiel: Sei G = {(x, y)t ∈ R2 : 2x − y = 1}. Der Punkt (1, 0) hat Abstand
√1 von der Geraden G. In der obigen Form sind übrigens die Achsenabschnitte,
5
also die Schnittpunkte der Geraden mit den Koordinatenachsen leicht als (0, −1)
und ( 21 , 0) abzulesen.
Es gibt auch Normalformen zu Ebenen im R3 . Hier heißt ein Vektor z ∈ Rn
orthogonal zu einer Ebene E ⊂ Rn , falls hz, v1 − v2 i = 0 für alle v1 , v2 ∈ E
gilt. Dabei ist z offensichtlich genau dann orthogonal zu E = v + Rw1 + Rw2 ,
wenn z⊥w1 und z⊥w2 . Ganz ähnlich wie bei Geraden gilt hier
Satz 2.23 (Hessesche Normalform). Sei 0 6= z ∈ R3 und u ∈ R3 , so ist
E = {v ∈ R3 : hz, v − ui = 0}
eine Ebene durch u, welche orthogonal zu z ist. Ist umgekehrt E eine Ebene,
welche u enthält und orthogonal zu z ist, so ist E von obiger Form.
58
Abbildung 10. Punkt p und sein Lot auf eine Gerade G mit Fußpunkt f .
Satz 2.24. Ist E ⊂ R3 eine Ebene durch u, die orthogonal zu z ist, so gilt für
p ∈ R3
|hz, u − pi|
.
d(p, E) =
kzk
Ist speziell
E = {(x, y, z)t ∈ R3 : ax + by + cz = d}
mit gewissen a, b, c, d ∈ R, so gilt
d(p, E) =
|ax0 + by0 + cz0 − d|
√
a2 + b2 + c2
für


x0
p =  y0  .
z0
Für die Beweise verweisen wir auf das Buch von Scheid & Schwarz und diskutieren nun Anwendungen. Die eindeutige Achsenabschnittsform der Ebene
E ist von der Form
E = {(x, y, z)t ∈ R3 : αx + βy + γz = 1}
mit entsprechenden Koeffizienten α, β, γ. Diese Darstellung liefert unmittelbar
die Schnittpunkte von E mit den Koordinatenachsen: Gilt etwa α, β, γ 6= 0, so
sind diese gegeben durch ( α1 , 0, 0), (0, β1 , 0) und (0, 0, γ1 ); falls etwa α = 0 gülte,
verliefe E parallel zur x-Achse.
Beispiel (Herbst 2005, Thema 1, Aufgabe 3): Im euklidischen Raum R3 mit
den Koordinaten x, y, z seien zwei Ebenen E1 und E2 gegeben durch ihre Gleichungen
E1 : x + y = 1,
E2 : y + z = 1.
Bestimmen Sie den Abstand des Nullpunktes (0, 0, 0) ∈ R3
a) von der Ebene E1 ,
b) von der Schnittgerade L = E1 ∩ E2 .
59
Kurze Beweisskizze: Zu a): Die Ebene E1 besitzt die Darstellung




 
2
1
0





E1 =
+R
+R 0 
−1
−1
0
0
1
und also den
Normalenvektor

1
 1 
0

der Länge kzk =
√
2.
Nach entsprechender Normierung ist also die Hessesche Normalform von E1
gegeben durch die folgende lineare Gleichung
1
√ (x + y − 1) = 0.
2
Damit errechnet sich der Abstand des Nullpunktes von E1 als
1
1
d(0, E1 ) = √ |0 + 0 − 1| = √ .
2
2
Zu b): Die Schnittgerade L berechnet sich durch Lösen des durch L = E1 ∩ E2
definierten Gleichungssystems explizit als


 
1
0
L =  1  + R  −1  .
1
0
 
1
1
Der Fußpunkt des Lotes berechnet sich als 3
2 , womit sich der gesuchte
1
Abstand d(0, L) =
√
6
3
ergibt.
Aufgaben
Aufgabe 48. Gegeben eine Parabel und ein Punkt P außerhalb der Parabel. Bestimmen
Sie den Punkt Q auf der Parabel, der minimalen Abstand zum Punkt P hat. Wie groß
ist die Länge der Strecke P Q? (alte Aufgabe aus dem vergangenen Semester!)
Aufgabe 49 (Herbst 2008, Thema 3, Aufgabe 5). In der euklidischen Ebene R
werde das Dreieck mit den Eckenanzahl
A = (0, 0),
B = (4, 0),
2
C = (0, 3)
betrachtet.
2
a) Es sei t ∈ R und P = (t, t) ∈ R . Bestimmen Sie die Hessesche Normalform der Geradengleichung für die Gerade BC und damit den Abstand d des
Punktes P von der Geraden BC als Funktion von t.
b) Berechnen Sie den Inkreismittelpunkt I des Dreiecks ABC.
c) Berechnen Sie die Berührpunkte A′ ∈ BC, B ′ ∈ CA und C ′ ∈ AB des
Inkreises mit den Dreiecksseiten.
d) Zeigen Sie: Die drei Geraden AA′ , BB ′ und CC ′ treffen sich in einem Punkt.
Aufgabe 50. Beweisen Sie die Sätze 2.23 und 2.24.
60
8. Vektorprodukt und Spatprodukt
Im euklidischen Raum R3 erklären wir ein weiteres Produkt von Vektoren
durch






x2 y 3 − x3 y 2
x1
y1
x × y =  x3 y 1 − x1 y 3 
für x =  x2  , y =  y2  ∈ R3 ;
x1 y 2 − x2 y 1
x3
y3
wir nennen x × y das Vektorprodukt (bzw. Kreuzprodukt) von x und y.
Man verifiziert leicht, dass dieses Produkt schiefsymmetrisch ist:
x × y = −y × x.
Mit dem Vektorprodukt lassen sich lineare Abhängigkeiten entdecken.
Satz 2.25. Es gilt genau dann x × y = 0 mit x, y ∈ R3 , wenn x und y linear
abhängig sind.
Beweis. Mit den üblichen Bezeichnungen für die Koordinaten von x und y ist
x × y = 0 äquivalent zu
x2 y3 − x3 y2 = x3 y1 − x1 y3 = x1 y2 − x2 y1 = 0.
Angenommen, keine der Koordinaten xj , yk verschwindet, so können wir die
drei vorangegangenen Gleichungen umschreiben zu
x3
x1
x2
=
=
,
y2
y3
y1
was aber bedeutet, dass x ein Vielfaches von y ist, so dass die beiden also linear
abhängig sind. Im Falle x = 0 oder y = 0 sind x und y linear abhängig und
ebenso x × y = 0. Es verbleibt nur noch der Fall, dass oBdA x 6= 0, aber x1 = 0.
Aus x × y = 0 folgt dann aber sofort y1 = 0 (da weder x2 noch x3 gleichzeitig
verschwinden). Nun folgt aus x × y = 0 aber
x2 y 2
= 0,
det
x3 y 3
was bekanntlich die lineare Abhängigkeit nach sich zieht, welches wiederum die
lineare Abhängigkeit von x und y impliziert. •
Das Vektorprodukt ist nicht assoziativ, aber bilinear (wie das Skalarprodukt). Neben diesen strukturellen Eigenschaften besitzt es aber noch eine interessante geometrische Eigenschaft:
Satz 2.26. Es seien x, y ∈ R3 .
(i) Sind x und y linear unabhängig, so steht x × y orthogonal zu der von
x und y aufgespannten Ebene.
(ii) Es gilt kx × yk = kxk · kyk · sin φ, wobei φ = ∠(x, y); insbesondere ist
kx × yk der Flächeninhalt des von x und y aufgespannten Parallelogramms.
61
Aussage (i) lässt sich gut bei der Findung Hessescher Normalformen einsetzen!
Ist etwa E = u + Rw1 + Rw2 gegeben, so ist z = w1 × w2 ein zu E orthogonaz
ler Vektor und mit dem Normaleneinheitsvektor n = kzk
entsteht die bis aufs
Vorzeichen eindeutige Hessesche Normalform hn, v − ui = 0.
Beweis. Wir berechnen
hx, x × yi = x1 (x2 y3 − x3 y2 ) + x2 (x3 y1 − x1 y3 ) + x3 (x1 y2 − x2 y1 );
denselben Wert erhalten wir für die Determinante der 3 × 3-Matrix gebildet
von den linear abhängigen Vektoren x, x und y. Entsprechend verschwindet die
Determinante und so auch hx, x × yi = 0. Ganz analog zeigt sich hx × y, yi = 0.
Ferner ist mit seiner Bilinearität das Vektorprodukt auch orthogonal zu jeder
Linearkombination von x und y, was Aussage (i) beweist.
Abbildung 11. Die Berechnung des Flächeninhaltes eines Parallelogramms mit Hilfe des Vektorproduktes.
Für den Beweis von (ii) rechnen wir
kx × yk2 = (x2 y3 − x3 y2 )2 + (x3 y1 − x1 y3 )2 + (x1 y2 − x2 y1 )2
= (x21 + x22 + x23 )(y12 + y22 + y32 ) − (x1 y1 + x2 y2 + x3 y3 )2 )
= kxk2 kyk2 − (kxk · kyk · cos φ)2
= kxk2 kyk2 (1 − (cos φ)2 );
mit dem Satz des Pythagoras für trigonometrische Funktionen, cos2 + sin2 = 1,
ergibt sich die Formel aus (ii). Betrachten wir das von x und y aufgespannte Parallelogramm, so berechnet sich dessen Flächeninhalt über die bekannte
Formel Länge der Grundlinie multipliziert mit der Länge der Höhe als
kxk · kyk sin φ = kx × yk
mit Hilfe des bereits Bewiesenen. •
Beispiel: Gegeben die Vektoren
 
1

x=
2 
0
und

3
y =  4 .
0

62
Dann gilt

 

2·0−0·4
0
x×y =  0·3−1·0  =  0 
1·4−2·3
−2
und
kx × yk = 2.
Damit sind x und y also linear unabhängig. Offensichtlich steht auch x × y
orthogonal auf sowohl x als auch auf y. Ferner ist 2 = kx × yk der Flächeninhalt
des von x und y aufgespannten Parallelogramms. Dieses liegt offensichtlich in
der Ebene
 
 
0
1
E = R  0  + R  1 ;
0
0
hier reduziert sich also das Vektorprodukt auf die Determinante und es gilt die
übliche Formel für den Flächeninhalt des von zwei Vektoren x = ( xx12 ), y = ( yy12 )
in der euklidischen Ebene R2 aufgespannten Parallelogramms, nämlich bis auf
das Vorzeichen

 
 

x1
0
y
1
x1 y 1






± det
=
= x2
×
0
y2 .
x2 y 2
x y −x y
0
0
1 2
2 1
Abbildung 12. Mit Determinante und Vektorprodukt lassen sich
Flächen berechnen. Das
1
| det( −1
)| = 4.
2 2
eingezeichnete
Parallelogramm
hat
Fläche
Wir kommen zu einem weiteren Produkt von Vektoren: Das Spatprodukt
ist definiert durch


x1 y1 z1
det(x, y, z) = det  x2 y2 z2 
x3 y3 z3
63
für






x1
y1
z1
x =  x2  , y =  y2  , z =  z2  ∈ R3 ;
x3
y3
z3
Mit den uns bekannten Rechenregeln für die Determinante (siehe Lineare Algebra) ergeben sich leicht diverse Eigenschaften:
•
•
•
•
det(x, y, z) = 0 wenn und nur wenn x, y, z linear abhängig sind;
det(x, y, z) = det(y, z, x) = det(z, x, y) = − det(z, y, x);
das Spatprodukt ist trilinear;
det(x, y, z) = hx, y × zi = hx × y, zi.
Die letzten Identitäten mit dem Vektorpordukt rechnet man leicht nach. Eine
weitere interessante, vom Koordinatensystem unabhängige und damit geometrische Eigenschaft liefert
Satz 2.27. Der Absolutbetrag des Spatproduktes | det(x, y, z)| ist gleich dem
Volumen des von den Vektoren x, y, z ∈ R3 aufgespannten Parallelepipeds
(bzw. Spates)
Π = {λx + µy + νz ∈ R3 : 0 ≤ λ, µ, ν ≤ 1}.
Beweis. Das Parallelepiped Π ensteht als der konvexe Körper der durch die
Eckpunkte 0, x, y, x + y, z, x + z, y + z, x + y + z definiert ist; die Seitenflächen
sind entsprechende Parallelogramme. Wiederum gemäß der Formel Grundfläche
multipliziert mit der Höhe ergibt sich das Volumen von Π mit Hilfe von Satz
2.26 als
kx × yk · kzk cos φ,
wobei φ der Winkel zwischen z und einer zur Grundfläche orthogonalen Gerade
ist. Damit folgt nunmehr
kx × yk · kzk cos φ = |hx × y, zi| = | det(x, y, z)|,
was zu zeigen war. •
Beispiel: Gegeben seien die Vektoren
 


 
2
0
0





x=
0 ,y =
−3 , z =
1  ∈ R3 ;
0
0
4
diese bilden die Eckpunkte eines Parallelepipeds mit Eckpunkten 0, x, y, x +
y, z, x + z, y + z, x + y + z und Volumen 24 = − det(x, y, z) (siehe Abbildung
13).
Das Spatprodukt kann noch mehr. Seien zwei Geraden Gj = vj + Rwj ⊂ R3
(j = 1, 2) gegeben. Wir wollen den Abstand der beiden Geraden voneinander
messen, also
d(G1 , G2 ) = min{d(u1 , u2 ) : uj ∈ Gj }
64
Abbildung 13. Versuch einer Zeichnung eines dreidimensionalen Objektes auf zweidimensionalem Grund.
bestimmen; es ist anschaulich klar, dass es Punkte uj ∈ Gj gibt, deren Distanz
minimal ist (so dass wir nicht ein Infimum zu bilden haben). Wir berechnen
nun
d(u1 , u2 )2 = kv1 + λ1 w1 − (v2 + λ2 w2 )k2
= hv1 − v1 + λ1 w1 − λ2 w2 , v1 − v1 + λ1 w1 − λ2 w2 i
= kv1 − v2 k2 + 2hv1 − v2 , λ1 w1 − λ2 w2 i − 2λ1 λ2 hw1 , w2 i
+λ21 kw1 k2 + λ22 kw2 k2 .
Wir betrachten diesen Ausdruck als Funktion f zweier Veränderlicher λ1 , λ2
und suchen das Minimum dieser Funktion mit Hilfe der Methoden der Analysis
mehrerer Veränderlicher. Hierzu setzen wir also die partiellen Ableitungen von
f gleich null und erhalten so potentielle Werte für Extrema. Einsetzen derselben
in die Hesse-Matrix, bestehend aus den zweiten partiellen Ableitungen von f ,
liefert dann die Punkte uj ∈ Gj , für die deren Abstand minimal ist. Die Rechnungen gestalten sich jedoch als recht aufwendig! Ein einfaches geometrisches
Argument mit Hilfe des Spatproduktes liefert ebenso
(5)
d(G1 , G2 ) := min{d(u1 , u2 ) : uj ∈ Gj } =
(siehe Aufgabe 53).
| det(v1 − v2 , w1 , w2 )|
kw1 × w2 k
Aufgaben
Aufgabe 51. Zeigen Sie: Die vier Punkte




0
±2
a1,2 =  0  , a3,4 =  ±2 
√
√
2
− 2
65
bilden die Eckpunkte eines regulären Tetraeders. Bestimmen Sie ferner Normalenvektoren zu den vier Seitenflächen. Zeigen Sie außerdem, dass das Tetraeder durch die
folgenden vier Ungleichungen beschrieben wird:
√
√
2x2 + x3 − 2 < 0,
√
√
− 2x2 + x3 − 2 < 0,
√
√
2x1 − x3 − 2 < 0,
√
√
− 2x2 − x3 − 2 < 0.
Aufgabe 52. Beweisen Sie die Grassmann-Identität
x × (y × z) = hx, ziy − hx, yiz
sowie
(x × y) × (z × w) = det(x, z, w)y − det(y, z, w)x.
3
Aufgabe 53. Sei G = v + Rw eine Gerade im R . Zeigen Sie, dass für den Abstand
eines Punktes p von G folgende Formel gilt:
d(p, G) =
k(p − v) × wk
.
kwk
Zeigen Sie ferner Formel (5) für den Abstand zweier Geraden Gj = vj Rwj .
3
Aufgabe 54. Es seien x, y, z ∈ R kollineare Punkte. Zeigen Sie, dass dann
1
6 |h(x
× y, zi|
gleich dem Volumen des Tetraeders mit den Eckpunkten 0, x, y, z ist.
KAPITEL 3
Kegelschnitte
Apollonius (ca. ∗ 262 - † 190 v.Chr.) studierte wohl als Erster die Kegelschnitte. Die drei Kurven, die durch Schnitte eines geraden Kreiskegels mit einer
Ebene entstehen, sind bekanntlich Ellipse, Parabel und Hyperbel. Bei Apollonius finden sich bereits sehr tiefe Resultate zu diesen geometrischen Objekten.
Die Relevanz derselben offenbarte nicht zuletzt Johannes Kepler (ca. ∗ 1571 † 1630) mit seinem ersten Keplerschen Gesetz, welches besagt, dass sich Himmelskörper auf Ellipsen, Hyperbeln und Parabeln bewegen. Und natürlich sind
diese Kegelschnitte Gegenstand der Schulmathematik — ein weiterer Grund
sich mit diesen gut auszukennen!
Abbildung 1. Einige Kreise und Ellipsen – Gegenstände dieser Vorlesung und des täglichen Lebens! Wie lassen sich diese Objekte geometrisch
bzw. algebraisch beschreiben?
1. Quadratische Formen
Ein Polynom q(X) heißt homogen, wenn q(λX) = λd q(X) mit einer nichtnegativen ganzen Zahl d gilt; offensichtlich ist dann d der Grad von q. Ein
homogenes quadratisches Polynom nennen wir eine quadratische Form.
Ein Beispiel einer quadratischen Form ist etwa (x, y) 7→ x2 + 3y 2 . Die Niveaumengen (vgl. Analysis mehrerer Veränderlicher)
Nc = {(x, y) ∈ R2 : x2 + 3y 2 = c}
sind für c > 0 Ellipsen (siehe Abbildung 2).
66
67
Abbildung 2. Kein Stein in einer Pfütze sondern Ellipsen x2 + 3y 2 = c
mit c = 1, 2, . . . , 6
Gegeben ein Skalarprodukt h . , . i, erklären wir durch
q : Rn → R
x 7→ q(x) := hx, xi
die assoziierte quadratische Form. Ist hier n = 2, spricht man von einer
binären quadratischen Form; bei n = 3 von einer ternären, der Anzahl der
Unbekannten (Koordinaten) entsprechend. Wenn q bekannt ist, so lässt sich das
zugehörige Skalarprodukt durch Polarisierung (wie man leicht nachrechnet)
wie folgt gewinnen:
hx, yi = 41 (q(x + y) − q(x − y)).
Beispiel: Gegeben sei die Abbildung
x1
x=
7→ q(x) = x21 + 2x1 x2 + 4x22 .
x2
Polarisierung liefert mit y = ( yy12 ) nach einer länglichen Rechnung
1
4 (q(x
=
+ y) − q(x − y))
1
4 ((x1
+ y1 )2 + 2(x1 + y1 )(x2 + y2 ) + 4(x2 + y2 )2
−((x1 − y1 )2 + 2(x1 − y1 )(x2 − y2 ) + 4(x2 − y2 )2 ))
1 1
y1
;
= (x1 , x2 )
y2
1 4
der letzte Ausdruck definiert gerade das Skalarprodukt aus Beispiel §2.4.
Was für ein geometrisches Objekt steckt hinter der Menge aller x ∈ R2 ,
welche q(x) = 0 genügen? Und welche hinter den Lösungen der Gleichung q(x) =
68
10 etwa? Eine Antwort finden wir (vorerst noch) mit Hilfe eines Computers;
siehe Abbildung 3.
Abbildung 3. Die Menge der (x1 , x2 ), welche der Gleichung x21 +2x1 x2 +
4x22 = 10 genügt: eine Ellipse! Die Gleichung mit rechter Seite = 0 besitzt
nur den Nullpunkt als Lösung.
Übrigens interessiert man sich bei quadratischen Formen oft für das Bild der
Punkte mit ganzzahligen Koordinaten, also q(Zn ). Der Satz von Lagrange (vgl.
Elementare Zahlentheorie?) besagt, dass jede natürliche Zahl sich darstellen
lässt als Summe von vier Quadraten ganzer Zahlen:
N ⊂ q(Z4 )
für q(x) = hx, xi = x21 + x22 + x23 + x24 .
Beispielsweise
2011 = 212 + 272 + 292 = 432 + 2 · 92 .
(die Darstellung ist i.A. nicht eindeutig).
Aufgaben
Aufgabe 55. Zeigen Sie, dass zu jeder quadratischen Form q eine symmetrische Matrix
A gefunden werden kann, so dass q(x) = xt Ax gilt. Geben sie ferner ein Skalarprodukt
an, so dass q die zu diesem Skalarprodukt assoziierte quadratische Form ist. Führen sie
die weiteren Details zu Beispiel 2 aus.
Aufgabe 56. Welche geometrischen Objekte verbergen sich hinter der Menge aller
2
( xy ) ∈ R , welche der Gleichung
x2 + 6λxy + 9y 2 = 0
für λ = −1, 0, +1?
69
2. Kreise und Ellipsen
Kreise sind neben Rechtecken die vielleicht am häufigsten in der Realität
vorkommenden geometrischen Objekte. Während Rechtecke ihrer rechten Winkel wegen maßgebend für Stabilität und Ordnung sind, finden wir Kreise oftmals
im Zusammenhang mit Bewegung. Aber nicht notwendig: Eine gute Frage, die
tatsächlich sehr viel mit Geometrie zu tun hat, ist:
Warum sind Gullydeckel rund?
Ein Kreis ist die Menge aller Punkte, die von einem gewissen Punkt einen
gewissen Abstand besitzt; diesen ausgezeichneten Punkt nennen wir Mittelpunkt und besagter Abstand ist der Radius des Kreises. In der euklidischen
Ebene gilt also für jeden Punkt x = ( xx12 ) auf einem Kreis um den Mittelpunkt
p = ( pp12 ) damit
p
kx − pk = (x1 − p1 )2 + (x2 − p2 )2 ;
nennen wir diesen Abstand bzw. Radius ρ, so gilt also die Kreisgleichung:
(x1 − p1 )2 + (x2 − p2 )2 = ρ2 .
Abbildung 4. Fliesen auf Kreta: Zählen der Steine innerhalb des Viertelkreises und im gesamten Quadrat liefert
3, 04225 . . .
π
4
≈
54
54+17
bzw. π ≈
216
71
=
Die Menge E aller Punkte x ∈ R2 , für welche die Summe der Abstände zu
zwei gegebenen Punkten p, q ∈ R2 konstant gleich 2ρ mit einer positiven reellen
Zahl ρ ist, heißt eine Ellipse. Die Punkte p, q nennt man die Brennpunkte
und 12 (p + q) bezeichnet den Mittelpunkt der Ellipse. Nach Definition ist E
durch die Gleichung
kx − pk + kx − qk = 2ρ
70
beschrieben. Hier und im Folgenden bezeichne h . , . i bis auf Weiteres das Standardskalarprodukt und k . k die zugehörige euklidische Norm. Mit der Dreiecksungleichung folgt aus obigem kp − qk ≤ 2ρ. Im Falle p = q fallen die beiden
Brennpunkte zusammen und wir erhalten einen Kreis mit Mittelpunkt p (bzw.
q) vom Radius ρ (s.o.). Falls kp − qk = 2ρ gilt, so entartet unsere Ellipse zur
Verbindungsstrecke der Punkte p und q. Im Folgenden nehmen wir deshalb
kp − qk < 2ρ
(6)
an. Ferner können wir durch eine Translation stets unsere Ellipse so verschieben,
dass der Mittelpunkt im Ursprung zu liegen kommt (dass also q = −p gilt).
Satz 3.1. Die Ellipse E = {x ∈ R2 : kx − pk + kx + pk = 2ρ} besteht genau
aus den Punkten x ∈ R2 , für die
ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 )
(7)
gilt. Insbesondere ist kxk ≤ ρ.
Beweis. Quadrieren der E definierenden Gleichung liefert
kx − pk · kx + pk = 2ρ2 − kxk2 − kpk2 ;
man beachte, dass der Ausdruck rechts nicht-negativ ist. Erneutes Quadrieren
liefert
(kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 ,
welches nach Ausmultiplizieren der Terme auf die Gleichung (7) führt. Hierbei
ist aber die Nebenbedingung
kxk2 + kpk2 ≤ 2ρ2
zu beachten (um eine positive rechte Seite in der allerersten Formel zu haben).
Mit Hilfe der Cauchy-Schwarzschen Ungleichung für das Skalarprodukt
hp, xi2 ≤ kpk2 kxk2
ergibt sich aus (7)
kxk2 (ρ2 − kpk2 ) ≤ ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 ),
und wegen kpk < ρ ebenso kxk ≤ ρ, so dass also die Nebenbedingung bereits
aus der E definierenden Gleichung folgt. •
Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den
Mittelpunkt nennen wir die Achsen der Ellipse. Die Schnittpunkte derselben
mit der Ellipsen heißen Scheitelpunkte und die Strecken zum Mittelpunkt
werden Halbachsen genannt. Die Ellipse kann in einem kartesischen Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu
liegen kommen. Hierbei verstehen wir unter einer Bewegung eine Abbildung, die
den Abstand zwischen beliebigen Punkten invariant lässt (wie etwa Translationen oder Drehungen; solche Abbildungen werden uns später noch eingehend
71
beschäftigen). In diesem Fall lässt sich die Ellipse auch durch eine quadratische Gleichung beschreiben: Mittels x = ( xx12 ) und p = ( σ0 ) liefert eine einfache
Rechnung
Korollar 3.2. Nach einer geeigneten Bewegung kann eine Ellipse E beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung
2 2
x1
x2
+
= 1;
α1
α2
p
genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = ρ2 − σ 2 und die
Brennpunkte sind ±( σ0 ).
Man beachte, dass auf der linken Seite eine quadratische Form steht.
Abbildung 5. Und noch eine Ellipse.
Einen Kreis zeichnet man mit einem Zirkel. Aber wie zeichnet man eine
Ellipse? Gemäß der Definition besteht eine Ellipse aus der Menge aller Punkte,
deren Abstandssumme zu zwei ausgezeichneten Punkten konstant ist. Entsprechend spannen wir einen geschlossenen Faden der Länge 2σ + 2ρ durch einen
Bleistift um die Punkte p und q in der euklidischen Ebene und lassen den
Bleistift wandern. Dies liefert damit eine Ellipse mit Brennpunkten p, q und
Abstandssumme 2ρ und σ = 12 kp − qk. Die Fadenkonstruktion, auch Gärtnerkonstruktion genannt, wird Anthemios (im fünften Jahrhundert n. Chr.) zugeschrieben. (Siehe auch Abbildung 5.)
Sei nun α1 ≥ α2 . Die Exzentrizität
s
2
α2
ǫ := 1 −
α1
misst die Abweichung einer Ellipse von einem Kreis. Es gilt 0 ≤ ǫ < 1 und ǫ = 0
steht für die Gleichheit der Längen der beiden Halbachsen, also den Fall eines
Kreises.
72
Der Umfang U einer Ellipse lässt sich i.A. nicht explizit angeben. Was
im Spezialfall des Kreises eine leichte Übungsaufgabe in der Analysis ist (vgl.
Analysis mehrerer Veränderlicher), führt bei der Ellipse mit Hilfe der Parametrisierung durch trigonometrische Funktionen
x1 = α1 cos φ,
x2 = α2 sin φ
auf ein so genanntes elliptisches Integral
Z
Z πq
2
2
2
2
α1 (sin φ) + α2 (cos φ) dφ = 4α1
U =4
0
0
π
2
p
1 − (ǫ sin φ)2 dφ,
welches i.A. keine elementare Stammfunktion besitzt! Für den Flächeninhalt A
einer Ellipse gilt die Formel∗
A = πab.
Noch kurz sei hier auf das wohl älteste Problem der Analysis verwiesen:
Das Problem der Dido fragt nach dem maximalen Flächeninhalt, den eine
geschlossene Kurve in der Ebene umschließen kann. Die so genannte isoperimetrische Ungleichung besagt
4πA ≤ ℓ2 ,
wobei ℓ die Bogenlänge der geschlossenen Kurve ist und A die Fläche des hiervon
berandeten Gebietes (vgl. Analysis mehrerer Veränderlicher).† Im Spezialfall
eines Kreises besteht Gleichheit. Dido war die legendäre Gründerin und erste
Königin von Karthago (bei Tunis im heutigen Tunesien).
Aufgaben
Aufgabe 57. Recherchieren Sie den mathematischen Begriff kissing number und
2
geben Sie einen geometrischen Beweis, dass diese Größe im R gleich sechs ist!
Aufgabe 58. Es sei E eine Ellipse und Q ein Quadrat mit Kanten parallel zu den
Achsen von E und Eckpunkten auf E. Berechnen Sie den Flächeninhalt von Q.
Aufgabe 59. Sei die Ellipse E gegeben als die Menge aller ( xy ), welcher der Gleichung
y2
x2
+ 2 =1
2
α
β
genügen, wobei α ≥ β > 0 gelte. Zeigen Sie, dass die Tangente an den Punkt u = ( wv ) ∈
E gegeben ist durch die Gerade
!
w
−α
β
u+R
.
β
αv
Aufgabe 60. Suchen Sie im Internet nach dem Begriff Gleichdick und geben Sie eine
kurze Erläuterung dieses mathematischen Begriffes!
∗
Der Nachweis läuft über den Integrationssatz von Green und ist nicht trivial.
Der Beweis ist schwierig und wurde erst im neunzehnten Jahrhundert erbracht
†
73
3. Hyperbeln und Parabeln
Die Hyperbel ist eine nahe Verwandte der Ellipse. Die Hyperbel ist definiert als die Menge H aller Punkte x ∈ R2 , für welche der Betrag der Differenz
der Abstände zu zwei verschiedenen Punkten p, q ∈ R2 konstant gleich 2ρ ist.
Also
kx − pk − kx − qk = ±2ρ.
Die Punkte p, q heißen wiederum Brennpunkte und 21 (p + q) ist der Mittelpunkt. Sofern H nicht die leere Menge ist, gilt vermöge der Dreiecksungleichung
2ρ ≤ kp − qk =: 2σ.
Gilt kp − qk = 2ρ bzw. ρ = 0, so entartet die Hyperbel zur Geraden pq durch p
und q. Im Folgenden nehmen wir deshalb
0 < 2ρ < kp − qk
(8)
an. Wie bei der Ellipse können wir durch eine geeignete Bewegung unsere Hyperbel so verschieben, dass der Mittelpunkt im Ursprung zu liegen kommt (dass
also q = −p gilt).
Satz 3.3. Die Hyperbel H = {x ∈ R2 : kx − pk − kx + pk = ±2ρ} besteht genau
aus den Punkten x ∈ R2 , für die
(9)
ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 )
gilt. Insbesondere ist kxk ≥ ρ.
Man beachte, dass die Gleichungen für die Ellipse (7) und für die Hyperbel (9)
identisch sind, jedoch wegen der unterschiedlichen Bedingungen (6) und (8) zu
unterschiedlichen geometrischen Objekten führt!
Beweis. Die H definierende Gleichung quadriert schreibt sich als
−kx − pkkx + pk = 2ρ2 − kpk2 − kxk2 ;
die rechte Seite ist also nicht positiv. Weiteres Quadrieren liefert
(kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 ,
wobei nun die Nebenbedingung also (entsprechend der ersten Formel)
2ρ2 ≤ kxk2 + kpk2
lautet. Durch Termumformung entsteht hieraus nun (9). Aus (9) folgt wiederum
mit der Cauchy-Schwarzschen Ungleichung
kxk2 (ρ2 − kpk2 ) ≤ ρ2 (ρ2 − kpk2 );
wegen 0 < ρ < kpk nach (8), ergibt sich nun ρ ≤ kxk und die Nebenbedingung
folgt also wiederum aus der definierenden Gleichung. •
Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den
Mittelpunkt nennen wir die Achsen der Hyperbel. Die Schnittpunkte derselben
mit der Hyperbel heißen Scheitelpunkte die Strecken zum Mittelpunkt werden Halbachsen genannt. Natürlich kann die Hyperbel in einem kartesischen
74
Abbildung
6. Die Hyperbel x2 − 3y 2 = 1 mit ihren beiden Asymptoten
√
x±
3y = 0. Wo liegen die Brennpunkte?
Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu liegen kommen. In diesem Fall lässt sich die Hyperbel auch durch eine
quadratische Gleichung beschreiben:
Korollar 3.4. Nach einer geeigneten Bewegung kann eine Hyperbel H beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung
2 2
x2
x1
−
= 1;
α1
α2
p
genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = σ 2 − ρ2 und die
Brennpunkte sind ±( σ0 ).
Man beachte, dass auf der linken Seite wiederum eine quadratische Form steht.
Im Gegensatz zur Ellipse steht hier (der Definition entsprechend) die Differenz
zweier Quadrate!
Die Hyperbel ist ein unbeschränktes Objekt in dem Sinne, dass sie nicht
Teilmenge einer beschränkten Menge ist (wie die Ellipse). Die Asymptoten
der Hyperbel ergeben sich als die Geraden, die den Lösungen der verwandten
Gleichgung
2 2 x2
x1
x1
x2
x2
x1
−
=
−
+
0=
α1
α2
α1 α2
α1 α2
75
15
10
5
-5
5
15
10
20
-5
-10
-15
Abbildung 7. Die Hyperbel X 2 − 2Y 2 = 1; die ganzzahligen Punkte
sind fett eingezeichnet, wie etwa (x, y) = (3, 2).
entsprechen, also
A± :
α2 x1 ± α1 x2 = 1.
An diese schmiegen sich die Hyperbeläste nämlich mit wachsendem x1 bzw.
x2 zusehends an. Beim Zeichnen von Hyperbeln ist es sinnvoll, zunächst die
Asymptoten zu zeichnen und dann erst die sich anschmiegenden Hyperbeläste.
Wir hatten beobachtet, dass die trigonometrischen Funktionen sin und cos
die Ellipse parametrisieren. Deren hyperbolische Varianten, der Sinus hyperbolicus und der Kosinus hyperbolicus
sinh φ = 12 (exp(φ) − exp(−φ))
und
cosh φ = 21 (exp(φ) + exp(−φ)),
führen via x1 = α1 cosh φ und x2 = α2 sinh φ auf die Gleichung:
2 2
x2
x1
−
= (sinh φ)2 − (cosh φ)2 = 1.
α1
α2
Die algebraische Gleichung links beschreibt eine Hyperbel gemäß Korollar 3.4.
Mit der Pellschen Gleichung X 2 − dY 2 = 1 hatten wir tatsächlich Beispiele
von Hyperbeln in der Elementaren Zahlentheorie kennen gelernt. Dort hatten
wir bewiesen, dass auf solchen Hyperbeln stets unendlich viele Punkte mit ganzzahligen Koordinaten liegen sofern d ∈ N kein Quadrat ist, wie etwa (3, 2) auf
der Hyperbel
X 2 − 2Y 2 = 1
76
(siehe Abbildung 7). Durch Quadrieren ergeben sich weitere Lösungen:
√
√
(3 + 2 2)2 = 17 + 12 2,
und durch Potenzieren sogar alle Lösungen, u.a. auch die Lösung√x = 99 und
2 gewinnen
y = 70, aus der man die rationale Approximation xy = 99
70 an
kann. Diese wird beim Din A4-Format benutzt, um annähernd die gewünschte
Inavrianz des Längenverhältnis beim Falten zu realisieren!
Die Parabel P ist die Menge aller Punkte x ∈ R2 , die gleichen Abstand
von einer Geraden G und einem Punkt p ∈ R2 \ G haben, d.h.
P := {x ∈ R2 : d(x, G) = kx − pk}
und 2ρ := d(p, G) > 0.
Dabei heißt G die Leitlinie und p der Brennpunkt von P . Ist G als die
Menge aller x gegeben, die he, xi = c mit einem Einheitsvektor e ∈ G (also der
Länge kek = 1) und einer gewissen Konstanten c erfüllt, so lässt sich P mit der
Hesseschen Normalform wie folgt darstellen:
|he, xi − c| = kx − pk
mit 2ρ = |he, pi − c|.
Der Scheitelpunkt ist die Mitte des Lotes von p auf G; mit Hilfe einer geeigneten Translation liegt dieser im Nullpunkt und die Parabel P besitzt die
Darstellung
kxk2 − he, xi2 = 4ρhe, xi.
Hieraus gewinnt man nun die Normalform
x2 = αx21
für die Punkte x = ( xx12 ) ∈ P .
Abbildung 8. Eine Parabel P mit Leitlinie G; Lichtstrahlen durch den
Brennpunkt p werden an P orthogonal zur Leitlinie reflektiert.
Ellipsen und Parabeln besitzen interessante optische Eigenschaften, welche
u.a. den Begriff Brennpunkt erklären. Sei E eine Ellipse mit Brennpunkten p
und q. Dann wird jeder von q ausgehende Lichtstrahl an E so reflektiert, dass er
schließlich durch p geht (gemäß dem physikalischen Gesetz, dass Ausfalls- und
77
Einfallswinkel identisch sind). Bei der Parabel P gibt es eine erstaunliche Reflexionseigenschaft zu vermerken: Alle Lichtsrahlen, die orthogonal zur Leitlinie
einfallen, werden an P so reflektiert, dass sie durch den Brennpunkt gehen. Dies
wird insbesondere bei Parabolantennen ausgenutzt!
Aufgaben
Aufgabe 61. Wie könnte eine Fadenkonstruktion der Hyperbel bzw. der Parabel aussehen?
Aufgabe 62. Beweisen Sie die Aussagen über die Eigenschaften von Lichtstrahlen aus
einem Brennpunkt einer Ellipse bzw. aus einer Parabel.
2
Aufgabe 63. Gegeben sei die Parabel durch die Gleichung y = αx2 in R mit einem
0 6= α ∈ R. Berechnen Sie die Leitlinie und den Brennpunkt.
4. Die orthogonale Gruppe
”Geometrie ist die Invariantentheorie von Transformationen.”
schrieb Felix Klein in seinem Erlanger Programm. Entsprechend interessieren
wir uns im Folgenden für spezielle Abbildungen, welche die Lage eines geometrischen Objektes in der Ebene oder im Raum verändern, dabei jedoch das Objekt
an sich unverändert lassen (wie etwa eine Translation um einen Vektor). Wir
beginnen hierzu mit einem Beispiel in der Ebene: Die Abbildung
x1
−x2
f : R2 ∋ x =
7→ f (x) := x⊥ =
x2
x1
0 −1
∈ R2×2 beschreiben:
lässt sich durch die Matrix A :=
1 0
x1
x1
x1
−x2
0 −1
x=
7→ A
=
=
= f (x).
1 0
x2
x2
x2
x1
Insbesondere ist also f eine lineare Abbildung. Was geschieht mit Vektoren
unter f ? Speziell für die Standardeinheitsvektoren e1 = ( 10 ) und e2 = ( 01 ) des
R2 beobachten wir
Ae1 = e2
und
Ae2 = −e1 ,
bzw.
f (Re1 ) = Re2
und
f (Re2 ) = −Re1 = Re1 .
Da eine lineare Abbildung bereits durch die Bilder einer Basis eindeutig festgelegt ist (siehe lineare Algebra), folgt, dass f eine Drehung um einen rechten
Winkel im mathematischen Umlaufsinn (entgegen dem Uhrzeigersinn) mit Fixpunkt im Ursprung ist (siehe Abbildung 9). Insbesondere werden Ursprungsgeraden auf Ursprungsgeraden abgebildet. Übrigens folgt hieraus sofort, dass
A keine reellen Eigenwerte besitzen kann, denn für einen reellen Eigenwert λ
gäbe es nach Av = λv mit passenden Eigenvektoren v 6= 0 eine Gerade, nämlich
Rv, die invariant unter Anwendung von A wäre, was aber für unsere Drehung
unmöglich ist.
78
Abbildung 9. Eine Drehung f um 90 Grad um den Ursprung; jede Ursprungsgerade G wird auf eine um einen rechten Winkel gedrehte Ursprungsgerade f (G) abgebildet.
Tatsächlich ist die Matrix A der Prototyp einer orthogonalen Matrix,
welche also AAt = E (mit der passenden Einheitsmatrix E) erfüllt. Es gilt
nämlich:
1 0
0 0
0 −1
t
= E.
=
AA =
0 1
−1 0
1 0
Wir wiederholen Wissenswertes über solche Matrizen aus der linearen Algebra:
Satz 3.5. Für A ∈ Rn×n sind äquivalent:
(i)
(ii)
(iii)
(iv)
(v)
(vi)
A ist orthogonal,
At ist orthogonal,
A ist invertierbar und es gilt A−1 = At ,
die Spaltenvektoren von A haben Länge eins und sind orthogonal,
es gilt kAvk = kvk für alle v ∈ Rn ,
es gilt hAv, Awi = hv, wi für alle v, w ∈ Rn .
Ist dies der Fall, dann gilt det A = ±1 und reelle Eigenwerte von A sind ∈ {±1}.
Wir wiederholen den Beweis: Ist A orthogonal, dann gilt AAt = E und mit
dem Determinantenmultiplikationssatz folgt
1 = det E = det(AAt ) = det A · det At = (det A)2
und also det A = ±1. Also ist jede orthogonale Matrix A invertierbar und wegen
AAt gilt A−1 = At , was (iii) impliziert. Ferner ergibt sich durch Transposition
E = (AAt )t = (At )t At .
Also ist At ebenso orthogonal und (ii) folgt somit aus (i) bzw. die umgekehrte
Implikation aus dem bereits Gezeigten. Ebenso impliziert (ii) unmittelbar (iii).
Die Äquivalenz von (i) und (iv) beweisen wir nur für den Spezialfall n = 2 und
79
K = R: Wir schreiben A = (w1 , w2 ) mit Spaltenvektoren wj ∈ R2 . Mit den
Rechenregeln für Matrizen zeigt sich dann
t
t kw1 k2 hw1 , w2 i
w1 w1 w1t w2
w1
t
=
.
(w1 , w2 ) =
E = AA =
hw1 , w2 i kw2 k2
w2t w1 w2t w2
w2t
Also folgt kwj k = 1 und hw1 , w2 i = 0. (Der allgemeine Fall geht analog.) Ferner
impliziert (i) auch (v), denn
kAvk2 = (Av)t (Av) = v t At Av = vv t = kvk2 .
Aus (v) folgt (vi), denn eine kurze Rechnung zeigt
kAvk2 + 2hAv, Awi + kAwk2 = kA(v + w)k2 = kv + wk2 = kvk2 + 2hv, wi + kwk2 .
Nach Subtraktion von kAvk2 = kvk2 und kAwk2 = kwk2 ergibt sich die Aussage.
Schließlich folgert man noch (i) aus (vi) mit Wahl der kanonischen Einheitsvektoren. Gilt nun eine dieser Eiegnschaften, ist also A orthogonal, so gilt nach
(iv) für einen Eigenwert λ von A wegen Av = λv mit einem Eigenvektor v
insbesondere
kvk = kAvk = kλvk = |λ| · kvk;
wegen v 6= 0 folgt hieraus |λ| = 1, was den Beweis abschließt. •
Sei O(Rn ) die Menge aller orthogonalen n × n-Matrizen A mit Einträgen
aus R; es gilt also At A = E. Nach dem gerade bewiesenen Satz ist O(Rn ) eine
multiplikative Gruppe, die so genannte orthogonale Gruppe des Vektorraums
Rn (vgl. Lineare Algebra). Tatsächlich wird mit dieser Notation die Aktion der
orthogonalen Matrizen auf Vektoren des Rn gemäß Aussage (v) des Satzes betont: Matrizen induzieren lineare Abbildungen und – umgekehrt – existiert zu
jeder linearen Abbildung f eine Matrix A, so dass
f (v) = Av
für v ∈ Rn .
Tatsächlich gibt nun jede orthogonale Matrix A vermöge dieser Vorschrift Anlass
zu einer linearen Abbildung f , welche die Eigenschaft
(10)
hf (v), f (w)i = hv, wi
für alle
v, w ∈ Rn
besitzt. Entsprechend nennen wir einen Endomorphismus f : Rn → Rn orthogonal, falls die vorangegangene Bedingung (10) erfüllt ist. Es gilt folgender
Satz 3.6. Für eine orthogonale Abbildung f : Rn → Rn gelten:
(i) kf (v)k = kvk für alle v ∈ V ;
(ii) ist λ ein Eigenwert von f (d.h. f (v) = λv für ein v 6= 0), so ist
|λ| = 1;
(iii) es ist genau dann v⊥w, wenn f (v)⊥f (w);
(iv) f ist injektiv.
Gemäß (iii) sind die Bilder orthogonaler Vektoren unter solchen Abbildungen f
wieder orthogonal, welches die Namensgebung orthogonale Abbildung rechtfertigt.
80
Der Beweis ergibt sich leicht aus Satz 3.5: Beispielsweise entspricht (i) Aussage (v) aus Satz 3.5 (und die weiteren Details seien dem Leser/der Leserin
überlassen). Alternativ kann man aber auch einfach die Definition orthogonaler
Abbildungen benutzen: So gilt wegen (10)
kf (v)k2 = hf (v), f (v)i = hv, vi = kvk2
für beliebiges v. Wurzelziehen liefert nun (i). Ähnliches gilt für die anderen
Behauptungen. •
Aufgaben
n×n
Aufgabe 64. Eine Matrix A ∈ R
ist genau dann orthogonal, wenn mit jeder
n
Orthonormalbasis {v1 , . . . , vn } auch {Av1 , . . . , Avn } eine Orthonormalbasis des R ist.
Beweisen Sie dies für den Fall n = 2.
Aufgabe 65. Komplettiere den Beweis von Satz 3.6.
5. Drehungen in der Ebene und im Raum
Wir kehren nun zunächst zum Spezialfall orthogonaler 2×2-Matrizen zurück
und untersuchen die etwas allgemeinere Abbildung x 7→ D(α)x mit der Matrix
cos α − sin α
D(α) :=
,
sin α cos α
wobei α ∈ R ein fester Parameter sei. Tatsächlich ist D(α) eine orthogonale
Matrix:
cos α − sin α
cos α sin α
t
D(α)D(α) =
=E
sin α cos α
− sin α cos α
mit Hilfe des Satzes von Pythagoras; ferner gilt det D(α) = +1 unabhängig von
α. Wir definieren
cos α
e(α) =
.
sin α
Dann gilt offensichtlich e(α)⊥e(α ± π2 ) und es besteht die Polarkoordinatendarstellung x = kxke(α) für Vektoren 0 6= x ∈ R2 mit einem Winkel α ∈ [0, 2π).
Allgemeiner liefert das Additionstheorem 2.16 (mit −β statt β)
he(α), e(β)i = cos(α − β).
Nun sei noch
cos α sin α
S(α) :=
sin α − cos α
für α ∈ R. Offensichtlich ist auch S(α) eine orthogonale Matrix, jedoch mit
Determinante det Sα = −1. Wir berechnen wiederum mit Hilfe des Additionstheorems 2.16
D(α)e(β) = e(α + β)
und
D(α)D(β) = D(α + β)
und
D(α)S(β) = S(α + β)
und
S(α)e(β) = e(α − β),
S(α)S(β) = D(α − β),
S(α)D(β) = S(α − β).
81
Abbildung 10. Links: eine Drehung um den Winkel α durch Anwendung der Drehmatrix D(α) auf den Vektor e(β) auf dem Einheistkreis.
Rechts: Eine Spiegelung an der y-Achse vermöge S(π).
Diese Berechnungen führen zu
Satz 3.7. Die Abbildung x 7→ D(α)x beschreibt eine Drehung in R2 um den
Winkel α (im mathematischen Umlaufsinn‡) mit Fixpunkt im Nullpunkt; ferner
beschreibt x 7→ S(α)x eine Spiegelung in R2 an der Geraden Re( α2 ). Ferner ist
jede orthogonale 2 × 2-Matrix A von dieser Form und es gilt
det A = +1
det A = −1
⇐⇒
A = D(α),
⇐⇒
A = S(α)
mit einem passendem α ∈ [0, 2π).
Beweis. Es verbleibt lediglich noch zu zeigen, dass jede orthogonale Matrix
A ∈ R2×2 entweder von der Form D(α) oder von der Form S(α) mit einem passenden Parameter α ist, je nachdem ob det A = +1 oder −1; die Determinantenbedingung ergibt sich hierbei sofort aus der Definition von D(α) und S(α).
Nach Satz 3.5 (iv) besitzt A orthogonale Spaltenvektoren w1 , w2 der Länge eins.
Mit w1 = ( xy ) folgt aus kw1 k = 1 zunächst x2 + y 2 = 1 und mit Hilfe der Stetigkeit der trigonometrischen Funktionen ergibt sich die Existenz eines reellen
α, so dass die Darstellung w1 = e(α) besteht. Hieraus folgt
∓ sin α
⊥
π
,
w2 = w1 = e(α ± 2 ) =
± cos α
was wegen A = (w1 , w2 ) auf A = S(α) oder A = D(α) führt und den Beweis
abschließt. •
Die orthogonalen A ∈ O(Rn ) mit det A = +1 bildet eine Untergruppe, die
spezielle orthogonale Gruppe SO(Rn ). Speziell im euklidischen Raum R3
werden Drehungen um die z-Achse vermöge der Matrizen


cos α − sin α 0
∆(α) =  sin α cos α 0 
0
‡
also entgegen dem Uhrzeigersinn
0
1
82
realisiert, wobei α ∈ R der Drehwinkel ist. Mit
f : R3 → R3 ,
x 7→ f (x) = ∆(α)x
berechnet sich nämlich leicht f (Re3 ) = Re3 mit dem Standardeinheitsvektor
et3 = (0, 0, 1); d.h. die z-Achse wird tatsächlich von f fest gelassen und die
Projektion auf die xy-Ebene ist nichts anderes als die Drehung D(α) in der
Ebene. Ganz ähnlich lassen sich Drehungen um die x- bzw. y-Achse beschreiben.
Tatsächlich gibt es für eine Drehung des R3 insgesamt drei Freiheitsgrade: zwei
für die Drehachse und einen für den Drehwinkel. Für die spezielle orthogonale
Gruppe SO(R3 ) aller Matrizen A ∈ O(R3 ) mit det A = 1 gilt
Satz 3.8. Jede Drehung in R3 um eine Ursprungsgerade lässt sich darstellen
als x 7→ Ax mit A ∈ SO(R3 ) (also det A = +1). Ist A ∈ SO(R3 ), so gibt es
Winkel α, β, γ ∈ [0, 2π), so dass




cos α − sin α 0
1
0
0
cos γ − sin γ 0
A =  sin α cos α 0   0 cos β − sin β   sin γ cos γ 0  .
0
0
1
0 sin β cos β
0
0
1
Ferner induziert jedes A ∈ SO(R3 ) eine Drehung in R3 .
Für den Beweis sei jeweils auf das Buch von Fischer verwiesen.
Beispiel (Frühjahr 2007, Thema 1, Aufgabe 3): Es seien ϕ1 und ϕ2 die Drehungen um die x-Achse bzw. um die z-Achse des R3 mit
 
 
 
 
0
0
1
1
1
1
ϕ1 :  0  7→ √  1  und ϕ2 :  0  7→ √  1  .
2
2
1
1
0
0
a) Zeigen Sie, dass die Hintereinanderausführung ϕ1 ◦ ϕ2 eine Drehung
ist.
b) Zeigen Sie, dass ϕ1 ◦ ϕ2 durch die Matrix

 1
√
√1
−
0
2
2
 1
1
√1 
 2
2
2 
− 21 − 12 √12
gegeben wird.
c) Bestimmen Sie die Drehachse von ϕ1 ◦ϕ2 sowie den Cosinus des Drehwinkels α.
Die den Drehungen ϕj assoziierten Abbildungsmatrizen Aj ∈ R3×3 sind orthogonal mit det Aj = 1. Insbesondere ist die Abbildungsmatrix A = A1 · A2
der Komposition ϕ := ϕ1 ◦ ϕ2 wiederum orthogonal mit det A = 1 (nach dem
Determinantenmultiplikationssatz (vgl. Lineare Algebra bzw. mit der Gruppeneigenschaft). Entsprechend ist ϕ eine Drehung, was für a) zu zeigen war. Für
die Drehung ϕ1 um die x-Achse ist die zugehörige Abbildungsmatrix von der
83
Gestalt


1
0
0
A1 =  0 cos α1 − sin α1 
0 sin α1 cos α1
mit einem Drehwinkel α1 . Wegen
 
 
  

0
0
0
0
1
√  1  = ϕ1  0  = A1  0  =  − sin α1 
2
1
1
cos α1
1
ergibt sich

1
0
 0 √1
A1 = 
2
0 − √12
0
√1
2
√1
2



(und α1 = − π4 ). Da ϕ2 eine Drehung um die z-Achse ist, besitzt A2 die Gestalt


cos α2 − sin α2 0
A2 =  sin α2 cos α2 0 
0
0
1
mit einem Drehwinkel α2 . Hier berechnet sich
 1
√
− √12
 √12
√1
A2 =  2
2
0
0
ganz analog

0

0 
1
(und also α2 = π4 ), womit sich nun leicht die explizite Form von A aus b)
errechnen lässt. Es verbleibt c): Die Drehachse GA besteht aus den Fixpunkten
von ϕ; aus der entsprechenden Gleichung ϕ(v) = v bzw. Av = v folgt, dass die
Drehachse also mit dem Eigenraum zum Eigenwert 1 von A übereinstimmt (vgl.
lineare Algebra). Wir berechnen demzufolge diesen Eigenraum durch Lösen des
homogenen linearen Gleichungssystems (A − 1 · E)v = 0 als


−1√
GA = R ·  −1 + 2  .
1
Für den Drehwinkel α von ϕ gilt nun (vgl. nachstehenden Satz 3.9)
1 1
1
1
1
1
1
cos α = (Spur(A) − 1) = ( √ + + √ − 1) = √ − .
2
2 2 2
2
2 4
Eine weitere orthogonale 3 × 3-Matrix ist für α ∈ R gegeben durch


−1
0
0
∇(α) :=  0 cos α − sin α  .
0 sin α cos α
Diese liegt offensichtlich nicht in SO(R3 ), sondern vielmehr induziert sie
vermöge f : x 7→ f (x) = ∇(α)x eine Drehspiegelung, d.h. eine Drehung
um die x-Achse um einen Winkel α und Spiegelung an der Ebene yz-Ebene.
84
Legen wir übrigens eine Orthonormalbasis {v1 , v2 , v3 } des R3 zugrunde, so beschreiben die obigen Matrizen




cos α − sin α 0
−1
0
0
∆(α) =  sin α cos α 0 
und
∇(α) :=  0 cos α − sin α  .
0
0
1
0 sin α cos α
eine Drehung um den Winkel α mit Drehachse Rv1 bzw. eine Drehspiegelung
um Rv1 und Spiegelung an der Ebene Rv2 + Rv3 . Durch einen geeigneten Basiswechsel lassen sich Drehungen und Spiegelungen also mit sehr einfachen Matrizen beschreiben! Tatsächlich wird eine Drehung um den Winkel α um eine
Ursprungsgerade GA = Rn in R3 mit einem Einheitsvektor nt = (n1 , n2 , n3 )
durch x 7→ Ax beschreiben, wobei
(11)
A=
cos α + n21 (1 − cos α)
n2 n1 (1 − cos α) + n3 sin α
n3 n1 (1 − cos α) − n2 sin α
n1 n2 (1 − cos α) − n3 sin α
cos α + n22 (1 − cos α)
n3 n2 (1 − cos α) + n1 sin α
n1 n3 (1 − cos α) + n2 sin α
n2 n3 (1 − cos α) − n1 sin α
cos α + n23 (1 − cos α)
.
Abschließend betrachten wir Drehungen in höherdimensionalen Räumen;
dabei wird auch die Argumentation zu Ende des vorangegangenen Beispiels
erläutert: Allgemeiner als in Ebenen und dem dreidimensionalem Raum gilt
nämlich
Satz 3.9. Jede Drehung in R3 um eine Ursprungsgerade GA lässt sich darstellen
vermöge x 7→ Ax mit einer Matrix A ∈ SO(R3 ) (also det A = +1); dabei ergibt
sich die Drehachse GA als der Eigenraum zum Eigenwert λ = 1 von A:
GA = {v ∈ R3 : (A − E)v = 0}
und der Drehwinkel α vermöge
hw, Awi = kwk · kAwk cos α,
wobei w⊥GA , bzw. alternativ aus der Spur der Drehmatrix 1 + 2 cos α.
Beweis. (Wie bereits in dem obigen Beispiel angedeutet:) Die Drehachse GA
einer Drehung x 7→ Ax besteht aus den Vektoren v, die unter A festgelassen
werden, für die also
Av = v = 1 · v
gilt; jedes solche v 6= 0 ist also ein Eigenvektor zum Eigenwert λ = 1 von A.
Diese Gerade GA ist also identisch dem Eigenraum von A zum Eigenwert 1:
GA = {v ∈ R3 : (A − E)v = 0}.
Die Aussage über den Drehwinkel ergibt sich leicht aus den Eigenschaften des
Skalarproduktes und für den restlichen Beweis verweisen wir auf das Buch von
Fischer. •
Insbesondere besitzt nach dem vorangegangenen Beweis jede Matrix A ∈
SO(R3 ) also den Eigenwert 1 (aus rein geometrischen Gründen!). Man beachte
aber, dass der zugehörige Eigenraum nicht notwendig eindimensional ist, also
85
keine eindeutige Drehachse existieren muss, denn beispielsweise ist auch die Eingeitsmatrix (welche den ganzen Raum invariant lässt) eine spezielle orthogonale
Matrix: E ∈ SO(Rn ).
Wir schließen mit einer sportlichen Anwendung :-)
Korollar 3.10 (Satz vom Fußball). Beim Anstoß zur ersten und zur zweiten Halbzeit eines jeden Fussballspiels gibt es mindestens zwei Punkte auf der
Oberfläche des Spielgerätes, die identisch im Raum liegen!
Beweis. Die Lage des Balles zu Beginn der zweiten Halbzeit hat sich gegenüber
seiner Lage zu Beginn der ersten durch eine Drehung des Raumes verändert,
welche sich durch eine Matrix A ∈ SO(R3 ) beschreiben lässt. Nach Satz 3.9
besitzt A den Eigenwert 1, so dass die Drehung also eine Gerade Rv mit einem
Eigenvektor v zum Eigenwert 1 fest lässt. Der Schnitt dieser Gerade mit der
Oberfläche des Fußballes liefert die gesuchten Fixpunkte. •
Aufgaben
Aufgabe 66. Verifizieren Sie D(α)D(β) = D(α + β) und schlussfolgern Sie die Additionstheoreme aus Satz 2.16.
Aufgabe 67 (Frühjahr 2000, Thema 1, Aufgabe 2). Es ist

1 −8
1
A=
−8 1
9
−4 −4
3

−4
−4 
7
3
und ϕ : R → R , x 7→ Ax, die zu A gehörige lineare Abbildung. Zeigen Sie, dass ϕ
a) orthogonal ist,
b) eine Spiegelung an einer Ebene ist.
Aufgabe 68 (Frühjahr 2004, Thema 3, Aufgabe 5). Gegeben sei die Abbildung
3
3
ρ : R →R ,




x
y+1
 y →
7  x .
z
1−z
Zerlegen Sie ρ in eine Drehung δ und eine Translation τ so, dass ρ = τ ◦ δ. Bestimmen
Sie die Achse der Drehung δ und den Kosinus des Drehwinkels von δ.
n
Aufgabe 69. Zeigen Sie: Die spezielle orthogonale Gruppe SO(R ) bildet einen RVektorraum der Dimension 21 n(n − 1).
Aufgabe 70. Beweisen Sie Formel (11). Zeigen Sie für die entsprechende Drehung
ebenso die Darstellung
x 7→ nhn, xi + cos α(n × x) × n + sin α(n × x).
86
6. Euklidische Bewegungen
Sei Rn zusammen mit einem Skalarprodukt h . , . i ein euklidischer Raum.
Wir wollen zwei geometrische Objekte als nicht wesentlich verschieden ansehen,
wenn sie durch eine Abbildung f : Rn → Rn ineinander überführt werden
können (vgl. etwa die Bewegungen der Ellipse in Satz 3.1, so dass der Mittelpunkt im Nullpunkt zu liegen kommt). Entsprechend nennen wir eine solche
Abbildung f eine (euklidische) Bewegung (bzw. Isometrie oder Kongruenzabbildung in einiger Literatur), falls
kf (x) − f (y)k = kx − yk
für alle
x, y ∈ Rn ,
wenn also die Abstände zwischen irgendwelchen Punkten invariant bleibt.
Ein erstes und auch offensichtliches Beispiel sind Translationen (bzw. affine Abbildungen), welche vermöge
tb : Rn → Rn , x 7→ x + b
mit einem beliebigen Punkt b ∈ Rn definiert sind. Weitere spezielle Bewegungen
sind Drehungen und Spiegelungen (siehe §3.5). Der nachstehende Satz klassifiziert euklidische Bewegungen:
Satz 3.11. Die Bewegungen der euklidischen Ebene Rn sind genau die Abbildungen
f : Rn → Rn ,
x 7→ f (x) = Ax + b
mit einer orthogonalen Matrix A ∈ O(Rn ) und b ∈ Rn .
Bis auf Translationen sind Bewegungen also orthogonale und insbesondere lineare Abbildungen!
Beweis. Zunächst ist jede Abbildung der obigen Gestalt sicherlich eine Bewegung, denn für f (x) = Ax + b mit A ∈ O(Rn ) rechnet sich mit Satz 3.5 leicht
nach:
kf (x) − f (y)k = kAx + b − (Ay + b)k = kA(x − y)k = kx − yk
für beliebige x, y ∈ Rn . Ist nun g irgendeine Bewegung von Rn , so dürfen wir
oBdA annehmen, dass g(0) = 0 gilt (nach Anwendung einer entsprechenden
Translation). Dann folgt aus der Definition
(12)
kg(x)k = kxk
und
hg(x), g(y)i = hx, yi;
erstes gewinnt man aus der Definition mit g(y) = g(0) = 0 = y und letzteres
gewinnt man aus dem Satz des Pythagoras
−h< g(x), g(y)i = hg(x), −g(y)i
=
=
2
2
1
2 (kg(x) − g(y)k − kg(x)k
2
2
2
1
2 (kx − yk − kxk − kyk )
= hx, −yi = −hx, yi
− kg(y)k2 )
87
und anschließender Multiplikation mit −1. Hieraus ergibt sich wiederum mit
dem Satz des Pythagoras und mühsamer Rechnung
kg(x + y) − g(x) − g(y)k2
= kg(x + y)k2 − 2hg(x + y), g(x)i − 2hg(x + y), g(y)i +
+2hg(x), g(y)i + kg(x)k2 + kg(y)k2
= kx + yk2 − 2hx + y, xi − 2hx + y, yi +
+2hx, yi + kxk2 + kyk2
= 0,
was sofort g(x + y) = g(x) + g(y) impliziert. Analog folgt g(λx) = λg(x), womit
g also ein Endomorphismus des Rn ist. Damit existiert eine Matrix A ∈ Rn×n
mit g(x) = Ax und (12) liefert kAxk = kxk für alle x. Mit Satz 3.5 zeigt sich,
dass A orthogonal ist. •
Insbesondere ist wegen der Invertierbarkeit orthogonaler Matrizen eine Bewegung f also stets eine bijektive Abbildung! Ist nämlich f gegeben durch
x 7→ f (x) = Ax + b mit A ∈ O(Rn ), also als Komposition (bzw. Hintereinanderschaltung) f = tb ◦ dA mit der Translation x 7→ tb (x) = x + b und einer
orthogonalen Abbildung x 7→ dA (x) = Ax, so ergibt sich die Umkehrabbildung
−1
−1 = At (bzw.
als f −1 = d−1
A ◦t−b , wobei dA die entgegengesetze Drehung mit A
Umkehrabbildung von dA ) ist, denn
t
−1
= d−1
f −1 (Ax + b) = (d−1
A (Ax) = A Ax = x.
A ◦ t−b )(Ax + b) = f
Bei linearen Abbildungen entspricht die Hintereinanderschaltung von Abbildung
der Multiplikation der Abbildungsmatrizen. Deren Gruppenstruktur im Falle
orthogonaler Matrizen legt folgenden Satz nahe:
Satz 3.12. Die Menge Iso(Rn ) aller euklidischen Bewegungen des Rn bilden eine Gruppe bzgl. der Komposition ◦ von Abbildungen; sie heißt die Bewegungsbzw. Isometriegruppe des Rn . Die Menge aller Translationen bildet eine
kommutative Untergruppe; die Menge der orthogonalen Abbildungen ist eine
nicht-kommutative Unterguppe, nämlich die derjenigen Bewegungen, die den
Ursprung als Fixpunkt besitzen.
Beweis. Gegeben zwei euklidische Bewegungen f, g ∈ Iso(Rn ), dann ist die
Abbildung g ◦ f wohldefiniert und es gilt
k(g ◦ f )(x) − (g ◦ f )(y)k = kg(f (x)) − g(f (y))k = kf (x) − f (y)k = kx − yk
für alle x, y ∈ Rn . Damit ist g ◦ f ∈ Iso(Rn ). Die Identität id : x 7→ x ist
das neutrale Element bzgl. der Komposition: id ◦ f = f ◦ id = f für jedes
f ∈ Iso(Rn ). Ferner ist jede Bewegung f eine bijektive Abbildung, wie wir
bereits oben angemerkt hatten; die somit existente Umkehrabbildung f −1 ist
das zu f inverse Element bzgl. der Komposition, denn
(f ◦ f −1 )(x) = f (f −1 (x)) = x
bzw. f ◦ f −1 = id
88
sowie analog f −1 ◦ f = id. Die restlichen Eigenschaften zum Nachweis, dass
Iso(Rn ) eine Gruppe ist, seien dem Leser/der Leserin zur Übung überlassen.
Ebenso zeigt sich, dass die Menge der Translationen bzw. die Menge der orthogonalen Abbildungen jeweils eine Untergruppe bilden; hier ist die zu tb inverse
Abbildung gegeben durch t−b , welche offenbar wiederum eine Translation ist.
Die Komposition beliebiger Bewegungen ist i.A. nicht kommutativ, wie etwa
das Beispiel einer Drehung f um den Winkel π2 um den Ursprung und einer
Spiegelung g an der Geraden Re1 zeigt: So ist
(f ◦ g)(e1 ) = f (g(e1 ) = f (e1 ) = e2 6= −e2 g(e2 ) = g(f (e1 )) = g ◦ f (e1 ).
Für die Untergruppe der Translationen hingegen gilt offensichtlich
(tb ◦ tc )(x) = tb (x + c) = x + c + b = tc (x + b) = (tc ◦ tb )(x),
womit sich die Kommutativität ergibt. •
Abschließend untersuchen wir geometrische Abbildungseigenschaften von
Bewegungen: Offensichtlich bleiben Distanzen zwischen Punkten und dsomit
auch Längen unverändert. Wie sieht es mit Winkeln aus? Wir erinnern, dass
der Winkel α = ∠(v, w) zwischen zwei Vektoren v, w ∈ Rn durch
cos α =
hv, wi
kvk · kwk
gegeben ist (siehe §2.5). Entsprechend nennen wir eine Abbildung f winkeltreu, wenn sie die Winkel zwischen Geraden invariant lässt, also stets
hf (v), f (w)i
hv, wi
=
kf (v)k · kf (w)k
kvk · kwk
(13)
erfüllt ist. Eine unmittelbare Konsequenz dieser Definition ist
Korollar 3.13. Eine Bewegung ist winkeltreu.
Beweis folgt sofort mit f statt g aus (13) und (12) im Beweis von Satz 3.11. •
Aufgaben
n
n
Aufgabe 71. Zeigen Sie: f : R → R ist genau dann eine Bewegung, wenn f bijektiv
ist, die längentreu und geradentreu ist, also Längen invariant lässt und Geraden auf
Geraden abbildet.
Aufgabe 72 (Frühjahr 2006, Thema 2, Aufgabe 4). Gegeben seien die Vektoren
 
 
 
1
0
0
3
e1 =  0  , e2 =  1  , e3 =  0  ∈ R .
0
0
1
3
3
Weiter sei f : R → R linear mit
f (e1 ) = e2 ,
f (e2 ) = e3 ,
f (e3 ) = e1 .
a) Zeigen Sie, dass f eine Drehung ist. Bestimmen Sie die Drehachse von f
und den Cosinus des Drehwinkels α von f .
89
b) Bestimmen Sie das Bild von e1 unter der Spiegelung g1 an der Ebene
 
1
E1 = Re3 + R  1  .
1
c) Schreiben Sie f als Produkt von zwei Spiegelungen an Ebenen.
n
n
Aufgabe 73. Zeigen Sie: Eine lineare Abbildung f : R → R ist genau dann winkeltreu, wenn λf orthogonal ist für ein λ > 0.
n
Aufgabe 74. Vervollständigen Sie den Beweis von Satz 3.12. Warum ist O(R ) keine
kommutative Untergruppe?
* Wiederholung: Eigenwerte und Diagonalisierbarkeit *
Wir wiederholen aus der linearen Algebra: Gegeben eine quadratische Matrix A ∈ Rn×n , heißt λ ∈ R (bzw. C) ein Eigenwert von A, falls
Av = λv
für ein
v ∈ Rn \ {0};
in diesem Fall nennt man v einen Eigenvektor zum Eigenwert λ. Man beachte
hier, dass der Nullvektor v = 0 ausgeschlossen ist (weil die Gleichung Av = λv
sonst mit beliebigem λ lösbar ist). Weil
Av = λv
⇐⇒
(A − λE)v = 0
mit
v 6= 0
äquivalent dazu ist, dass A−λE keinen vollen Rang besitzt, sind die Eigenwerte
genau die Nullstellen des charalteristischen Polynoms
χA (λ) = det(λE − A).
Beispiel: Die Drehmatrizen D(α) besitzen das charakteristische Polynom
χD(α) (λ) = λ2 − 2λ cos α + 1, und nur für ganzzahlige Vielfache von π existieren
reelle Nullstellen, wenn also die Drehung die Identität oder eine Spiegelung ist
(vgl. §3.5). Es gibt aber komplexe Eigenwerte: im Fall α = π2 etwa λ = ±i.
Ist λ ein Eigenwert von A, so berechen sich die die Eigenvektoren zu λ
durch das Lösen des homogenen linearen Gleichungssystems (A − λE)v = 0.
Der Lösungsraum ist mindestens eindimensional (bereits aufgrund der Existenz
eines v 6= 0) und heißt Eigenraum zum Eigenwert λ:
EigA (λ) = {v ∈ Rn : (A − λE)v = 0},
und genau die vom Nullvektor verschiedenen Elemente des Eigenraumes sind
Eigenvektoren zu λ. Es gibt also stets viele Eigenvektoren!
Beispiel: Sei


10
5
10
1 
A=
5 −14
2 .
15
10
2
−11
90
Dann rechnet man leicht nach, dass A eine orthogonale Matrix ist (also AAt = E
gilt). Insbesondere bedeutet dies, dass die Spaltenvektoren von A eine Orthonormalbasis des R3 bilden! Das charakteristische Polynom berechnet sich (mühsam)
als


λ − 32
− 31
− 23
14
2
 = (λ − 1)(λ + 1)2 .
χA (λ) = det  − 31
λ + 15
− 15
2
11
2
− 15
λ + 15
−3
Wir sagen: A besitzt die Eigenwerte λ1 = +1 und λ2 = −1 mit der algebraischen Vielfachheit 1 bzw. 2 je nachdem mit welcher Vielfachheit der
Linearfaktor λ − λj im charakteristischen Polynom auftritt. Die Eigenräume zu
diesen Eigenwerten berechnen sich mit Hilfe der Gauß-Elimination leicht als
 




5
0
1
EigA (+1) = R  1 
und
EigA (−1) = R  −2  + R  −1  ,
2
1
−2
sind also eine Gerade und eine Ebene, also mit geometrischer Vielfachheit
dim EigA (λj ) = 1 bzw. 2. Da diese geometrischen Vielfachheiten mit den algebraischen übereinstimmen, ist A diagonalisierbar.
Hierbei heißt eine Matrix A ∈ Rn×n diagonalisierbar, wenn eine invertierbare Matrix S ∈ Rn×n existiert, so dass


λ1


..
S −1 AS = 
;
.
λn
hierbei stehen in der Diagonalen rechts die Eigenwerte λj von A und sonst
lauter Nullen. Aber nicht jede Matrix kann in diese Gestalt gebracht werden:
Beispielsweise sind Drehmatrizen D(α) nur in den Spezialfällen α = mπ mit
m ∈ Z diagonalisierbar (weil keine reellen Eigenwerte existieren). Tatsächlich
ist A genau dann diagonalisierbar, wenn es eine Basis des Rn bestehend aus
Eigenvektoren von A gibt; in diesem Fall bilden die Spalten der Transformationsmatrix S eine Orthonormalbasis!
Beispiel (von oben): Wir finden eine Orthonormalbasis des R3 von Eigenvektoren
 




5
0
1
1
1
1
√  1  , √  −2  , √  −1 
30
5
6
2
1
−2
und bilden entsprechend die Matrix
 5
√

S=
30
√1
30
√2
30
0
− √25
√1
5
√1
6
− √16
− √26


;
91
Dann berechnet sich tatsächlich


+1 0
0
S −1 AS = S t AS =  0 −1 0  .
0
0 −1
Hier durften wir S −1 durch S t ersetzen, weil S orthogonal ist.
7. Bewegungen in der Ebene
Wir wollen die spezielle Situation in der Ebene etwas genauer betrachten:
Zunächst fragen wir nach Punkten, die unter einer Bewegung invariant sind.
Beispielsweise lässt die Punktpiegelung an p ∈ R2 , gegeben durch
f : x 7→ 2p − x
(bzw. in der Form f (x) = −Ex + 2p in der Form von Satz 3.11), genau den
Punkt x = p fest. Andererseits fixiert eine Translation x 7→ x + b mit b 6= 0
keinen Punkt. Für eine genauere Analyse nennen wir eine Bewegung x 7→ Ax+b
eigentlich, wenn A ∈ SO(Rn ) (also det A = 1) gilt; ansonsten, wenn also
det A = −1 gilt, heißt die Bewegung uneigentlich. Eigentliche Bewegungen
bewahren die natürliche Orientierung des Rn , uneigentliche drehen sie um.
Satz 3.14. Sei f : R2 → R2 eine eigentliche Bewegung gegeben durch x 7→
f (x) = Ax + b.
(i) Ist f keine Translation, so besitzt f genau einen Fixpunkt p, nämlich
p = (E − A)−1 b; die Bewegung beschreibt in diesem Fall eine Drehung
um den Punkt p.
(ii) f ist durch die Bilder zweier verschiedener Punkte eindeutig festgelegt.
Beweis. Nach Satz 3.11 und Satz 3.7 ist
cos α − sin α
A = D(α) =
sin α cos α
für ein α ∈ [0, 2π). Für Ap + b = p bzw. (E − A)p = b ist ein lineares Gleichungssystem zu lösen, welches genau dann lösbar ist, wenn 0 6= det(E − A) =
2(1 − cos α) bzw. α 6= 0 gilt. In diesem Fall ist E − A invertierbar und es gilt
p = (E − A)−1 b. Dies beweist (i).
Für den Nachweis von (ii) seien f und g zwei eigentliche Bewegungen mit
f (p) = g(p) und f (q) = g(q) für p, q ∈ R2 mit p 6= q. Wir betrachten die
eigentliche Bewegung
h = g−1 ◦ f
mit
h(x) = Ax + b;
hierbei benutzen wir Satz 3.11 und, dass jede Bewegung umkehrbar ist, also die
Umkehrabbildung g−1 existiert. Dann gilt h(p) = g −1 (f (p)) = p und ebenso
h(q) = q. Damit folgt
p − q = h(p) − h(q) = Ap + b − (Aq + b) = A(p − q).
92
Weil A nach Annahme eine Drehung ist und p − q 6= 0, ergibt sich A = E. Somit
ist b = 0 und also h = id bzw. f = g. •
Für uneigentliche Bewegungen ist die Aussage des Korollars offensichtlich falsch,
denn eine Spiegelung an einer Geraden lässt jeden Punkt dieser Gerade fest.
Auch gelten nicht die analogen Aussagen im R3 , wie etwa die Drehmatrizen
∆(α) aus §3.5 zeigt, welche die komplette Gerade Re3 festlassen.
Satz 3.15 (Dreispiegelungssatz). Die Bewegungsgruppe Iso(R2 ) aller euklidischen Bewegungen der Ebene R2 wird von Spiegelungen erzeugt; genauer gilt:
jedes f ∈ Iso(R2 ) ist eine Komposition von höchstens drei Spiegelungen.
Beweis. Eine Bewegung f ∈ Iso(R2 ) ist eindeutig durch f (0) und die orthogonalen Spaltenvektoren in ihrer Abbildungsmatrix A = (w1 , w2 ) bestimmt. Ist f
gemäß Satz 3.11 gegeben durch f (x) = Ax+b mit orthogonalen Spaltenvektoren
w1 , w2 , also A = (w1 , w2 ), dann gelten
f (0) = b
und
f (ej ) = (w1 , w2 )ej + b = wj + b
für j = 1, 2 (mit den üblichen Standardbasiseinheitsvektoren e1 , e2 des R2 ).
Nun spiegeln wir zunächst die Ebene R2 an der Mittelsenkrechten von 0 und
f (0). Dann wird das abgebildete Orthonormalsystem e1 , e2 durch eine oder zwei
Abbildung 11. Bilder zum Dreispiegelungssatz.
Spiegelungen an Geraden durch f (0) = b in das Orthogonalsystem f (e1 ) =
w1 + b, f (e2 ) = w2 + b überführt (siehe Abbildung 11). •
Nun klassifizieren wir die Bewegungen der Ebene:
Satz 3.16. Jede Bewegungen der Ebene lässt sich einem der folgenden Typen
zuordnen:
• die Identität: id : x 7→ x,
• Translation: tb : x 7→ x + b mit einem b ∈ R2 ,
93
• Drehung: x 7→ D(α)x mit D(α) ∈ SO(R2 ),
• Spiegelung an einer Geraden,
• Gleitspiegelung, d.h. einer Kombinationen einer Spiegelung an einer Geraden G und einer Translation um einen Vektor b 6= 0 parallel
zu G.
Beweis. Die jeweiligen Typen sind disjunkt.§ Wir betrachten die Menge der
Fixpunkte einer Bewegung f ; es gelten:
• f lässt alle Punkte des R2 fest
⇐⇒ f = id,
• die Menge der Fixpunkte von f ist eine Gerade
⇐⇒ f ist eine Spiegelung an einer Geraden,
• f lässt die Geraden einer Schar von Parallelen fest, besitzt aber keine
Fixpunkte
⇐⇒ f ist eine Translation,
• f besitzt genau einen Fixpunkt
⇐⇒ f ist eine Drehung um den Ursprung,
• f führt genau eine Gerade in sich über, besitzt aber keine Fixpunkte
⇐⇒ f ist eine Gleitspiegelung.
Diese Äquivalenzen gelten, weil f als Bewegung Abstände, Parallelität und Orthogonalität erhält. Es verbleibt also zu zeigen, dass auch stets mindestens einer
dieser Typen auftritt. Hierzu verwenden wir den vorangegangenen Satz: Ist f
eine Komposition von null Spiegelungen, so ist f die Identität, ist f hingegen die
Komposition von einer Spiegelung, so ist f eine Spiegelung an einer Geraden. Ist
f Komposition von zwei Spiegelungen, so ist f vom Typ eine Translation oder
Drehung. Es verbleibt der Fall, dass f eine Komposition von drei Spiegelungen
ist; dabei dürfen wir annehmen, dass die Geraden, an denen gespiegelt wird,
keinen gemeinsamen Punkt besitzen und nicht parallel sind Dann lässt sich f
aber darstellen als f = d ◦ s, wobei s eine Spiegelung an einer Geraden G ist
und d eine Drehung um einen Punkt p 6∈ G mit Drehwinkel 2α. Dann lassen
sich zwei Geraden G1 , G2 konstruieren, für die s(G1 ) = G2 und d(G2 ) = G1
gelten, woraus f (G1 ) = G1 folgt: Diese Geraden schneiden sich in einem Punkt
q ∈ G, dem Fußpunkt des Lotes von p auf G und schneiden beide die Gerade
G unter dem Winkel α. Wegen f (q) 6= q fixiert f die Gerade G1 aber nicht
punktweise; sie hat damit insebsondere keinen Fixpunkt auf G1 . Weil zudem f
nicht orientierungserhaltend ist, kann f keine Translation sein, weshalb f also
eine Gleitspiegelung ist. •
Wir räumen noch mehr auf: Eigentliche Bewegungen der Ebene sind jede Parallelverschiebung, jede Drehung um einen Punkt der Ebene und die Punktspiegelung als Sonderfall einer Drehung um π. Uneigentliche Bewegungen sind
§
Hierbei gibt es jedoch Beispiele von Bewegungen, die verschiedenen Typen zugehören,
wie etwa eine Drehung um 2π um den Ursprung gleich der Identität ist; jedoch sind die Typen
trotzdem disjunkt.
94
demzufolge jede Achsenspiegelung und jede Gleitspiegelung bestehend aus eine
Achsenspiegelung gefolgt von einer Translation längs dieser Achse.
Identifizieren wir einmal mehr die euklidische Ebene R2 mit der komplexen
Zahlenebene C (wie schon desöfteren), so können wir fragen, welche komplexen
Funktionen f die euklidischen Bewegungen liefern? Translationen sind hier er√
klärt durch Abbildungen z 7→ tb (z) := z + b, wobei nun z = x + iy mit i = −1
für eine komplexe Veränderliche steht und b ∈ C eine beliebige komplexe Zahl
sei. Drehungen um einen Winkel α um den Ursprung (die komplexe Zahl null)
ergeben sich vermöge z 7→ dα (z) := z exp(iα) (wie man unschwer mit Hilfe
der Polarkoordinaten sieht). Eine Rotation um einen Punkt w ∈ C mit einem
Winkel α ergibt sich durch Hintereinanderschaltung
tw ◦ dα ◦ t−w
und die Translationen und Rotationen der euklidischen Ebene lassen sich also
durch die komplexen Funktionen
z 7→ f (z) := az + b
mit
a, b ∈ C, |a| = 1
charakterisieren.
Aufgaben
Aufgabe 75. Gegeben ein reguläres Sechseck, wieviele Bewegungen existieren, die dieses Sechseck auf sich abbilden?
Aufgabe 76. Zeigen Sie, dass die Abbildung
f : x 7→ x − 2
hx − a, w⊥ i ⊥
w
hw, wi
eine Geradenspiegelung an der Geraden G = a+Rw ist (wobei w⊥ ein zu w orthogonaler
Vektor ist). Beschreiben Sie f ferner in der Form von Satz 3.11.
Aufgabe 77. Beweisen Sie, dass eine eigentliche Bewegung f genau dann eine Drehung um den Punkt p ist, wenn
2
kf (x) − pk = kx − pk
für alle x ∈ R gilt.
Aufgabe 78. Für welche Bewegungen f der Ebene gilt f ◦ f = id?
Aufgabe 79. Gegeben reelle Zahlen a, b, c, d mit ad−bc = 1 betrachten wir für komplexe
Zahlen z die Abbildungen
z 7→ M (z) :=
az + b
cz + d
für
z 6= −
d
c
(falls c 6= 0). Wie werden Kreise bzw. Geraden in C unter M abgebildet? Was können
Sie über die Hintereinanderschaltung von zwei solchen Abbildungen sagen? Zeigen Sie,
dass die Abbildung M umkehrbar ist und die Umkehrabbildung von ähnlicher Gestalt
ist!
95
*** Weihnachtsvorlesung ***
Wieso vertauschen Spiegel links und rechts, aber nicht oben und unten?
Diese Frage stellt sich beim morgendlichen Blick in den Spiegel. Aber eigentlich
stimmt diese Behauptung überhaupt nicht. Tatsächlich vertauscht ein Spiegel
nämlich vorne und hinten! Um dies einzusehen, mache man sich klar, dass beim
Betrachten des Spiegelbildes sich der Betrachter um die eigene vertikale Achse
um den Winkel π (also 180 Grad) dreht und dabei nach wie vor mit derselben
Hand zuwinkt (wenn denn gewunken wird; siehe Abbildung 12). Hingegen werden vorne und hinten vertauscht, denn unsere Nasenspitze und ihr Spiegelbild
sind sich nun näher als unser Hinterkopf und sein Spiegelbild. Der Spiegel dreht
Abbildung 12. Spieglein, Spieglein an der Wand – wer ist die Schönste
im ganzen Land?
tatsächlich genau die Richtung um, die senkrecht auf seiner Oberfläche steht!
Ein an der Decke angebrachter Spiegel (wie in einigen Aufzügen) vertauscht
oben und unten: Wir sehen dann den Kopf zuerst und darunter die Füße (als
stünden wir auf dem Kopf).
Das war zu einfach; hier ist unsere zweite Frage:
Gibt es eine Fläche mit nur eine Seite?
Ja! Das Möbius-Band wurde 1858 von Johann Benedict Listing und (unabhängig) August Ferdinand Möbius entdeckt. Man erhält ein Möbius-Band aus
einem Streifen Papier, wenn man diesen einmal verdreht und an den Enden miteinander verklebt (siehe Abbildung 13). Das Möbius-Band ist einseitig in dem
Sinne, dass jeder Punkt von jedem anderen Punkt erreichbar ist, ohne über
eine Kante zu gehen (es gibt ja keine!). Aber es gibt noch mehr Erstaunliches
zu berichten: Lässt man einen Spaziergänger auf einem Möbius-Band entlang
laufen, so kehrt sie seitenverkehrt zurück. Damit ist das Möbius-Band nicht
orientierbar!
96
Möbius-Bänder sind recht populär: Der Film Möbius von Gustavo Musquera R. aus dem Jahr 1996 behandelt u.a. eine verschwundene U-Bahn in
Buenos Aires, die auf einem Möbius-Band ähnlichem Parkour verkehrt, und der
Künstler Maurits Escher schuf viele Grafiken, die das Möbius-Band zum Thema haben (z.B. etwa Ameisen statt Spaziergänger auf einem Möbius-Band).
Möbius-Bänder besitzen viele Anwendungen in der Technik:
Abbildung 13. Bastelanleitung für ein Möbius-Band.
• Bei Riemengetrieben wird es verwendet, um eine geringere Abnutzung
zu gewährleisten;
• als Tonträger im Tefifon, um eine längere Spieldauer zu erzielen; dabei
ist ein Tefifon ein Wiedergabegerät für spezielle elektromechanische
Tonträger, welches seit den 1960ern nicht mehr benutzt wird;
• in der Elektrotechnik existiert mit dem Ringzähler mit einer Invertierung ein schaltungstechnisches Analogon;
• als Knotenmoleküle mit besonderen Eigenschaften (gewissen Symmetrien).
(Für Details und Weiteres sei auf wikipedia verwiesen.) Mathematisch lässt sich
ein Möbius-Band im dreidimensionalen Raum zum Beispiel wie folgt parametrisieren:
r
2 cos
(1 + 2r cos
r
α
2 sin 2 ,
x = (1 +
y =
x =
α
2 ) cos α,
α
2 ) sin α,
für −1 ≤ r ≤ 1 und 0 ≤ α < 2π.
Und hier noch eine verwandte Frage:
Was passiert, wenn man ein Möbius-Band
der Länge nach mittig aufschneidet?
Es gibt weitere einseitige Flächen. Eine Kleinsche Flasche entsteht ähnlich wie das Möbius-Band durch kreatives Verkleben von Streifen. Sie ist benannt
97
Abbildung 14. Ein Möbius-Band und eine Kleinsche Flasche.
nach dem Mathematiker Felix Klein, der sie 1882 entdeckte (oder erdachte, je
nachdem, was für einen Blick auf Mathematik wir haben). Eine Kleinsche Flasche ist eine so genannte nicht orientierbare Fläche. Dieser Begriff der NichtOrientierbarkeit bedeutet, dass wir keine Orientierung auf der Kleinschen Flasche einführen können: Wie auch beim Möbius-Band gibt es weder links noch
rechts bzw. vorne oder hinten; jeglicher Versuch eine solche Orientierung einzuführen, muss scheitern. Gegenüber dem Möbius-Band fällt bei der Kleinschen
Flasche zudem noch auf, dass sie keinen Rand besitzt.
Folgender Limerick enthält eine Konstruktionsanleitung:
A mathematician named Klein
Thought the Moebius band was divine.
Said he: ”If you glue
The edges of two,
You’ll get a weird bottle like mine.”
Wir folgen dieser Konstruktion: Hierzu verkleben wir die gegenüberliegenden
Seiten eines Quadrates gemäß Abbildung 15. Dabei entstehen Selbstdurchdringungen, allerdings lässt sich eine Kleinsche Flasche im vierdimensionalen Raum
ohne solche Selbstdurchdringungen realisieren! Eine Kleinsche Flasche enthält
Abbildung 15. Zwei Quadrate: Verkleben der gegenüberliegenden Seiten führt links zu einem Torus (oder doughnut oder Fahrradschlauch) und
rechts zu einer Kleinschen Flasche. Man beachte hierbei die unterschiedliche
Orientierung der Seiten!
98
ein Möbius-Band, wie man der Konstruktionsanleitung entnehmen kann – insofern ist also auch die Kleinsche Flasche nicht orientierbar! Ferner besitzt sie
auch keinen Rand und also kein Innen und kein Außen; trotzdem kann man
aus ihr trinken! Bloß hat sie dabei kein Volumen im mathematischen Sinne.
Abbildung 16. Und noch eine Kleinsche Flasche.
Eine mathematische Beschreibung der Kleinschen Flasche liefert die folgende
Parametrisierung:
x = 2(1 − sin α) cos α + (2 − cos α)(2 exp(−( α2 − π)2 ) − 1) cos β,
y = (2 − cos α) sin β,
z = 6 sin α + 12 (2 − cos α) exp(−(α −
3π 2
2 ) ) sin α cos β,
für 0 ≤ α, β < 2π. Eine sehr ansprechende Animation von Ilkay Sakalli und
Konstantin Weixelbaum zu den verschiedenen oben angeführten und auch weiteren erstaunlichen Eigenschaften findet sich auf der Webseite www.klein-bottlefilm.com.
Und abschließend eine letzte und der festlichen Jahreszeit angemessene Frage, die Anlass geben soll, während der Feiertage nicht nur über euklidische Bewegungen nachzudenken:
Wie kann der Himmel nachts dunkel sein, wo es doch so viele leuchtende
Sterne im Universum gibt?
99
Gehen wir von einer gleichmäßigen Sternenverteilung im Universum aus – dies
ist das so genannte kosmologische Prinzip – und all der Zeit nach dem Urknall, so
muss das Licht der Sterne doch mittlerweile das gesamte Universum erleuchtet
haben?
Frohe Weihnachten und ein gutes neues Jahr!
Nachtrag von Anfang Januar: Letzte Frage behandelt das Olberssche Paradoxon¶ aus der Astronom. Heinrich Wilhelm Olbers formulierte diese Fragestellung im Jahre 1826, sie war u.a. aber bereits Johannes Kepler bekannt, der da
fragte ”Wenn es wahr ist, dass sie (die Sterne) auch Sonnen sind von ähnlicher
Natur wie unsere Sonne, warum übertreffen sie dann nicht alle zusammen die
Sonne an Helligkeit?”k Tatsächlich enthält das Universum zu wenig Energie, um
den Nachthimmel zu erleuchten! Die durchschnittliche Entfernung der Sterne ist
so groß, dass die Zeit, die das sich mit bekanntlich endlicher Geschwindigkeit
ausbreitende Licht zur Sichtbarkeitsgrenze in unserem Universum zurück legen
muss, größer ist als das Alter des Universums (wohl ca. 13 Millarden Jahre)
bzw. die endliche Lebensdauer der Sterne (welche im beobachteten Mittel so
ungefähr in der Größenordnung 1010 Jahre geschätzt wird). Ein zusätzlicher
Effekt für die Dunkelheit des Nachthimmels ist, dass wir uns allem Anschein
nach in einem sich expandierenden Universum befinden. Durch die kosmologische Rotverschiebung reduziert sich die Energie des sich im Raum bewegenden
Lichts und die Hintergrundstrahlung des Urknalls entspricht der eines kalten
schwarzen Körpers, welcher im Mikrowellenbereich liegt und für das menschliche Auge unsichtbar bleibt.∗∗ Unter Astronomen strittig scheint der Punkt, ob
der dunkle Nachthimmel bereits als Indiz angesehen werden kann, dass wir in
einem expandierenden Universum leben: Wäre es stationär oder schrumpfend,
so müsste überall am Himmel ein Stern zu sehen sein (zumindest nach einer gewissen Zeit) und der Nachthimmel wäre taghell! Auch wäre der Himmel letztlich
so heiß wie die Oberfläche eines Sterns.
8. Ähnlichkeitsabbildungen
Nun wollen wir eine weitere Klasse von geometrisch interessanten Abbildungen studieren und einige Anwendungen in der Dreiecksgeometrie geben: Eine
Abbildung f : Rn → Rn heißt Ähnlichkeitsabbildung, falls ein λ > 0 mit
kf (x)k = λkxk
für alle
x ∈ Rn
existiert.
Satz 3.17. Für einen Endomorphismus f : Rn → Rn sind äquivalent:
¶
und ist trotz des Namens kein Paradoxon!
Gern wird auch folgende Analogie bemüht: In einem dichten Wald sieht man in jeder
Richtung schließlich einen Baumstamm.
∗∗
Mehr Informationen in ”Das Olbers’sche Paradoxon” von Rainer Göhring, welches ein leicht auffindbares Skript im Internet ist, sowie der Film von Harald
Lesch in BRα: http://www.br.de/fernsehen/br-alpha/sendungen/alpha-centauri/alpha-centauriuniversum-2000 x102.html.
k
100
(i) f ist eine Ähnlichkeitsabbildung,
(ii) für x, y ∈ Rn folgt aus hx, yi = 0 stets hf (x), f (y)i = 0,
(iii) f ist winkeltreu (siehe (13)).
Die Menge der Ähnlichkeitsabildungen bildet mit der Komposition eine Gruppe,
die so genannte Hauptgruppe.
Wir hatten mit euklidschen Bewegungen bereits winkeltreue Abbildungen kennengelernt (Korollar 3.13); obiger Satz liefert aber eine Charakterisierung sämtlicher winkeltreuer Abbildungen!
Beweis. Wir zeigen zunächst (i) ⇒ (iii): Nach Definition existiert ein λ > 0
mit kf (x)k = λkxk für alle x. Sei nun g(x) = λ1 f (x). Dann ist offensichtlich
g(0) = 0 und
1
kg(x)k = kf (x)k = kxk,
λ
womit also g nach Satz 3.6 eine orthogonale Abbildung, also insbesondere eine
euklidische Bewegung ist. Mit Korollar 3.13 folgt, dass f winkeltreu ist.
Als Nächstes zeigen wir (iii) ⇒ (ii): Gemäßder Definition von Winkeltreue,
also (13) in §3.5, gilt
hf (x), f (y)i
hx, yi
=
;
kf (x)k · kf (y)k
kxk · kyk
offensichtlich impliziert iii) die Behauptung ii).
Es verbleibt (ii) ⇒ (i): Für x, y ∈ Rn mit kxk = kyk gilt
hx + y, x − yi = hx, xi + hy, xi − hx, yi +hy, yi = kxk2 − kyk2 = 0.
|
{z
}
=0
Mit der Linearität von f folgt somit aus der Annahme (ii)
0 = hf (x + y), f (x − y)i = hf (x) + f (y), f (x) − f (y)i = kf (x)k2 − kf (y)k2
und also kf (x)k = kf (y)k. Speziell für z ∈ Rn mit kzk = 1 und λ := kf (z)k
ergibt sich für allgemeines x ∈ Rn wegen kxk = kkzkxk, dass x und y := zkxk
dieselbe Länge besitzen und nach dem bereits Gezeigten also kf (x)k = kf (y)k
gilt. Durch Einsetzen folgt wiederum mittels der Linearität von f nun
kf (x)k = kf (y)k = kf (zkxk)k = kf (z)k · kxk = λkxk,
was zu zeigen war.
Die Gruppeneigenschaft weist man ähnlich zum Beweis von Satz 3.12 nach
(was wir der Leserin/dem Leser als Übungsaufgabe überlassen). •
Solch eine Ähnlichkeitsabbildung f : Rn → Rn nennt man auch eine zentrische Streckung: Wie ein Filmprojektor im Kino vergrößert bzw. verkleinert f alle Strecken in einem bestimmten Verhältnis, dabei sind die Bildstrecken
parallel zu den ursprünglichen Strecken. In diesem Zusammenhang sei noch an
die aus der Schule wohlbekannten Strahlensätze erinnert: Werden zwei durch
einen Punkt Z verlaufende Geraden von zwei Parallelen geschnitten, die Z nicht
enthalten, so gelten (mit den Bezeichnungen aus Abbildung 17):
101
Abbildung 17. Ein Bild zum Strahlensatz.
(1) Je zwei Abschnitte auf der einen Geraden verhalten sich so zueinander
wie die diesen entsprechenden Abschnitte auf der anderen Geraden,
etwa
|ZA|
|ZB|
=
.
′
|AA |
|BB ′ |
(2) Je zwei Abschnitte auf den Parallelen verhalten sich so zueinander
wie die diesen entsprechenden jeweils vom Scheitel Z aus gemessenen
Strecken auf den Geraden, etwa
|ZA|
|AB|
=
.
′
′
|A B |
|ZA′ |
(3) Je zwei Abschnitte auf den Parallelen, welche einander entsprechen,
stehen in gleichem Verhältnis zueinander (wobei hier drei Geraden
vorrausgesetzt seien).
Ferner besteht folgende Umkehrung des ersten Strahlensatzes: Ist (1) erfüllt,
dann liegen parallele Geraden vor; hingegen kann man aus (2) i.A. nicht auf
eine solche Parallelität schließen.
Abbildung 18. Ein Dreieck wird unter einer zentrischen Streckung abgebildet; das Bilddreieck ist ähnlich zu dem Ausgangsdreieck.
102
Im Folgenden begnügen wir uns wieder mit der Ebene R2 . Zwei Figuren heißen ähnlich, wenn sie durch eine Ähnlichkeitsabbildung ineinander überführt
werden können. Hierbei erweitern wir den Begriff der Ähnlichkeitsabbildung
noch dahingehend, dass wir auch noch die Komposition mit Translationen zulassen; solche Abbildungen sind dann also von der Form
x 7→ λAx + b
mit λ > 0, A ∈ O(R2 ), b ∈ R2 ;
Wir geben eine Anwendung dieses Begriffes auf Dreiecke (siehe Abbildung 18),
welche womöglich bereits aus der Schule bekannt ist:
Satz 3.18. Zwei Dreiecke sind ähnlich, wenn sie
• in zwei Winkeln (und somit in allen drei Winkeln) übereinstimmen,
• in allen Verhältnissen entsprechender Seiten übereinstimmen,
• in einem Winkel und im Verhältnis der anliegenden Seiten übereinstimmen,
• im Verhältnis zweier Seiten und im Gegenwinkel der größeren Seite
übereinstimmen.
Beweis. Angenommen, in den Dreiecken ABC und A′ B ′ C ′ sind zwei und somit also (nach dem Winkelsummensatz) sogar alle drei Winkel gleich. OBdA
dürfen wir mit Hilfe einer passenden Translation und Drehung annehmen, dass
die beiden Dreiecke so zur Deckung kommen, dass C und C ′ übereinstimmen,
also Z = C = C ′ , und ferner die Richtungsvektoren von Z zu den Punkten
den Punkten A und A′ bzw. zu B und B ′ wegen der gleichen Winkel jeweils
identisch sind (vgl. Abbildung 17). Nun sind die Winkel β und β ′ bei B bzw.
B ′ Stufenwinkel an AB und A′ B ′ mit ZB ′ und also identisch: β = β ′ . Damit
sind AB und A′ B ′ parallel und es liegt eine zentrische Streckung vor, d.h. die
Dreiecke sind ähnlich. Die weiteren Aussagen beweist man ähnlich. •
Ganz ähnliche Sachverhalte gelten für kongruente Dreiecke, wenn also
die entsprechenden Seitenlängen übereinstimmen; tatsächlich existiert in diesem
Falle eine eindeutig bestimmte Bewegung (Kongruenzabbildung), welche die
beiden Dreiecke ineinander überführt (siehe unten stehende Aufgabe).
Kongruente geometrische Objekte liefern oft Symmetrien und diese erlauben mitunter interessante Konstruktionen. Wir schließen mit einer solchen Anwendung:
Satz 3.19 (Satz von Fermat). Gegeben ein spitzwinkliges Dreieck ABC, werden diesem drei gleichseitige Dreiecke ABC ′ , ACB ′ und BCA′ aufgesetzt. Dann
schneiden sich die drei Verbindungsstrecken AA′ , BB ′ und CC ′ in einem Punkt
F unter dem Winkel π3 , die Längen sind gleich.
Beweis. Sei F der Schnittpunkt der Strecken AA′ und BB ′ . Eine Drehung um
den Winkel π3 um C bildet B ′ auf A und B auf A′ ab und die Strecke BB ′ geht
in AA′ über; insbesondere sind die Längen gleich. Ferner gilt für die Winkel
π
∠(B ′ F A) = ∠(A′ F B) = .
3
103
Abbildung 19. Ein Bild zum Satz von Fermat. Die drei gleichseitigen
Dreiecke sind ähnlich. Der Fermatpunkt F liegt im Inneren des Dreiecks
ABC.
Desweiteren sind ∠(B ′ F A) = ∠(B ′ CA) Peripheriewinkel eines Kreises über
AB ′ . Für denselben Kreis ist auch ∠(B ′ F C) Peripheriewinkel über B ′ C. Damit
sind alle Winkel bei F gleich π3 ; insbesondere liegt F also auch auf CC ′ und der
Beweis ist erbracht. •
Aufgaben
Aufgabe 80. Zeigen Sie, dass eine zentrische Streckung f im Raum
(i) winkeltreu ist,
(ii) eine beliebige geometrische Figur genau dann auf eine Figur mit dem m2 fachen Flächeninhalt abgebildet wird, wenn ein beliebiger Körper auf einen
Körper mit dem |m|3 -fachen Volumen abgebildet wird.
Welche dieser Eigenschaften gelten auch für Ähnlichkeitsabbildungen?
Aufgabe 81. Beweisen Sie die Strahlensätze und auch die erwähnte Umkehrung!
Aufgabe 82. Vier Punkte A, B, C, D heißen harmonisch, falls
|AD|
|AC|
=
.
|CB|
|DB|
Zeigen Sie, dass eine zentrische Streckung von vier harmonischen Punkten wieder auf
vier harmonische Punkte führt.
Aufgabe 83. Zeigen Sie: Zwei Dreiecke ABC und A′ B ′ C ′ sind genau dann kongruent,
wenn es eine Bewegung f gibt, so dass f (A) = A′ , f (B) = B ′ und f (C) = C ′ gilt.
Aufgabe 84. Beweisen Sie den Satz von Napoléon, dass die Mittelpunkte der drei
aufgesetzten Dreiecke im Satz von Fermat ein gleichseitiges Dreieck bilden.
9. Hauptachsentransformation
Wir interessieren uns im Folgenden für die Situation abstandserhaltender
Abbildungen der Ebene R2 im Kontext von Kurven, die durch quadratische
Gleichungen definiert werden.
104
Beispiel: Gegeben sei die Gleichung
41x21 − 24x1 x2 + 34x22 = 25;
welche Menge K steckt hinter all den Punkten x = ( xx12 ) ∈ R2 , die dieser Gleichung genügen? Mit Hilfe der Matrix
41 −12
A=
−12 34
gilt
x1
= 41x21 − 24x1 x2 + 34x22 .
hx, Axi = (x1 , x2 )A
x2
Durch Anwendung einer geeigneten Drehung versuchen wir nun die Kurve K =
{x ∈ R2 : hx, Axi = 25} vereinfachen, so dass wir auf ihren Typ schließen
können: Nach §3.5 werden Drehungen der Ebene um den Ursprung beschrieben
durch spezielle orthogonale Matrizen
cos α − sin α
D := D(α) :=
sin α cos α
mit einem reellen Drehwinkel α. Wir erinnern, dass D(α)−1 = D(−α) = D(α)t .
Schreiben wir x = D(α)y mit y = ( yy12 ), so wird die Kurve K in den Koordinaten
y = D(−α)x durch
hy, Byi = 25
mit
B = D t AD
beschrieben (denn hy, Byi = hD t x, D t ADD −1 xi = hx, Axi). Nun gilt es also
D = D(α) durch geschickte Wahl von α so zu wählen, dass B von möglich
einfacher Gestalt ist – bestenfalls ist B eine Diagonalmatrix. Mit dem Ansatz
λ1 0
B=
0 λ2
mit reellen λj ist hierzu nach einem Koeffizientenvergleich folgendes nichtlineares Gleichungssystem in u = cos α, v = sin α zu lösen:
41u2 − 24uv + 34v 2 = λ1 ,
−12u2 − 7uv + 12v 2 = 0,
342 + 24uv + 41v 2 = λ2 .
Wir können dies auch als ein lineares Gleichungssystem in u2 , uv und v 2 auffassen:

 

41 −24 34
λ1
 −12 −7 12  =  0  .
34
24 41
λ2
Die Lösung berechnet sich als
 2 


u
23λ1 + 2λ2
 uv  = 1  36(λ2 − λ1 )  .
1875
v2
2λ1 + 23λ2
Mit dem Determinantenmultiplikationssatz gilt nebenbei
105
Abbildung 20. Die beiden Ellipsen vor und nach der Hauptachsentransformation. Form und Abstände sind erhalten geblieben, bloß die Lage in der
Ebene hat sich geändert.
λ1 λ2 = det B = det(D t AD) = det A = 1250
sowie u2 + v 2 = 1 (auf Grund der Setzung u = cos α und v = sin α); bringt man
diese Zusatzbedingungen noch mit der Lösungsmenge des obigen Gleichungssystems in Zusammenhang, so ergeben sich
12
25u2 = 9, 25v 2 = 16 und uv = ,
25
was auf eine Lösung u = cos α = 53 , v = sin α = 45 des obigen Gleichungssystems
führt. Einsetzen liefert die spezielle orthogonale Matrix
1 3 −4
D := D(α) :=
;
5 4 3
daraus ergibt sich folglich
t
B = D AD =
25 0
0 50
.
Damit ist K also die um den Winkel α (≈ 53◦ ; siehe Abbildung 20) gegen den
Uhrzeigersinn gedrehte Ellipse
25y12 + 50y22 = 25
bzw.
y12 + 2y22 = 1;
hierbei haben wir die Normalform von Ellipsen gemäß Korollar 3.2 uns zu Nutzen gemacht. Die Achsen der gedrehten Ellipse liegen dabei auf den Koordinatenachsen, weshalb der Typ der Kurve so leicht ablesbar. Da eine Drehung
106
Abstände unverändert lässt, können wir sogar aus den Achsen 1 und
gedrehten Ellipse die Längen der Achsen der Ausgangsellipse ablesen.
√1
2
der
Nun gilt es, dieses Beispiel zu verallgemeinern. Allerdings schweifen wir
zunächst ab und erinnern an die alten Begriffe der Bilinearform (siehe §2.3)
und der symmetrischen Matrix (§2.4). Bekanntlich kann jede symmetrische Bilinearform mit Hilfe einer symmetrischen Matrix beschrieben werden.
Satz 3.20 (Hauptachsentransformation). Es sei A ∈ Rn×n eine symmetrische Matrix und
h . , . i : Rn × Rn → Rn ,
(x, y) 7→ hx, yiA = xt Ay
die zugehörige symmetrische Bilinearform. Dann besitzt A reelle Eigenwerte
λ1 , . . . , λn und A ist diagonalisierbar, d.h. es gibt eine orthogonale Matrix D,
so dass


λ1


..
D −1 AD = D t AD = 

.
λn
eine Diagonalmatrix ist; deren Diagonaleinträge λj sind die Eigenwerte von A,
die weiteren Einträge sind null. Ferner existiert eine Orthonormalbasis B =
{w1 , . . . , wn } mit
λi falls i = j,
hwi , wj iA =
0 falls i 6= j.
Symmetrische Matrizen besitzen also reelle Eigenwerte und können mittels geeigneten orthogonalen Matrizen diagonalisert werden! In die transformierende
Matrix schreibt man hierzu orthonormierte Eigenvektoren.
Beweis. Die Inverse D −1 einer orthogonalen Matrix D ist nach Satz 3.5 gleich
der transponierten Matrix D t . Wir zeigen zunächst, dass D t AD = D −1 AD und
A dasselbe charakteristische Polynom besitzen, womit dann D −1 AD und A
insbesondere dieselben Eigenwerte besitzen. Hierzu berechnen wir mit dem Determinantenmultiplikationssatz und insbesondere det(D −1 ) = (det D)−1 , dass
det(λE − D −1 AD) = det(λD −1 ED − D −1 AD) = det(D −1 (λE − A)D)
= det(D −1 ) · det(λE − A) · det D = det(λE − A);
also stimmen die jeweiligen charakteristischen Polynome überein. Die Eigenwerte symmetrischer Matrizen sind nach Satz 2.12 allesamt reell.
Wir betrachten zunächst den Spezialfall n = 2: In diesem Fall existiert zu
einer symmetrischen Matrix
a b
A=
b c
eine Drehmatrix
D = D(α) =
cos α − sin α
sin α cos α
,
107
so dass D t AD eine Diagonalmatrix ist. Um dies zu sehen, berechnen wir mit
Hilfe der Additionstheoreme für trigonometrische Funktionen den Eintrag neben
der Diagonalen als
(c − a) sin α cos α + b((cos α)2 − (sin α)2 ) =
c−a
sin(2α) + b cos(2α)
2
(die beiden Nebendiagonaleinträge sind auf Grund der Symmetrie und der Orthogonalität identisch). Bei geeigneter Wahl von α verschwindet dieser Aus2b
druck: Wenn nämlich a 6= c gilt, so ist α = 12 arctan a−c
der gesuchte Winkel;
π
andernfalls mag man α = 4 verwenden (alternativ kann man mit dem Zwischenwertsatz argumentieren). Damit ist D eine Drehmatrix und nach Satz 3.5 sind
die Spaltenvektoren von D orthonormiert und es ist eine einfache Rechenaufgabe zu zeigen, dass diese Spaltenvektoren auch Eigenvektoren zu den jeweiligen
Eigenwerten von A sind.
Für den allgemeinen Fall ist etwas mehr lineare Algebra notwendig: Nach
Satz 2.18 lässt sich eine Orthonormalbasis bestehend aus Eigenvektoren zu den
Eigenwerten von A bilden. Sind die Eigenwerte allesamt verschieden, ist dies aus
Dimensionsgründen klar; bei mehrfachen Eigenwerten ist zunächst eine Orthonormalbasis aus Eigenvektoren des entsprechenden Eigenraums zu finden. Die
Eigenräume zu den verschiedenen Eigenwerten bilden dabei eine direkte Summe, deren Gesamtheit Rn ist. Wir schreiben die so gefundenen n normierten
Eigenvektoren in die Spalten einer Matrix D. Mit Hilfe dieses Basiswechsels ist
dann D t AD eine Diagonalmatrix mit den Eigenwerten auf der Diagonalen; die
Aussage über die von A induzierte Bilinearform folgt auf Grund der Orthonormalität der Spaltenvektoren von D. •
Mit dem Satz über die Hauptachsentransformation lässt sich eine beliebige
quadratische Form x 7→ hx, xiA = xt Ax also stets wie folgt umformen
xt Ax =
n
X
λj yj2
j=1
mit x = Dy; die rechte Seite heißt metrische Normalform und ist frei von
gemischten Termen! Dieser Darstellung ist positive Definitheit der von A induzierten symmetrischen Bilinearform unmittelbar abzulesen: (x, y) 7→ xt Ay ist
genau dann positiv definit (also xt Ax > 0 für x 6= 0), wenn alle Eigenwerte von A positiv sind. Diese Aussage von Satz 2.13 folgt somit direkt aus der
Hauptachsentransformation; die weiteren Aussagen ergeben sich ganz ähnlich.
In den Spalten von D stehen orthogonale Eigenvektoren von A; diese werden auch Hauptachsen der quadratischen Form genannt. Die Transformation
x = Dy bzw. y = D 1 x ist die Basistransformation von der Standardbasis zur
Basis bestehend aus den Hauptachsen, weshalb die Überführung in die metrische
Normalform auch Hauptachsentransformation genannt wird.
Beispiel: Gegeben die quadratische Form
(x1 , x2 , x3 ) 7→ q(x1 , x2 , x3 ) = 6x21 + 5x22 + 7x23 − 4x1 x2 + 4x1 x3 ,
108
so gilt



6 −2 2
x1
q(x1 , x2 , x3 ) = (x1 , x2 , x3 )  −2 5 0   x2  .
2
0 7
x3
Die metrische Normalform können wir bereits aus den Eigenwerten λ1 = 3, λ2 =
6 und λ3 = 9 der obigen Matrix herauslesen als
y = (y1 , y2 , y3 ) 7→ 3y12 + 6y22 + 9y32 ;
diese quadratische Form ist also positiv definit. Zur Berechnung der Hauptachsen bestimmen wir Eigenvektoren zu den genannten Eigenwerten, etwa






2
−1
2
w1 =  2  , w2 =  2  , w3 =  −1  .
−1
2
2
Da die zugehörige Matrix symmetrisch ist, sind diese Vektoren bereits orthogonal. Nach deren Normierung schreiben wir diese in die Spalten der Matrix
D


2 −1 2
1
D=
2
2 −1  .
3
−1 2
2
Dann ergibt sich die Basis der Hauptachsen durch x = Dy bzw. y = D −1 x.
Geometrisch beschreibt die Hauptachsentransformation einen geeigneten
Koordinatenwechsel. Um dies noch einmal zu betonen, illustrieren wir den obigen Beweis mit einem Spezialfall gewisser 2 × 2-Matrizen: Ist A gegeben durch
a b
mit a, b ∈ R,
A=
b a
dann berechnet sich das charakteristische Polynom als
λ − a −b
det(λE − A) = det
= λ2 − 2aλ + a2 − b2 ,
−b λ − a
woraus sich die Eigenwerte λ1 = a + b und λ2 = a − b ergeben. Zugehörige Eigenvektoren liest man aus den entsprechenden homogenen linearen Gleichungssytemen ab: x + y = 0 bzw. x − y = 0; nach normieren finden wir etwa
1
1
1
−1
and
w2 = √
.
w1 = √
1
2 1
2
Wir bilden aus diesen die Transformationsmatrix
1
1 −1
D=√
2 1 1
und berechnen (zur Probe)
D
−1
1
1
1 1
a b
1 −1
√
√
AD =
b a
2 −1 1
2 1 1
a+b
0
=
=: B.
0
a−b
109
Wir finden die neuen Koordinaten y1 , y2 vermöge x = Dy bzw. y = D −1 x, also
1
y1
1 1
x1
y=
=√
.
y2
x2
2 −1 1
Die zugehörigen symmetrischen Bilinearformen sind
xt Ax = ax21 + 2bx1 x2 + ax22
und
y t By = (a + b)y12 + (a − b)y22 ;
der gemischte Term ist durch die Koordinatentransformation also beseitigt worden!
Eine wichtige Anwendung der Hauptachsentransformation liegt in der Diskussion der durch eine quadratische Gleichung definierten Kurve. In dem obigen
zweidimensionalen Beispiel sei etwa der Typ der durch xt Ax = 1 festgelegten
Kurve zu bestimmen:
Q = {x = (x1 , x2 ) ∈ R2 : ax21 + 2bx1 x2 + ax22 = 1}.
Nehmen wir an, dass beide Eigenwerte positiv sind, so wird Q in den Koordinaten y1 , y2 durch die Gleichung
2 2
y2
1
y1
+
=1
mit αj = √
α1
α2
a±b
beschrieben; hier liegt also wiederum eine Ellipse mit Hauptachsen αj vor. Ist
hingegen a + b > 0 > a − b, so ergibt sich eine Hyperbel:
2 2
y2
1
y1
−
=1
mit αj = p
.
α1
α2
|a ± b|
Auch hier sind die αj die Hauptachsen von Q. Hierbei haben wir die Sätze
über die Normalformen dieser Kurven aus §3.2 und §3.3 benutzt! Im Fall der
Hyperbel können wir mittels der weiteren Koordinatentransformation
y2
y1
y2
y1
+
und
z2 =
−
z1 =
α1 α2
α1 α2
alternativ auch durch z1 z2 = 1 darstellen, denn
2 2
y2
y1
y1
y1
y2
y2
+
−
−
.
z1 z2 =
=
α1 α2
α1 α2
α1
α2
Die Transformationsmatrix D ist eine orthogonale Matrix; sie beschreibt eine
Drehung um den Winkel π4 = 45◦ (denn cos π4 = sin π4 = √12 ). In beiden Fällen
ist die durch ax21 + 2bx1 x2 + ax22 = 1 definierte Kurve Q also durch eine Drehung
π
4 auf Hauptachsenform gebracht worden.
Aufgaben
Aufgabe 85. Gegeben B ∈ R
n×n
. Zeigen Sie, dass A = 21 (B + B t ) symmetrisch ist.
Aufgabe 86. Für welche Parameter λ ∈ R ist die quadratische Form
(x, y) 7→ (2 − λ)x2 + 3xy + (λ − 1)y 2
negativ definit?
110
Aufgabe 87. Zeigen Sie, dass die Gleichung
√
7x2 + 6 3xy + 13y 2 = 1
eine Ellipse definiert; berechnen Sie deren Hauptachsen! Um welchen Winkel muss für
die Hauptachsenform in welcher Richtung gerdeht werden?
Aufgabe 88. Zeigen Sie, dass für reelle x, y, z stets die Ungleichung
q(x, y, z) := 5x2 + 6y 2 + 7z 2 − 4xy + 4yz > 0
besteht. Hierzu zeige man zunächst, dass die zu q assoziierte symmetrische Matrix drei
positive Eigenwerte besitzt!
10. Allgemeine Kurven zweiter Ordnung
Wir wollen nun systematisch die Kurven untersuchen, die durch quadratische Gleichungen definiert werden. Die allgemeine Gleichung zweiten Grades in
zwei Veränderlichen x, y ist von der Gestalt
(14)
ax21 + 2bx1 x2 + cx22 + 2dx1 + 2ex2 + f = 0
mit a, b, c, . . . , f ∈ R;
hier haben wir einen Faktor 2 bei einigen Termen auf der linken Seite eingebaut,
um diese wie folgt darstellen zu können:
2d
a b
x1
+ (x1 , x2 )
+f
(x1 , x2 )
2e
x2
b c
bzw.
xt Ax + v t x + f
mit
A=
a b
b c
und
v=2
d
e
.
Dann heißt die Menge Q aller x = (x1 , x2 ) ∈ R2 , welche der Gleichung (14)
genügt, eine Quadrik Q in R2 (auch quadratische Hyperfläche), also
Q = {x ∈ R2 : xt Ax + xt v + f = 0}.
Solch eine Quadrik beschreibt eine ebene Kurve zweiter Ordnung. Welche
Kurven können sich hinter einer solchen Quadrik Q verbergen?
Den Spezialfall, wenn keine gemischten Terme vorhanden sind, hatten
wir bereits kennengelernt. Der allgemeine Fall lässt sich durch quadratische
Ergänzung auf diesen zurückführen!
Beispiel 1 (Staatsexamen Frühjahr 2006, Thema 3, Aufgabe 4): Zeigen Sie,
dass die Gleichungen
x2 + 2xy + 2x + 2y = 0
eine Hyperbel im R2 definiert und bestimmen Sie deren Asymptoten.
Zur Lösung bestimmen wir die affine Normalform: Dazu sei Q die durch
x2 + 2xy + 2x + 2y = 0
111
definierte Quadrik. Hierzu finden wir mittels quadratischer Ergänzung die äquivalente Gleichung
(x + y + 1)2 − y 2 = 1
und mit u = x + y + 1 und v = y ergibt sich die affine Normalform u2 − v 2 = 1.
Nach Korollar 3.4 ist Q also eine Hyperbel mit den Asymptoten u = ±v; letztere
Abbildung 21. Die beiden um 45 Grad gedrehten Hyperbeln aus Beispiel 1.
lassen sich auch beschreiben durch
x + y + 1 = u = +v = y
bzw.
x = −1
und
x + y + 1 = u = −v = −y
bzw.
x + 2y = −1
(siehe Abbildung 21).
Beispiel 2: Gegeben sei die Quadrik Q ⊂ R2 durch die folgende Gleichung
x21 + x22 + 6x1 x2 − 2x1 + 6 = 0.
Wir binden die zusätzlichen linearen Terme sowie den konstanten Term in einer
zusätzlichen Dimension ein; hierzu sei


6 −1 0
A′ =  −1 1 3  .
0
3 1
112
Dann gilt



6 −1 0
1
(1, x1 , x2 )  −1 1 3   x1  = x21 + x22 + 6x1 x2 − 2x1 + 6 =: q(x1 , x2 ).
x2
0
3 1
Zunächst diagonalisieren wir die Untermatrix
1 3
A=
3 1
die durch Streichen der ersten Zeile und Spalte von A′ entsteht; diese entspricht
der quadratischen Form x21 + x22 + 6x1 x2 (also genau den quadratischen Termen
in q). Das Charakteristische Polynom ist det(λE − A) = (λ + 2)(λ − 4), die
Eigenwerte sind also λ1,2 = −2, 4 und die jeweiligen Eigenräume berechnen sich
zu
1
−1
R.
R
und
EigA (4) =
EigA (−2) =
1
1
Normieren der Richtungsvektoren liefert die Transformationsmatrix
1
1 −1
D=√
2 1 1
und A wird diagonalisiert durch
1
1 1
1 3
1 −1
4 0
t
D AD =
=
3 1
1 1
0 −2
2 −1 1
(man vergleiche dies mit einem allgemeineren Beispiel aus dem vorigen Paragraphen). Wir ergänzen nun D durch Hinzufügen einer ersten Zeile und Spalte
zu


1 0
0
1
1 

D ′ =  0 √2 − √2 
√1
0 √12
2
(gewissermaßen rückwärts zu dem Schritt von A′ zu A). Dann berechnet sich

6
 − √1
′ t ′ ′
(D ) A D = 
2
√1
2
− √12
4
0
√1
2
0 
.
−2
Wir notieren das Ergebnis ebenso als



c β1 β2
(D ′ )t A′ D ′ =  β1 λ1 0 
β2 0 λ2
113
mit also c = 6, β1 = − √12 und β2 = √12 . Hieraus entsteht durch Multiplikation
von (1, x1 , x2 ) von links und rechts (als Spaltenvektor)



c β1 β2
1
(1, x1 , x2 )  β1 λ1 0   x1 
β2
0
λ2
= c + 2β1 x1 + 2β2 x2 +
x2
λ1 x21
+ λ2 x22
Damit haben wir also den gemischten Term beseitigt. Die linearen Terme lassen
sich hier durch quadratische Ergänzung eliminieren:
2 !
β1
β1 2
2
−
.
2β1 x1 + λ1 x1 = λ1
x1 +
λ1
λ1
Ersetzen wir hierin x1 durch x1 − β1 /λ1 , so beseitigt dies die unerwünschten
linearen Terme mit x1 (und analog verfährt man mit dem linearen Term mit
x2 ). Multiplikation der Matrix


1
0 0
U ′ =  −β1 /λ1 1 0 
−β2 /λ2 0 1
von links mit dem Spaltenvektor

 
1
1
U ′  x1  =  −β1 /λ1
x2
−β2 /λ2
(1, x1 , x2 )t liefert nun

 

0 0
1
1
1 0   x1  =  x1 − β1 /λ1  .
0 1
x2
x2 − β2 /λ2
Wir haben also die Koordinaten x1 , x2 transformiert zu y1 = x1 − β1 /λ1 , y2 =
x2 − β2 /λ2 , was der gewünschten quadratischen Ergänzung entspricht. In unserem Beispiel ergibt sich so


1 0 0
√


U ′ =  √82 1 0 
2
0 1
4
sowie die Hauptachsenform

49
8
(D ′ U ′ )t A′ (D ′ U ′ ) =  0
0
Entsprechend ergibt sich die Gleichung

0 0
4 0 ;
0 −2
49
+ 4y12 − 2y22 = 0.
8
Also ist Q ähnlich zu der hauptachsentransformierten Hyperbel mit Normalform
2 y1
y2 2
√
−
=1
7/4
7/ 24
(siehe Abbildung 22). Gewissermaßen haben wir statt der Quadrik Q die höher-
114
Abbildung 22. Zwei Hyperbeln: vor und nach der Hauptachsentransformation – welche ist welche?
dimensionale Quadrik Q′ im Raum R3 gegeben durch die Gleichung
q ′ (x0 , x1 , x2 ) = 0
mit q(x0 , x1 , x2 ) := x21 + x22 + 6x1 x2 − 2x0 x1 + 6x20 = 0
behandelt. Wir beobachten q(x1 , x2 ) = q ′ (1, x1 , x2 ); Setzen von x0 = 1 entspricht einer Projektion von R3 in die Ebene und also entsteht Q = {(x1 , x2 ) ∈
R2 : q(x1 , x2 ) = 0} durch Schneiden von Q′ = {(x0 , x1 , x2 ) ∈ R3 :
q ′ (x0 , x1 , x2 ) = 0} mit der Ebene x0 = 1 in R3 .
Nun wollen wir das obige Verfahren systematisieren: Hierzu sei eine quadratische Gleichung in n Variablen gegeben durch
(15)
n
X
i=1
aii x2i
+
n
X
1≤i<j≤n
2aij xi xj + 2
n
X
bk xk + c = 0
k=1
mit aij , bk , c ∈ R; dann heißt die Menge Q aller x = (x1 , . . . , xn )t ∈ Rn , welche
dieser Gleichung genügen eine Quadrik in Rn . Unser Anliegen ist es, durch
Hauptachsentransformation (Satz 3.20) den Typ dieser Quadrik zu bestimmen,
bzw. die Frage zu klären, welche geometrischen Objekte auftreten können.
1. Quadratische Terme: Hierzu bilden wir die Matrix A = (aij ) bestehend aus den Koeffizienten aij der Q definierenden quadratischen
Gleichung bei dem quadratischen Term xi xj als Eintrag in der i-ten
Zeile und j-ten Spalte; im Falle i 6= j sei dabei aji = aij . Mittels
Hauptachsentransformation ist die symmetrische Matrix A ∈ Rn×n
zu diagonalisieren: Hierzu berechnet man zunächst deren Eigenwerte
115
λ1 , . . . , λn und eine Orthonormalbasis von zugehörigen Eigenvektoren
w1 , . . . , wn ; diese als Spaltenvektoren in eine Matrix D = (w1 , . . . , wn )
geschrieben, liefert die Diagonalmatrix


λ1
0


..
D −1 AD = D t AD = 
 =: B
.
0
λn
(mit lauter Nullen außerhalb der Diagonalen).
2. Lineare Terme: Zum Beseitigen der linearen Terme sei A′ die symmetrische Matrix, für die
n
n
n
X
X
X
1
t
′
2
bk xk + c = (1, x )A
2aij xi xj + 2
,
aii xi +
x
i=1
1≤i<j≤n
(1, xt )
k=1
n+1
wobei
∈R
der um die Komponente 1 erweitere Zeilenvektor
1
x sei und ( x ) sein transponierter Spaltenvektor; es gilt also
c bt
′
A =
∈ R(n+1)×(n+1)
b A
mit bt = (b1 , . . . , bn ) als Zeilen- bzw. Spaltenvektor. Wir bilden ferner
1 0
′
D =
0 D
mit 0 = (0, . . . , 0) ∈ Rn als dem passenden Zeilen- bzw. Spaltennullvektor sowie D aus Schritt 1. Schließlich seien Zahlen β1 , . . . , βn
definiert durch


c β1 . . . . . . βn
 β1 λ1 0 . . . 0 



.. 
..
′ t ′ ′

.
(D ) A D =  β2 0
. 
.
 ..
..
.
.
. . .. 
 .

.
βn 0 . . . . . . λn
Wir bilden ferner

1
−β1 /λ1
..
.



U′ = 

 −βn−1 /λn−1
−βn /λn
0 ... ...
1 0 ...
.. ..
.
.
1
0 ... 0
0
0
..
.




,

0 
1
wobei der j + 1-te Eintrag in der ersten Spalte gleich −βj /λj sei, falls
λj 6= 0, und andernfalls gleich null sei. Dann ergibt sich


γ


λ1


′ t
′ t ′
′ ′
(U ) (D ) A (D U ) = 
 =: B ′ ,
..


.
λn
116
wobei
γ =c−
n
X
βj2
λj
j=1
λj 6=0
und B ′ eine Diagonalmatrix ist mit den Eigenwerten λj von A auf der
Diagonalen, falls alle diese Eigenwerte ungleich null sind; ist hingegen
λj = 0, so stehen in den j + 1-ten Einträgen der ersten Zeile bzw. der
ersten Spalte nicht notwendig verschwindende reelle Zahlen vj und
Nullen sonst.
3. Metrische Normalform: Die durch (15) definierte Quadrik
Q = {x = (x1 , . . . xn ) ∈ Rn : xt Ax + 2bt x + c = 0}
ist kongruent zu einer Quadrik
Q′ = {y = (y1 , . . . yn ) ∈ Rn : y t By + 2v t y + γ = 0}
mit der Diagonalmatrix B (mit den Eigenwerten von A in der Diagonalen) und einem Vektor v mit Einträgen vj für Λj und Nullen sonst
entsprechend Schritt 2. Damit besitzt Q die metrische Normalform
n
X
j=1
λj yj2 + 2
n
X
vj y j + γ = 0
j=1
λj 6=0
mit den Eigenwerten λj von A und γ aus Schritt 2.
Hierbei heißen zwei geometrische Objekte kongruent, wenn es eine euklidische
Bewegung gibt, welche diese ineinander überführt; dabei bleiben also Form und
Größe erhalten. (Und Q′ mag als die im Raum bewegte Quadrik Q angesehen
werden!)
Einige Bemerkungen: Die spezielle Form für das Produkt (D ′ )t A′ D ′ ergibt sich aus der Hauptachsentransformation D t AD = B als
1 0
c b
1 0
′ t ′ ′
(D ) A D =
0 Dt
b A
0 D
1 0
c
c βt
c
b
bt D
=
=
=
Dtb Dt A
0 D
D t b D t AD
β B
mit β t = (β1 , . . . βn ) = bt D (bzw. β = D t b).†† Die zusätzliche Transformation
mit der Matrix U ′ steht für die quadratische Ergänzung, welche die linearen
Terme beseitigt sofern der zugehörige Eigenwert von null verschieden ist. Geometrisch ist diese quadratische Ergänzung eine Translation. Dabei gilt mit den
Rechenregeln für Transposition:
(U ′ )t (D ′ )t A′ (D ′ U ′ ) = (D ′ U ′ )t A′ (D ′ U ′ ).
††
Hierbei sei darauf hingewiesen, dass die mit dicken Linien unterteilten Matrizen asl
Blockmatrizen zu lesen sind!
117
Wegen
1
x
′
=DU
′
1
y
gilt y = (DU )−1 x, so dass also x 7→ (DU )−1 x die euklidische (und damit abstandserhaltende!) Bewegung ist, welche Q in Q′ überführt.
Mit diesem Kochrezept wollen wir ein weiteres Beispiel rechnen: Die Quadrik Q sei gegeben durch die Gleichung
4x21 + 2x22 + 3x23 + 4x1 x3 − 4x2 x3 + 12x1 + 30x2 + 36x3 + 2 = 0.
Wir bilden die zugehörige symmetrische Matrix


4 0
2
A =  0 2 −2 
2 −2 3
und berechnen über deren charakteristisches Poylnom λ3 − 9λ2 + 18λ die Eigenwerte als λ1 = 0, λ2 = 3 und λ3 = 6. Normierte Eigenvektoren sind hierzu






−1
2
2
1
1
1
w1 =
2  , w2 =  2  , w3 =  −1  .
3
3
3
2
−1
2
Mit der Matrix D = (w1 , w2 , w3 ) ergibt sich die Hauptachsentransformation

−1
1
 2
D t AD =
9
2

0 0
=  0 3
0 0



2
2
4 0
2
−1 2
2
2 −1   0 2 −2   2
2 −1 
−1 2
2 −2 3
2 −1 2

0
0 .
6
Damit ist Q kongruent zu einer Quadrik mit definierender Gleichung ohne gemischte quadratische Terme:
3z22 + 6z32 + 40z1 + 16z2 + 22z3 + 2 = 0;
vermöge quadratischer Ergänzung lässt sich diese letzte Gleichung umschreiben
als
3(z2 + 38 )2 + 6(z3 +
11 2
6 )
+ 40(z1 −
79
80 )
= 0.
Hieraus kann man bereits alle notwendigen Daten zu Q ablesen; wir fahren
aber trotzdem noch mit dem Kochrezept fort: Mittels der Größen c = 2 sowie
b1 = 6, b2 = 15 und b3 = 18, welche man der Q definierenden Gleichung abliest,
bildet man A′ sowie D ′ und berechnet (D ′ )t A′ D ′ und liest hieraus die Größen
118
β1 , β2 , β3 ab:
(D ′ )t A′ D ′

3 0
0
1
0
−1
2

=
2
9 0 2
0 2 −1

2 20 8 11
 20 0 0 0
= 
 8 0 3 0
11 0 0 6

0
2 6 15 18
 6 4 0
2 
2



−1
15 0 2 −2
2
18 2 −2 3



3 0
0
0
  0 −1 2
2 


 0 2
2 −1 
0 2 −1 2

.

Alternativ lassen sich die βj ’s (gemäß unserer Bemerkung) auch berechnen
Abbildung 23. Der noch nicht auf hauptachsentransfomierte Paraboloid.
durch





 
β1
20
−1 2
2
6
1
β =  β2  = D t b =  2
2 −1   15  =  8  .
3
β3
11
2 −1 2
18
Wir bilden nun mit den Einträgen −bj /λj für
ersten Spalte und ansonsten null die Matrix

1
0 0

0
1 0
U′ = 
 −8 0 1
3
− 11
0 0
6
nichtverschwindende λj in der

0
0 

0 
1
119
und berechnen damit

3
0
0
0
1  −9 −1 2
2 

S ′ = D′ U ′ = 
7

2 −1 
−2 2
3
−1 2 −1 2

sowie

− 79
2
 20
′ t ′ ′

(S ) A S = 
0
0
20
0
0
0
0
0
3
0
Daraus lesen wir die Normalform
3y22 + 6y32 + 40y1 −
79
2

0
0 
.
0 
6
=0
ab. Also ist Q kongruent zu einem elliptischen Paraboloid mit Normalform
6 2
79 y2
+
12 2
79 y3
+
80
79 y1
=1
(siehe Abbildung 23); die entsprechende Koordinatentransformation ist in S ′
kodiert.
Zweites Beispiel: Sei Qc die Quadrik des R3 , welche durch die Gleichung
3x21 − 2x1 x2 + 3x22 − 6x23 − 2x1 − 4x2 − 2x3 + c = 0
gegeben sei; hierbei ist c ein reeller Parameter. Von welchem Typ ist Qc ? Es ist
zu erwarten, dass der Typ von der Wahl von c abhängt.
Abbildung 24. c′ = ±1: Ein und zweischalige Hyperboloide.
Wir bestimmen die symmetrische Matrix


3 −1 0
A =  −1 3
0 
0
0 −6
120
gemäß unserem Kochrezept. Das zugehörige charakteristische Polynom berechnet sich als (λ − 2)(λ − 4)(λ + 6), was auf etwa die Transformationsmatrix
 1

√
− √12 0
2


√1
D =  √12
0 
2
0
0
1
führt. Mit den erweiterten Matrizen A′ und D ′ ergibt sich dann
(D ′ )t A′ D ′


1
0
0 0  c −1 −2 −1
 0 √1
√1
0 
−1 3 −1 0


2
2
= 

1
1
0
 0 − √2 √2 0   −2 −1 3
−1 0
0 −6
0
0
0 1


c
− √32 − √12 −1
 − √3
2
0
0 


2
= 
.

 − √1
0
4
0
2
−1
0
0
6
Mit

1
√
3

2
4 √
U′ = 
 −1 2
8
− 61
folgt
0
1
0
0
53
c − 24

0
(D ′ U ′ )t A′ D ′ U ′ = 

0
0
0
√1
2
√1
2
0
0
− √12
√1
2
0
0
0
0
1






0
0 

0 
1
0
0
1
0

 1

0


 0
0
0
2
0
0

0 0
0 0 
.
4 0 
0 −6
53
ergibt sich die Normalform 2x21 + 4x22 − 6x23 = 0 und Qc ist
Speziell für c = 24
ein Ellipsenkegel. Falls c > 53
24 , ist die definierende quadratische Gleichung von
der Gestalt
2 2
c ′ x1
+
4 2
c ′ x2
−
6 2
c ′ x3
= −1
mit
c′ = c −
53
24
> 0;
53
in diesem Fall ist Qc ein zweischaliges Hyperboloid; ist schließlich c < 24
, so
′
ist c < 0 und Qc ist ein einschaliges Hyperboloid (siehe Abbildung 24). Weitere Erscheinungsformen von Quadriken werden wir im nächsten Paragraphen
kennen lernen.
Aufgaben
Aufgabe 89. Welches geometrische Objekt verbirgt sich hinter der Quadrik, welche
durch die Gleichung
x2 − 2y 2 + 3z 2 − 4xy + 5xz − 6yz + 7 = 0
gegeben ist?
121
Aufgabe 90 (Frühjahr 2004, Thema 3, Aufgabe 4). Bestimmen Sie alle Parameter
s ∈ R, für welche die Gleichung
(sx1 )2 + 2x1 x2 + x22 − 2x1 − 2x2 + s + 1 = 0
eine Hyperbel beschreibt.
11. Klassifikation der Quadriken
Mit Hilfe der Hauptachsentransformation und quadratischer Ergänzung
können wir nun die verschiedenen Typen von Quadriken klassifizieren; dabei
wollen wir aber den trivialen Fall ausschließen, dass die definierende Gleichung
keine quadratischen Terme enthält, in welchem die Quadrik eine Hyperebene ist
(eine Gerade im Falle der Ebene) oder gar der gesamte Raum (wenn nämlich
die Gleichung 0 = 0 gegeben ist). Wesentlich interessanter ist:
Satz 3.21 (Metrische Klassifikation der Quadriken). Zu jeder Quadrik Q
in Rn existiert eine euklidische Bewegung f sowie m, k ∈ N0 mit m + k ≥ 1 und
positive reelle Zahlen αj , so dass die bewegte Quadrik f (Q) durch genau eine
der folgenden Gleichungen beschrieben wird.
(I) Es treten keine linearen oder konstanten Terme auf:
2
x1
xm 2
xm+1 2
xm+k 2
+ ... +
−
− ... −
=0
α1
αm
αm+1
αm+k
mit m ≥ k.
(II) Es treten keine linearen Terme auf; der konstante Term ist normiert
gleich eins:
2
xm 2
xm+1 2
xm+k 2
x1
+ ... +
−
− ... −
= 1;
α1
αm
αm+1
αm+k
(III) Es tritt genau ein linearer Term auf:
2
xm 2
xm+1 2
xm+k 2
x1
+ ... +
−
− ... −
= xm+k+1 ,
α1
αm
αm+1
αm+k
wobei m + k < n.
Beweis mittels Hauptachsentransformation und quadratischer Ergänzung (wie
im vorangegangenen Paragraphen). Im Falle eines verschwindenden Eigenwertes
lassen sich die linearen Terme durch eine geeignete zusätzliche, abstandserhaltende Transformation auf einen einzigen reduzieren. (Im R2 tritt dieser letzte
Fall tatsächlich gar nicht auf.) •
Wir wollen nun die verschiedenen Erscheinungsformen insbesondere für die
Ebene und den dreidimensionalen Raum untersuchen. Dabei werden wir mit
der Ellipse, Hyperbel und Parabel alte Bekannte treffen (vgl. §3.2 und 3.3).
Für die Quadriken in der Ebene R2 liefert der Satz die verschiedenen
Typen im Fall (I):
122
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 0, womit f (Q) die
durch x1 = 0 beschriebene Gerade ist;
• für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und
durch Faktorisieren der linken Seite zeigt sich, dass f (Q) das Paar
sich schneidender Geraden x2 = ± αα12 x1 ist;
• für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche nur
durch (x1 , x2 ) = (0, 0) gelöst wird, womit f (Q) gleich dem Nullpunkt
ist.
Die verschiedenen Typen im Fall (II):
• Für m = 0, k = 1 liefert die Normalform −( αx11 )2 = 1, welches keine
Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist;
• für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das
Paar paralleler Geraden x1 = ±α1 ;
• für m = 0, k = 2 entsteht die Gleichung −( αx11 )2 − ( αx22 )2 = 1, womit
f (Q) wiederum leer ist;
• für m = 1, k = 1 ergibt sich für f (Q) die Normalform ( αx11 )2 −( αx22 )2 = 1
einer Hyperbel;
• für m = 2, k = 0 ergibt sich für f (Q) eine durch ( αx11 )2 + ( αx22 )2 = 1
beschriebene Ellipse.
Es verbleibt ein einzelner Typ im Fall (III):
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) eine
Parabel ist.
Die jeweiligen Untertypen lassen sich insbesondere noch über den Rang von A
und A′ gemäß unserem Kochrezept und die jeweilige Anzahl der positiven und
negativen Eigenwerte charakterisieren. In der Ebene genügen sogar Determinantenbedingungen: Beispielsweise liegt genau dann eine Hyperbel vor, wenn
det A < 0 und det A′ 6= 0 gilt.
Die gegebenen metrischen Normalformen enthalten genaue Informationen
über die Quadrik Q. Die Bewegung f aus Satz 3.21 hat Abstände und Winkel
unverändert gelassen (nach Satz 3.5 und 3.1). Aus beispielsweise der hauptachsentransformierten Normalform der Ellipse Q
2 2
x2
x1
+
=1
α1
α2
liest man unmittelbar die Halbachsen α1 und α2 ab (durch Setzen von xj = 0;
vgl. §3.1). Andererseits liefert die Hauptachsentransformation einen Zusammenhang zu den Eigenwerten λ1 , λ2 der zu Q assoziierten Matrix A: Gehen wir von
einer quadratischen Gleichung ohne lineare Terme aus, besteht also etwa die
hauptachsentransformierte Gleichung
λ1 x21 + λ2 x22 = γ
p
mit positiven γ, λ1 , λ2 , so folgt für die Halbachsen der Ellipse αj = γ/λj . Ähnliche Informationen lassen sich aus den metrischen Normalformen der anderen
geometrischen Objekte ziehen.
123
Abbildung 25. Von links nach rechts: Ebenenpaar, Kegel, Hyperbelzylinder
Als Nächstes wollen wir Quadriken im dreidimensionalen Raum R3 untersuchen; in diesem Fall entstehen Flächen! Der Satz liefert die verschiedenen
Typen im Fall (I):
• Für m = 1, k = 0 entsteht wiederum die Normalform ( αx11 )2 = 0 bzw.
x1 = 0, jedoch ist im R3 hierdurch eine Ebene beschrieben (während
in R2 dies auf eine Gerade führt);
• für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und durch
Faktorisieren der linken Seite offenbart sich f (Q) als ein Paar sich
schneidender Ebenen x2 = ± αα21 x1 (statt Geraden);
• für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche die
Gerade Re3 mit dem dritten Standardeinheitsvektor e3 beschreibt;
• für m = 2, k = 1 ist die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 0 und
damit entsteht ein Ellipsenkegel f (Q);
• für m = 3, k = 0 ergibt sich ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 0, welches nur
durch den Nullpunkt (x1 , x2 , x3 ) = (0, 0, 0) gelöst wird.
Abbildung 26. Von links nach rechts: Ellipsenzylinder, Ellipsoid, parabolischer Zylinder
Die verschiedenen Typen im Fall (II):
• Für m = 0, k = 1 liefert die Normalform −( αx11 )2 , welches wiederum
keine Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist;
• für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das
Paar paralleler Ebenen x1 = ±α1 ;
124
• für m = 0, k = 2 kommt −( αx11 )2 − ( αx22 )2 = 1, womit f (Q) wiederum
leer ist;
• für m = 1, k = 1 entsteht die Gleichung ( αx11 )2 − ( αx22 )2 = 1, womit
f (Q) ein Hyperbelzylinder ist;
• für m = 2, k = 0 ergibt sich für f (Q) ein durch ( αx11 )2 + ( αx22 )2 = 1
beschriebener Ellipsenzylinder;
• für m = 0, k = 3 lautet die Normalform −( αx11 )2 − ( αx22 )2 − ( αx33 )2 = 1
und f (Q) ist mal wieder leer;
• für m = 1, k = 2 ergibt sich für f (Q) die Normalform ( αx11 )2 − ( αx22 )2 −
( αx33 )2 = 1 ein zweischaliges Hyperboloid, während
• für m = 2, k = 1 die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 1 und damit
ein einschaliges Hyperboloid f (Q) entsteht;
• für m = 3, k = 0 entsteht ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 1 und f (Q) ist ein
Ellipsoid.
Es verbleiben die Typen im Fall (III):
• Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) ein
parabolischer Zylinder ist;
• für m = 1, k = 1 entsteht ( αx11 )2 − ( αx22 )2 = x3 und f (Q) ist ein hyperbolisches Paraboloid;
• für m = 2, k = 0 lautet die Normalform ( αx11 )2 + ( αx22 )2 = x3 , womit
f (Q) ein elliptisches Paraboloid ist.
Abbildung 27. Von links nach rechts: hyperbolisches Paraboloid, elliptisches Paraboloid
Etliche der neuen Quadriken haben sich in natürlicher Weise aus deren Analoga
in der Ebene ergeben: Steht x1 = 0 etwa in R2 eine Gerade, nämlich Re2 mit
dem zweiten Standardeinheitsvektor e2 , so existiert mit e3 in R3 ein weiterer
linear unabhängiger Vektor, der dieser Gleichung genügt, womit also im dreidimensionalen Raum die entsprechende Quadrik gleich der Ebene Re2 + Re3 ist.
Ähnlich wurden beispielsweise aus Paare von Geraden nun Paare von Ebenen.
Oder aber aus einer Hyperbel mit der Gleichung x21 − x22 = 1 in der Ebene
125
(Typ (II)) entsteht im Raum ein Hyperbelzylinder (ebenfalls Typ (II)), denn
x3 tritt nicht in der definierenden Gleichung auf, kann also beliebig gewählt
werden). Ferner ergeben sich einige der Quadriken im dreidimensionalen Raum
als so genannte Rotationskörper von ebenen Quadriken: Lassen wir etwa eine
Hyperbel in R3 um ihre Achsen rotieren, so entsteht ein Hyperboloid.
Abbildung 28. Links: Querschnitte eines Kegels; rechts: Längsschnitte.
Aber, gegeben eine quadratische Gleichung, wie erkennt man, welche Fläche
sich hinter der Quadrik verbirgt? – ohne Computer! Greifen wir hierzu noch
einmal das Beispiel des einschaligen Hyperboloids aus dem vergangenen Paragraphen auf, welcher gegeben ist durch die Gleichung
2x21 + 4x22 − 6x23 = 1
(c′ = −1). Wir können die Normalformdarstellungen aus §3.2 und 3.3 für Kurven in der Ebene benutzen, um die Fläche im dreidimensionalen Raum zu bestimmen: Hierzu schneiden wir etwa die Fläche Q mit Ebenen x3 = κ mit
verschiedenen reellen Werten κ. In diesem speziellen Beispiel ergeben sich so
für κ = 0, ±1, ±2, . . . jeweils Ellipsen
!2
!2
x1
x1
2
2
2
p
=1
+ p
2x1 + 4x2 = 1 + 6κ
bzw.
(1 + 6κ2 )/2
(1 + 6κ2 )/4
p
p
mit |κ| wachsenden Halbachsen (1 + 6κ2 )/2 bzw. (1 + 6κ2 )/4 (siehe Abbildung 28). Durch Zusammenfügen all dieser Schnittkurven entsteht die Fläche
Q (ganz ähnlich dem Prinzip von Cavalieri mit dem wir in Analysis mehrerer
Veränderlicher das Volumen der Kugel durch Aufintegrieren der Flächeninhalte
der Kreise, die als Schnitte der Kugel auftraten, berechnet hatten). Hierbei zeigt
sich auch, ob ein ein- oder ein zweischaliges Hyperboloid vorliegt. Zusätzliche Informationen ergeben sich, wenn wir die Schnittkurven mit beispielsweise x2 = κ
und variierendem κ ∈ R betrachten. Die Attribute elliptisch, hyperbolisch, parabolisch in den Klassifikationslisten für Ebene und dreidimensionalen Raum
kennzeichnen entsprechend die Art der Schnittkurven der jeweiligen Quadrik
126
mit einer Ebene. Im folgenden Paragraphen werden wir uns noch überlegen,
welche Schnittkurven bei solchen Schnitten mit Ebenen überhaupt entstehen
können...
Werden die Eigenvektoren bei der Hauptachsentransformation übrigens
nicht normiert, so entsteht zwar noch eine Diagonalmatrix, bloß stehen dann
nicht mehr notwendig die Eigenwerte auf der Diagonalen.
Beispiel 2 aus §10.: Mit den nicht-normierten Eigenvektoren bilden wir
1 −1
D̂ =
1 1
statt D (also ohne den Faktor
(D̂)t AD̂ = A =
√1 ),
2
1 1
−1 1
so berechnet sich
1 3
3 1
1 −1
1 1
=
8 0
0 −4
.
Tatsächlich ergibt sich das Doppelte der zu A gehörigen√Diagonalmatrix (was
nicht überraschend ist hinsichtlich der Normierung 2 = ( 2)2 ). Trotzdem lässt
sich der Typ – nämlich eine Hyperbel – bereits aus dieser Diagonalisierung von
A ablesen!
Ohne Normieren der Eigenvektoren im Kochrezept geht lediglich die Größe,
nicht aber die Form der Quadrik verloren, denn nach den Sätzen 3.5 und 3.1 erhalten Abbildungen der Form x 7→ Dx mit orthogonalen Matrizen D Abstände
und Winkel. Letztlich entscheidend sind also im Wesentlichen wie viele positive und wie viele negative Eigenwerte die Ausgangsmatrix A besitzt; vergleiche
hierzu den Begriff der positiven Definitheit in §2.4. Mit etwas mehr linearer
Algebra (dem Trägheitssatz von Sylvester) lassen sich dann die Quadriken in
beliebigen euklidischen Räumen Rn klassifizieren.
Als illustrierendes Beispiel zeigen wir nun, dass Kreis und Ellipse affin
äquivalent sind, also durch eine invertierbare Abbildung ineinander überführt
werden können: Hierzu sei eine Ellipse E mit metrischer Normalform
2 2
x2
x1
+
=1
α1
α2
gegeben (eine jede Ellipse lässt sich nach obigem ja in diese Gestalt bringen);
ebenso nehmen wir unseren Kreis K als den durch die Gleichung
x21 + x22 = 1
gegeben an. Dann überführt die Abbildung x1 7→ α1 x1 , x2 7→ α2 x2 die Ellipse E
in den Kreis K. So sind also Ellipse und Kreis nicht zu unterscheiden! Darstellungen wie die obige Kreisgleichung mit lauter auf ±1 normierten Koeffizienten
nennen wir die affine Normalform; für eine Hyperbel sieht diese beispielsweise
wie folgt aus
x21 − x22 = 1.
127
Allgemein entstehen die affinen Normalformen durch Setzen von αj = 1 in den
Gleichungen von Satz 3.21 über die metrische Normalform. Den Typ der Quadrik können wir so noch einfacher beschreiben; jedoch verlieren wir sämtliche
metrischen Informationen.
Wir wiederholen: Orthogonale Matrizen D in der Hauptachsentransformation D t AD = B liefern eine Diagonalmatrix B mit den Eigenwerten von A
in der Diagonalen (hierzu sind die Eigenvektoren zu normieren!). Ferner bleiben die Abstände bei x 7→ y := Dx zwischen jeweiligen Punkten erhalten und
die Quadrik ändert weder Form noch Größe, lediglich die Lage im euklidischen
Raum mag sich geändert haben. Insofern liefert die Klassifikation via der metrischen Normalform wesentlich mehr Informationen! Ist D hingegen eine Matrix
aus der SLn (R), so bleiben immerhin noch Volumina und Elemente und bei
D ∈ GLn (R) nur noch Parallelität erhalten.
Aufgaben
Aufgabe 91. Sei c ∈ R. Welches geometrische Objekt verbirgt sich hinter der Menge
aller x = (x1 , x2 , x3 ), die der Gleichung
x21 − 2x22 + 3x33 + c = 0
genügen? Welche Schnittkurven entstehen, wenn x3 konstant einer reellen Zahl gesetzt
wird?
Aufgabe 92. Welche Kurve zweiter Ordnung wird durch
2
{(ℓ2 + 2ℓ, ℓ2 − 2ℓ − 1)t ∈ R : ℓ ∈ R}
dargestellt?
Aufgabe 93 (Staatsexamen: Herbst 2003, Thema 2, Aufgaben 1 & 2). Gegeben
sei das von den Parametern r, s, t ∈ R abhängige lineare Gleichungssystem
x1 + 2x2 + 2x4
=
4
2x1 + 4x2 + rx3
=
1
sx1 + x3 + tx4
=
1
a) Für welche Wahl der Parameter ist die Lösungsmenge des Systems eindimensional, also eine affine Gerade? (Die Antwort ist zu begründen.)
b) Es sei C die Menge der Parametertripel (r, s, t), für welche die Lösungsmenge des Systems keine affine Gerade ist. Als Teilmenge des euklidischen
R3 mit den Koordinaten r, s, t ist C ein Kegelschnitt, der in einer Koordinatenebene liegt. Was ist der affine Typ des Kegelschnitts und in welcher
Koordinatenebene liegt er?
c) Bestimmen Sie die Parameter r, s, t im Gleichungssystem so, dass die
Lösungsmenge zweidimensional, also eine affine Ebene ist. Lösen Sie das
System für diese Wahl der Parameter.
128
12. Kegelschnitte
Nachdem wir die verschiedenen Typen von Quadriken klassifiziert haben,
wollen wir jetzt den Zusammenhang zwischen diesen geometrischen Objekten
in der Ebene und im dreidimensionalen Raum beleuchten. Ein Kreiskegel im
euklidischen Raum R3 lässt sich durch die quadratische Gleichung
x21 + x22 − x23 = 0
beschreiben (s.o.). Sämtliche Quadriken der Ebene ergeben sich als Schnitte von
Ebenen mit einem solchen Kegel im dreidimensionalen Raum, weshalb diese den
Namen Kegelschnitt tragen (siehe Abbildungen 29-31) und Analoges gilt für
den Fall von mehr als dreidimensionalen Kegeln. Schneiden wir etwa mit der
Abbildung 29. Eine Ellipse entsteht als Schnitt eines Kegels mit einer
Ebene im Raum.
Ebene, die durch x3 = r mit einer fixierten positiven reellen Zahl r definiert ist,
so ergibt sich durch Einsetzen in der Kreiskegelgleichung die Gleichung
x21 + x22 = r 2 ,
welches bekanntlich einen Kreis vom Radius r mit Mittelpunkt im Ursprung in
der x1 x2 -Ebene beschreibt. Also ist die Schnittkurve unseres Kegels mit besagter
Ebene eben dieser Kreis. Wählen wir eine etwas geneigte Ebene statt x3 = r, so
129
ergeben sich Ellipse bzw. Parabel als Schnittkurven, wobei die Parabel genau
dann entsteht, wenn die Winkel bei Ebene und Kegel übereinstimmen (siehe
Abbildungen 29 und 31). Schneiden wir hingegen mit einer Ebene x2 = r,
wobei r ≥ 0 sei, so folgt nach Umstellen die Gleichung
x23 − x21 = r 2 ;
damit ist die Schnittkurve in diesem Fall ein Geradenpaar (wenn r = 0) oder
eine Hyperbel (wenn r > 0; siehe Abbildung 30).
Satz 3.22. Die Schnittkurve Q ∩ E einer Quadrik Q ⊂ R3 mit einer Ebene E
ist kongruent zu einer Quadrik Q′ ⊂ R2 (also einem Kegelschnitt). Ist Q ein
Kreiskegel, so existiert zu jeder Quadrik Q′ eine Ebene E, so dass Q′ ähnlich
zu der Schnittkurve Q ∩ E ist.
Beweis. Jede Ebene E in R3 lässt sich durch eine lineare Gleichung
α1 x1 + α2 x2 + α3 x3 + γ = 0
beschreiben; hierbei können nicht alle Koeffizienten αj verschwinden, also sei
oBdA α3 = 1. Auflösen der Ebenengleichung nach x3 und Einsetzen in die Q
definierende quadratische Gleichung liefert eine Gleichung in x1 und x2 von
einem Grad kleiner oder gleich zwei. Also existiert zu Q nach dem Satz über
die metrische Normalform eine Bewegung f , so dass Q′ = f (Q ∩ E). Dass jede
Quadrik Q′ ⊂ R2 ähnlich zu einem Schnitt eines Kegels mit einer passenden
Ebene ist, also die Quadriken der Ebene den Namen Kegelschnitt zu Recht
tragen, hatten wir uns bereits überlegt. •
Ellipsen treten beispielsweise als Schnittkurven einer Ebene mit Ellipsoiden,
elliptischen Paraboloiden, ein- oder auch zweischaligen Hyperboloiden, Kegeln
oder elliptischen Zylindern auf, jedoch nicht als Schnitt einer Ebene mit etwa
einem hyperbolischen Zylinder. Die einzige Quadrik, die alle drei Kegelschnitte,
also Ellipse, Hyperbel und Parabel, als Schnittkurve mit einer geeigneten Ebene
liefert, ist der Kegel!
Abschließend diskutieren wir nun die Frage:
Wieviele Punkte bestimmen einen Kegelschnitt eindeutig?
Wir erinnern: zwei Punkte legen eine Gerade durch ebendiese fest, und mit ein
wenig mehr Mühe zeigt sich, dass drei Punkte, welche nicht auf einer Geraden
liegen, einen Kreis definieren.
Satz 3.23 (Fünfpunktesatz). Durch fünf Punkte, von denen keine vier kollinear sind, gibt es immer einen Kegelschnitt. Ferner existiert zu gegebenen
verschiedenen fünf Punkten, von denen keine drei auf einer Geraden liegen,
existiert ein ein eindeutiger Kegelschnitt durch diese fünf Punkte.
Beweis. Ein Kegelschnitt Q ⊂ R2 ist definiert durch eine quadratische Gleichung:
α1 x2 + α2 y 2 + α3 xy + α4 x + α5 y + α6 = 0.
130
Abbildung 30. Eine Hyperbel als Kegelschnitt.
Wir nehmen an, dass nicht alle quadratischen Terme verschwinden (ansonsten
haben wir es mit einer Gerade zu tun); sei also oBdA α1 verschieden von null.
Nach Division durch α1 entsteht die äquivalente Gleichung
x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0
mit aj = αj+1 /α1 . Diese quadratische Gleichung beschreibt also nach wie vor
unsere gegebenen Kegelschnitt Q! Angenommen, wir wissen nicht, um was für
einen Kegelschnitt es sich bei Q handelt, sondern wir kennen lediglich m Punkte
Pj = (xj , yj ), die auf unserem Kegelschnitt liegen, also Pj ∈ Q für j = 1, . . . , m.
Wie viele solche Punkte m benötigen wir, um den genauen Typ unseres Kegelschnittes bestimmen zu können?
Wir schreiben statt Pj = (xj , yj ) ∈ Q die entsprechenden Gleichungen
nieder:
x21 + a1 y12 + a2 x1 y1 + a3 x1 + a4 y1 + a5
=
0
x22 + a1 y22 + a2 x2 y2 + a3 x2 + a4 y2 + a5
=
0
...
2
x2m + a1 ym
+ a2 xm ym + a3 xm + a4 ym + a5
=
0.
131
Abbildung 31. Eine Parabel als Kegelschnitt.
Dies sind m lineare Gleichungen in fünf Unbekannten: a1 , a2 , . . . , a5 (die Terme
gebildet aus den xj , yj sind hier die Koeffizienten: bei konkreten Punkten Pj sind
dies die Koordinaten, also Skalare). Wir können dieses lineare Gleichungssystem
auch umschreiben zu

 

 2
−x21
a1
y 1 x1 y 1 x1 y 1 1
 ..
..   ..  =  ..  ;
 .
.  .   . 
y m xm y m xm y m 1
a5
−x2m
Die Lösungsmenge dieses inhomogenen linearen Gleichungssystems ist nicht leer
(denn wir gehen ja von Punkten Pj aus, deren Koordinaten dieses lösen). Gehen
wir von vier Punkten Pj aus , also m = 4, so haben wir einen Freiheitsgrad unter
den fünf Unbekannten a1 , . . . , a5 und wir können im Allgemeinen keine eindeutige Lösung finden, die unseren Kegelschnitt festlegt. Aus der linearen Algebra ist
bekannt, dass eine eindeutige Lösung unseres linearen Gleichungssystems genau
dann existiert, wenn der Rang der Koeffizientenmatrix
 2

y 1 x1 y 1 x1 y 1 1

.. 
A =  ...
. 
y m xm y m xm y m 1
132
mit der Anzahl n = 5 der Unbekannten übereinstimmt (bzw. gleich dem Rang
der erwiterten Matrix (A, b) mit der rechten Seite b ist). Wir benötigen im Allgemeinen also fünf Punkte um den Kegelschnitt aus fünf auf diesem liegenden
Punkten exakt bestimmen zu können. Hierbei ist allerdings auszuschließen, dass
drei oder mehr der Punkte Pj auf einer Geraden liegen, ansonsten reduzieren
sich die linear unabhängigen Gleichungen, die wir den Punkten Pj ∈ Q zugeordnet hatten (und entsprechend der Rang). •
Man beachte hier, dass kollinear gelegene Punkte alleine beispielsweise keine
Gerade eindeutig festelegen können!
Wir schließen mit einem illustrierenden Beispiel: In der Ebene sei eine uns
unbekannte Quadrik Q gegeben, die definierende Gleichung sei
x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0,
und wir kennen vier Punkte P1 = (1, 0), P2 = (−1, 0), P3 = (0, 1), P4 = (0, −1),
welche allesamt auf Q liegen. Es bestehen somit die folgenden vier linearen
Gleichungen in den fünf Unbekannten a1 , . . . , a5 :


 a1



0
1 0 1 0 1 

a2  
 1 0 −1 0 1  
  0 

.

=

 0 0 1 0 1   a3 
  −1 
 a4 
0 0 −1 0 1
−1
a5
Lösen dieses linearen Gleichungssystems liefert a1 = 1, a3 = 0, a4 = 0, a5 = −1
und a2 ist ein freier Parameter. Setzen wir als a3 = α mit beliebigem α ∈ R, so
ergibt sich für die Q definierende Gleichung
x2 + y 2 + αxy = 1.
Wir sehen, dass durch Angabe von vier Punkten Pj ∈ Q, die Quadrik noch
nicht eindeutig bestimmt ist. Geben wir einen weiteren Punkt vor, so können
verschiedene Dinge passieren. Der Punkt (0, 0) kann einerseits nicht auf Q liegen,
andererseits läge er auch mit wei weiteren Punkten der vier anderen auf einer
Geraden, was im Fünfpunktesatz ausgeschlossen ist. Hingegen folgt aus der
Forderung P5 = (3, 5) sofort, dass α = − 33
15 , also Q durch
x2 + y 2 −
33
15 xy
1 2
u +
− 12
25 2
12 v
= 1.
11
Mit dem Beispiel aus §3.9 (mit a = 1 und b = − 33
30 = − 10 ) ergibt sich dann die
hauptachsentransformierte Gleichung
= 1,
womit Q also die durch die Punkte P1 , . . . , P5 ∈ Q eindeutig bestimmte Hyperbel ist (siehe Abbildung 32).
133
Abbildung 32. Fünfpunkte auf einer Hyperbel.
Aufgaben
Aufgabe 94. Es sein λ ein reeller Parameter. Welche Kegelschnitte verstecken sich
hinter den Schnitten der Ebene Eλ
 


 
1
0
0
 0  + R λ  + R 0 
0
1
1
mit dem Kreiskegel Q, der gegeben ist durch die Gleichung x2 + y 2 − z 2 = 0?
3
Aufgabe 95. Für welche Quadriken Q ⊂ R kann ein Schnitt mit einer Ebene eine
Hyperbel liefern?
Aufgabe 96. Man zeige, dass der Durchschnitt zweier Kugeloberflächen im Raum
entweder leer, ein Punkt oder ein Kreis ist, der in einer orthogonal zur Geraden durch
die zwei Kugelmittelpunkte liegenden Ebene enthalten ist.
Aufgabe 97. Beweisen Sie, dass sich stets ein Kreis durch drei nicht kollineare Punkte
legen lässt und dieser eindeutig bestimmt ist.