Analytische Geometrie für Lehramtstudierende der Schulformen Grund-, Haupt- und Realschule Jörn Steuding Universität Würzburg, Wintersemester 2011/12 Geometrie steht wörtlich für die Vermessung der Erde, entspringt also einem praktischen Anliegen, hat sich aber natürlich im Laufe ihrer über fünf Jahrtausende währenden Geschichte zu einer sehr vielfältigen mathematischen Disziplin entwickelt. In der Schule spielt die Geometrie eine zentrale Rolle, insbesondere in der Mittel- und Oberstufe. In dieser Vorlesung werden wir insbesondere jene Aspekte eingehend studieren, die sich mit Hilfe der Methoden der linearen Algebra untersuchen lassen: Neben der Klassifikation der Quadriken (insbesondere der Kegelschnitte) werden wir auch ein wenig klassische Geometrie kennen lernen, aber auch japanische Geometrierätsel (so genannte sangakus) lösen... Ein herzlicher Dank an Nicola Oswald für das Erstellen diverser Bilder und kritische Lektüre. Trotzdem ist dieses Skript - wie fast jeder längere geschriebene Text - wohl nicht ohne Druckfehler. Vielen Dank für weitere Korrekturen einer früheren Version dieses Skriptes gebühren meinem Koellegen Prof. Dr. Fabian Wirth. Weitere Berichtigungen und Verbesserungsvorschläge sind herzlich willkommen. Viel Spaß! Jörn Steuding, Würzburg im April 2013. Empfehlenswerte Literatur zum Thema: • T. Arens, F. Hettlich, C. Karpfinger, U. Kockelkorn, K. Lichtenegger, H. Stachel, Mathematik, Spektrum 2008 (ein umfangreiches Buch mit den wichtigsten Resultaten zur Analysis und linearen Algebra) • Rolf Brandl, Vorlesungen über analytische Geometrie, Brandl Verlag, 1997 (hält, was es verspricht) • D.M. Burton, The history of Mathematics, McGraw-Hill, 2011 (Geschichte!) • R. Courant, H. Robbins, Was ist Mathematik?, Springer 1993, 4. Auflage (ein Klassiker!) • G. Fischer, Analytische Geometrie, Vieweg 2001, 7. Auflage (die Standardreferenz!) • A. Holme, Geometry. Our cultural heritage, Springer 2010, 2nd ed. (sehr schön geschriebenes Buch zur Geschichte der Geometrie) • K. Johannson, Geometrie für das Lehramt, www.mathematik.uni-frankfurt.de/∼johannson (schönes Vorlesungsskript!) • F. Klein, Elementarmathematik vom höheren Standpunkt, Teil II: Geometrie, Teubner 1909 (setzte seinerzeit Maßstäbe für das Lehramt) • M. Koecher, A. Krieg, Ebene Geometrie, Springer 2007, 3. Auflage (alles Wissenswerte zur Geometrie in der Ebene) • J. Kratz, K. Wörle, Geometrie, Bayerischer Schulbuchverlag München 1972 (ein älteres Schulbuch) • H. Scheid, W. Schwarz, Elemente der Geometrie, Spektrum 2007, 4. Auflage (uneingeschränkt empfehlenswert!) • C.J. Scriba, P. Schreiber, 5000 Jahre Geometrie, Springer 2001 (umfangreiches Geschichtswerk) • J. Steuding, Elementare Zahlentheorie, Vorlesungsskript WS 2009/10, www.mathematik.uni-wuerzburg.de/∼steuding/elzt.pdf • J. Stilwell, Numbers and Geometry, Springer 2001 (Zahlentheorie und Geometrie gut erklärt und mit geschichtlichem Hintergrund) Inhaltsverzeichnis Kapitel 1. Eine kurze Geschichte der Geometrie 1. Thales und die Ursprünge der Geometrie 2. Eratosthenes und die Messung des Erdumfangs 3. Der Satz des Pythagoras und seine Verwandten 4. Pythagoräische Tripel 5. Die Entdeckung der Inkommensurabilität 6. Platonische Körper und die Polyederformel 7. Euklids Elemente und die Axiomatisierung der Mathematik 8. Was lässt sich mit Zirkel und Lineal konstruieren? 9. Die Algebraisierung der Geometrie durch Descartes und Fermat 10. Sangakus 4 4 7 9 11 15 18 22 25 28 31 Kapitel 2. Analytische Geometrie in euklidischen Räumen 1. Lineare Gleichungssysteme 2. Geraden und Ebenen 3. Das Skalarprodukt 4. Symmetrische Matrizen 5. Winkel und die trigonometrischen Funktionen 6. Orthogonalität 7. Hessesche Normalform 8. Vektorprodukt und Spatprodukt 33 33 35 38 43 46 50 54 60 Kapitel 3. Kegelschnitte 1. Quadratische Formen 2. Kreise und Ellipsen 3. Hyperbeln und Parabeln 4. Die orthogonale Gruppe 5. Drehungen in der Ebene und im Raum 6. Euklidische Bewegungen * Wiederholung: Eigenwerte und Diagonalisierbarkeit * 7. Bewegungen in der Ebene *** Weihnachtsvorlesung *** 8. Ähnlichkeitsabbildungen 9. Hauptachsentransformation 10. Allgemeine Kurven zweiter Ordnung 11. Klassifikation der Quadriken 12. Kegelschnitte 3 66 66 69 73 77 80 86 89 91 95 99 103 110 121 128 KAPITEL 1 Eine kurze Geschichte der Geometrie Geometrie ist mit einer Tradition von über fünftausend Jahren eine der ältesten mathematischen Disziplinen überhaupt. Wir geben im Folgenden einen sehr kurzen Abriss ihrer Entwicklung mit Fokus auf die ebene Elementargeometrie und diejenigen Aspekte, welche insbesondere für die analytische Geometrie relevant sind (und darüber hinaus auch viel für den Schulunterricht zu bieten haben). 1. Thales und die Ursprünge der Geometrie Bereits im alten Mesopotamien und Ägypten finden sich bemerkenswerte geometrische Einsichten wie etwa die Formel für die Fläche eines Dreiecks sowie Näherungen für die Kreisfläche. Auf dem ägyptischen Papyrus Rhind findet sich beispielsweise bereits ca. 1700 v.Chr. die Approximation 4( 89 )2 = 3, 16 . . . an die Kreiszahl π. Über den Kenntnisstand und den Hintergrund ihrer mathematischen Untersuchungen ist mangels Überlieferungen oft leider nur wenig bekannt. So ist auch die Herleitung der genannten Näherung an π nicht klar; sie ist aber recht nahe an der exzellenten Kettenbruchnäherung 3 71 (während die alten Babylonier und Hebräer hatten noch die wesentlich schlechtere Approximation 3 benutzt haben). Es wird heutzutage davon ausgegangen, dass die Mathematik, die in diesen Kulturen betrieben wurde, sehr an praktischen Problemen orientiert war und Rechenmethoden phänomenologisch entdeckt wurden. Das Konzept des Beweises, welches die Mathematik zu einer exakten Wissenschaft macht (der einzigen!), hat wohl erst mit den alten griechischen Denkern Einzug in die Mathematik genommen! Der Beginn der Geometrie ist nur bedingt auf einen Zeitpunkt bzw. auf eine Kultur oder gar eine Person datierbar. Als erster griechische Geometer mag vielleicht Thales von Milet (∗ 622 - † 547) gelten. Viele seiner Erkenntnisse erwarb er in Ägypten und Babylonien, jedoch entwickelte er zusätzlich eigene bahnbrechende Ideen in Philosophie und Mathematik. Thales größter geometrischer Verdienst ist die Einführung von Winkeln und erste Untersuchungen ebendieser. Ein Winkel entsteht demzufolge durch den Schnitt zweier Geraden; ein rechter Winkel ist dabei ein solcher, wenn die beiden Geraden sich ’symmetrisch’ schneiden. Für ebensolche gibt Thales folgende Konstruktion an: Zu zwei verschiedenen Punkten P, Q bilde man die Verbindungsstrecke P Q und schlage jeweils einen Kreis von einem Radius größer als die Hälfte der Länge von P Q; dann schneiden sich diese Kreise in zwei verschiedenen Punkten P ′ , Q′ und deren Verbindungsstrecke P ′ Q′ steht auf Grund der Symmetrie senkrecht auf P Q, so dass ein rechter Winkel entstanden ist (bzw. mehrere rechte Winkel). 4 5 Wir geben einige weitere repräsentative Beispiele seines Schaffens: Satz 1.1. In einem gleichschenkligen Dreieck sind die Basiswinkel gleich. Beweis (nach Pappus). Wir führen implizit grundsätzliche Notation ein. Sei ABC ein gleichschenkliges Dreieck mit Eckpunkten A, B und C; dabei gelte für die Längen der Strecken AB von A nach B und BC von B nach C Gleichheit: |AB| = |BC|. Jetzt spiegeln wir das Dreieck so, dass AB auf BC zu liegen kommt und BC auf AB. Wegen der Symmetrie gleichschenkliger Dreiecke nimmt das gespiegelte Dreieck genauso viel Fläche ein wie das Ausgangsdreieck und insbesondere sind die Basiswinkel gleich. • Übrigens: An Bildern lassen sich mathematische Schlussweisen manchmal gut illustrieren, allerdings kann ein Bild keinen mathematischen Beweis ersetzen. Das logische Begründen eines jeden Schrittes ist notwendig! Ein Bild stellt oftmals nur einen bestimmten Spezialfall eines viel allgemeineren Sachverhaltes dar. Abbildung 1. Links Thales’ Konstruktion eines rechten Winkels. Aus der rechten Figur lassen sich viele von Thales’ Ergebnissen entwickeln, z.B.: der Durchmesser halbiert den Kreis. Entdecken Sie weitere Gesetzmäßigkeiten? Satz 1.2. Der Durchmesser halbiert den Kreis. Beweis. Der Durchmesser zerlegt den Kreis in zwei Teile. Wir denken uns den einen Teil auf den anderen gelegt. Sind die beiden nicht gleich, so liegt der obere Teil entweder innerhalb oder außerhalb des unteren. Da alle Linien vom Mittelpunkt zur Kreislinie einander gleich sind, folgt in beiden Fällen, dass die kürzere Gerade gleich der längeren ist, der gewünschte Widerspruch. • Dieser Beweis geht auf Proklos (im fünften Jahrhundert n.Chr.) zurück und ist einer der ersten überlieferten indirekten Beweise überhaupt! Satz 1.3 (Winkelsummensatz). Die Winkelsumme im Dreieck ist zwei Rechte (beträgt also π bzw. 180 Grad). 6 Bevor wir den Beweis in Angriff nehmen, erinnern wir: Schneidet eine Gerade zwei andere Geraden g und h, so nennt man die auf den gleichen Seiten liegenden Winkel Stufenwinkel; diese sind genau dann gleich, wenn die Geraden g und h parallel sind. Die gegenüber sitzenden Winkel nennt man oft Wechselwinkel und auch diese sind natürlich genau dann gleich, wenn die Geraden parallel sind. Beweis. Gegeben ein Dreieck ABC, ziehen wir eine Parallele zur Seite AB durch den Punkt C. Weil die Wechselwinkel an parallelen Geraden gleich sind, finden wir die Innenwinkel an den Ecken A und B zwischen der Parallelen und den Schenkeln an C wieder. Es folgt also, dass die Summe der Innenwinkel gleich zwei rechten Winkeln ist. • Abbildung 2. Beispiels zum Winkelsummensatz (links) und dem Satz des Thales (rechts); zur Übung wird empfohlen, rechts die Bezeichnungen des Beweises einzufügen und den Beweis noch einmal am Bild nachzuvollziehen. Und natürlich zeigte Thales seinen berühmten Satz 1.4 (Satz des Thales). Der Peripheriewinkel im Halbkreis ist ein rechter. Ein Dreieck in einem Halbkreis beinhaltet also stets einen rechten Winkel. Es heißt, dass Thales aus Dank für diese Erkenntnis den Göttern einen Ochsen opferte! Beweis (nach Euklid). Sei ABC das Dreieck mit den Eckpunkten A, B, C über einem Kreisdurchmesser AB, so ist zu zeigen, dass für den Winkel ∠(ACB) bei C im Bogenmaß die Gleichung ∠(ACB) = π2 gilt. Sei M der Mittelpunkt des Kreises, dann sind AM C und CM B gleichschenklige Dreiecke mit also gleichen Winkeln ∠(M AC) = ∠(M CA) =: ϕ und ∠(M CB) = ∠(M BC) =: ψ. Mit dem Winkelsummensatz folgt π = ∠(CM A) + ∠(BM C) = (π − 2ϕ) + (π − 2ψ) und daraus ergibt sich daraus ∠(ACB) = ϕ + ψ = π2 . • Thales befasste sich auch mit Navigationsproblemen in der Schifffahrt. Die Seefahrer des Altertums orientierten sich soweit möglich an der Küstenlinie∗ und Thales benutzte seine Winkel zur Bestimmung der Entfernung von Schiffen von der Küste. Aber Thales betätigte sich auch als Astronom und sagte die ∗ was vielleicht Odysseus’ lange Irrfahrt erklärt? 7 Sonnenfinsternis am 22. Mai 585 v.Chr. (nach unserer Zeitrechnung) voraus. In erster Linie wird Thales aber (seit Aristoteles) als Philosoph verstanden, fragte er doch als Erster nach dem Urgund des Seins und Geschehens; seine Naturphilosophie basiert auf der Überlegung, dass alles in der einen oder anderen Weise aus dem Wasser entstanden ist. Aufgaben Aufgabe 1. Beweisen Sie folgende Sätze von Thales: • Die Scheitelwinkel zwischen zwei sich schneidenden Geraden sind gleich. • Die Diagonalen eines Rechtecks sind gleich und halbieren einander. Aufgabe 2. Welche geometrische Methode mag Thales für die Messung der Entfernung eines Schiffes von der Küste benutzt haben? (Hinweis: Das Buch von Hulme.) 2. Eratosthenes und die Messung des Erdumfangs Geometrie steht für die die Messung der Erde. Lokal sieht unsere Umwelt (abgesehen von den Weinbergen) eben aus, tatsächlich ist unsere Erde aber eine abgeflachte Kugel. Bei den alten Griechen war die Meinung, dass die Erde eine Kugel sei, bereits seit den Arbeiten von Pythagoras und seinen Schülern (s.u.), sowie Parmenides und Plato vertreten. Aristoteles gab als einen Grund an, dass bei sich von der Küste entfernenden Schiffen zunächst der Rumpf und erst später die Segel und der Mast verschwinden; auch sei der Erdschatten bei einer Mondfinsternis kreisförmig. Diese Idee hat Eratosthenes von Syrene (∗ 276 - † 194 v.Chr.) noch wesentlich weiter gesponnen und in einem beeindruckenden Experiment eine Näherung für die Größe der Erdkugel angegeben. Eratosthenes beobachtete mittags am Tag der Sonnenwende (21. Juni) die Reflexion der Sonne in einem tiefen Brunnen in Syrene (dem heutigen Assuan), also steht die Sonne zu diesem Zeitpunkt nahezu senkrecht. Eratosthenes ließ an diesem Tag des darauf folgenden Jahres zwei Winkel messen: einmal den Winkel des Schattens, den die Sonne am Obelisken in Alexandria warf, sowie den rechten Winkel in besagtem Brunnen in Syrene. Ferner geht die Sonne in Syrene und Alexandria fast zur selben Zeit auf (sie liegen auf nahezu demselben Längengrad). Die Distanz zwischen Syrene und Alexandria beträgt 5000 Stadien; ein Stadion war eine im Mittelmeerraum zur damaligen Zeit übliche Längeneinheit, die regional zwischen 150 und 180 Metern schwankte. Der Winkel des Schattens betrug 7◦ 12′ Grad, bzw. 2π 50 als Bogenmaß. Entsprechend ergibt sich ein Erdumfang von 360◦ × 5 000 = 50 × 5 000 = 250 000 7◦ 12′ Stadien. Legen wir eine Länge von 160 Metern für ein Stadion zu Grunde, ergeben sich 40 000 Kilometer für den Erdumfang. Wie gelangte Eratosthenes zu letzter Formel? Als Stufenwinkel paralleler Geraden sind die Winkel α und α′ in Abbildung 3 gleich, also α = α′ = 2π 50 , woraus für die Länge des Kreisbogens von Alexandria nach Syrene eben die 25 000 Stadien resultieren. Tatsächlich 8 Abbildung 3. Die Sonne scheint auf Eratosthenes Experiment. beträgt der Erdumfang über die Pole 40 007, 76 Kilometer. Für eine Korrektur der Rechnung des Eratosthenes sei bemerkt, dass die wirkliche Entfernung von Syrene zu Alexandria 729 Kilometer beträgt und der Winkel des Schattens in Alexandria 7◦ 5′ ist. Ferner liegen Alexandria und Syrene nicht auf demselben Längenkreis, sondern um drei Grad verschoben. Eine weitere Annahme in Eratosthenes Experiment ist, dass die Sonnenstrahlen parallel verlaufen, was wir hier aber nicht weiter erörtern wollen... Eratosthenes war nicht nur Erdvermesser, sondern auch Mathematiker, Astronom und Direktor der legendären Bibliothek von Alexandria. In der Philosophie war er ein Anhänger Platos (dem wir später noch kurz begegnen werden); in der Mathematik ist das Sieb des Eratosthenes ein wichtiges Werkzeug zur Auflistung der Primzahlen (vgl. das Skript Elementare Zahlentheorie). Die Liste der prominenten mathematischen Landvermesser ließe sich weiter ausdehnen. Beispielsweise vermaß Gauß von 1821 bis 1825 das Königreich Hannover; seine Triangulationsmethode bildet einen Meilenstein in der Kartographie.† Aufgaben Aufgabe 3. Bereits Thales nutzte Geometrie zur Vermessung der Welt. So benutzte er den Schattenwurf einer Pyramide zu zwei verschiedenen Zeitpunkten, um deren Höhe zu messen! Konsultieren Sie Burtons Buch (Seite 88) für eine Anleitung. Illustrieren Sie die Methode mit einem praktischen Beispiel. Aufgabe 4. Versuchen Sie Eratosthenes’ Berechnung unter Verwendung der angegebenen präzisierten Daten zu verbessern! Aufgabe 5. Sie peilen abwechselnd über einen 20 cm entfernten Bleistift mit dem rechten Auge das Haus und mit dem linken Auge den Baum in Abbildung 4 an. Wenn † und wurde auf der früheren 10 DM-Note verewigt; sehr lesenswert ist der Roman ’Die Vermessung der Welt’ von Daniel Kehlmann. 9 Abbildung 4. Geometrie in action! Ihre Augen acht Zentimeter auseinanderliegen und Sie vom Haus 50 Meter entfernt sind, wie weit ist der Baum vom Haus entfernt? Testen Sie dieses Verfahren in ihrer Umwelt! 3. Der Satz des Pythagoras und seine Verwandten Wir gehen etwas zurück in der Zeit und widmen uns Pythagoras von Samos (ca. ∗ 569 -† 475 v.Chr.) und seiner Schule, die man als einen Vorläufer heutiger Universitäten ansehen kann. Die Pythagoräer befreiten die Mathematik von der Notwendigkeit praktischer Anwendungen; die Motivation ihrer Mathematik war, dem Göttlichen näher zu kommen (um es mit den Worten von van der Waerden zu sagen).‡ Aber für Pythagoras und seine Schüler galten auch einige auf uns heute seltsam anmutende, selbst auferlegte Regeln wie etwa das Verbot, Bohnen zu essen. Eine mögliche Erklärung für dieses sonderliche Gebot mag in dem Selbstverständnis der griechischen Denker liegen: Gemäßigte Lebensweise und Mathematik wurden als der Weg angesehen, die unsterbliche Seele zu reinigen. Ein anderer, für uns relevanter, wenngleich ebenso kontroverser Grundsatz der Pythagoräer lautete: Alles ist Zahl, wobei das Zahlenuniversum der damaligen Zeit aus den positiven rationalen Zahlen bestand. Diese Behauptung sollte zur ersten Grundlagenkrise der Mathematik führen (die wir im anschließenden Paragraphen diskutieren werden). Aber zuerst behandeln wir den vielleicht bekanntesten Satz der Mathematik überhaupt: Satz 1.5 (Satz des Pythagoras). In einem rechtwinkligen Dreieck ist die Summe der Quadrate der Katheten gleich dem Quadrat der Hypothenuse. ‡ Das äußerst lesenswerte Buch Als die Götter lachen lernten von H. Heuser (Piper 1992) gibt einen amüsanten Einblick in die Gedankenwelt der alten Griechen. 10 Abbildung 5. Links der Satz des Pythagoras ”a2 + b2 = c2 ”, rechts ein Bild, welches zu einem Beweis desselben ausgebaut werden kann. Beweis. Wir berechnen den Flächeninhalt des Quadrates mit Kantenlänge a + b in Abbildung 5 auf zwei verschiedene Arten. Zunächst einmal ist besagte Fläche gleich dem Quadrat der Seitenlänge; andererseits können wir besagtes Quadrat auch in ein Quadrat der Kantenlänge c und vier kongruente, also deckungsgleiche rechtwinklige Dreiecke mit Kathetenlängen a und b disjunkt zerlegen. Also gilt (a + b)2 = c2 + 4 · 12 ab. Mit dem binomischen Satz folgt hieraus unmittelbar die Formel des Satzes. • Es sei bemerkt, dass der binomische Satz geometrisch im Sinne von Abbildung 6 gedeutet werden kann. Es gibt eine Vielzahl von weiteren Beweisen des Sat- Abbildung 6. Der binomische Lehrsatz (a + b)2 = a2 + 2ab + b2 . zes des Pythagoras; z.B. von Leonardo da Vinci, dem indischen Mathematiker Bhaskara II aus dem 12 Jhd. oder vom US-Präsidenten Garfield (siehe hierzu die Bücher von Scheid & Schwarz bzw. Stilwell). Der Satz des Pythagoras und die folgenden beiden Sätze bilden die so genannte Satzgruppe des Pythagoras: 11 Satz 1.6 (Kathetensatz). In einem rechtwinkligen Dreieck ist das Quadrat über eine Kathete gleich dem Rechteck aus der Hypothenuse und dem der Kathete anliegenden Hypothenusenabschnitt. Abbildung 7. Links eine Illustration des Kathetensatzes, rechts des Höhensatzes: Bezeichnen q und p die Längen der Hypothenuse links bzw. rechts der Höhe h, so gelten a2 = pc und h2 = qp. Satz 1.7 (Höhensatz). In einem rechtwinkligen Dreieck ist das Quadrat über der Höhe zur Hypothenuse gleich dem Rechteck aus den Hypothenusenabschnitten. Jeder Satz der Satzgruppe des Pythagoras ist gleichwertig, d.h. jeder Satz ist aus jedem anderen der Sätze herleitbar: Kathetensatz, Höhensatz und der Satz des Pythagoras sind äquivalent (siehe entsprechende Übungsaufgabe). Aufgaben Aufgabe 6. Zeigen Sie folgende Implikationen: Kathetensatz ⇒ Satz des Pythagoras ⇒ Höhensatz ⇒ Kathetensatz. Aufgabe 7. Parallel zur Grundlinie eines Dreieckes werden Linien gezeichnet, die die beiden anderen Seiten des Dreiecks in jeweils zehn gleich große Teile zerlegen. Jeder zweite sich so ergebende Streifen wird schwarz eingefärbt. Wie viel Prozent der Fläche des Dreiecks können schwarz sein? Aufgabe 8. Zeigen Sie folgende Verallgemeinerung des Satzes des Pythagoras: Wir zeichnen über den Seiten eines rechtwinkligen Dreiecks gleichsinnig ähnliche Dreiecke (mit also gleichen Winkeln in den entsprechenden Ecken) wie in Abbildung 8. Zeigen Sie, dass dann die Flächensumme der Kathetendreiecke mit der Fläche des Hypothenusendreiecks übereinstimmt. 4. Pythagoräische Tripel Der Satz des Pythagoras lässt sich auf nicht notwendig rechtwinklige Dreiecke verallgemeinern: 12 Abbildung 8. Der pythagoräische Lehrsatz gilt auch mit ähnlichen Dreiecken statt der üblichen Quadrate. Satz 1.8 (Cosinussatz). Gegeben ein Dreieck ABC mit Seitenlängen a, b und c (gegenüber den Ecken A, B und C wie in Abbildung 9). Dann gilt a2 + b2 = c2 + 2ab cos γ, wobei γ = ∠(ACB) der Winkel bei C ist. Abbildung 9. Nicht jedes Dreieck ist rechtwinklig! Wir werden diesen Satz erst im nächsten Kapitel beweisen.§ Als unmittelbare Konsequenz ergibt sich § Der/Die ungeduldige LeserIn sei auf das Skript von Johannson verwiesen. 13 Korollar 1.9 (Umkehrung des pythagoräischen Satzes). Gegeben ein Dreieck mit Seitenlängen a, b und c. Gilt a2 + b2 = c2 , so ist das Dreieck rechtwinklig. Der Satz des Pythagoras und seine Verallgemeinerung haben enorme Konsequenzen. Von diesen wollen wir zuerst mit den pythagoräischen Tripeln eine arithmetische Anwendung mit durchaus praktischen Nutzen betrachten: Die pythagoräischen Tripel erlauben die Konstruktion von rechten Winkeln, die in der Baukunst so wichtig sind und welche bereits den alten Babyloniern vor ca. 3500 Jahren bekannt waren. Auch die Aussage des Satzes des Pythagoras war wohl zu diesen Zeiten bereits bekannt, wenngleich es in der babylonischen Mathematik wohl noch keine Beweise gab. Hier einige Beispiele: 32 + 42 = 52 , 52 + 122 = 132 , 652 + 722 = 972 , ... Wegen des Cosinussatzes 1.9 führen diese Identitäten tatsächlich auf rechtwinklige Dreiecke mit ganzzahligen Seitenlängen; gerade wegen der Ganzzahligkeit der seiten, sind diese Dreiecke damit leicht zu konstruieren! Aber wie gelangt man zu Identitäten wie die oben erwähnten? Gegeben sei die Gleichung X 2 + Y 2 = Z 2; Lösungen (x, y, z) in natürlichen Zahlen heißen pythagoräische Tripel zu Ehren von Pythagoras. Mit einer solchen Lösung (x, y, z) ist offensichtlich auch jedes Tripel (ax, ay, az) mit a ∈ N eine Lösung, wenn auch keine sonderlich interessante. Deshalb heißen Tripel (x, y, z), für die ggT(x, y, z) = 1 gilt, primitiv; die Teilerfremdheitsbedingung ist dabei äquivalent zur Forderung, dass die Zahlen x, y, z paarweise teilerfremd sind. Beispiele primitiver pythagoräischer Tripel sind gegeben durch 32 + 42 = 52 , 52 + 122 = 132 , 82 + 152 = 172 , während die folgenden Tripel offensichtlich nicht primitiv sind: 15222 + 28522 = 32322 und 31522 + 10822 = 33322 . Pythagoras fand eine unendliche Familie von primitiven pythagoräischen Tripeln basierend auf der Identität (2n + 1)2 + (2n2 + 2n)2 = (2n2 + 2n + 1)2 . Euklid gelang die komplette Charakterisierung primitiver pythagoräischer Tripel: Satz 1.10. Es seien a und b teilerfremde natürliche Zahlen unterschiedlicher Parität (d.h. entweder ist a gerade und b ungerade oder umgekehrt) und es gelte a > b. Dann ist (x, y, z), gegeben durch x = a 2 − b2 , y = 2ab, z = a2 + b2 , ein primitives pythagoräisches Tripel. Ferner ist jedes primitives pythagoräische Tripel von dieser Form. 14 Abbildung 10. Links: Der Einheitskreis geschnitten mit der Sekante durch die Punkte (−1, 0) und ( 53 , − 45 ) (mit Steigung m = − 21 ); dem zweiten Schnittpunkt entspricht das pythagoräische Tripel (3, 4, 5). Man beachte, dass die Zuordnung zwischen rationalen Punkten und pythagoräischen Tripeln nicht bijektiv ist (man denke an Vorzeichensymmetrien). Wir geben hiervon einen geometrischen Beweis (nach Bachet). Mittels U = cos t und V = sin t für 0 ≤ t < 2π lässt sich der Einheitskreis in der euklidischen Ebene parametrisieren (aus der Schule bekannt?) und der Satz des Pythagoras liefert damit via cos2 + sin2 = 1 die algebraische Gleichung C : U 2 + V 2 = 1. Wir schneiden nun diesen Einheitskreis mit der Geradenschar Lm : V = m(U + 1) für m ∈ Q. Jede Gerade Lm schneidet den Kreis in dem Punkt (−1, 0) sowie in einem weiteren Schnittpunkt, dessen Koordinaten sich vermöge Einsetzen über 1 = U 2 + (m(U + 1))2 ⇐⇒ (1 + m2 )U 2 + 2m2 U + m2 − 1 = 0 leicht berechnen als 1 − m2 2m . 1 + m 1 + m2 Tatsächlich ist also dieser zweite Schnittpunkt genau dann rational, wenn die Steigung m der Geraden Lm rational ist. Das ist für rationale m sofort einsichtig; √ für irrationale m der Form r mit einer rationalen Zahl r, die kein Quadrat ist, schaue man auf die v-Koordinate. Auf diese Weise erhalten wir nicht nur viele rationale Punkte auf dem Kreis, sondern sogar sämtliche: Die Sekante durch (−1, 0) und (u, v) ∈ C ∩ Q2 \ {(−1, 0)} besitzt nämlich eine rationale Steigung (u, v) = , 2 15 b a für ganzzahlige a, b ergibt sich so a 2 − b2 2ab , ∈ C. (u, v) = a2 + b2 a2 + b2 Den Punkt (−1, 0) erhalten wir vermöge m → ∞ (dem Fall der Tangente an (−1, 0)). Weil nun u2 + v 2 = 1 mit rationalen u = xz und v = yz auf x2 + y 2 = z 2 mit ganzzahligen x, y und z führt, und auch jedes solche einem rationalen Punkt entspricht, ergibt sich nun der euklidische Satz 1.10, allerdings zunächst ohne die Unterscheidung primitiver pythagoräischer Tripel (welche aber leicht mit elementaren Teilbarkeitsargumenten hinzugefügt werden kann). • und mittels m = Die pythagoräischen Tripel parametrisieren also die rationalen Punkte auf dem Einheitskreis! (was wir bereits in der Elementaren Zahlentheorie gesehen hatten.) Aufgaben Aufgabe 9. Heron von Alexandria lebte im ersten Jahrhundert nach Christus und bewies die so genannte Heronsche Formel: Ein Dreieck mit Seitenlängen a, b, c besitzt den Flächeninhalt p s(s − a)(s − b)(s − c), wobei s := 21 (a + b + c). Aufgabe 10. Es seien a1 = 3, c1 = 5 und an+1 = 3an + 2cn + 1 und cn+1 = 4an + 3cn + 2 für n ∈ N. Zeigen Sie, dass dann (an , an + 1, cn ) ein pythagoräisches Tripel ist. 5. Die Entdeckung der Inkommensurabilität Nun kommen wir zur angekündigten Grundlagenkrise der griechischen Mathematik. Nach dem√pythagoräischen Satz ist die Länge einer Diagonale im Einheitsquadrat gleich 2, welches bekanntlich keine rationale Zahl ist und damit nicht in das Weltbild der Pythagorärer passte. Diese Beobachtung geht wohl auf den Pythagoras-Schüler Hippasos von Metapont zurück; die Legende berichtet, dass Hippasos für den Verrat dieses Geheimnisses vom pythagoräischen Geheimbundes ausgestoßen und womöglich sogar ertränkt wurde. Die Einführung der reellen Irrationalzahlen blieb den griechischen Denkern verwehrt; sie behoben ihr mathematisches Dilemma auf einem anderen Wege. Eudoxos (ca. ∗ 408 - † 347 v.Chr.) entwickelte seine Proportionenlehre, welche auf geniale Weise die Schwierigkeit keine irrationalen Zahlen zu kennen, aus dem Wege räumt. Zwei Strecken heißen kommensurabel, falls es eine Strecke gibt, so dass beide Strecken jeweils ein ganzzahliges Vielfaches dieser sind (also deren Proportion rational ist); andernfalls sind die Strecken inkommensurabel. Kommensurabilität lässt sich mit Hilfe der geometrischen Wechselwegnahme – das ist eine Form des euklidischen Algorithmus bzw. sukzessiver Division mit Rest (vgl. Elementare Zahlentheorie) –, entscheiden. Zur Illustration betrachten wir ein Quadrat. Bezeichnen wir in Abbildung 12 die Ecken des großen Quadrates mit A, B, C und D und ziehen wir um A 16 Abbildung 11. Eine geometrische Variante des euklidischen Algorithmus: 33 = 3 · 10 + 3, 10 = 3 · 3 + 1 Abbildung 12. Erste Schritte zur Inkommensurabilität von Diagonale und Basis des Quadrates. Beschriften der Eck- und Schniottpunkte hilft beim Verständnis! einen Kreis durch B, so schneidet dieser die Diagonale von A nach C in einem Punkt E. Dabei gilt für die jeweiligen Längen |AC| = |AB| + |EC|. Wir bilden ein Quadrat zur Strecke EC und definieren F als den Eckpunkt auf der Geraden BC (verschieden von C) und nennen G den weiteren Eckpunkt. Dann ist das Dreieck BF E gleichschenklig und also |BF | = |F E|. Damit folgt |AB| = |BC| = |EC| + |F C|. Diese beiden Gleichungen bilden den Beginn des euklidischen Algorithmus für die Längen |AC| und |AB|, wobei vom großen Quadrat ABCD zum kleineren Quadrat EF GC übergegangen wurde. Setzen wir diese Konstruktion nun fort (zunächst mit dem Schlagen eines Kreises um F vom Radius |EF |), so ergeben sich sukzessive weitere, immer kleinere Quadrate; der euklidische Algorithmus terminiert nicht, d.h. die Längen |AC| und |AB| sind inkommensurabel. Wir haben also gezeigt: 17 Satz 1.11. Diagonale und Basis eines Quadrates sind inkommensurabel. Wir können diese Inkommensurabilität auch quantifizieren: Nach dem Satz des Pythagoras beträgt das Verhältnis von Diagonale und Seite eines Quadrates √ |AC|/|AB| = 2 √ und obiger Satz beweist die Irrationalität von 2 geometrisch!¶ Der nichtdeterminierende euklidische Algorithmus liefert übrigens einen unendlichen Kettenbruch: √ 2 = |AC|/|AB| = 1 + |EC|/|AB| 1 1 =1+ = 1 + |AB|/|EC| 1 + |F C|/|EC| ... = 1+ 1 2+ 1 2+ 1 ; .. . es ergibt sich der unendliche Kettenbruch mit lauter Zweien als Teilnennern. Abbildung 13. Die Seitenlängen zweier Quadrate, deren Flächen sich wie 2 : 1 verhalten sind nicht kommensurabel. Aufgaben Aufgabe 11. Zeigen Sie an einem regelmäßigen Fünfeck (Pentagramm), dass das Verhältnis von Diagonale und Seite inkommensurabel bzw. irrational ist. Aufgabe 12. Beweisen Sie, • dass die Seitenlängen zweier Quadrate, deren Flächen sich wie 2 : 1 verhalten nicht kommensurabel sind (leicht); • dass die Flächen zweier Kreise mit rationalen Radien kommensurabel sind (schwierig – und natürlich ohne die bekannte Formel für die Kreisfläche zu benutzen). ¶ für einen algebraischen Beweis sei an die Elementare Zahlentheorie erinnert! 18 6. Platonische Körper und die Polyederformel Den Pythagoräern folgte die Schule des großen Philosophen Sokrates. Einer dessen Schüler war Plato (oder Platon) (∗ 427 - † 347), welcher wiederum auch für die Mathematik bedeutsam war. Er gründete eine Akademie über deren Eingang stand geschrieben: Kein der Geometrie Unkundiger trete ein! Eines der berühmtesten Mitglieder der Akademie war Aristoteles, Philosoph und u.a. Erzieher des jungen Alexander, der sich später den Beinamen der Große gab. Aristoteles’ Ideen beeinflussten die Wissensschaft bis in die Renaissance; erst zu Zeiten von Kopernikus und Galilei wurden die aristotelischen Schriften teilweise widerlegt. Ein weiterer Schüler Platos war Theaitetos, dem bedeutende Einsichten in der räumlichen Geometrie gelangen. Abbildung 14. Die fünf platonischen Körper von links nach rechts: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder. Unter einem (dreidimensionalen) Polyeder verstehen wir einen von ausschließlich geraden Flächen (Ebenen) begrenztem Körper. Ein Polyeder heißt regulär bzw. platonischer Körper, falls alle Seitenflächen kongruente reguläre Vielecke sind und an jeder Ecke gleich viele von ihnen zusammen treffen. Einige Beispiele solcher sind uns wohlbekannt. Satz 1.12. Es gibt genau fünf platonische Körper, nämlich Tetraeder, Würfel, Oktaeder, Dodekaeder und Ikosaeder.∗ Die Entdeckung von Dodekaeder und Ikosaeder sind bemerkenswert und werden Theaitetos (ca. ∗ 417 - † 369 v.Chr.) zugesprochen; ihre Konstruktion in Buch XIII bildet einen der Höhepunkte in Euklids Elementen (s.u.). Den Beweis der Eindeutigkeitsaussage erbringen wir hier auf einem anderen Wege als Euklid, nämlich mit kombinatorischen Methoden einer Idee Eulers aus dem 18. Jahrhundert folgend. Dieser untersuchte, welche kombinatorischen Gesetzmäßigkeiten Polyeder im dreidimensionalen Raum besitzen. Kann es beispielsweise einen Polyeder mit 10 Ecken, 25 Kanten und 18 Flächen geben? Nein! Denn: Satz 1.13 (Eulersche Polyederformel). Gegeben sei ein Polyeder mit genau e Ecken, f Flächen und k Kanten. Dann gilt e + f = k + 2. ∗ Eine Bastelanleitung bayreuth.de//mmlu/gzu findet man im Internet, z.B. auf http://did.mat.uni- 19 Euler formulierte seine Polyederformel erstmals im Jahre 1750 in einem Brief an Goldbach. Tatsächlich war diese Formel im Wesentlichen bereits Descartes bekannt. Leibniz sichtete nämlich den Nachlass von Descartes und notierte eine verwandte Formel; während Descartes’ Papiere verschollen sind, wurden Leibnizs Aufzeichnungen im 19. Jahrhunder in der Königlich Hannoverschen Bibliothek wiedergefunden. Beweis (nach Thurston†). Wir stellen das gegebene Polyeder so in eine leere Badewanne, dass keine zwei Ecken auf gleicher Höhe sind, womit auch keine waagerechten Kanten auftreten. Nun lassen wir Wasser in die Wanne fließen. Immer, wenn der Wasserspiegel eine Ecke übersteigt, werden neue Kanten und Flächen nass; handelt es sich dabei nicht um die unterste oder oberste Ecke, werden dabei stets eine Kante mehr nass als Flächen. Bei der untersten Ecke hingegen sind es gleich viele Kanten wie Flächen; bei der obersten wird gar nichts Neues nass. Damit ergibt sich nach vollständigem Wassereinlass die Anzahl der Kanten als Anzahl der Flächen plus einer zusätzlichen Kante pro Ecke, wobei die oberste und unterste Ecke auszuschließen ist. Also: k = f + e − 2, was zu zeigen war. • Nun gelingt der Beweis von Satz 1.12. Unser Polyeder besitze f Flächen, e Ecken und k Kanten. Wir erinnern an die Definition eines regulären Polyeders: Jede Fläche ist ein reguläres n-Eck und von jeder Ecke gehen genau m Kanten aus; jede Kante berandet zwei Flächen und verbindet zwei Ecken. Also bestehen die Gleichungen 2k = nf und 2k = me. Mit der Eulerschen Polyederformel ergibt sich 2 2 −1+ . 2=f −k+e=k n m 1 Also muss die Ungleichung n1 + m > 12 bestehen. Damit kommen nur 3 ≤ m, n ≤ 5 in Frage. Wir notieren für die fünf platonischen Körper: Tetraeder Würfel Oktaeder Dodekaeder Ikosaeder f 4 6 8 12 20 k e m n 6 4 3 3 12 8 3 4 12 6 4 3 30 20 3 5 30 12 5 3 Es ist nicht schwierig zu sehen, dass für andere Werte von m, n besagte Ungleichung nicht besteht, womit die Existenz von genau den oben angeführten fünf platonischen Körpern erbracht ist. • Der Beweis ist sehr interessant, benutzt er doch eine kombinatorische Beschreibung von Gestalt und Form. Geometrische Objekte werden auf gewisse mathematische Größen reduziert; die Schlussweise basiert letztendlich auf einer † siehe hierzu auch C. Blatter, G.M. Ziegler, Eulers Polederformel, und die Arithmetisierung der Gestalt, www.math.eth.ch/∼blatter/Mathesis.pdf 20 Ungleichung für eben diese Kenngrößen. Diese Idee, sich auf die wesentlichen Daten eines geometrischen Objektes zu konzentrieren, wurde von Euler auch bei seiner Behandlung des Königsberger Brückenproblems gewinnbringend eingesetzt, womit er u.a. die Topologie begründete. Abbildung 15. Das Königsberger Brückenproblem: Existiert ein Rundweg durch Königsberg (heute Kaliningrad), welcher jede der sieben Brücken über den Fluss Pregel genau einmal überquert? Übrigens: Der Architekt und Designer Buckminster Fuller konstruierte geodätische Kuppeln wie etwa den buckyball C60 , ein abgestumpftes Ikosaeder mit einer Oberfläche bestehend aus zwölf regulären Fünf- und zwanzig regulären Sechsecken.‡ Den Hintergrund bilden die so genannten Fullerene, also sphärische Moleküle von Kohlenstoffen, welche zuerst von Osawa 1970 vorausgesagt wurden. Zur weiteren Flächen- und Volumenberechnung von regelmäßigen Körpern haben wir in der Analysis mit dem Integralkalkül ein wichtiges Konzept kennen gelernt. Oft genug hilft aber auch elementare Geometrie: Ein regelmäßiges Sechseck mit Seitenlänge a lässt sich in sechs gleichseitige Dreiecke zerlegen. Da für deren Höhe h jeweils a 2 3 = a2 h2 = a2 − 2 4 √ gilt, ergibt sich für den Flächeninhalt des regelmäßigen Sechsecks 3 2 3 a2 . Selbiges für das regelmäßige Fünfeck zu berechnen ist bereits schwieriger (hier gibt es ein Wiedersehen mit dem aus der elementaren Zahlentheorie bekannten goldenen Schnitt). Der Satz von Pick aus dem Jahre 1899 erlaubt eine einfache Berechnung des Flächeninhaltes von Polygonen durch Abzählen von Gitterpunkten. Dazu ‡ welchem gewisse Fußbälle nachempfunden sind! 21 sei P ein Polygon, welches nur Eckpunkte mit ganzzahligen Koordinaten in der Ebene besitze. Der Rand des Polygons sei so beschaffen, dass das Innere eine zusammenhängende Menge sei. Es bezeichne i(P ) die Anzahl der Gitterpunkte (x, y) ∈ Z2 im Inneren von P und r(P ) die Anzahl der Gitterpunkte auf dem Rand von P . Dann gilt der erstaunliche Satz Satz 1.14 (Satz von Pick). Ein Polygon, welches den obigen Voraussetzungen genügt, besitzt Flächeninhalt Fläche(P ) = i(P ) + 12 r(P ) − 1. Beweisskizze. Zunächst verifiziert man leicht die Formel des Satzes für achsenparallele Rechtecke. Ebenso gilt die Aussage für rechtwinklige Dreiecke mit achsenparallelen Katheten. Als Nächstes mache man sich klar, dass im Falle von zwei Polygonen P1 und P2 , die beiden den Voraussetzungen des Satzes genügen, und welche eine Strecke als gemeinsame Schnittmenge besitzen, die Formel auch für die Vereinigung P = P1 ∪P2 gilt. Nun ergibt sich so, dass der Satz für beliebige Dreiecke richtig ist, solange die Voraussetzungen erfüllt sind. Schließlich folgt die allgemeine Aussage per Induktion nach der Anzahl der Ecken von P ; beim Induktionsschritt zerlegt man P dabei in zwei geeignete Polygone mit weniger Ecken. • Abschließend wollen wir noch die Arbeit des womöglich innovativsten griechischen Mathematikers betrachten. Archimedes (ca. ∗ 287 - † 212 v.Chr.) ist bekannt für sein vielfältiges Wirken in Physik, Ingenieurswesen und natürlich Mathematik. Unvergessen ist sein Eureka! im Bad, welches der Physik das archimedische Prinzip bescherte und ebenso legendär sein bonmot Störe meine Kreise nicht!, adressiert an einen römischen Soldaten, der ihn der Überlieferung zufolge hierfür ins Jenseits beförderte. Wir wollen hier Archimedes’ Arbeit zur Kreisfläche beleuchten. Archimedes’ Idee zur Kreismessung basiert auf einer Zerlegung des Kreises in Sektoren gleichen Winkels und Approximation derselben durch entsprechende Dreiecke; damit wird der Kreis also durch ein reguläres Vieleck angenähert! So sind beispielsweise beim regulären Achteck die Winkel der jeweiligen acht Dreiecke π4 und (zweimal) 3π 8 . Legen wir einen Kreis vom Radius 1 zu Grunde. √ 2 ergibt sich so 2 und dem Cosinussatz√ 2 4 . Damit erhalten wir 2 2 = 2, 82 . . . Unter Verwendung von sin π4 = cos π4 =√ die Fläche eines solchen Dreiecks als als Approximation an die Einheitskreisfläche. Insofern wird also die Kreisfläche durch die Fläche des einbeschriebenen Polygons approximiert und mit wachsender Eckenanzahl des Polygons ergibt sich eine beliebige Genauigkeit. Ebenso kann man natürlich auch mit einem umschreibenden Polygon arbeiten, welches den Kreis berührt. Auf diese Art und Weise erzielt Archimedes mit regulären 96-Ecken die Näherungen 10 = 3, 14084 . . . < 3 71 π = 3, 14159 . . . < 3 17 = 3, 14285 . . . 22 Abbildung 16. Ein einem Kreis einbeschriebenes regelmäßiges Achteck. Erst Jahrhunderte später wurden bessere rationale Näherungen an die Kreiszahl π gefunden (mit Hilfe von Kettenbrüchen; vgl. Elementare Zahlentheorie). Archimedes’ Exhaustionsmethode kann als ein Vorläufer der Integrationsrechnung angesehen werden. Aufgaben Aufgabe 13. Mit welchen regelmäßigen n-Ecken kann eine Ebene parkettiert werden? Aufgabe 14. Untersuchen Sie, ob beim Fußball (gebildet aus regelmäßigen Fünf- und Sechsecken) die Eulersche Polyederformel Bestand hat! Aufgabe 15. In wie viele Pyramiden zerlegen die Diagonalen zwischen gegenüber liegenden Ecken eines Würfels denselben? Aufgabe 16. Ein so genanntes Möbiusband besteht aus einer Fläche und einer Kante, aber keiner Ecke, ist also kein Polyeder. Können Sie ein solches Möbiusband basteln? Forschen Sie ferner in der Bibliothek oder im Internet nach der Kleinschen Flasche... Aufgabe 17. Auf Archimedes’ Grabstein sollen der Überlieferung nach ineinander geschachtelt ein Zylinder, eine Kugel und ein Kegel von jeweils gleicher Höhe und gleicher Kreisgrundfläche eingemeisselt gewesen sein. In welchem Verhältnis stehen diese Körper? 7. Euklids Elemente und die Axiomatisierung der Mathematik Während über das Leben des Euklid von Alexandria (ca. ∗ 325 - † 265 v.Chr.) nur wenig bekannt ist, bilden seine aus 13 Bänden bestehenden Elemente das meistverbreitetste und einflussreichste Mathematiklehrbuch aller Zeiten. Euklid systematisierte mit seinen Elementen das mathematische Wissen seiner 23 Zeit (soweit wir es heute beurteilen können). Die Elemente bilden damit das Fundament für die moderne Mathematik. Vieles von dem was wir bislang behandelt haben, ist in den Elementen zu finden (z.B. ist Satz 32, Buch I, der Satz über die Winkelsumme): Euklid behandelt • Planimetrie: Geometrie der Ebene und der Figuren in der Ebene (enthält beispielsweise die Satzgruppe des Pythagoras). • Stereometrie: Geometrie im Raum sowie krperlicher Figuren; hier werden die platonischen Körper mit Zirkel und Lineal konstruiert (ein Thema, dem wir uns anschließend noch widmen werden). • Arithmetik: Dies ist elementare Zahlentheorie (inkl. dem euklidischen Algorithmus und dem Beweis der Existenz unendlich vieler Primzahlen). • Proportionenlehre: Hier verbirgt sich Eudoxos’ Theorie der kommensurable und inkommensurablen Größen. Das Revolutionäre seines Werkes jedoch ist die strenge axiomatische Begründung der Geometrie. Neben Definitionen kommen zu Anfang so genannte Axiome, also Aussagen, die nicht bewiesen werden, aus denen heraus aber alles weitere folgt, nämlich Definitionen sowie Sätze und deren Beweise; in jedem Beweis darf dabei (außer den Axiomen) nur verwendet werden, was zuvor bewiesen wurde. Dieser deduktive Aufbau der Mathematik ist bis in die heutige Zeit richtungsweisend! Die Elemente waren nicht umsonst für lange Zeit der Prototyp für ein mathematisches Lehrbuch schlechthin. Beispielsweise beginnt der erste Band der Elemente mit folgenden Definitionen: (i) (ii) (iii) (iv) (v) (vi) (vii) (viii) (ix) (x) (xi) (xii) Ein Punkt ist, was keine Teile hat. Eine Linie breitenlose Länge. Die Ende einer Linie sind Punkte. Eine gerade Linie (Strecke) ist eine solche, die zu den Punkten auf ihr gleichmäßig liegt. Eine Fläche ist, was nur Länge und Breite hat. Die Enden einer Fläche sind Linien. Eine ebene Fläche ist eine solche, die zu den geraden Linien gleichmäßig liegt. Ein ebener Winkel ist die Neigung zweier Linien in einer Ebene gegeneinander, die einander treffen, ohne einander gerade fortzusetzen. Wenn die den Winkel umfassenden Linien gerade sind, heißt der Winkel geradlinig. Wenn eine gerade Linie, auf eine gerade Linie gestellt, einander gleiche Nebenwinkel bildet, dann ist jeder der beiden gleichen Winkel ein rechter; und die stehende gerade Linie heißt senkrecht zu (Lot auf) der, auf der sie steht. Stumpf ist ein Winkel, wenn er größer als ein rechter ist. Spitz, wenn kleiner als ein rechter. 24 Es folgen noch weitere Definitionen, die jedoch für das Weitere unerheblich sind. Es schließen sich Postulate an. In diesen wird gefordert (i) dass man von jedem Punkt nach jedem Punkt die Strecke ziehen kann, (ii) dass man eine begrenzte gerade Linie zusammenhängend gerade verlängern kann, (iii) dass man mit jedem Mittelpunkt und Abstand den Kreis zeichnen kann, (iv) dass alle rechten Winkel gleich sind, und (v) das Parallelenaxiom, dass nämlich, wenn eine gerade Linie beim Schnitt mit zwei geraden Linien bewirkt, dass innen auf derselben Seite entstehende Winkel zusammen kleiner als zwei Rechte werden, dann die zwei geraden Linien bei Verlängerung ins Unendliche sich treffen auf der Seite, auf der die Winkel liegen, die zusammen kleiner als zwei Rechte sind. Hier sei insbesondere auf das Parallelenaxiom hingewiesen; seine Formulierung ist wesentlich länger als die der anderen. Sämtliche Versuche, dieses aus den anderen herzuleiten, scheiterten, so dass schließlich über Modelle nachgedacht wurden, wie eine Geometrie ohne dieses aussehen könnte.§ Und es folgen weitere Axiome: (i) Was demselben gleich ist, ist auch einander gleich. (ii) Wenn Gleichem Gleiches hinzugefügt wird, sind die Ganzen gleich. (iii) Wenn von Gleichem Gleiches weggenommen wird, sind die Reste gleich. Auch hier folgen noch einige weitere Axiome, die wir aber nicht angeben wollen. Lange Zeit blieb die Geometrie trotz der Elemente stark der Anschaulichkeit verhaftet. Erst mit Hilberts Grundlagen der Geometrie von 1899 wurde eine vollständige moderne axiomatische Begründung der euklidischen Geometrie gegeben. Er entwarf hierzu ein vollständiges Axiomensystem und entwicklete hieraus das Gesamtgebäude der Geometrie (soweit damals bekannt). Die Begriffe, die Hilbert verwendet, heißen zwar noch Punkt, Gerade, Ebene, besitzen jedoch im Gegensatz zu Euklids Elementen keinerlei Bezug zur Anschauung; hatte es bei letzterem doch z.B. ’Ein Punkt ist, was keine Teile hat’ geheißen. Hilberts Begriffe Punkt, Gerade, Ebene könnten also durch beliebige Ausdrücke wie Tisch, Stuhl, Bierseidel ersetzt werden. Hilbert war einer der bedeutendsten Vertreter des so genannten Formalismus, wonach Mathematik aus einem gegebenen Axiomen- und Regelwerk durch striktes logisches Schlussfolgern entsteht. Dem gegenüber behauptet der Realismus bzw. Platonismus mit prominenten Vertretern wie Plato, Erdös und Gödel, dass Mathematik nicht erfunden sondern vielmehr entdeckt wird. § womit wir uns in der Vorlesung Vertiefung Mathematik im WS 2012/13 noch beschäftigen wollen 25 Aufgaben Aufgabe 18. Euklids Proposition 1 in Buch I fragt nach der Konstruktion eines gleichseitigen Dreiecks über einer gegebenen Strecke mit ausschließlich Zirkel und Lineal. Realisieren Sie dies! Aufgabe 19. Bereits im Schulunterricht lernt man: Sind von einem Dreieck bekannt die Längen bzw. Größen (sss) (sws) (wsw) (Ssw) dreier Seiten, zweier Seiten und des eingeschlossenen Winkels, einer Seite und der beiden anliegenden Winkel, zweier Seiten und des der größeren Seite gegenüberliegenden Winkels, so kann dieses Dreieck eindeutig konstruiert werden (vgl. das Schulbuch von Kratz & Wörle bzw. die Monographie von Scheid & Schwarz, §I.3). Führen Sie diese Konstruktionen explizit durch! 8. Was lässt sich mit Zirkel und Lineal konstruieren? Bereits Pythagoras und seine Schule konstruierte das reguläre Fünfeck. Euklid gibt in seinen Elementen ebenfalls diese Konstruktion an und zeigt, dass sich die Seiten im Pentagramm im Verhältnis des goldenen Schnittes teilen (siehe Aufgabe 10 und auch das Skript von Johannson). In diesem Kontext sei folgende allgemeinere Aufgabe gestellt: • Gegeben eine ganze Zahl n ≥ 3, konstruiere ein reguläres n-Eck. Für n = 3 und n = 4 ist dies trivial; ebenso für Produkte dieser n mit beliebigen Zweierpotenzen (siehe Aufgabe). In seinem Buch Underweysung in der messung mit dem zirckel und richtscheyt in Linien ebnen und gantzen corporen gibt der bekannte fränkische Künstler Albrecht Dürer (∗ 1471 - † 1528) mit expliziten Konstruktionen des regulären Fünfecks und approximativen Methoden für beliebige reguläre n-Ecke seinen Einstand als Mathematiker. Weitere Themen, die er behandelt sind die Zentralperspektive und Kegelschnitte (zwei Gebiete, die wir später noch untersuchen werden). Als Achtzehnjähriger gelang Gauß schließlich die Charakterisierung all der natürlichen Zahlen n, zu denen ein reguläres n-Eck mit Zirkel und Lineal konstruiert werden kann: nämlich genau für die n, die sich darstellen lassen als Produkt einer Zweierpotenz und k verschiedener so genannter Fermatscher Primzahlen p = 22 + 1, wobei k eine nicht negative ganze Zahl bezeichne. Bislang sind mit 3 = 21 + 1, 5 = 22 + 1, 17 = 24 + 1, 65 537 = 216 + 1 nur insgesamt vier solche Fermatsche Primzahlen bekannt und es wird vermutet, dass es keine weiteren gibt.¶ Bevor wir weitere Konstruktionsprobleme ansprechen, präzisieren wir zunächst, welche Operationen überhaupt zur Konstruktion herangezogen werden dürfen: ¶ Ein reguläres Siebzehneck ziert die Gauß-Statue am Gauß-Berg in Braunschweig. 26 Abbildung 17. Ein regelmäßiges Fünfeck aus Dürers underweysung; für die Konstruktion konsultiere man etwa Stilwells Buch. • Zwei verschiedene Punkte P, Q lassen sich (mit dem Lineal) durch eine eindeutig bestimmte Gerade P Q verbinden. • Der Abstand |P Q| von zwei verschiedenen Punkten P, Q lässt sich (mit dem Zirkel abgreifen und) übertragen • Zu jeder Geraden g und jedem Punkt P (auf oder außerhalb von g) lässt sich eine zu g orthogonale (senkrechte) Gerade h durch P konstruieren. Durch Wiederholung entsteht das Mittellot oder die Mittelsenkrechte einer Strecke. • Gegeben ein Winkel, so lässt sich dieser halbieren; insbesondere können Winkel der Form 2mn π mit natürlichen Zahlen m, n konstruieren. • Gegeben eine Gerade g und ein Punkt P 6∈ g, lässt sich eine Gerade h durch P konstruieren, die g nicht schneidet (also g ∩ h = ∅). Die Existenz einer solchen Geraden h, die wir natürlich eine Parallele von g nennen, folgt aus Euklids Parallelenaxiom (s.o.). Desweiteren lassen sich Punkt- und Geradenspiegelungen sowie Translationen als Hintereinanderführung von Spiegelungen an parallelen Geraden und Drehungen konstruieren; dies werden wir aber ausführlich im folgenden Kapitel behandeln. Eine wichtige Anmerkung: All diese Konstruktionen sind ausschließlich mit Zirkel und Lineal auszuführen! Die folgenden weiteren klassischen Konstruktionsprobleme gehen wohl auf Anaxagoras und Hippokrates zurück: • Quadratur des Kreises: Gegeben ein Kreis, konstruiere man ein flächengleiches Quadrat. • Verdopplung des Würfels: Gegeben ein Würfel, konstruiere einen Würfel mit doppeltem Volumen (auch als Delisches Problem bekannt). 27 • Dreiteilung des Winkels: Gegeben ein Winkel, konstruiere man einen Winkel der ein Drittel des gegebenen Winkels ist. Die letzten beiden Probleme wurden erstmals durch Pierre Wantzel im Jahre 1837 negativ beantwortet.k Die negative Lösung der Kreisquadratur geht auf Lindemann zurück,∗∗ welcher zeigte, dass π sogar transzendent ist, also keiner polynomiellen Gleichung genügt, welches wiederum nachsichzieht, dass eben kein zu einem gegebenen Kreis flächengleiches Quadrat konstruiert werden kann. Mascheroni bewies übrigens, dass alle Kosntruktionen mit Zirkel und Lineal sich bereits einzig mit Zirkel realisieren lassen (siehe hierzu das Buch von Courant & Robbins). Unter Zuhilfenahme gewisser algebraischer Kurven lassen sich jedoch einige der oben genannten Konstruktionsprobleme positiv lösen. Aufgaben Aufgabe 20. Konstruieren Sie ein reguläre Fünf-, Zehn- und Zwölfecke. Aufgabe 21. Lösen Sie die Konstruktionsaufgabe, ein Rechteck zu quadrieren, d.h. zu einem gegebenen Rechteck ist unter Verwendung von ausschließlich Zirkel und Lineal ein flächengleiches Quadrat zu konstruieren. (Dies ist Proposition 14 aus Band II aus Euklids Elementen.) Abbildung 18. Das Möndchen des Hippokrates Aufgabe 22. In einen Halbkreis zeichne man ein gleichschenkliges Dreieck und erichte weitere Halbkreise über den Katheten des Dreieckes (wie in Abbildung 18). Das Möndchen des Hippokrates ist dann die durch die beiden Kreisbögen begrenzte Figur. Berechnen Sie den Flächeninhalt des Möndchens. Inwiefern kann man dies als ein Versuch der Quadratur des Kreises interpretieren? k Die Unmöglichkeit der Würfelverdopplung wird ein Thema der Veranstaltung Vertiefung Mathematik im WS 2012/13 sein. ∗∗ welcher um 1875 an der Würzburger Universität tätig war! 28 9. Die Algebraisierung der Geometrie durch Descartes und Fermat Gegeben sei eine Strecke AB, gesucht ist ein Punkt C auf dieser Strecke mit der Eigenschaft, dass |AB| · |BC| = |AC|2 . (1) Wir wollen diese Konstruktionsaufgabe geometrisch lösen, also ausschließlich unter Verwendung von Zirkle und Lineal! Hierzu bilden wir das Quadrat der Strecke |AB|, nennen den diagonal B gegenüberliegenden Punkt D, halbieren daraufhin die Strecke AD und nennen den entsprechenden Punkt E. Dann schlagen wir einen Kreis vom Radius |EB| um E und finden einen Schnittpunkt F auf der Geraden durch A und D oberhalb von A. Schließlich gibt der Schnittpunkt des Kreises vom Radius |AF | um A mit AB den gesuchten Punkt C (vgl. Abbildung 19). Zur Verifikation bilden wir zu den Punkten A, C, F ein Rechteck und nennen den A diagonal gegenüberliegenden Eckpunkt G. Mit der Satzgruppe des Pythagoras errechnet sich |F D| · |F G| + |AE|2 = |EF |2 = |EB|2 = |AB|2 + |AE|2 und |F D| · |F G| = |AB|2 , woraus sich |AC|2 = |AD| · |BC| = |AB| · |BC|, also (1) ergibt. Dies ist tatsächlich eine Lösung einer quadratischen Gleichung im Sinne der griechischen Mathematik! Abbildung 19. Geometrische Lösungen quadratischer Gleichungen; rechts ein Beispiel quadratischer Ergänzung. Das Rechnen mit Buchstaben verdanken wir Francois Vieta (∗ 1540 - † 1603).∗ Schreiben wir a = |AB| und x = |AC|, so überträgt sich (1) in die ∗ Vokale für unbekannte Größen und Konsonanten für bekannte 29 algebraische Gleichung a(a − x) = x2 bzw. x2 + ax − a2 = 0, welche in der Unbekannten x zu lösen ist. Hier finden sich unschwer die Lösun√ a gen x = 2 (−1 ± 5), ein unverhofftes Wiedersehen mit dem goldenen Schnitt, welches auch zur Konstruktion des regelmäßigen Fünfecks herangezogen werden kann. Tatsächlich finden sich solche Aufgaben (wenngleich auch nicht in Form von Buchstaben) bereits in der Arithmetica von Diophant† und bei diversen arabischen Mathematikern des Mittelalters. Tatsächlich befand sich Europa nach dem Untergang des römischen Reiches in einem lange anhaltenden kulturellen Tiefschlaf, während in der arabischen Welt die Wissenschaft blühte. Der Mathematiker al-Hwārizmı̄‡ entdeckte, wie sich beliebige quadratische Gleichungen ¯ geometrisch explizit lösen lassen: Sei die Gleichung X 2 + 10X − 144 = 0 gegeben. Dann interpretieren wir die Terme X 2 und 10X als Flächen eines Quadrates bzw. zweier Rechtecke mit Seitenlängen X bzw. 5 und X und ergänzen deren Summe zu einem Quadrat mit Seitenlänge X + 5 (gemäß Abbildung 19). Diese geometrische Idee nennt man (aus nahe liegenden Gründen) quadratische Ergänzung, wird aber oft leider nur noch als eine algebraische Umformung wahrgenommen (vgl. Elementare Zahlentheorie). Bis hierhin ist Geometrie im Wesentlichen eine Kulturleistung der alten griechischen Mathematik! Natürlich ist unsere Zusammenstellung dabei nicht erschöpfend gewesen; gewisse Errungenschaften sind sicherlich unerwähnt geblieben und auch haben wir die Leistungen der arabischen Mathematik nicht hinreichend gewürdigt. Nun wollen wir jedoch die Renaissance der Geometrie zu Beginn der Neuzeit etwas genauer betrachten. Der berühmte Philosoph§ und Mathematiker René Descartes (∗ 1596 - † 1650) veröffentlichte sein Buch ’La geométrie’ im Jahre 1637, welches bis heute als die Geburtsstunde der analytischen Geometrie gilt. Hier führt Descartes Koordinaten ein: Damit können Punkte in der Ebene (oder im Raum) durch Paare (oder Tripel) von Zahlen beschrieben werden. Mit Hilfe dieser Koordinaten kann nun Geometrie mit den mächtigen Werkzeugen der Algebra behandelt werden. Descartes zu Ehren heißt jedes Koordinatensystem mit senkrecht aufeinander stehenden Achsen kartesisch. Bereits 1629 hat Pierre de Fermat (∗ 1607/08(?) - † 1665) einen ähnlichen Ansatz verfolgt, doch der Hobbymathematiker hat seine Ideen nicht veröffentlicht. Beide Ansätze versuchen das Bildhafte und Anschauliche durch das Konkrete und Örtliche zu ersetzen. ”Geometry is the science of correct reasoning on incorrect figures.” (George Pólya) † der wohl im dritten Jahrhundert lebte, über den aber leider nur wenig bekannt ist gilt als Begründer der Algebra und Namensgeber für das Wort ’Algorithmus’ § ’cogito, ergo sum!’ ‡ 30 Dieses berühmte Zitat verliert durch den analytischen Ansatz seine Bedeutung. Jedes geometrische Objekt und jede geometrische Operation wird auf ein Zahlensystem bezogen und damit quantifiziert! Die entscheidende technische Invention hierzu ist die Beschreibung durch Koordinaten. Beispielsweise lässt sich ein Kreis in der Ebene um den Mittelpunkt (x0 , y0 ) vom Radius r durch die Menge aller Punkte (x, y) beschreiben, die der algebraischen Gleichung (x − x0 )2 + (y − y0 )2 = r 2 genügen. Mit dieser Algebraisierung der Geometrie lassen sich beispielsweise die Schnittpunkte eines Kreises mit einer Geraden bestimmen (ein triviales Beispiel mit dem wir bereits die rationalen Punkte auf dem Einheistkreis bestimmt hatten). Und der Satz von Pick über den Flächeninhalt von Polygonen ist ein weiteres Beispiel vom Nutzen von Koordinaten oder auch die rationalen Punkte auf dem Einheitskreis. Abbildung 20. Dieses vierblättrige Kleeblatt ist gegeben durch die Gleichung (X 2 + Y 2 )2 − 4X 2 Y 2 = 0. Weitere Vorläufer von Fermat und Descartes sind Vieta und bereits Nicolas Oresme (∗ 1320 - † 1382). Einen immensen Ausbau dieses Ansatz leistete Euler; einen späteren wichtigen Impuls war die durch Grassmann geschaffene lineare Algebra (um ca. 1844) und die damit verbundenen Begriffe Vektoren, Basis, Dimension, und vieles mehr mit dem wir uns im folgenden Kapitel beschäftigen werden... 31 Aufgaben Aufgabe 23. Leiten Sie die obige Kreisgleichung aus Ihren Kenntnissen der Schulgeometrie her! 10. Sangakus Während sich in Europa die analytische Geometrie entwickelte, ist eine völlig andere Art von Geometrie in Japan entstanden. In der so gennanten EdoPeriode von 1603 bis 1868 isolierte sich Japan weitgehend. Nachdem ein jahrhundertelanger Brgerkrieg berstanden war, befriedete Shōgun Tokugawa Japan durch drastische Maßnahmen. Die zerstrittenen Fürsten wurden entmachtet, Handelsbeziehungen wurden extrem eingeschränkt, das Christentum verboten und der Aufenthalt europäischer Ausländer komplett untersagt. Die Kriegerkaste der Samuari nutzte ihre gewonnene Freizeit und erstellte mathematische, meist geometrische Rätsel, die auf kleinen Holztafeln – so genannten sangakus – in Tempeln oder Schreinen ausgestellt wurden und zum Lösen derselben einluden. Trotzdem sei erwähnt, dass diese kulturelle Hochphase großartige professionelle Mathematiker hervorgebracht hat. Beispielsweise gelangen Seki Kowa (∗ 1640 - † 1702) diverse Entdeckungen vor europäischen Zeitgenossen: die Determinante vor Leibniz, die Bernoulli-Zahlen vor den Bernoullis; auch entwickelte er Differential- und Integralrechnung zeitgleich zu Leibniz und Newton. Hier nun ein Beispiel der japanischen Tempelgeometrie: In Abbildung 21 sind die Radien r < R der Kreise in Abhängigkeit von der Kantenlänge a des Quadrates gesucht. Die Lösung ergibt sich leicht durch Anwenden des Satzes von Abbildung 21. Ein bekanntes sangaku von 1895 aus dem Distrikt Fukushima. 1 39 Pythagoras als r = 16 a und R = 320 a. Tatsächlich sind auf diesem spielerischen Wege auch gewisse tiefere Sätze der Geometrie entdeckt worden, die zeitgleich 32 oder sogar später in der europäischen, mehr der wissenschaftlichen Entwicklung verschreibenen Geometrie gefunden wurden (z.B. der Satz von Casey).∗ Aufgaben Aufgabe 24. Für die Radien r1 , r2 , r3 der Kreise in Abbildung 22 (von links nach rechts) ist √1r2 = √1r1 + √1r3 zu zeigen! Abbildung 22. Ein schönes sangaku von 1824. Aufgabe 25. Denken Sie sich ein eigenes sangaku aus und stellen Sie dies als Aufgabe in Ihrem Freundeskreis! ∗ Für dies und weitere Beispiele dieser auf Ästhetik fokussierten Geometrie ohne praktischen Nutzen verweisen wir auf die Zulassungsarbeit von Christiane Hartmann, Sangaku – Japanische Tempelgeometrie, www.mathematik.uni-wuerzburg.de/∼steuding/sonstiges.html. KAPITEL 2 Analytische Geometrie in euklidischen Räumen Ein zentrales Thema der linearen Algebra und analytischen Geometrie sind die euklidischen Vektorräume; in diesen ist Längen- und Winkelmessung und damit ein sehr konkreter Zugang zur Geometrie möglich. Der allgemeine Begriff des Vektorraumes wurde erst im 19. Jahrhundert durch Graßmann eingeführt, während die Untersuchungen zur analytischen Geometrie (wie auch im ersten Kapitel erwähnt) bereits mit der Einführung von Koordinaten durch Descartes und Fermat einsetzen. Unser Zugang ist im Folgenden eher stromlinienförmig und also weniger historisch motiviert. Wir beginnen deshalb mit einer kurzen Wiederholung linearer Algebra... Unsere Universen sind dabei die reellen Vektorräume Rn := R ×. . .× R (also das n-fache kartesische Produkt der Menge der reellen Zahlen). Die Elemente sind Vektoren, die als Zeilenvektoren (x1 , . . . , xn ) oder auch als Spaltenvektoren auftreten, welche wir komponentenweise addieren können und mit einem reellen Skalar multiplizieren können: (x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ), λ · (x1 , . . . , xn ) := (λx1 , . . . , λxn ) (λ ∈ R). Mit dieser Vektoraddition und skalaren Multiplikation ist Rn ein ndimensionaler Vektorraum (vgl. Lineare Algebra). Punkte im Rn werden wir (meist) durch Angabe von Koordinaten identifizieren; wir mögen sie auch als Vektoren interpretieren, wobei ein Vektor aber auch als Äquivalenzklasse von gerichteten Strecken (genauer: Pfeile gleicher Länge und gleicher Richtung) aufgefasst werden kann, die an jeden Punkt anzuheften sind. Allerdings wollen wir diese verschiedenen Sichtweisen nicht thematisieren. 1. Lineare Gleichungssysteme Gegeben sei ein System zweier linearer Gleichungen in zwei veränderlichen Größen x und y: a11 x + a12 y = b1 , a21 x + a22 y = b2 , wobei die Zahlen aij , bi allesamt reell seien. Dann lässt sich dieses lineare Gleichungssystem bekanntlich in die Form x A =b y 33 34 umschreiben, wobei A = (aij ) die 2 × 2-Matrix mit den Koeffizienten aij ist und b der Spaltenvektor gebildet aus den Zahlen bi . Die lineare Algebra zeigte, dass dieses System genau dann eine Lösung ( xy ) besitzt, wenn die Ränge von A und der um b erweiterten Matrix (A, b) gleich sind (bzw. wenn b im Erzeugnis der Spaltenvektoren von A liegt). Ferner existiert genau dann eine eindeutige Lösung, wenn der Rang von A gleich zwei ist, bzw. wenn die Determinante von A nicht verschwindet. Nun wollen wir dieses lineare Gleichungssystem geometrisch interpretieren. Eine jeder der individuellen Gleichungen beschreibt eine Gerade im R2 (wobei wir davon ausgehen wollen, dass nicht beide Koeffizienten verschwinden). Damit besteht die Lösungsmenge des Gleichungssystems genau aus den Punkten, die auf beiden Geraden liegen. Nun können zwei Geraden in der Ebene • identisch sein, • sich in genau einem Punkt schneiden, • parallel liegen (ohne gemeinsamen Punkt). Also tritt der zweite Fall genau dann ein, wenn die Koeffizientenmatrix A eine nicht-verschwindende Determinante besitzt. In den anderen beiden Fällen besitzen die Geraden dieselbe Steigung und die zugehörigen Koeffizienten bilden linear abhängige Spaltenvektoren von A. Mit der Determinante können also lineare Abhängigkeiten entdeckt werden! Übrigens sind auch lineare Ungleichungssysteme interessant. Ihre Lösungsmengen (wenn existent) lassen sich mit Hilfe von Polygonen beschreiben; mit der Simplexmethode (siehe Fischers Buch) lassen sich die Randpunkte finden, welche ein Extremwertproblem lösen. Solcher Art Anwendungen spielen bei Optimierungsfragestellungen eine wichtige Rolle. Aufgaben Aufgabe 26 (Staatsexamen: Frühjahr 2003, Thema 1, Aufgabe 2). 2 a) Zeigen Sie, dass die Menge ℓ aller (s, t) ∈ R , für die das lineare Gleichungssystem x1 + x2 − 2x3 2x1 + x2 − 3x3 3x1 − 3x2 = s2 = st = t2 lösbar ist, eine Gerade ist! b) Bestimmen Sie für (s, t) ∈ ℓ die allgemeine Lösung des obigen Gleichungssystems! Aufgabe 27. Welche Lösungen besitzt das folgende lineare Ungleichungssystem: 3x − 5y −x + 2y ≤ ≤ Welches geometrische Objekt steckt dahinter? 1, 2. 35 2. Geraden und Ebenen Wir präzisieren und ergänzen einige Aussagen des vorangegangenen Paragraphen. Wir beginnen mit der Definition einer Geraden (obwohl wir bereits regen Umgang mit denselben hatten): Eine Teilmenge G ⊂ Rn heißt Gerade, wenn es Vektoren v, w ∈ Rn existieren mit w 6= 0 und G = v + Rw := {u ∈ Rn : u = v + λw mit λ ∈ R}. Dabei ist die Abbildung λ 7→ λw bijektiv, weil w nicht der Nullvektor ist. In dieser Parameterform der Geraden heißt v Ortsvektor und w Richtungsvektor von G. Tatsächlich stehen hier u und v für spezielle Punkte im Rn , wogegen w einen Vektor im Sinne einer gerichteten Strecke ist: der Punkt u ist dann durch Anhängen eines Vielfachens λw dieser Strecke an den Fußpunkt v gegeben. Satz 2.1. (i) Sei G = v + Rw eine Gerade und v ′ ∈ G, dann gilt G = v ′ + Rw. (ii) Zwei Geraden G = v + Rw und G′ = v ′ + Rw′ stimmen genau dann überein, wenn ihr Schnitt nicht-leer ist und ihre Richtungsvektoren linear abhängig sind (d.h. ein β ∈ R mit w′ = βw existiert). Beweis. Zu Aussage (i): Nach Vorausetzung gibt es ein λ′ ∈ R mit v ′ = v +λ′ w. Für x = v + λw ∈ G gilt dann ′ x = v + λw + λ − λ′ w} = |v +{zλ′ w} +(λ − λ′ )w ∈ v ′ + Rw, | w {z =v′ =0 v′ und somit G ⊂ + Rw. Für die umgekehrte Inklusion sei x = v ′ + λw mit beliebigem λ ∈ R gegeben, dann gilt x = v + λ′ w + λw = v + (λ + λ′ )w ∈ G. Für den Nachweis von (ii) gehen wir zunächst von G = G′ aus. Dann gilt sicherlich G ∩ G′ 6= ∅. Wegen v ′ ∈ G′ = G gibt es ein λ′ ∈ R mit v ′ = v + λ′ w und ähnlich folgt über v ′ + w′ ∈ G′ = G dann v ′ + w′ = v + λ′′ w für ein λ′′ ∈ R. Dies liefert w′ = v + λ′′ w − v ′ = v + λ′′ w − (v + λ′ w) = (λ′′ − λ′ )w. Also gilt w′ = βw mit β = λ′′ − λ′ ∈ R, welches von null verschieden ist, da w′ nicht der Nullvektor ist. Für die umgekehrte Implikation existiert ein u ∈ G ∩ G′ und nach (i) gilt G = u + Rw sowie G′ = u + Rw′ . Daraus folgt nun für x = u + λw ∈ G leicht λ λ x = u + λw = u + · βw = u + w′ ∈ G′ , β |{z} β =w ′ also G ⊂ G′ . Analog zeigt sich G′ ⊂ G, womit die Gleichheit G = G′ folgt. • Als Nächstes beweisen wir ein Resultat, welches anschaulich trivial sein mag: Korollar 2.2. Durch zwei verschiedene Punkte geht genau eine Gerade. 36 Abbildung 1. Orts- und Richtungsvektoren einer Geraden. Beweis. Seien v1 , v2 zwei verschiedene Punkte des Rn . Setze w := v2 − v1 6= 0, dann ist G = v1 + Rw sicherlich eine solche gesuchte Gerade (siehe Abbildung 1). Es verbleibt die Eindeutigkeit zu zeigen: Sei G′ = v ′ + Rw′ eine weitere Gerade durch v1 und v2 , dann folgt aus dem vorangegangenen Satz, dass G′ = v1 + Rw′ gilt. Wegen v2 ∈ G′ existiert ein reelles λ mit v2 = v1 + λw′ und zusammen mit v2 = v1 + w folgt 0 = λw′ − w mit λ 6= 0 (da w 6= 0). Also gilt w = λw′ und G = G′ . • Wir nennen Punkte A, B, C, . . . kollinear, wenn sie auf einer Geraden liegen bzw. die Vektoren A − B, A − C, . . . linear abhängig sind. (In Zukunft werden wir jedoch nur selten zwischen Punkten und Vektoren unterscheiden.) Korollar 2.3. Drei Punkte A, B, C in der Ebene sind genau dann kollinear, wenn es reelle Konstanten α, β, γ gibt, nicht alle gleich null, so dass αA + βB + γC = 0 bzw. wenn det mit 1 1 1 A B C α + β + γ = 0; = 0, wobei für die Punkte A, B, C hier die Koordinaten einzutragen sind. Der Beweis basiert auf dem vorangegangenen Satz und ist eine gute Übungsaufgabe zum Training der Begrifflichkeiten und dem Rechnen mit Vektoren. Satz 2.4. Eine Teilmenge G ⊂ R2 ist genau dann eine Gerade, wenn es a, b, c ∈ R mit (a, b) 6= (0, 0) gibt, so dass G = {(x, y) ∈ R2 : ax + by = c}. Wir erinnern uns hier an die Schulmathematik, wo Geraden oft in der Form y = αx + β mit Steigung α und y-Achsenabschnitt β dargestellt wurden. 37 Beweis. Sei G = v + Rw eine Gerade mit w = (x1 , y1 ) 6= (0, 0) und v = (x0 , y0 ). Für einen generischen Punkt u = (x, y) ∈ G gilt dann x − x0 x1 = y − y0 y1 bzw. xy1 − x0 y1 = x1 y − x1 y0 ; dies liefert die gesuchte lineare Gleichung in x und y falls y1 6= 0. Trotzdem definieren wir für den allgemeinen Fall entsprechend a = y1 , b = −x1 und c = x0 y1 − x1 y0 und setzen (1) L = {(x, y) ∈ R2 : ax + by = c}. Für u = v + λw = (x0 + λx1 , y0 + λy1 ) ∈ G errechnet sich dann a(x0 + λx1 ) + b(y0 + λy1 ) = y1 x0 + λx1 y1 − xx 1y0 − λx1 y1 = x0 y1 − x1 y0 = c, also G ⊂ L. Für den Nachweis der Inklusion L ⊂ G nehmen wir zunächst 0 a = y1 6= 0 und u = (x, y) ∈ L an. Dann folgt mit λ = y−y y1 y = y0 + y − y0 y1 = y0 +λy1 y1 und x = c − by x0 y 1 − x1 y 0 + x1 y = = x0 +λx1 , a y1 also u = (x, y) = v + λw ∈ G. Im Falle a = y1 = 0 ist b = −x1 6= 0 (da w 6= 0) 0 und ein analoges Argument mit λ = x−x x1 führt zum Ziel. Es verbleibt zu zeigen, dass die Menge (1) eine Gerade definiert; hierbei dürfen wir (a, b) 6= (0, 0) annehmen. Falls a 6= 0 (der Fall b 6= 0 kann ähnlich behandelt werden), ergibt sich mit v = (c/a, 0) und w = (−b, a) nach ein wenig Rechnerei L = v + Rw, womit also L als Gerade nachgewiesen ist. • Beispiel: Der konstruktive Beweis zeigt, dass die Geraden −2 1 G= +R −3 2 ebenso durch die lineare Gleichung 2x − y = −1 beschrieben werden kann. Eine Teilmenge E ⊂ Rn heißt Ebene, falls Vektoren v, w1 , w2 ∈ Rn existieren, so dass w1 und w2 linear unabhängig sind und E = v + Rw1 + Rw2 ; auch hier nennen wir v einen Ortsvektor und w1 , w2 Richtungsvektoren von E (siehe Abbildung 2). Analog zu Satz 2.1 gilt hier für einen beliebigen Punkt v ′ ∈ E ebenso E = v ′ + Rw1 + Rw2 sowie Korollar 2.2 entsprechend Satz 2.5. Gegeben drei verschiedene Punkte v1 , v2 , v3 ∈ Rn , die nicht auf einer Geraden liegen (also kollinear sind), existiert stets genau eine Ebene durch v1 , v2 und v3 . Drei Punkte legen also eine Ebene im euklidischen Raum eindeutig fest! Schließlich sei noch angemerkt, dass Ebenen wie Geraden durch eine lineare Gleichung beschrieben werden können: 38 Abbildung 2. Orts- und Richtungsvektoren einer Ebene. Satz 2.6. Eine Teilmenge E ⊂ R3 ist genau dann eine Ebene, wenn es Zahlen a, b, c, d ∈ R mit (a, b, c) 6= (0, 0, 0) gibt, so dass E = {(x, y, z) ∈ R3 : ax + by + cz = d}. Auch hier erfolgt der Beweis analog zum Fall von Geraden (siehe etwa das Buch von Koecher & Krieg). Aufgaben 2 Aufgabe 28. Drei Punkte A, B, C ∈ R sind genau dann kollinear, wenn det(A − C, B − C) = 0, wobei hier die Koordinaten von A, B, C einzusetzen sind. Aufgabe 29. Zur Erinnerung an die Elementare Zahlentheorie: Gegeben eine Gerade aX + bY = c in der euklidischen Ebene, wobei a, b, c ganze Zahlen sind. Gibt es Punkte mit ganzzahligen Koordinaten x, y auf dieser Geraden? Wenn ja, beschreiben Sie diese. Aufgabe 30. Beweisen Sie Korollar 2.3 sowie Satz 2.5. 3 3 Aufgabe 31. Gegeben seien drei Punkte a, b, c des R , gesucht ist der Punkt d ∈ R , so dass abcd ein Parallelogramm ist. 3. Das Skalarprodukt In R lässt sich der Abstand zwischen zwei Punkten durch den Betrag der Differenz angeben. Wir verallgemeinern nun diesen Distanzbegriff auf euklidische Räume Rn . Hierzu stellen wir uns den zweidimensionalen euklidischen Raum R2 als Ebene vor. Nach dem Satz des Pythagoras ist der Abstand zweier Punkte P1 = (x1 , y1 ) und P2 = (x2 , y2 ) des R2 p d(P1 , P2 ) = (x1 − x2 )2 + (y1 − y2 )2 . 39 Dieser Abstand hängt nur von der Differenz P1 −P2 ab und wir schreiben deshalb auch kP1 − P2 k bzw. p k(x, y)k := x2 + y 2 . Dieser Abstandsbegriff lässt sich problemlos auf den drei- bzw. sogar ndimensionalen Raum übertragen: Für den Rn definieren wir die euklidische Norm eines Vektors x = (x1 , . . . , xn ) als q kxk := x21 + . . . + x2n . Die wichtigsten Eigenschaften der euklidischen Norm sind uns bereits aus der Analysis mehrerer Veränderlicher bekannt: Satz 2.7. Für die euklidische Norm gelten (i) kxk ≥ 0 für alle x ∈ Rn und Gleichheit genau für x = 0; (ii) kλxk = |λ| · kxk für alle x ∈ Rn und λ ∈ R; (iii) kx + yk ≤ kxk + kyk für alle x, y ∈ Rn . Beweisskizze. Der Nachweis von (i) und (ii) ist trivial. Seien x (x1 , . . . , xn ), y := (y1 , . . . , yn ) ∈ Rn . Mit A := n X x2j , B := n X xj y j , n X yj2 j=1 j=1 j=1 C := = und variablem λ ∈ R gilt n X (xj − λyj )2 = A − 2λB + λ2 C. 0≤ j=1 Ist C = 0, so auch B = 0. Ist hingegen C 6= 0, so definiert die obige rechte Seite ein quadratisches Polynom in λ, welches keine negativen Werte annimmt; damit sind die Nullstellen p 1 λ1,2 = (B ± B 2 − AC) C entweder identisch oder nicht-reell, d.h. B 2 − AC ≤ 0 (was auch den Fall C = B = 0 beinhaltet). Nun übersetzt sich B 2 ≤ AC zu 2 X n n X X n 2 yj2 . x · x y ≤ j j j j=1 j=1 j=1 Einsetzen dieser Ungleichung in n n n X X X 2 2 yj2 xj y j + xj + 2 kx + yk2 = j=1 j=1 j=1 und Ziehen der Quadratwurzel liefert die Dreiecksungleichung (iii). • Dies lässt sich verallgemeinern: Eine Abbildung k . k : Rn → R, die (i), (ii) und (iii) des Satzes genügt, heißt Norm auf Rn . (Beispiele derselben haben wir in der Analysis mehrerer Veränderlicher kennen gelernt.) Ein Vektor v ∈ Rn mit Norm kvk = 1 wird normiert bzw. Einheitsvektor genannt. 40 Den euklidischen Abstand zwischen x, y ∈ Rn definieren wir als d(x, y) := kx − yk (s.o.). Natürlich definieren wir diese Größen ebenso für Spaltenvektoren. Offensichtlich gilt d(x, y) = d(y, x) ≥ 0 mit Gleichheit rechts, wenn und nur wenn x = y. Die Dreiecksungleichung nimmt dann die Form d(x, y) ≤ d(x, z) + d(z, y) an, wobei x, y, z beliebige Punkte bzw. Vektoren sind. Im Folgenden wollen wir etwas allgemeiner arbeiten. Sei hierzu nun V ein Vektorraum über dem Skalarenkörper R (wie etwa V = Rn ). Dann nennen wir eine Abbildung h . , . i : V × V → R, (x, y) 7→ hx, yi eine Bilinearform, wenn sie linear in beiden Argumenten ist, d.h. für alle x, y, z ∈ V und λ ∈ R (B1) (B2) (B3) (B4) hx + y, zi = hx, zi + hy, zi, hλx, yi = λhx, yi, hx, y + zi = hx, yi + hx, zi, hx, λyi = λhx, yi. Eine solche Abbildung heißt symmetrisch, falls stets (S) hx, yi = hy, xi; wir nennen sie positiv definit, falls (PD) hx, xi ≥ 0 und Gleichheit genau für x = 0. Eine symmetrische, positiv definite Bilinearform heißt Skalarprodukt.∗ Ein Paar (Rn , h , i) bestehend aus einem Vektorraum V = Rn und einem dazugehörigen Skalarprodukt nennen wir einen euklidischen Raum. Im Folgenden werden wir – wenn nicht ausdrücklich auf einen anderen Vektorraum verwiesen wird – in euklidischen Räumen arbeiten. Legen wir statt der reellen Zahlen die komplexen Zahlen zugrunde (vgl. Elementare Zahlentheorie), so nennen wir h . , . i : Cn × Cn → C, (x, y) 7→ hx, yi eine Sesquilinearform, falls neben (B1), (B3) und (B4) noch (B2’) hλx, yi = λhx, yi √ besteht, wobei hier λ = α + iβ ∈ C gilt (also α, β ∈ R sowie i := −1) und λ = α − iβ für das Konjugierte von λ steht. Eine solche Sesquilinearform heißt hermitesch,† falls hv, wi = hw, vi. Der Begriff der positiven Definitheit bleibt unverändert. ∗ In einiger Literatur wird statt hx, yi auch x · y geschrieben; allerdings ist hier Vorsicht geboten (insbesondere weil es verschiedene Produkte von Vektoren gibt). † nach dem Mathematiker Charles Hermite 41 Ein erstes Beispiel für ein Skalarprodukt liefert der folgende Satz: Satz 2.8. Die durch t hx, yi = x · y = n X xj y j j=1 n für xt = (x1 , . . . , xn ), y t = (y1 , . . . , yn ) ∈ R erklärte Abbildung ist ein Skalarprodukt auf Rn und heißt Standardskalarprodukt. Hier und im Folgenden schreiben wir Vektoren üblicherweise als Spaltenvek x1 toren, wie etwa x = x2 und notieren mit xt = (x1 , x2 ) den zugehörigen transponierten Zeilenvektor. Beweis. Mit zusätzlich z t = (z1 , . . . , zn ) ∈ Rn rechnet man leicht nach: hx + y, zi = n n n X X X yj zj = hx, zi + hy, zi. xj zj + (xj + yj )zj = j=1 j=1 j=1 Die weiteren definierenden Eigenschaften weist man ganz ähnlich nach. Für (PD) sei bemerkt, dass Quadrate reeller Zahlen nicht-negativ sind und also hx, xi = x21 + . . . + x2n ≥ 0 gilt; hierbei herrscht genau dann Gleichheit, wenn alle xj verschwinden, also x = 0 ist. • Ein exotisches Beispiel für ein Skalarprodukt ist die Abbildung Z 1 f (t)g(t)dt (f, g) 7→ hf, gi := 0 auf dem Vektorraum aller auf dem Einheitsintervall erklärten stetigen, reellwertigen Funktionen. Weitere Beispiele von Skalarprodukten folgen im nächsten Paragraphen. p Zu einem jeden solchen Skalarprodukt können wir vermöge kxk := hx, xi eine Norm und damit einen Abstand definieren; im Falle des Standardskalarproduktes entstehen so die euklidische Norm und Abstand (s.o.). Satz 2.9 (Cauchy-Schwarzsche Ungleichung). Sei h . , . i ein Skalarprodukt auf Rn und k . k die zugehörige Norm. Dann gilt für beliebige x, y ∈ Rn |hx, yi| ≤ kxk · kyk; hier besteht genau dann Gleichheit, wenn x und y linear abhängig sind. Beweis. Für y = 0 ist die Aussage trivialerweise erfüllt; sei also y 6= 0. Dann sei λ := hy, yi und µ = −hx, yi. Wir berechnen 0 ≤ hλx + µy, λx + µyi = λ2 hx, xi + 2λµhx, yi + µ2 hy, yi = λ(hy, yihx, xi − hx, yi2 ). Wegen λ > 0 folgt hieraus hy, yihx, xi ≥ hx, yi2 und durch Ziehen der Wurzel ergibt sich die Ungleichung. Diese ist genau dann eine Gleichung, wenn λx + µy = 0 gilt, also x und y linear abhängig sind. • 42 Übrigens ergibt sich die Dreiecksungleichung aus Satz 2.7 als einfache Konsequenz der Cauchy-Schwarzschen Ungleichung. Wir notieren weitere interessante Eigenschaften von allgemeinen Skalarprodukten: Satz 2.10. Sei h . , . i ein Skalarprodukt auf Rn und k . k die zugehörige Norm. Dann gelten für x, y ∈ Rn (i) Satz des Pythagoras: kx + yk2 = kxk2 + kyk2 + 2hx, yi, (ii) Parallelogrammgleichung: kx + yk2 + kx − yk2 = 2kxk2 + 2kyk2 . Beweis durch Nachrechnen: kx + yk2 = hx + y, x + yi = hx, x + yi + hy, x + yi = hx, xi + hx, yi + hy, xi + hy, yi = kxk2 + 2hx, yi + kyk2 , was für (i) zu zeigen war; der Nachweis von (ii) geht analog. • Abbildung 3. Eine geometrische Interpretation der Parallelogrammgleichung. Man mache sich klar, dass die kürzere Diagonale durch den Vektor x − y beschrieben wird. Insbesondere liefert die Aussage in (i) mit dem Standardskalarprodukt und der euklidischen Norm einen Beweis von Satz 1.8; allerdings wird hierfür noch die Definition des Winkels über das Skalarprodukt benötigt – dies ist Gegenstand des übernächsten Paragraphen. Die Parallelogrammgleichung gilt übrigens nicht in normierten Vektorräumen, in denen die Norm nicht durch ein Skalarprodukt definiert ist. Ein solches Beispiel liefert die Maximumnorm, welche für xt = (x1 , . . . , xn ) durch kxk∞ := max{|xj | : j = 1, . . . , n} definiert ist. Hier rechnet sich sofort nach, dass die Parallelogrammgleichung i.A. nicht gültig ist. Aufgaben 43 Aufgabe 32. Zeigen Sie, dass für ein beliebiges Skalarprodukt stets h0, xi = hx, 0i = 0 gilt. Beweisen Sie ferner, dass genau dann ha, xi = 0 mit dem Standardskalarprodukt 0 −1 ⊥ ⊥ . Geben Sie eine besteht, wenn x ∈ Ra mit einem a 6= 0 gilt, wobei a := 1 0 geometrische Interpretation dieses Sachverhaltes! Aufgabe 33. Beweisen Sie den Diagonalensatz: In einem Parallelogramm halbieren sich die Diagonalen gegenseitig. Und zeigen Sie folgende Tischlerregel: Ein Parallelogramm ist genau dann ein Rechteck, wenn beide Diagonalen gleich lang sind. 4. Symmetrische Matrizen Eine Matrix A ∈ Rn×n mit der Eigenschaft At = A heißt symmetrisch; gilt A = (aij )i,j , so lässt sich dies auch äquivalent durch aji = aij für alle 1 ≤ i, j ≤ n ausdrücken (denn Vertauschen der Indizes bedeutet Vertauschen von Zeilen und Spalten, also letztlich Transposition). Zu einer solchen symmetrischen Matrix A definieren wir die Abbildung h . , . iA : Rn × Rn → R, (x, y) 7→ hx, yiA := xt Ay, bzw. hx, yiA = hx, Ayi mit dem Standardskalarprodukt; selbiges entsteht im Falle A = E, wobei E hier und im Folgenden die Einheitsmatrix bezeichne. Die obige Definition liefert eine Vielzahl von Bilinearformen: Satz 2.11. Es sei A ∈ Rn×n symmetrisch. Dann ist die assoziierte Abbildung h . , . iA eine symmetrische Bilinearform auf Rn × Rn . Beweis. Wir prüfen die einzelnen Eigenschaften nach: Für Vektoren x, y ∈ Rn sowie Skalaren λ, µ ∈ R gilt hλx + µz, yi = (λx + µz)t Ay = λxt Ay + µz t Ay = λhx, yiA + µhz, yiA , womit die Linearität im ersten Argument gezeigt ist; die im zweiten folgt analog. Zur Erinnerung: beim Transponieren werden Zeilen und Spalten ausgetauscht, entsprechend dreht sich die Reihenfolge der Faktoren in einem Produkt um: (ab)t = bt at . Damit zeigt sich hy, xiA = y t Ax = (Ax)t (y t )t = xt At y = xt Ay = hx, yiA , wobei wir hier die Eigenschaft von A, symmetrisch zu sein, benutzt haben. • Tatsächlich lässt sich zeigen, dass symmetrische Matrizen eineindeutig symmetrischen Bilinearformen entsprechen (siehe Fischers Buch). Unter welchen Umständen handelt es sich bei h . , . iA um ein Skalarprodukt? Hierzu ist positive Definitheit nachzuprüfen. Diese hängt interessanterweise von den Eigenwerten von A ab. Satz 2.12. Eine symmetrische Matrix A ∈ Rn×n besitzt n (nicht notwendig verschiedene) reelle Eigenwerte. 44 Beweis. Wir erinnern an den Fundamentalsatz der Algebra (vgl. Elementare Zahlentheorie): Jedes nichtkonstantes Polynom zerfällt über dem Körper C der komplexen Zahlen in Linearfaktoren. Angewandt auf das charakteristische Polynom von A folgt die Existenz von n (nicht notwendig verschiedenen) komplexen Eigenwerten λ von A. Wir haben zu zeigen, dass λ reell ist. Wir beobachten, dass mit λ auch das Konjugierte λ ein Eigenwert von A ist, denn mit Av = λv gilt ebenso Av = Av = λv; insbesondere für Eigenvektoren v zum Eigenwert λ. Aufgrund der Symmetrie von A ergibt sich v t Av = v t Av bzw. λkvk = v t λv = v t λv = λkvk. Nach Kürzen von kvk (was ungleich null ist, da v 6= 0) folgt λ = λ, was impliziert, dass λ reell ist. • Für das Weitere definieren wir: Eine symmetrische Matrix A ∈ Rn×n heißt • • • • • Dann gilt positiv definit, wenn hx, xiA > 0 für alle x ∈ Rn \ {0}, positiv semidefinit, wenn hx, xiA ≥ 0 für alle x ∈ Rn \ {0}, negativ definit, wenn hx, xiA < 0 für alle x ∈ Rn \ {0}, negativ semidefinit, wenn hx, xiA ≤ 0 für alle x ∈ Rn \ {0}, indefinit, wenn es x, y ∈ Rn gibt mit hx, xiA < 0 < hy, yiA . Satz 2.13. Eine symmetrische Matrix A ∈ Rn×n ist genau dann • • • • • positiv definit, wenn sämtliche Eigenwerte positiv sind, positiv semidefinit, wenn sämtliche Eigenwerte nicht-negative sind, negativ definit, wenn sämtliche Eigenwerte negativ sind, negativ semidefinit, wenn sämtliche Eigenwerte nicht-positiv sind,, indefinit, wenn es mindestens einen positiven und mindestens einen negativen Eigenwert gibt. Wir verschieben den Beweis auf das nächste Kapitel und begnügen uns hier mit einem Beispiel: Die Matrix B= 1 1 1 4 ∈ R2×2 ist symmetrisch, definiert also eine symmetrische Bilinearform y1 1 1 t (x, y) 7→ hx, yiB = x By = (x1 , x2 ) y2 1 4 = x21 + x1 y2 + x2 y1 + 4y22 . Zum Nachweis der positiven Definitheit berechnen wir die Eigenwerte von B √ über das charakteristische Polynom λ2 − 5λ + 3 als λ± = 21 (5 ± 13). Damit handelt es sich hier also um ein Skalarprodukt. 45 Das folgende Kriterium erlaubt eine schnelle Entscheidung über die Definitheit, welches ohne die explizite Berechnung der Eigenwerte auskommt: Satz 2.14 (Hurwitz-Kriterium). Eine symmetrische Matrix A (αij )1≤i,j≤n ∈ Rn×n ist genau dann positiv definit, wenn det Ak > 0 wobei Ak := (αij )1≤i,j≤k α21 usw.). = für k = 1, . . . , n, α11 α12 mit α12 = (also A1 = (α11 ) und A2 = α21 α22 Beweis für den Spezialfall n = 2: Eine symmetrische 2 × 2-Matrix mit reellen Einträgen ist von der Gestalt α β mit α, β, γ ∈ R; A= β γ wir haben zu zeigen, dass A genau dann positiv definit ist, wenn α > 0 und αγ − β 2 > 0. Hierzu berechnen wir x = α2 x2 + 2αβxy + αγy 2 α(x, y)A y = (αx + βy)2 + (αγ − β 2 )y 2 , woraus sich das Kriterium leicht ablesen lässt. Für den Beweis des allgemeinen Falles verweisen wir wiederum auf das Buch von Fischer. • Wir schließen unsere Untersuchungen zu symmetrischen Matrizen mit einigen weiteren strukturellen Eigenschaften: Satz 2.15. Es bezeichne Symn (R) die Menge der symmetrischen Matrizen A ∈ Rn×n . (i) Symn (R) ist ein Vektorraum der Dimension 21 n(n + 1). (ii) Für W ∈ Rn×n ist A 7→ W t AW ein Endomorphismus von Symn (R); dieser ist genau dann bijektiv, wenn W invertierbar ist. (iii) Ist A ∈ Symn (R) positiv definit und W invertierbar ist, dann ist auch W t AW positiv definit. Wir stellen den leichten Beweis als Übungsaufgabe. Aufgaben Aufgabe 34 (Frühjahr 2002, Thema 3, Aufgabe 4). a) Man zeige, dass durch y1 x1 2 ∈R , , y= hx, yi := x1 y1 + 2x1 y2 + 2x2 y1 + 5x2 y2 , x = y2 x2 2 eine positiv definite symmetrische Bilinearform, d.h. ein Skalarprodukt im R definiert ist. b) Man berechne den Abstand des Punktes 01 von der Geraden R · 10 bezüglich p der Abstandsfunktion d(x, y) = hx − y, x − yi, die durch das Skalarprodukt aus a) definiert wird. 46 Aufgabe 35. Finden Sie Eigenvektoren und Diagonalisieren Sie die Matrix B aus dem obigen Beispiel. Aufgabe 36. Beweisen Sie Satz 2.15. Zeigen Sie ferner, dass durch A∼B :⇐⇒ B = W t AW eine Äquivalenzrelation auf Symn (R) definiert wird. Aufgabe 37. Welche Bedingungen muss eine Matrix A mit komplexen Einträgen erfüllen, so dass (x, y) 7→ xt Ay eine hermitesche Sesquilinearfrom ist? Geben Sie auch Beispiele an! 5. Winkel und die trigonometrischen Funktionen Im Folgenden sei h . , . i das Standardskalarprodukt. Gegeben zwei vom Nullvektor verschiedene Vektoren x, y ∈ Rn , definieren wir nun den Winkel zwischen ebendiesen bzw. zwischen den Strecken 0x und 0y (wo 0 für den Ursprung bzw. Nullvektor steht). Mit der Cauchy-Schwarzschen Ungleichung gilt −1 ≤ hx, yi ≤ +1. kxk · kyk Es existieren genau zwei Winkel α und α′ mit der Eigenschaft α + α′ = 2π und hx, yi (1) cos α = cos α′ = . kxk · kyk Mit der Forderung α ∈ [0, π] ist α der eindeutig bestimmte Winkel zwischen x und y; in Zeichen: α = ∠(x, y). Der Kosinus ist hierbei natürlich die uns aus der Analysis bekannte 2π-periodische Funktion mit Werten zwischen −1 und +1. Im Falle zweier Geraden G = v + Rw und G′ = v + Rw′ mit gemeinsamen Ortsvektor (welches also ein Schnittpunkt von G und G′ ist) definieren wir den Winkel zwischen den Geraden G und G′ als Minimum der Winkel der Richtungsvektoren: ∠(G, G′ ) = min{∠(w, w′ ), ∠(w, −w′ )}. Abbildung 4. Die Winkel zwischen zwei sich schneidenden Geraden. Punkte und Vektoren des Rn werden oft durch Koordinaten, also letztlich mit Hilfe einer gewählten Basis beschrieben. In der Linearen Algebra wurde 47 bereits gezeigt, dass es keine eindeutige Basis, sondern vielmehr eine große Auswahl von Basen gibt (insbesondere im Rn ), welche allesamt gleichberechtigt sind. Auch berechnen wir beispielsweise das Standardskalarprodukt in Abhängigkeit der Koordinaten (bzw. der gewählten Basis). Allerdings zeigt obige Formel (1) umgeschrieben als hx, yi = kxk · kyk · cos ∠(x, y), dass ein Skalarprodukt im Falle eines kartesischen Koordinatensystems von der Wahl der Basis unabhängige Werte liefert! Hierbei heißt ein Koordinatensystem kartesisch, wenn die Basisvektoren senkrecht aufeinander stehen (also hx, yi = 0 gilt; siehe nächster Paragraph) und auf Länge eins normiert sind. Diese Unabhängigkeit von solcherlei Basen zeigt auf, was für eine wichtige Invariante wir hier vorliegen haben! Weitere einfache Eigenschaften des Winkels sind (i) ∠(x, y) = ∠(y, x); (ii) ∠(λx, µy) = ∠(x, y) für λ, µ > 0; (iii) ∠(x, y) = 0 ⇐⇒ x = λy für ein λ > 0. Bekanntlich lässt sich der Einheitskreis durch die trigonometrischen Funktion Kosinus cos und Sinus sin parametrisieren:‡ x = cos α, y = sin α für 0 ≤ α < 2π erfüllt mit dem Satz des Pythagoras die algebraische Gleichung x2 + y 2 = 1 (siehe Abbildung 6). Allgemeiner gelten in einem rechtwinkligen Dreieck ABC Abbildung 5. Die trigonometrischen Funktionen cos, sin und tan. mit Hypothenuse AC die Beziehungen cos ∠(BAC) = ‡ |AB| |AC| und sin ∠(BAC) = |BC| , |AC| Übrigens: Was heisst Trigonometrie? τ ριγωνoν steht für Dreieck und µǫτ ρoν für Maß. 48 bzw. in Schulsprache: der Kosinus des Winkels bei A ist gleich dem Quotienten der Längen von Ankathete und Hypothenuse, während der Sinus besagten Winkels gleich dem Quotienten der Längen von Gegenkathete und Hypothenuse ist. Sofort ergibt sich hieraus die 2π-Periodizität von Kosinus und Sinus cos(α + 2π) = cos(α) und sin(α + 2π) = sin(α). Aber wir wollen auch noch eine Brücke zu den komplexen Zahlen schlagen Abbildung 6. Links: Kosinus und Sinus am Kreis. Rechts: Das Bild zum Beweis des Additionstheorems. (vgl. Elementare Zahlentheorie). Wir denken uns einen Kreis vom Radius r und Mittelpunkt im Ursprung des R2 . Dann gelten allgemein für die Koordinaten eines Punktes z = (x, y) die Gleichungen x = r cos α und y = r sin α, wenn α den Winkel zwischen der x-Achse und dem Richtungsvektor nach z bezeichnet. Fassen wir den R2 als Gaußsche Zahlenebene auf, so ist z = x + iy eine komple√ xe Zahl mit der imaginären Einheit i = −1 (vgl. Elementare Zahlentheorie); der Übergang von der Menge C der komplexen Zahlen zur euklidischen Ebene R2 erklärt sich dann einfach durch Abtragen des Realteils einer komplexen Zahl auf der x-Achse und des Imaginärteils auf der y-Achse. Neben dieser kartesischen Darstellung komplexer Zahlen lassen sich diese auch alternativ durch Polarkoordinaten wiedergeben: Für 0 6= z ∈ C schreiben wir dazu z = r exp(iα), woraus wir |z| = r und die Formeln von Euler – de Moivre exp(iα) = cos α + i sin α, cos(nα) + i sin(nα) = (cos α + i sin α)n für beliebige α ∈ R und n ∈ Z ablesen. Ferner gewinnt man hieraus auch noch cos α = 21 (exp(iα) + exp(−iα)) und sin α = 1 2i (exp(iα) − exp(−iα)) 49 Mit Hilfe dieser Formeln lässt sich unschwer folgender Satz beweisen: Satz 2.16 (Additionstheorem). Für beliebige reelle α, β gelten cos(α + β) = cos α cos β − sin α sin β, sin(α + β) = sin α cos β + cos α sin β. Wir geben aber ein geometrisches Argument: Beweis. Wir betrachten Dreiecke ABC und AEB mit rechten Winkeln bei B bzw. E; die Winkel bei A seien α bzw. β (wie in Abbildung 6). Setzen wir voraus, dass die Strecke AC Länge eins besitzt, so ergeben sich |AB| = cos α und |BC| = sin α. Als Nächstes bilden wir den Punkt D so, dass BCD ein rechtwinkliges Dreieck Abbildung 7. Dieses Bild zeigt einen PolarPlot der Funktion t 7→ cos 3t mit t ∈ [0, π]; hierbei werden die Werte cos 3t in Richtung des Winkels t vom Ursprung aus abgetragen. Was passiert, wenn man stattdessen cos 5t be- trachtet? mit Hypothenuse BC ist. Dann ist der Winkel dieses Dreiecks bei C wegen des Winkelsummensatzes und dem rechten Winkel des Dreiecks ABC bei B gleich dem Winkel β bei A im Dreieck AEB. Der Punkt F entsteht als Schnittpunkt der Geraden CD und AE. Dies liefert nun |BD| = sin α sin β und |AE| = cos α cos β, woraus sich cos(α + β) = |AF | = |AE| − |F E| = cos α cos β − sin α sin β ergibt. Damit ist das erste Additionstheorem bewiesen; das zweite lässt sich auf ähnliche Weise herleiten. • Aufgaben 50 Aufgabe 38. Geben Sie einen neuen Beweis des Winkelsummensatzes 1.3 mit Hilfe des Standardskalarproduktes. Aufgabe 39. Zeigen Sie: Zu gegebenen α, β ∈ R existiert ein φ ∈ R mit α cos φ + β sin φ = 0. Berechnen Sie ferner (ohne Taschenrechner!) die Werte cos π6 , sin π6 , cos π4 , sin π4 , cos π3 , sin π3 ; was können sie über andere Werte cos πn , sin nπ mit n ∈ N sagen? Aufgabe 40. Beweisen Sie mit geometrischen Argumenten cos(φ + π) = − cos(φ) und sin(φ + π) = − sin(φ). Aufgabe 41. Beweisen Sie folgendes Additionstheorem für den Tangens tan = tan(α + β) = sin cos : tan α + tan β 1 − tan α tan β für alle reellen α, β, für die diese Formel Sinn macht. Aufgabe 42. Sei n ≥ 4. Zeigen Sie: Winkel zwischen Diagonalen im n-dimensionalen Einheitswürfel können verschieden sein. (vgl. mit einem Satz von Thales in Aufgabe 1) Aufgabe 43. Zeigen Sie, dass es kein gleichseitiges Dreieck mit Eckpunkten in Z gibt! 2 6. Orthogonalität Nach Definition des Winkels gilt für das Standardskalarprodukt π ∠(x, y) = ⇐⇒ hx, yi = 0. 2 Entsprechend heißen zwei Vektoren x, y ∈ Rn orthogonal bzgl. eines (allgemeinen) Skalarproduktes h . , . i, falls hx, yi = 0; in Zeichen: x⊥y. In einem euklidischen Raum Rn stehen orthogonale Vektoren also senkrecht aufeinander. Insbesondere gilt für den Nullvektor 0⊥x mit jedem Vektor x. Der Satz des Pythagoras formuliert sich dementsprechend als kx + yk2 = kxk2 + kyk2 für x⊥y. Gegeben eine Teilmenge U ⊂ Rn , heißt U ⊥ := {v ∈ Rn : hu, vi = 0 für alle u ∈ U } das orthogonale Komplement von U . Ist etwa U = Rv eine Gerade durch den Ursprung in der euklidischen Ebene mit v 6= 0, so ist U ⊥ die zu U senkrechte Gerade durch den Ursprung. Das orthogonale Komplement des Nullvektors ist der gesamte Raum; umgekehrt ist das orthogonale Komplement des gesamten Raums ausschließlich der Nullvektor, also {0}⊥ = Rn und (Rn )⊥ = {0}. Ferner gilt: Lemma 2.17. Das orthogonale Komplement U ⊥ eines Unterraums U ⊂ Rn bzgl. eines Skalarproduktes h . , . i ist wieder ein Unterraum. 51 Beweis durch Verifizieren der Unterraumaxiome. Beispielsweise gilt für x, y ∈ U ⊥ auch x + λy ∈ U ⊥ mit λ ∈ R, denn mit hx, ui = hy, ui = 0 für beliebige u ∈ U gilt hx + λy, ui = hx, ui + λhy, ui = 0. Die weiteren Eigenschaften zeigen sich ähnlich. • Tatsächlich ist U ⊥ stets ein Unterraum (unabhängig davon, ob U ein Unterraum ist oder nicht). Zwei Vektoren v, w ∈ Rn heißen parallel, in Zeichen vkw, wenn v oder w = 0 oder wenn ein λ ∈ R existiert, so dass v = λw. (Man mache sich klar, dass dies genau zu Satz 2.1 über parallele Geraden passt!) Sei nun v, w ∈ Rn mit w 6= 0. Dann nennen wir einen Vektor v ′ ∈ Rn die Orthogonalprojektion von v auf w, wenn v ′ parallel zu w ist und wenn die Normalenkomponente v⊥ := v − v ′ von v bzgl. w orthogonal zu w ist. Mit der Orthogonalität v⊥ ⊥w ergibt sich 0 = hv − v ′ , wi = hv, wi − λhw, wi woraus mit λ = hv, wi , hw, wi hv, wi w hw, wi folgt. Eine Familie von Vektoren {vj } heißt orthogonal, falls hvj , vi i = 0 für v′ = Abbildung 8. Die Orthogonalprojektion v′ von v auf w. i 6= j; eine solche Familie heißt orthonormal, wenn darüber hinaus stets kvj k = 1 gilt. Eine orthogonale (orthonormale) Familie, welche eine Basis des zugrunde liegenden Vektorraumes bildet, nennen wir eine Orthogonalbasis (Orthonormalbasis). Beispiel: Die n Standardeinheitsvektoren ej = (0, . . . , 0, 1, 0, . . . 0)t mit einer 1 in der j-ten Komponente und 0 sonst, bilden eine Orthonormalbasis des Rn bzgl. des Standardskalarproduktes. 52 Satz 2.18. Sei V ein endlich-dimensionaler euklidischer Raum mit Skalarprodukt h . , . i und W ⊂ V ein Unterraum mit Orthonormalbasis {w1 , . . . , wm }. Dann lässt sich diese zu einer Orthonormalbasis {w1 , . . . , wm , wm+1 , . . . , wn } von V ergänzen. Der Beweis ist konstruktiv mit dem Orthonormalisierungsverfahren von Gram-Schmidt: OBdA sei W eine echte Teilmenge von V und v ∈ V \ W . Wir definieren v ′ := hv, w1 iw1 + . . . + hv, wm iwm . Der Vektor v ′ ist hier die Orthogonalprojektion von v auf W (s.o.) Mit w := v−v ′ ist w 6= 0 (da v ′ ∈ W und v ∈ V \ W ). Es gilt 1 falls k = ℓ, (2) hwk , wℓ i = 0 sonst. Damit folgt nun hw, wk i = hv, wk i − hv ′ , wk i = hv, wk i − hhv, w1 iw1 + . . . + hv, wm iwm , wk i = hv, wk i − (hv, w1 ihw1 , wk i + . . . + hv, wm ihwm , wk i) = hv, wk i − hv, wk i · 1 = 0 und also w ∈ W ⊥ . Mit wm+1 := w kwk gilt w 1 kwm+1 k = kwk = kwk · kwk = 1 und also ist {w1 , . . . , wm , wm+1 } eine orthonormale Familie. Außerdem ist diese Familie linear unabhängig, denn aus λ1 w1 + . . . + λm+1 wm+1 = 0 mit Skalaren λj folgt durch Einsetzen und (2) 0 = h0, wk i = hλ1 w1 + . . . + λm+1 wm+1 , wk i = λ1 hw1 , wk i + . . . + λm+1 hwm+1 , wk i = λk . Damit bildet {w1 , . . . , wm , wm+1 } eine Orthonormalbasis der linearen Hülle W ′ := LIN(w1 , . . . , wm , wm+1 ) von w1 , . . . , wm , wm+1 (also dem von diesen Vektoren erzeugte Unterraum; siehe Lineare Algebra). Falls W ′ = V sind wir fertig; andernfalls liefert eine Fortführung dieser Konstruktion mit W ′ statt W nach endlich vielen Schritten eine solche Orthonormalbasis für V . • Beispiel: Wir betrachten den R3 mit dem Standardskalarprodukt. Es sei √ 1 1 12 + 12 + 02 √ = 1. w1 := √ mit kw1 k = 1 2 2 0 Wählen wir etwa 0 6 LIN(w1 ) = Rw1 =: W, v := 0 ∈ 1 53 so erhalten wir gemäß dem Gram-Schmidtschen Orthonormalisierungsverfahren 0 v ′ = 0 und w = v − v ′ = 0 mit kwk = 1. 1 Entsprechend sei w2 := w und wir fahren fort mit 1 ′′ v := 0 6∈ LIN(w1 , w2 ) =: W ′ . 0 Mit der orthogonalen Projektion auf W ′ , + * + * 1 1 1 1 0 0 1 1 0 , √ 1 · √ 1 + 0 , 0 · 0 v ′′′ := 2 2 0 0 0 0 1 1 1 1 = 1 2 0 ergibt sich 1 1 1 mit kw′ k = √ . w′ := v ′′ − v ′′′ = −1 2 2 0 √ Zusammen mit w3 = 2w′ bilden w1 und w2 eine Orthonormalbasis des R3 . Ein euklidischer Raum V ist die orthogonale Summe der Unterräume V1 , . . . , Vk , falls V = V1 + . . . + Vk mit Vi ⊥Vj für i 6= j; in diesem Fall schreiben wir auch V = V1 ⊥ . . . ⊥Vk . Hierbei steht die Summe links für die Menge aller Vektoren der Gestalt v = v1 + . . . + vj mit vj ∈ Vj und Vi ⊥Vj bedeutet, dass vi ⊥vj für alle vi ∈ Vi und vj ∈ Vj gilt. Damit gilt Satz 2.19. Sei V ein endlich-dimensionaler euklidischer Raum und W ⊂ V ein Unterraum. Dann gilt V = W ⊥W ⊥; dabei ist die Summe sogar direkt, d.h. W ∩ W ⊥ = {0}. Insbesondere gilt dim V = dim W + dim W ⊥ . Beweis. Hierzu ergänze man eine Orthonormalbasis B von W mit Hilfe des Satzes 2.18 zu einer Orthonormalbasis B ′ von V . Dann bilden die Vektoren aus B ′ \ B eine Orthonormalbasis von V \ W und jeder Vektor dieser Menge ist offensichtlich orthogonal zu W . • Aufgaben 54 Aufgabe 44 (Staatsexamen: Frühjahr 2007, Thema 2, 4 Vektorraum R seien die drei Vektoren 1 1 2 2 v1 = 3 , v2 = 2 , v3 = 3 4 4 Aufgabe 1). Im reellen 1 2 5 6 gegeben. Weiter sei V = hv1 , v2 , v3 i ⊂ R der von diesen Vektoren aufgespannte Unterraum. a) Zeigen Sie, dass v1 , v2 eine Basis von V ist und stellen Sie v3 als Linearkombination von v1 und v3 dar. 4 b) Ergänzen Sie v1 , v2 zu einer Basis von R . 4 c) Bestimmen Sie (bezüglich des Standardskalarprodukts auf R ) eine Ortho4 ⊥ normalbasis für das orthogonale Komplement V von V in R . Aufgabe 45. Zeigen Sie, dass die Menge C der auf dem Einheitsintervall erklärten Polynome mit reellen Koeffizienten von einem Grad ≤ 5 einen Vektorraum mit der wie folgt erklärten Addition und skalaren Multiplikation einen Vektorraum bilden: Für f, g ∈ C und λ ∈ R sei (f + g)(x) := f (x) + g(x) (λ · f )(x) := λ · f (x) und Was ist die Dimension dieses Vektorraums? Beweisen Sie ferner, dass durch Z 1 C 2 ∋ (f, g) 7→ hf, gi := f (x)g(x) dx 0 ein Skalarprodukt erklärt ist und geben Sie eine Orthonormalbasis an. n Aufgabe 46. Seien U, V ⊂ R Untervektorräume. Zeigen sie, dass U ∪ V i.A. kein Untervektorraum ist, wohl aber U ∩ V und U + V . Gelten diese Aussagen auch in n anderen Vektorräumen als R ? Aufgabe 47. Beweisen Sie (W ⊥ )⊥ = W . 7. Hessesche Normalform Die Hessesche Normalform hat nichts mit dem Land Hessen zu tun: Otto Hesse war ein im 19. Jahrhundert lebender, in Königsberg (dem heutigen Kaliningrad) geborener und in München verstorbener Mathematiker, der mit seinen Vorlesungen und Arbeiten zur analytischen Geometrie dieses Gebiet befruchtete. Wir erinnern zunächst an den Orthogonalitätsbegriff: Ein Vektor z ∈ Rn heißt orthogonal zu einer Geraden G ⊂ Rn , falls hz, v1 − v2 i = 0 für alle v1 , v2 ∈ G. Hier und im Folgenden bezeichne h . , . i stets das Standardskalarprodukt. Wir greifen die Ergebnisse aus Paragraph 2.2 wieder auf. Beispiel: Die Gerade G sei in der euklidischen Ebene gegeben durch die Gleichung 2x − y = 1 bzw. alternativ durch 0 1 G= +R· . −1 2 55 Ein zum Richtungsvektor w = ( 12 ) orthogonaler Vektor ist offensichtlich w⊥ = 2 ( −1 ). Es ist kein Zufall, dass dieser aus den Koeffizienten der G definierenden Abbildung 9. Die Gerade zur Gleichung 2x − y = 1 mit dem Richtungsvektor w und dem hierzu orthogonalen Vektor w⊥ . Das orthognale Komplement von G ist die Ursprungsgerade G⊥ = IR · w⊥ . Gleichung abgelesen werden kann, wie der folgende Satz zeigt: Satz 2.20. (i) Sei G = v + Rw eine Gerade, dann ist z genau dann orthogonal zu G, wenn z⊥w. (ii) Ist G = {(x, y) ∈ R2 : ax + by = c} mit (a, b) = 6 (0, 0), so ist a z = ( b )⊥G. Beweis. Wir beginnen mit (i): Angenommen z⊥G. Mit v, v + w ∈ G folgt dann z⊥(v + w) − v = w. Umgekehrt gilt für v1 = v + λw, v2 = v + µw ∈ G hz, v1 − v2 i = hz, λw − µwi = (λ − µ)hz, wi = 0. Nun zu (ii): Für v1 = ( xy11 ), v2 = ( xy22 ) ∈ G berechnet sich hz, v1 − v2 i = hz, v1 i − hz, v2 i = (ax1 + by1 ) − (ax2 + by2 ) = c − c = 0, womit der Satz vollständig bewiesen ist. • Damit gelingt nun Satz 2.21 (Normalengleichung). Für 0 6= z ∈ R2 und u ∈ R2 beschreibt (3) G := {v ∈ R2 : hz, v − ui = 0} eine Gerade durch u, die orthogonal zu z ist. Ist umgekehrt G ⊂ R2 eine Gerade, u ∈ G und z 6= 0 orthogonal zu G, so gilt (3). 56 Der Vektor z heißt dann Normalenvektor zu G; speziell mit dem Normalenz ergibt sich die bis aufs Vorzeichen eindeutig bestimmte einheitsvektor n := kzk Hessesche Normalform hn, v − ui = 0 welche in der Literatur oft auch als n · (v − u) = 0 geschrieben wird. Beweis. Sei z = ( ab ), v = ( xy ) und c = hz, ui. Dann gilt hz, v − ui = hz, vi − hz, ui = ax + by − c. Nach Satz 2.4 ist G damit eine Gerade. Wegen hz, u − ui = hz, 0i = 0 ist u ∈ G. Gilt ferner v ∈ G mit v 6= u, so ist w := v − u ein Richtungsvektor von G nach Satz 2.1 und hz, wi = hz, v − ui = 0, womit z orthogonal zu w und nach Satz 2.20 damit auch zu G ist. Für den Nachweis der zweiten Aussage sei v ∈ G mit v 6= u. Dann ist G = v + Rw mit w := u − v. Da z orthogonal zu G ist, gilt hz, wi = 0 nach Satz 2.20. Ferner gilt mit dem bereits Bewiesenen, dass G′ := {v ′ ∈ R2 : hz, v ′ − ui = 0} eine Gerade mit u ∈ G′ ist; außerdem zeigt hz, v − ui = −hz, wi = 0, dass v ∈ G′ gilt. Da eine Gerade durch zwei Punkte nach Korollar 2.3 eindeutig bestimmt ist, folgt G = G′ . • Nun möchten wir Abstände messen. Wir definieren den Abstand eines Punktes p von einer Menge (wie etwa einer Geraden) G durch d(p, G) := inf{d(p, v) : v ∈ G}; dieses Infimum ist im Fall einer Geraden ein Minimum (d.h. das Extremum wird tatsächlich angenommen), wie folgender Satz zeigt: Satz 2.22. Sei G ⊂ Rn eine Gerade und p ∈ Rn . Dann existiert genau ein u ∈ G, so dass p − u orthogonal zu G ist und ferner gilt d(p, G) = d(p, u). Der senkrechte Abstand ist also minimal! Beweis. Sei G = v + Rw. Für u = v + λw mit einem reellen λ ist p − u nach Satz 2.20 genau dann orthogonal zu G, wenn 0 = hp − u, wi = hp − v − λw, wi = hp − v, wi − λhw, wi, wenn also hp − v, wi ; kwk2 an dieser Stelle erinnern wir uns an die Orthogonalprojektion und das GramSchmidtsche Orthogonalisierungsverfahren aus dem vorangegangenen Paragraphen! Damit ist λ und also auch u eindeutig bestimmt und für beliebiges v ∈ G gilt (p − u)⊥(v − u). Mit dem Satz des Pythagoras folgt λ= kp − vk2 = kp − uk2 + ku − vk2 ≥ kp − uk2 ; die linke Seite ist also genau für v = u minimal. • 57 Der Beweis liefert eine Formel für den Abstand d(p, G): Wegen (4) u = v + λw = v + gilt nämlich hp − v, wi w kwk2 hp − v, wi w d(p, G) = d(p, u) = kp − uk = p − v − . kwk2 Speziell für eine Gerade in der Ebene vereinfacht sich dies folgendermaßen: Sei z 6= 0 orthogonal zu G ⊂ R2 und u ∈ G, so besteht die Normalengleichung G = {v ∈ R2 : hz, v − ui = 0}. Gesucht ist nun ein λ ∈ R, so dass p + λz ∈ G, weil dann d(p, G) = d(p, p + λz) = kλzk = |λ| · kzk besteht. Hierbei ist p + λz ∈ G äquivalent zu 0 = hz, p + λz − ui = hz, p − ui + λhz, zi und damit |hz, p − ui| . kzk Ist die Gerade gegeben durch G = {(x, y)t ∈ R2 : ax + by = c}, so ergibt sich via z = ( ab ) 6= 0 und c = hz, ui der minimale Abstand als |ax0 + by0 − c| x0 √ d(p, G) = für p = . 2 2 y0 a +b d(p, G) = Den Abstand eines Punktes von einer Geraden kann man also durch Einsetzen in die Hessesche Normalform berechnen! Normieren wir noch z auf Länge eins, √ kzk = a2 + b2 = 1, so ergibt sich noch einfacher d(p, G) = |ax0 + by0 − c|. Wir definieren ferner : Das Lot eines Punktes p auf eine Gerade G ist die Gerade durch p, welche auf G senkrecht steht. Der Fußpunkt f ist der Schnittpunkt von G und dem Lot (siehe Abbildung 10). Zur Berechnung dieser Größen ist u.a. (4) nützlich! Beispiel: Sei G = {(x, y)t ∈ R2 : 2x − y = 1}. Der Punkt (1, 0) hat Abstand √1 von der Geraden G. In der obigen Form sind übrigens die Achsenabschnitte, 5 also die Schnittpunkte der Geraden mit den Koordinatenachsen leicht als (0, −1) und ( 21 , 0) abzulesen. Es gibt auch Normalformen zu Ebenen im R3 . Hier heißt ein Vektor z ∈ Rn orthogonal zu einer Ebene E ⊂ Rn , falls hz, v1 − v2 i = 0 für alle v1 , v2 ∈ E gilt. Dabei ist z offensichtlich genau dann orthogonal zu E = v + Rw1 + Rw2 , wenn z⊥w1 und z⊥w2 . Ganz ähnlich wie bei Geraden gilt hier Satz 2.23 (Hessesche Normalform). Sei 0 6= z ∈ R3 und u ∈ R3 , so ist E = {v ∈ R3 : hz, v − ui = 0} eine Ebene durch u, welche orthogonal zu z ist. Ist umgekehrt E eine Ebene, welche u enthält und orthogonal zu z ist, so ist E von obiger Form. 58 Abbildung 10. Punkt p und sein Lot auf eine Gerade G mit Fußpunkt f . Satz 2.24. Ist E ⊂ R3 eine Ebene durch u, die orthogonal zu z ist, so gilt für p ∈ R3 |hz, u − pi| . d(p, E) = kzk Ist speziell E = {(x, y, z)t ∈ R3 : ax + by + cz = d} mit gewissen a, b, c, d ∈ R, so gilt d(p, E) = |ax0 + by0 + cz0 − d| √ a2 + b2 + c2 für x0 p = y0 . z0 Für die Beweise verweisen wir auf das Buch von Scheid & Schwarz und diskutieren nun Anwendungen. Die eindeutige Achsenabschnittsform der Ebene E ist von der Form E = {(x, y, z)t ∈ R3 : αx + βy + γz = 1} mit entsprechenden Koeffizienten α, β, γ. Diese Darstellung liefert unmittelbar die Schnittpunkte von E mit den Koordinatenachsen: Gilt etwa α, β, γ 6= 0, so sind diese gegeben durch ( α1 , 0, 0), (0, β1 , 0) und (0, 0, γ1 ); falls etwa α = 0 gülte, verliefe E parallel zur x-Achse. Beispiel (Herbst 2005, Thema 1, Aufgabe 3): Im euklidischen Raum R3 mit den Koordinaten x, y, z seien zwei Ebenen E1 und E2 gegeben durch ihre Gleichungen E1 : x + y = 1, E2 : y + z = 1. Bestimmen Sie den Abstand des Nullpunktes (0, 0, 0) ∈ R3 a) von der Ebene E1 , b) von der Schnittgerade L = E1 ∩ E2 . 59 Kurze Beweisskizze: Zu a): Die Ebene E1 besitzt die Darstellung 2 1 0 E1 = +R +R 0 −1 −1 0 0 1 und also den Normalenvektor 1 1 0 der Länge kzk = √ 2. Nach entsprechender Normierung ist also die Hessesche Normalform von E1 gegeben durch die folgende lineare Gleichung 1 √ (x + y − 1) = 0. 2 Damit errechnet sich der Abstand des Nullpunktes von E1 als 1 1 d(0, E1 ) = √ |0 + 0 − 1| = √ . 2 2 Zu b): Die Schnittgerade L berechnet sich durch Lösen des durch L = E1 ∩ E2 definierten Gleichungssystems explizit als 1 0 L = 1 + R −1 . 1 0 1 1 Der Fußpunkt des Lotes berechnet sich als 3 2 , womit sich der gesuchte 1 Abstand d(0, L) = √ 6 3 ergibt. Aufgaben Aufgabe 48. Gegeben eine Parabel und ein Punkt P außerhalb der Parabel. Bestimmen Sie den Punkt Q auf der Parabel, der minimalen Abstand zum Punkt P hat. Wie groß ist die Länge der Strecke P Q? (alte Aufgabe aus dem vergangenen Semester!) Aufgabe 49 (Herbst 2008, Thema 3, Aufgabe 5). In der euklidischen Ebene R werde das Dreieck mit den Eckenanzahl A = (0, 0), B = (4, 0), 2 C = (0, 3) betrachtet. 2 a) Es sei t ∈ R und P = (t, t) ∈ R . Bestimmen Sie die Hessesche Normalform der Geradengleichung für die Gerade BC und damit den Abstand d des Punktes P von der Geraden BC als Funktion von t. b) Berechnen Sie den Inkreismittelpunkt I des Dreiecks ABC. c) Berechnen Sie die Berührpunkte A′ ∈ BC, B ′ ∈ CA und C ′ ∈ AB des Inkreises mit den Dreiecksseiten. d) Zeigen Sie: Die drei Geraden AA′ , BB ′ und CC ′ treffen sich in einem Punkt. Aufgabe 50. Beweisen Sie die Sätze 2.23 und 2.24. 60 8. Vektorprodukt und Spatprodukt Im euklidischen Raum R3 erklären wir ein weiteres Produkt von Vektoren durch x2 y 3 − x3 y 2 x1 y1 x × y = x3 y 1 − x1 y 3 für x = x2 , y = y2 ∈ R3 ; x1 y 2 − x2 y 1 x3 y3 wir nennen x × y das Vektorprodukt (bzw. Kreuzprodukt) von x und y. Man verifiziert leicht, dass dieses Produkt schiefsymmetrisch ist: x × y = −y × x. Mit dem Vektorprodukt lassen sich lineare Abhängigkeiten entdecken. Satz 2.25. Es gilt genau dann x × y = 0 mit x, y ∈ R3 , wenn x und y linear abhängig sind. Beweis. Mit den üblichen Bezeichnungen für die Koordinaten von x und y ist x × y = 0 äquivalent zu x2 y3 − x3 y2 = x3 y1 − x1 y3 = x1 y2 − x2 y1 = 0. Angenommen, keine der Koordinaten xj , yk verschwindet, so können wir die drei vorangegangenen Gleichungen umschreiben zu x3 x1 x2 = = , y2 y3 y1 was aber bedeutet, dass x ein Vielfaches von y ist, so dass die beiden also linear abhängig sind. Im Falle x = 0 oder y = 0 sind x und y linear abhängig und ebenso x × y = 0. Es verbleibt nur noch der Fall, dass oBdA x 6= 0, aber x1 = 0. Aus x × y = 0 folgt dann aber sofort y1 = 0 (da weder x2 noch x3 gleichzeitig verschwinden). Nun folgt aus x × y = 0 aber x2 y 2 = 0, det x3 y 3 was bekanntlich die lineare Abhängigkeit nach sich zieht, welches wiederum die lineare Abhängigkeit von x und y impliziert. • Das Vektorprodukt ist nicht assoziativ, aber bilinear (wie das Skalarprodukt). Neben diesen strukturellen Eigenschaften besitzt es aber noch eine interessante geometrische Eigenschaft: Satz 2.26. Es seien x, y ∈ R3 . (i) Sind x und y linear unabhängig, so steht x × y orthogonal zu der von x und y aufgespannten Ebene. (ii) Es gilt kx × yk = kxk · kyk · sin φ, wobei φ = ∠(x, y); insbesondere ist kx × yk der Flächeninhalt des von x und y aufgespannten Parallelogramms. 61 Aussage (i) lässt sich gut bei der Findung Hessescher Normalformen einsetzen! Ist etwa E = u + Rw1 + Rw2 gegeben, so ist z = w1 × w2 ein zu E orthogonaz ler Vektor und mit dem Normaleneinheitsvektor n = kzk entsteht die bis aufs Vorzeichen eindeutige Hessesche Normalform hn, v − ui = 0. Beweis. Wir berechnen hx, x × yi = x1 (x2 y3 − x3 y2 ) + x2 (x3 y1 − x1 y3 ) + x3 (x1 y2 − x2 y1 ); denselben Wert erhalten wir für die Determinante der 3 × 3-Matrix gebildet von den linear abhängigen Vektoren x, x und y. Entsprechend verschwindet die Determinante und so auch hx, x × yi = 0. Ganz analog zeigt sich hx × y, yi = 0. Ferner ist mit seiner Bilinearität das Vektorprodukt auch orthogonal zu jeder Linearkombination von x und y, was Aussage (i) beweist. Abbildung 11. Die Berechnung des Flächeninhaltes eines Parallelogramms mit Hilfe des Vektorproduktes. Für den Beweis von (ii) rechnen wir kx × yk2 = (x2 y3 − x3 y2 )2 + (x3 y1 − x1 y3 )2 + (x1 y2 − x2 y1 )2 = (x21 + x22 + x23 )(y12 + y22 + y32 ) − (x1 y1 + x2 y2 + x3 y3 )2 ) = kxk2 kyk2 − (kxk · kyk · cos φ)2 = kxk2 kyk2 (1 − (cos φ)2 ); mit dem Satz des Pythagoras für trigonometrische Funktionen, cos2 + sin2 = 1, ergibt sich die Formel aus (ii). Betrachten wir das von x und y aufgespannte Parallelogramm, so berechnet sich dessen Flächeninhalt über die bekannte Formel Länge der Grundlinie multipliziert mit der Länge der Höhe als kxk · kyk sin φ = kx × yk mit Hilfe des bereits Bewiesenen. • Beispiel: Gegeben die Vektoren 1 x= 2 0 und 3 y = 4 . 0 62 Dann gilt 2·0−0·4 0 x×y = 0·3−1·0 = 0 1·4−2·3 −2 und kx × yk = 2. Damit sind x und y also linear unabhängig. Offensichtlich steht auch x × y orthogonal auf sowohl x als auch auf y. Ferner ist 2 = kx × yk der Flächeninhalt des von x und y aufgespannten Parallelogramms. Dieses liegt offensichtlich in der Ebene 0 1 E = R 0 + R 1 ; 0 0 hier reduziert sich also das Vektorprodukt auf die Determinante und es gilt die übliche Formel für den Flächeninhalt des von zwei Vektoren x = ( xx12 ), y = ( yy12 ) in der euklidischen Ebene R2 aufgespannten Parallelogramms, nämlich bis auf das Vorzeichen x1 0 y 1 x1 y 1 ± det = = x2 × 0 y2 . x2 y 2 x y −x y 0 0 1 2 2 1 Abbildung 12. Mit Determinante und Vektorprodukt lassen sich Flächen berechnen. Das 1 | det( −1 )| = 4. 2 2 eingezeichnete Parallelogramm hat Fläche Wir kommen zu einem weiteren Produkt von Vektoren: Das Spatprodukt ist definiert durch x1 y1 z1 det(x, y, z) = det x2 y2 z2 x3 y3 z3 63 für x1 y1 z1 x = x2 , y = y2 , z = z2 ∈ R3 ; x3 y3 z3 Mit den uns bekannten Rechenregeln für die Determinante (siehe Lineare Algebra) ergeben sich leicht diverse Eigenschaften: • • • • det(x, y, z) = 0 wenn und nur wenn x, y, z linear abhängig sind; det(x, y, z) = det(y, z, x) = det(z, x, y) = − det(z, y, x); das Spatprodukt ist trilinear; det(x, y, z) = hx, y × zi = hx × y, zi. Die letzten Identitäten mit dem Vektorpordukt rechnet man leicht nach. Eine weitere interessante, vom Koordinatensystem unabhängige und damit geometrische Eigenschaft liefert Satz 2.27. Der Absolutbetrag des Spatproduktes | det(x, y, z)| ist gleich dem Volumen des von den Vektoren x, y, z ∈ R3 aufgespannten Parallelepipeds (bzw. Spates) Π = {λx + µy + νz ∈ R3 : 0 ≤ λ, µ, ν ≤ 1}. Beweis. Das Parallelepiped Π ensteht als der konvexe Körper der durch die Eckpunkte 0, x, y, x + y, z, x + z, y + z, x + y + z definiert ist; die Seitenflächen sind entsprechende Parallelogramme. Wiederum gemäß der Formel Grundfläche multipliziert mit der Höhe ergibt sich das Volumen von Π mit Hilfe von Satz 2.26 als kx × yk · kzk cos φ, wobei φ der Winkel zwischen z und einer zur Grundfläche orthogonalen Gerade ist. Damit folgt nunmehr kx × yk · kzk cos φ = |hx × y, zi| = | det(x, y, z)|, was zu zeigen war. • Beispiel: Gegeben seien die Vektoren 2 0 0 x= 0 ,y = −3 , z = 1 ∈ R3 ; 0 0 4 diese bilden die Eckpunkte eines Parallelepipeds mit Eckpunkten 0, x, y, x + y, z, x + z, y + z, x + y + z und Volumen 24 = − det(x, y, z) (siehe Abbildung 13). Das Spatprodukt kann noch mehr. Seien zwei Geraden Gj = vj + Rwj ⊂ R3 (j = 1, 2) gegeben. Wir wollen den Abstand der beiden Geraden voneinander messen, also d(G1 , G2 ) = min{d(u1 , u2 ) : uj ∈ Gj } 64 Abbildung 13. Versuch einer Zeichnung eines dreidimensionalen Objektes auf zweidimensionalem Grund. bestimmen; es ist anschaulich klar, dass es Punkte uj ∈ Gj gibt, deren Distanz minimal ist (so dass wir nicht ein Infimum zu bilden haben). Wir berechnen nun d(u1 , u2 )2 = kv1 + λ1 w1 − (v2 + λ2 w2 )k2 = hv1 − v1 + λ1 w1 − λ2 w2 , v1 − v1 + λ1 w1 − λ2 w2 i = kv1 − v2 k2 + 2hv1 − v2 , λ1 w1 − λ2 w2 i − 2λ1 λ2 hw1 , w2 i +λ21 kw1 k2 + λ22 kw2 k2 . Wir betrachten diesen Ausdruck als Funktion f zweier Veränderlicher λ1 , λ2 und suchen das Minimum dieser Funktion mit Hilfe der Methoden der Analysis mehrerer Veränderlicher. Hierzu setzen wir also die partiellen Ableitungen von f gleich null und erhalten so potentielle Werte für Extrema. Einsetzen derselben in die Hesse-Matrix, bestehend aus den zweiten partiellen Ableitungen von f , liefert dann die Punkte uj ∈ Gj , für die deren Abstand minimal ist. Die Rechnungen gestalten sich jedoch als recht aufwendig! Ein einfaches geometrisches Argument mit Hilfe des Spatproduktes liefert ebenso (5) d(G1 , G2 ) := min{d(u1 , u2 ) : uj ∈ Gj } = (siehe Aufgabe 53). | det(v1 − v2 , w1 , w2 )| kw1 × w2 k Aufgaben Aufgabe 51. Zeigen Sie: Die vier Punkte 0 ±2 a1,2 = 0 , a3,4 = ±2 √ √ 2 − 2 65 bilden die Eckpunkte eines regulären Tetraeders. Bestimmen Sie ferner Normalenvektoren zu den vier Seitenflächen. Zeigen Sie außerdem, dass das Tetraeder durch die folgenden vier Ungleichungen beschrieben wird: √ √ 2x2 + x3 − 2 < 0, √ √ − 2x2 + x3 − 2 < 0, √ √ 2x1 − x3 − 2 < 0, √ √ − 2x2 − x3 − 2 < 0. Aufgabe 52. Beweisen Sie die Grassmann-Identität x × (y × z) = hx, ziy − hx, yiz sowie (x × y) × (z × w) = det(x, z, w)y − det(y, z, w)x. 3 Aufgabe 53. Sei G = v + Rw eine Gerade im R . Zeigen Sie, dass für den Abstand eines Punktes p von G folgende Formel gilt: d(p, G) = k(p − v) × wk . kwk Zeigen Sie ferner Formel (5) für den Abstand zweier Geraden Gj = vj Rwj . 3 Aufgabe 54. Es seien x, y, z ∈ R kollineare Punkte. Zeigen Sie, dass dann 1 6 |h(x × y, zi| gleich dem Volumen des Tetraeders mit den Eckpunkten 0, x, y, z ist. KAPITEL 3 Kegelschnitte Apollonius (ca. ∗ 262 - † 190 v.Chr.) studierte wohl als Erster die Kegelschnitte. Die drei Kurven, die durch Schnitte eines geraden Kreiskegels mit einer Ebene entstehen, sind bekanntlich Ellipse, Parabel und Hyperbel. Bei Apollonius finden sich bereits sehr tiefe Resultate zu diesen geometrischen Objekten. Die Relevanz derselben offenbarte nicht zuletzt Johannes Kepler (ca. ∗ 1571 † 1630) mit seinem ersten Keplerschen Gesetz, welches besagt, dass sich Himmelskörper auf Ellipsen, Hyperbeln und Parabeln bewegen. Und natürlich sind diese Kegelschnitte Gegenstand der Schulmathematik — ein weiterer Grund sich mit diesen gut auszukennen! Abbildung 1. Einige Kreise und Ellipsen – Gegenstände dieser Vorlesung und des täglichen Lebens! Wie lassen sich diese Objekte geometrisch bzw. algebraisch beschreiben? 1. Quadratische Formen Ein Polynom q(X) heißt homogen, wenn q(λX) = λd q(X) mit einer nichtnegativen ganzen Zahl d gilt; offensichtlich ist dann d der Grad von q. Ein homogenes quadratisches Polynom nennen wir eine quadratische Form. Ein Beispiel einer quadratischen Form ist etwa (x, y) 7→ x2 + 3y 2 . Die Niveaumengen (vgl. Analysis mehrerer Veränderlicher) Nc = {(x, y) ∈ R2 : x2 + 3y 2 = c} sind für c > 0 Ellipsen (siehe Abbildung 2). 66 67 Abbildung 2. Kein Stein in einer Pfütze sondern Ellipsen x2 + 3y 2 = c mit c = 1, 2, . . . , 6 Gegeben ein Skalarprodukt h . , . i, erklären wir durch q : Rn → R x 7→ q(x) := hx, xi die assoziierte quadratische Form. Ist hier n = 2, spricht man von einer binären quadratischen Form; bei n = 3 von einer ternären, der Anzahl der Unbekannten (Koordinaten) entsprechend. Wenn q bekannt ist, so lässt sich das zugehörige Skalarprodukt durch Polarisierung (wie man leicht nachrechnet) wie folgt gewinnen: hx, yi = 41 (q(x + y) − q(x − y)). Beispiel: Gegeben sei die Abbildung x1 x= 7→ q(x) = x21 + 2x1 x2 + 4x22 . x2 Polarisierung liefert mit y = ( yy12 ) nach einer länglichen Rechnung 1 4 (q(x = + y) − q(x − y)) 1 4 ((x1 + y1 )2 + 2(x1 + y1 )(x2 + y2 ) + 4(x2 + y2 )2 −((x1 − y1 )2 + 2(x1 − y1 )(x2 − y2 ) + 4(x2 − y2 )2 )) 1 1 y1 ; = (x1 , x2 ) y2 1 4 der letzte Ausdruck definiert gerade das Skalarprodukt aus Beispiel §2.4. Was für ein geometrisches Objekt steckt hinter der Menge aller x ∈ R2 , welche q(x) = 0 genügen? Und welche hinter den Lösungen der Gleichung q(x) = 68 10 etwa? Eine Antwort finden wir (vorerst noch) mit Hilfe eines Computers; siehe Abbildung 3. Abbildung 3. Die Menge der (x1 , x2 ), welche der Gleichung x21 +2x1 x2 + 4x22 = 10 genügt: eine Ellipse! Die Gleichung mit rechter Seite = 0 besitzt nur den Nullpunkt als Lösung. Übrigens interessiert man sich bei quadratischen Formen oft für das Bild der Punkte mit ganzzahligen Koordinaten, also q(Zn ). Der Satz von Lagrange (vgl. Elementare Zahlentheorie?) besagt, dass jede natürliche Zahl sich darstellen lässt als Summe von vier Quadraten ganzer Zahlen: N ⊂ q(Z4 ) für q(x) = hx, xi = x21 + x22 + x23 + x24 . Beispielsweise 2011 = 212 + 272 + 292 = 432 + 2 · 92 . (die Darstellung ist i.A. nicht eindeutig). Aufgaben Aufgabe 55. Zeigen Sie, dass zu jeder quadratischen Form q eine symmetrische Matrix A gefunden werden kann, so dass q(x) = xt Ax gilt. Geben sie ferner ein Skalarprodukt an, so dass q die zu diesem Skalarprodukt assoziierte quadratische Form ist. Führen sie die weiteren Details zu Beispiel 2 aus. Aufgabe 56. Welche geometrischen Objekte verbergen sich hinter der Menge aller 2 ( xy ) ∈ R , welche der Gleichung x2 + 6λxy + 9y 2 = 0 für λ = −1, 0, +1? 69 2. Kreise und Ellipsen Kreise sind neben Rechtecken die vielleicht am häufigsten in der Realität vorkommenden geometrischen Objekte. Während Rechtecke ihrer rechten Winkel wegen maßgebend für Stabilität und Ordnung sind, finden wir Kreise oftmals im Zusammenhang mit Bewegung. Aber nicht notwendig: Eine gute Frage, die tatsächlich sehr viel mit Geometrie zu tun hat, ist: Warum sind Gullydeckel rund? Ein Kreis ist die Menge aller Punkte, die von einem gewissen Punkt einen gewissen Abstand besitzt; diesen ausgezeichneten Punkt nennen wir Mittelpunkt und besagter Abstand ist der Radius des Kreises. In der euklidischen Ebene gilt also für jeden Punkt x = ( xx12 ) auf einem Kreis um den Mittelpunkt p = ( pp12 ) damit p kx − pk = (x1 − p1 )2 + (x2 − p2 )2 ; nennen wir diesen Abstand bzw. Radius ρ, so gilt also die Kreisgleichung: (x1 − p1 )2 + (x2 − p2 )2 = ρ2 . Abbildung 4. Fliesen auf Kreta: Zählen der Steine innerhalb des Viertelkreises und im gesamten Quadrat liefert 3, 04225 . . . π 4 ≈ 54 54+17 bzw. π ≈ 216 71 = Die Menge E aller Punkte x ∈ R2 , für welche die Summe der Abstände zu zwei gegebenen Punkten p, q ∈ R2 konstant gleich 2ρ mit einer positiven reellen Zahl ρ ist, heißt eine Ellipse. Die Punkte p, q nennt man die Brennpunkte und 12 (p + q) bezeichnet den Mittelpunkt der Ellipse. Nach Definition ist E durch die Gleichung kx − pk + kx − qk = 2ρ 70 beschrieben. Hier und im Folgenden bezeichne h . , . i bis auf Weiteres das Standardskalarprodukt und k . k die zugehörige euklidische Norm. Mit der Dreiecksungleichung folgt aus obigem kp − qk ≤ 2ρ. Im Falle p = q fallen die beiden Brennpunkte zusammen und wir erhalten einen Kreis mit Mittelpunkt p (bzw. q) vom Radius ρ (s.o.). Falls kp − qk = 2ρ gilt, so entartet unsere Ellipse zur Verbindungsstrecke der Punkte p und q. Im Folgenden nehmen wir deshalb kp − qk < 2ρ (6) an. Ferner können wir durch eine Translation stets unsere Ellipse so verschieben, dass der Mittelpunkt im Ursprung zu liegen kommt (dass also q = −p gilt). Satz 3.1. Die Ellipse E = {x ∈ R2 : kx − pk + kx + pk = 2ρ} besteht genau aus den Punkten x ∈ R2 , für die ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 ) (7) gilt. Insbesondere ist kxk ≤ ρ. Beweis. Quadrieren der E definierenden Gleichung liefert kx − pk · kx + pk = 2ρ2 − kxk2 − kpk2 ; man beachte, dass der Ausdruck rechts nicht-negativ ist. Erneutes Quadrieren liefert (kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 , welches nach Ausmultiplizieren der Terme auf die Gleichung (7) führt. Hierbei ist aber die Nebenbedingung kxk2 + kpk2 ≤ 2ρ2 zu beachten (um eine positive rechte Seite in der allerersten Formel zu haben). Mit Hilfe der Cauchy-Schwarzschen Ungleichung für das Skalarprodukt hp, xi2 ≤ kpk2 kxk2 ergibt sich aus (7) kxk2 (ρ2 − kpk2 ) ≤ ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 ), und wegen kpk < ρ ebenso kxk ≤ ρ, so dass also die Nebenbedingung bereits aus der E definierenden Gleichung folgt. • Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den Mittelpunkt nennen wir die Achsen der Ellipse. Die Schnittpunkte derselben mit der Ellipsen heißen Scheitelpunkte und die Strecken zum Mittelpunkt werden Halbachsen genannt. Die Ellipse kann in einem kartesischen Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu liegen kommen. Hierbei verstehen wir unter einer Bewegung eine Abbildung, die den Abstand zwischen beliebigen Punkten invariant lässt (wie etwa Translationen oder Drehungen; solche Abbildungen werden uns später noch eingehend 71 beschäftigen). In diesem Fall lässt sich die Ellipse auch durch eine quadratische Gleichung beschreiben: Mittels x = ( xx12 ) und p = ( σ0 ) liefert eine einfache Rechnung Korollar 3.2. Nach einer geeigneten Bewegung kann eine Ellipse E beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung 2 2 x1 x2 + = 1; α1 α2 p genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = ρ2 − σ 2 und die Brennpunkte sind ±( σ0 ). Man beachte, dass auf der linken Seite eine quadratische Form steht. Abbildung 5. Und noch eine Ellipse. Einen Kreis zeichnet man mit einem Zirkel. Aber wie zeichnet man eine Ellipse? Gemäß der Definition besteht eine Ellipse aus der Menge aller Punkte, deren Abstandssumme zu zwei ausgezeichneten Punkten konstant ist. Entsprechend spannen wir einen geschlossenen Faden der Länge 2σ + 2ρ durch einen Bleistift um die Punkte p und q in der euklidischen Ebene und lassen den Bleistift wandern. Dies liefert damit eine Ellipse mit Brennpunkten p, q und Abstandssumme 2ρ und σ = 12 kp − qk. Die Fadenkonstruktion, auch Gärtnerkonstruktion genannt, wird Anthemios (im fünften Jahrhundert n. Chr.) zugeschrieben. (Siehe auch Abbildung 5.) Sei nun α1 ≥ α2 . Die Exzentrizität s 2 α2 ǫ := 1 − α1 misst die Abweichung einer Ellipse von einem Kreis. Es gilt 0 ≤ ǫ < 1 und ǫ = 0 steht für die Gleichheit der Längen der beiden Halbachsen, also den Fall eines Kreises. 72 Der Umfang U einer Ellipse lässt sich i.A. nicht explizit angeben. Was im Spezialfall des Kreises eine leichte Übungsaufgabe in der Analysis ist (vgl. Analysis mehrerer Veränderlicher), führt bei der Ellipse mit Hilfe der Parametrisierung durch trigonometrische Funktionen x1 = α1 cos φ, x2 = α2 sin φ auf ein so genanntes elliptisches Integral Z Z πq 2 2 2 2 α1 (sin φ) + α2 (cos φ) dφ = 4α1 U =4 0 0 π 2 p 1 − (ǫ sin φ)2 dφ, welches i.A. keine elementare Stammfunktion besitzt! Für den Flächeninhalt A einer Ellipse gilt die Formel∗ A = πab. Noch kurz sei hier auf das wohl älteste Problem der Analysis verwiesen: Das Problem der Dido fragt nach dem maximalen Flächeninhalt, den eine geschlossene Kurve in der Ebene umschließen kann. Die so genannte isoperimetrische Ungleichung besagt 4πA ≤ ℓ2 , wobei ℓ die Bogenlänge der geschlossenen Kurve ist und A die Fläche des hiervon berandeten Gebietes (vgl. Analysis mehrerer Veränderlicher).† Im Spezialfall eines Kreises besteht Gleichheit. Dido war die legendäre Gründerin und erste Königin von Karthago (bei Tunis im heutigen Tunesien). Aufgaben Aufgabe 57. Recherchieren Sie den mathematischen Begriff kissing number und 2 geben Sie einen geometrischen Beweis, dass diese Größe im R gleich sechs ist! Aufgabe 58. Es sei E eine Ellipse und Q ein Quadrat mit Kanten parallel zu den Achsen von E und Eckpunkten auf E. Berechnen Sie den Flächeninhalt von Q. Aufgabe 59. Sei die Ellipse E gegeben als die Menge aller ( xy ), welcher der Gleichung y2 x2 + 2 =1 2 α β genügen, wobei α ≥ β > 0 gelte. Zeigen Sie, dass die Tangente an den Punkt u = ( wv ) ∈ E gegeben ist durch die Gerade ! w −α β u+R . β αv Aufgabe 60. Suchen Sie im Internet nach dem Begriff Gleichdick und geben Sie eine kurze Erläuterung dieses mathematischen Begriffes! ∗ Der Nachweis läuft über den Integrationssatz von Green und ist nicht trivial. Der Beweis ist schwierig und wurde erst im neunzehnten Jahrhundert erbracht † 73 3. Hyperbeln und Parabeln Die Hyperbel ist eine nahe Verwandte der Ellipse. Die Hyperbel ist definiert als die Menge H aller Punkte x ∈ R2 , für welche der Betrag der Differenz der Abstände zu zwei verschiedenen Punkten p, q ∈ R2 konstant gleich 2ρ ist. Also kx − pk − kx − qk = ±2ρ. Die Punkte p, q heißen wiederum Brennpunkte und 21 (p + q) ist der Mittelpunkt. Sofern H nicht die leere Menge ist, gilt vermöge der Dreiecksungleichung 2ρ ≤ kp − qk =: 2σ. Gilt kp − qk = 2ρ bzw. ρ = 0, so entartet die Hyperbel zur Geraden pq durch p und q. Im Folgenden nehmen wir deshalb 0 < 2ρ < kp − qk (8) an. Wie bei der Ellipse können wir durch eine geeignete Bewegung unsere Hyperbel so verschieben, dass der Mittelpunkt im Ursprung zu liegen kommt (dass also q = −p gilt). Satz 3.3. Die Hyperbel H = {x ∈ R2 : kx − pk − kx + pk = ±2ρ} besteht genau aus den Punkten x ∈ R2 , für die (9) ρ2 kxk2 − hp, xi2 = ρ2 (ρ2 − kpk2 ) gilt. Insbesondere ist kxk ≥ ρ. Man beachte, dass die Gleichungen für die Ellipse (7) und für die Hyperbel (9) identisch sind, jedoch wegen der unterschiedlichen Bedingungen (6) und (8) zu unterschiedlichen geometrischen Objekten führt! Beweis. Die H definierende Gleichung quadriert schreibt sich als −kx − pkkx + pk = 2ρ2 − kpk2 − kxk2 ; die rechte Seite ist also nicht positiv. Weiteres Quadrieren liefert (kxk2 − 2hp, xi + kpk2 ) · (kxk2 + 2hp, xi + kpk2 ) = (2ρ2 − kpk2 − kxk2 )2 , wobei nun die Nebenbedingung also (entsprechend der ersten Formel) 2ρ2 ≤ kxk2 + kpk2 lautet. Durch Termumformung entsteht hieraus nun (9). Aus (9) folgt wiederum mit der Cauchy-Schwarzschen Ungleichung kxk2 (ρ2 − kpk2 ) ≤ ρ2 (ρ2 − kpk2 ); wegen 0 < ρ < kpk nach (8), ergibt sich nun ρ ≤ kxk und die Nebenbedingung folgt also wiederum aus der definierenden Gleichung. • Die Gerade pq durch die Brennpunkte und die orthogonale Gerade durch den Mittelpunkt nennen wir die Achsen der Hyperbel. Die Schnittpunkte derselben mit der Hyperbel heißen Scheitelpunkte die Strecken zum Mittelpunkt werden Halbachsen genannt. Natürlich kann die Hyperbel in einem kartesischen 74 Abbildung 6. Die Hyperbel x2 − 3y 2 = 1 mit ihren beiden Asymptoten √ x± 3y = 0. Wo liegen die Brennpunkte? Koordinatensystem so bewegt werden, dass die Achsen auf den Koordinatenachsen zu liegen kommen. In diesem Fall lässt sich die Hyperbel auch durch eine quadratische Gleichung beschreiben: Korollar 3.4. Nach einer geeigneten Bewegung kann eine Hyperbel H beschrieben werden als die Menge aller Punkte x = ( xx12 ), welche der Mittelpunktsgleichung 2 2 x2 x1 − = 1; α1 α2 p genügen; hierbei gilt für die Halbachsen α1 = ρ und α2 = σ 2 − ρ2 und die Brennpunkte sind ±( σ0 ). Man beachte, dass auf der linken Seite wiederum eine quadratische Form steht. Im Gegensatz zur Ellipse steht hier (der Definition entsprechend) die Differenz zweier Quadrate! Die Hyperbel ist ein unbeschränktes Objekt in dem Sinne, dass sie nicht Teilmenge einer beschränkten Menge ist (wie die Ellipse). Die Asymptoten der Hyperbel ergeben sich als die Geraden, die den Lösungen der verwandten Gleichgung 2 2 x2 x1 x1 x2 x2 x1 − = − + 0= α1 α2 α1 α2 α1 α2 75 15 10 5 -5 5 15 10 20 -5 -10 -15 Abbildung 7. Die Hyperbel X 2 − 2Y 2 = 1; die ganzzahligen Punkte sind fett eingezeichnet, wie etwa (x, y) = (3, 2). entsprechen, also A± : α2 x1 ± α1 x2 = 1. An diese schmiegen sich die Hyperbeläste nämlich mit wachsendem x1 bzw. x2 zusehends an. Beim Zeichnen von Hyperbeln ist es sinnvoll, zunächst die Asymptoten zu zeichnen und dann erst die sich anschmiegenden Hyperbeläste. Wir hatten beobachtet, dass die trigonometrischen Funktionen sin und cos die Ellipse parametrisieren. Deren hyperbolische Varianten, der Sinus hyperbolicus und der Kosinus hyperbolicus sinh φ = 12 (exp(φ) − exp(−φ)) und cosh φ = 21 (exp(φ) + exp(−φ)), führen via x1 = α1 cosh φ und x2 = α2 sinh φ auf die Gleichung: 2 2 x2 x1 − = (sinh φ)2 − (cosh φ)2 = 1. α1 α2 Die algebraische Gleichung links beschreibt eine Hyperbel gemäß Korollar 3.4. Mit der Pellschen Gleichung X 2 − dY 2 = 1 hatten wir tatsächlich Beispiele von Hyperbeln in der Elementaren Zahlentheorie kennen gelernt. Dort hatten wir bewiesen, dass auf solchen Hyperbeln stets unendlich viele Punkte mit ganzzahligen Koordinaten liegen sofern d ∈ N kein Quadrat ist, wie etwa (3, 2) auf der Hyperbel X 2 − 2Y 2 = 1 76 (siehe Abbildung 7). Durch Quadrieren ergeben sich weitere Lösungen: √ √ (3 + 2 2)2 = 17 + 12 2, und durch Potenzieren sogar alle Lösungen, u.a. auch die Lösung√x = 99 und 2 gewinnen y = 70, aus der man die rationale Approximation xy = 99 70 an kann. Diese wird beim Din A4-Format benutzt, um annähernd die gewünschte Inavrianz des Längenverhältnis beim Falten zu realisieren! Die Parabel P ist die Menge aller Punkte x ∈ R2 , die gleichen Abstand von einer Geraden G und einem Punkt p ∈ R2 \ G haben, d.h. P := {x ∈ R2 : d(x, G) = kx − pk} und 2ρ := d(p, G) > 0. Dabei heißt G die Leitlinie und p der Brennpunkt von P . Ist G als die Menge aller x gegeben, die he, xi = c mit einem Einheitsvektor e ∈ G (also der Länge kek = 1) und einer gewissen Konstanten c erfüllt, so lässt sich P mit der Hesseschen Normalform wie folgt darstellen: |he, xi − c| = kx − pk mit 2ρ = |he, pi − c|. Der Scheitelpunkt ist die Mitte des Lotes von p auf G; mit Hilfe einer geeigneten Translation liegt dieser im Nullpunkt und die Parabel P besitzt die Darstellung kxk2 − he, xi2 = 4ρhe, xi. Hieraus gewinnt man nun die Normalform x2 = αx21 für die Punkte x = ( xx12 ) ∈ P . Abbildung 8. Eine Parabel P mit Leitlinie G; Lichtstrahlen durch den Brennpunkt p werden an P orthogonal zur Leitlinie reflektiert. Ellipsen und Parabeln besitzen interessante optische Eigenschaften, welche u.a. den Begriff Brennpunkt erklären. Sei E eine Ellipse mit Brennpunkten p und q. Dann wird jeder von q ausgehende Lichtstrahl an E so reflektiert, dass er schließlich durch p geht (gemäß dem physikalischen Gesetz, dass Ausfalls- und 77 Einfallswinkel identisch sind). Bei der Parabel P gibt es eine erstaunliche Reflexionseigenschaft zu vermerken: Alle Lichtsrahlen, die orthogonal zur Leitlinie einfallen, werden an P so reflektiert, dass sie durch den Brennpunkt gehen. Dies wird insbesondere bei Parabolantennen ausgenutzt! Aufgaben Aufgabe 61. Wie könnte eine Fadenkonstruktion der Hyperbel bzw. der Parabel aussehen? Aufgabe 62. Beweisen Sie die Aussagen über die Eigenschaften von Lichtstrahlen aus einem Brennpunkt einer Ellipse bzw. aus einer Parabel. 2 Aufgabe 63. Gegeben sei die Parabel durch die Gleichung y = αx2 in R mit einem 0 6= α ∈ R. Berechnen Sie die Leitlinie und den Brennpunkt. 4. Die orthogonale Gruppe ”Geometrie ist die Invariantentheorie von Transformationen.” schrieb Felix Klein in seinem Erlanger Programm. Entsprechend interessieren wir uns im Folgenden für spezielle Abbildungen, welche die Lage eines geometrischen Objektes in der Ebene oder im Raum verändern, dabei jedoch das Objekt an sich unverändert lassen (wie etwa eine Translation um einen Vektor). Wir beginnen hierzu mit einem Beispiel in der Ebene: Die Abbildung x1 −x2 f : R2 ∋ x = 7→ f (x) := x⊥ = x2 x1 0 −1 ∈ R2×2 beschreiben: lässt sich durch die Matrix A := 1 0 x1 x1 x1 −x2 0 −1 x= 7→ A = = = f (x). 1 0 x2 x2 x2 x1 Insbesondere ist also f eine lineare Abbildung. Was geschieht mit Vektoren unter f ? Speziell für die Standardeinheitsvektoren e1 = ( 10 ) und e2 = ( 01 ) des R2 beobachten wir Ae1 = e2 und Ae2 = −e1 , bzw. f (Re1 ) = Re2 und f (Re2 ) = −Re1 = Re1 . Da eine lineare Abbildung bereits durch die Bilder einer Basis eindeutig festgelegt ist (siehe lineare Algebra), folgt, dass f eine Drehung um einen rechten Winkel im mathematischen Umlaufsinn (entgegen dem Uhrzeigersinn) mit Fixpunkt im Ursprung ist (siehe Abbildung 9). Insbesondere werden Ursprungsgeraden auf Ursprungsgeraden abgebildet. Übrigens folgt hieraus sofort, dass A keine reellen Eigenwerte besitzen kann, denn für einen reellen Eigenwert λ gäbe es nach Av = λv mit passenden Eigenvektoren v 6= 0 eine Gerade, nämlich Rv, die invariant unter Anwendung von A wäre, was aber für unsere Drehung unmöglich ist. 78 Abbildung 9. Eine Drehung f um 90 Grad um den Ursprung; jede Ursprungsgerade G wird auf eine um einen rechten Winkel gedrehte Ursprungsgerade f (G) abgebildet. Tatsächlich ist die Matrix A der Prototyp einer orthogonalen Matrix, welche also AAt = E (mit der passenden Einheitsmatrix E) erfüllt. Es gilt nämlich: 1 0 0 0 0 −1 t = E. = AA = 0 1 −1 0 1 0 Wir wiederholen Wissenswertes über solche Matrizen aus der linearen Algebra: Satz 3.5. Für A ∈ Rn×n sind äquivalent: (i) (ii) (iii) (iv) (v) (vi) A ist orthogonal, At ist orthogonal, A ist invertierbar und es gilt A−1 = At , die Spaltenvektoren von A haben Länge eins und sind orthogonal, es gilt kAvk = kvk für alle v ∈ Rn , es gilt hAv, Awi = hv, wi für alle v, w ∈ Rn . Ist dies der Fall, dann gilt det A = ±1 und reelle Eigenwerte von A sind ∈ {±1}. Wir wiederholen den Beweis: Ist A orthogonal, dann gilt AAt = E und mit dem Determinantenmultiplikationssatz folgt 1 = det E = det(AAt ) = det A · det At = (det A)2 und also det A = ±1. Also ist jede orthogonale Matrix A invertierbar und wegen AAt gilt A−1 = At , was (iii) impliziert. Ferner ergibt sich durch Transposition E = (AAt )t = (At )t At . Also ist At ebenso orthogonal und (ii) folgt somit aus (i) bzw. die umgekehrte Implikation aus dem bereits Gezeigten. Ebenso impliziert (ii) unmittelbar (iii). Die Äquivalenz von (i) und (iv) beweisen wir nur für den Spezialfall n = 2 und 79 K = R: Wir schreiben A = (w1 , w2 ) mit Spaltenvektoren wj ∈ R2 . Mit den Rechenregeln für Matrizen zeigt sich dann t t kw1 k2 hw1 , w2 i w1 w1 w1t w2 w1 t = . (w1 , w2 ) = E = AA = hw1 , w2 i kw2 k2 w2t w1 w2t w2 w2t Also folgt kwj k = 1 und hw1 , w2 i = 0. (Der allgemeine Fall geht analog.) Ferner impliziert (i) auch (v), denn kAvk2 = (Av)t (Av) = v t At Av = vv t = kvk2 . Aus (v) folgt (vi), denn eine kurze Rechnung zeigt kAvk2 + 2hAv, Awi + kAwk2 = kA(v + w)k2 = kv + wk2 = kvk2 + 2hv, wi + kwk2 . Nach Subtraktion von kAvk2 = kvk2 und kAwk2 = kwk2 ergibt sich die Aussage. Schließlich folgert man noch (i) aus (vi) mit Wahl der kanonischen Einheitsvektoren. Gilt nun eine dieser Eiegnschaften, ist also A orthogonal, so gilt nach (iv) für einen Eigenwert λ von A wegen Av = λv mit einem Eigenvektor v insbesondere kvk = kAvk = kλvk = |λ| · kvk; wegen v 6= 0 folgt hieraus |λ| = 1, was den Beweis abschließt. • Sei O(Rn ) die Menge aller orthogonalen n × n-Matrizen A mit Einträgen aus R; es gilt also At A = E. Nach dem gerade bewiesenen Satz ist O(Rn ) eine multiplikative Gruppe, die so genannte orthogonale Gruppe des Vektorraums Rn (vgl. Lineare Algebra). Tatsächlich wird mit dieser Notation die Aktion der orthogonalen Matrizen auf Vektoren des Rn gemäß Aussage (v) des Satzes betont: Matrizen induzieren lineare Abbildungen und – umgekehrt – existiert zu jeder linearen Abbildung f eine Matrix A, so dass f (v) = Av für v ∈ Rn . Tatsächlich gibt nun jede orthogonale Matrix A vermöge dieser Vorschrift Anlass zu einer linearen Abbildung f , welche die Eigenschaft (10) hf (v), f (w)i = hv, wi für alle v, w ∈ Rn besitzt. Entsprechend nennen wir einen Endomorphismus f : Rn → Rn orthogonal, falls die vorangegangene Bedingung (10) erfüllt ist. Es gilt folgender Satz 3.6. Für eine orthogonale Abbildung f : Rn → Rn gelten: (i) kf (v)k = kvk für alle v ∈ V ; (ii) ist λ ein Eigenwert von f (d.h. f (v) = λv für ein v 6= 0), so ist |λ| = 1; (iii) es ist genau dann v⊥w, wenn f (v)⊥f (w); (iv) f ist injektiv. Gemäß (iii) sind die Bilder orthogonaler Vektoren unter solchen Abbildungen f wieder orthogonal, welches die Namensgebung orthogonale Abbildung rechtfertigt. 80 Der Beweis ergibt sich leicht aus Satz 3.5: Beispielsweise entspricht (i) Aussage (v) aus Satz 3.5 (und die weiteren Details seien dem Leser/der Leserin überlassen). Alternativ kann man aber auch einfach die Definition orthogonaler Abbildungen benutzen: So gilt wegen (10) kf (v)k2 = hf (v), f (v)i = hv, vi = kvk2 für beliebiges v. Wurzelziehen liefert nun (i). Ähnliches gilt für die anderen Behauptungen. • Aufgaben n×n Aufgabe 64. Eine Matrix A ∈ R ist genau dann orthogonal, wenn mit jeder n Orthonormalbasis {v1 , . . . , vn } auch {Av1 , . . . , Avn } eine Orthonormalbasis des R ist. Beweisen Sie dies für den Fall n = 2. Aufgabe 65. Komplettiere den Beweis von Satz 3.6. 5. Drehungen in der Ebene und im Raum Wir kehren nun zunächst zum Spezialfall orthogonaler 2×2-Matrizen zurück und untersuchen die etwas allgemeinere Abbildung x 7→ D(α)x mit der Matrix cos α − sin α D(α) := , sin α cos α wobei α ∈ R ein fester Parameter sei. Tatsächlich ist D(α) eine orthogonale Matrix: cos α − sin α cos α sin α t D(α)D(α) = =E sin α cos α − sin α cos α mit Hilfe des Satzes von Pythagoras; ferner gilt det D(α) = +1 unabhängig von α. Wir definieren cos α e(α) = . sin α Dann gilt offensichtlich e(α)⊥e(α ± π2 ) und es besteht die Polarkoordinatendarstellung x = kxke(α) für Vektoren 0 6= x ∈ R2 mit einem Winkel α ∈ [0, 2π). Allgemeiner liefert das Additionstheorem 2.16 (mit −β statt β) he(α), e(β)i = cos(α − β). Nun sei noch cos α sin α S(α) := sin α − cos α für α ∈ R. Offensichtlich ist auch S(α) eine orthogonale Matrix, jedoch mit Determinante det Sα = −1. Wir berechnen wiederum mit Hilfe des Additionstheorems 2.16 D(α)e(β) = e(α + β) und D(α)D(β) = D(α + β) und D(α)S(β) = S(α + β) und S(α)e(β) = e(α − β), S(α)S(β) = D(α − β), S(α)D(β) = S(α − β). 81 Abbildung 10. Links: eine Drehung um den Winkel α durch Anwendung der Drehmatrix D(α) auf den Vektor e(β) auf dem Einheistkreis. Rechts: Eine Spiegelung an der y-Achse vermöge S(π). Diese Berechnungen führen zu Satz 3.7. Die Abbildung x 7→ D(α)x beschreibt eine Drehung in R2 um den Winkel α (im mathematischen Umlaufsinn‡) mit Fixpunkt im Nullpunkt; ferner beschreibt x 7→ S(α)x eine Spiegelung in R2 an der Geraden Re( α2 ). Ferner ist jede orthogonale 2 × 2-Matrix A von dieser Form und es gilt det A = +1 det A = −1 ⇐⇒ A = D(α), ⇐⇒ A = S(α) mit einem passendem α ∈ [0, 2π). Beweis. Es verbleibt lediglich noch zu zeigen, dass jede orthogonale Matrix A ∈ R2×2 entweder von der Form D(α) oder von der Form S(α) mit einem passenden Parameter α ist, je nachdem ob det A = +1 oder −1; die Determinantenbedingung ergibt sich hierbei sofort aus der Definition von D(α) und S(α). Nach Satz 3.5 (iv) besitzt A orthogonale Spaltenvektoren w1 , w2 der Länge eins. Mit w1 = ( xy ) folgt aus kw1 k = 1 zunächst x2 + y 2 = 1 und mit Hilfe der Stetigkeit der trigonometrischen Funktionen ergibt sich die Existenz eines reellen α, so dass die Darstellung w1 = e(α) besteht. Hieraus folgt ∓ sin α ⊥ π , w2 = w1 = e(α ± 2 ) = ± cos α was wegen A = (w1 , w2 ) auf A = S(α) oder A = D(α) führt und den Beweis abschließt. • Die orthogonalen A ∈ O(Rn ) mit det A = +1 bildet eine Untergruppe, die spezielle orthogonale Gruppe SO(Rn ). Speziell im euklidischen Raum R3 werden Drehungen um die z-Achse vermöge der Matrizen cos α − sin α 0 ∆(α) = sin α cos α 0 0 ‡ also entgegen dem Uhrzeigersinn 0 1 82 realisiert, wobei α ∈ R der Drehwinkel ist. Mit f : R3 → R3 , x 7→ f (x) = ∆(α)x berechnet sich nämlich leicht f (Re3 ) = Re3 mit dem Standardeinheitsvektor et3 = (0, 0, 1); d.h. die z-Achse wird tatsächlich von f fest gelassen und die Projektion auf die xy-Ebene ist nichts anderes als die Drehung D(α) in der Ebene. Ganz ähnlich lassen sich Drehungen um die x- bzw. y-Achse beschreiben. Tatsächlich gibt es für eine Drehung des R3 insgesamt drei Freiheitsgrade: zwei für die Drehachse und einen für den Drehwinkel. Für die spezielle orthogonale Gruppe SO(R3 ) aller Matrizen A ∈ O(R3 ) mit det A = 1 gilt Satz 3.8. Jede Drehung in R3 um eine Ursprungsgerade lässt sich darstellen als x 7→ Ax mit A ∈ SO(R3 ) (also det A = +1). Ist A ∈ SO(R3 ), so gibt es Winkel α, β, γ ∈ [0, 2π), so dass cos α − sin α 0 1 0 0 cos γ − sin γ 0 A = sin α cos α 0 0 cos β − sin β sin γ cos γ 0 . 0 0 1 0 sin β cos β 0 0 1 Ferner induziert jedes A ∈ SO(R3 ) eine Drehung in R3 . Für den Beweis sei jeweils auf das Buch von Fischer verwiesen. Beispiel (Frühjahr 2007, Thema 1, Aufgabe 3): Es seien ϕ1 und ϕ2 die Drehungen um die x-Achse bzw. um die z-Achse des R3 mit 0 0 1 1 1 1 ϕ1 : 0 7→ √ 1 und ϕ2 : 0 7→ √ 1 . 2 2 1 1 0 0 a) Zeigen Sie, dass die Hintereinanderausführung ϕ1 ◦ ϕ2 eine Drehung ist. b) Zeigen Sie, dass ϕ1 ◦ ϕ2 durch die Matrix 1 √ √1 − 0 2 2 1 1 √1 2 2 2 − 21 − 12 √12 gegeben wird. c) Bestimmen Sie die Drehachse von ϕ1 ◦ϕ2 sowie den Cosinus des Drehwinkels α. Die den Drehungen ϕj assoziierten Abbildungsmatrizen Aj ∈ R3×3 sind orthogonal mit det Aj = 1. Insbesondere ist die Abbildungsmatrix A = A1 · A2 der Komposition ϕ := ϕ1 ◦ ϕ2 wiederum orthogonal mit det A = 1 (nach dem Determinantenmultiplikationssatz (vgl. Lineare Algebra bzw. mit der Gruppeneigenschaft). Entsprechend ist ϕ eine Drehung, was für a) zu zeigen war. Für die Drehung ϕ1 um die x-Achse ist die zugehörige Abbildungsmatrix von der 83 Gestalt 1 0 0 A1 = 0 cos α1 − sin α1 0 sin α1 cos α1 mit einem Drehwinkel α1 . Wegen 0 0 0 0 1 √ 1 = ϕ1 0 = A1 0 = − sin α1 2 1 1 cos α1 1 ergibt sich 1 0 0 √1 A1 = 2 0 − √12 0 √1 2 √1 2 (und α1 = − π4 ). Da ϕ2 eine Drehung um die z-Achse ist, besitzt A2 die Gestalt cos α2 − sin α2 0 A2 = sin α2 cos α2 0 0 0 1 mit einem Drehwinkel α2 . Hier berechnet sich 1 √ − √12 √12 √1 A2 = 2 2 0 0 ganz analog 0 0 1 (und also α2 = π4 ), womit sich nun leicht die explizite Form von A aus b) errechnen lässt. Es verbleibt c): Die Drehachse GA besteht aus den Fixpunkten von ϕ; aus der entsprechenden Gleichung ϕ(v) = v bzw. Av = v folgt, dass die Drehachse also mit dem Eigenraum zum Eigenwert 1 von A übereinstimmt (vgl. lineare Algebra). Wir berechnen demzufolge diesen Eigenraum durch Lösen des homogenen linearen Gleichungssystems (A − 1 · E)v = 0 als −1√ GA = R · −1 + 2 . 1 Für den Drehwinkel α von ϕ gilt nun (vgl. nachstehenden Satz 3.9) 1 1 1 1 1 1 1 cos α = (Spur(A) − 1) = ( √ + + √ − 1) = √ − . 2 2 2 2 2 2 4 Eine weitere orthogonale 3 × 3-Matrix ist für α ∈ R gegeben durch −1 0 0 ∇(α) := 0 cos α − sin α . 0 sin α cos α Diese liegt offensichtlich nicht in SO(R3 ), sondern vielmehr induziert sie vermöge f : x 7→ f (x) = ∇(α)x eine Drehspiegelung, d.h. eine Drehung um die x-Achse um einen Winkel α und Spiegelung an der Ebene yz-Ebene. 84 Legen wir übrigens eine Orthonormalbasis {v1 , v2 , v3 } des R3 zugrunde, so beschreiben die obigen Matrizen cos α − sin α 0 −1 0 0 ∆(α) = sin α cos α 0 und ∇(α) := 0 cos α − sin α . 0 0 1 0 sin α cos α eine Drehung um den Winkel α mit Drehachse Rv1 bzw. eine Drehspiegelung um Rv1 und Spiegelung an der Ebene Rv2 + Rv3 . Durch einen geeigneten Basiswechsel lassen sich Drehungen und Spiegelungen also mit sehr einfachen Matrizen beschreiben! Tatsächlich wird eine Drehung um den Winkel α um eine Ursprungsgerade GA = Rn in R3 mit einem Einheitsvektor nt = (n1 , n2 , n3 ) durch x 7→ Ax beschreiben, wobei (11) A= cos α + n21 (1 − cos α) n2 n1 (1 − cos α) + n3 sin α n3 n1 (1 − cos α) − n2 sin α n1 n2 (1 − cos α) − n3 sin α cos α + n22 (1 − cos α) n3 n2 (1 − cos α) + n1 sin α n1 n3 (1 − cos α) + n2 sin α n2 n3 (1 − cos α) − n1 sin α cos α + n23 (1 − cos α) . Abschließend betrachten wir Drehungen in höherdimensionalen Räumen; dabei wird auch die Argumentation zu Ende des vorangegangenen Beispiels erläutert: Allgemeiner als in Ebenen und dem dreidimensionalem Raum gilt nämlich Satz 3.9. Jede Drehung in R3 um eine Ursprungsgerade GA lässt sich darstellen vermöge x 7→ Ax mit einer Matrix A ∈ SO(R3 ) (also det A = +1); dabei ergibt sich die Drehachse GA als der Eigenraum zum Eigenwert λ = 1 von A: GA = {v ∈ R3 : (A − E)v = 0} und der Drehwinkel α vermöge hw, Awi = kwk · kAwk cos α, wobei w⊥GA , bzw. alternativ aus der Spur der Drehmatrix 1 + 2 cos α. Beweis. (Wie bereits in dem obigen Beispiel angedeutet:) Die Drehachse GA einer Drehung x 7→ Ax besteht aus den Vektoren v, die unter A festgelassen werden, für die also Av = v = 1 · v gilt; jedes solche v 6= 0 ist also ein Eigenvektor zum Eigenwert λ = 1 von A. Diese Gerade GA ist also identisch dem Eigenraum von A zum Eigenwert 1: GA = {v ∈ R3 : (A − E)v = 0}. Die Aussage über den Drehwinkel ergibt sich leicht aus den Eigenschaften des Skalarproduktes und für den restlichen Beweis verweisen wir auf das Buch von Fischer. • Insbesondere besitzt nach dem vorangegangenen Beweis jede Matrix A ∈ SO(R3 ) also den Eigenwert 1 (aus rein geometrischen Gründen!). Man beachte aber, dass der zugehörige Eigenraum nicht notwendig eindimensional ist, also 85 keine eindeutige Drehachse existieren muss, denn beispielsweise ist auch die Eingeitsmatrix (welche den ganzen Raum invariant lässt) eine spezielle orthogonale Matrix: E ∈ SO(Rn ). Wir schließen mit einer sportlichen Anwendung :-) Korollar 3.10 (Satz vom Fußball). Beim Anstoß zur ersten und zur zweiten Halbzeit eines jeden Fussballspiels gibt es mindestens zwei Punkte auf der Oberfläche des Spielgerätes, die identisch im Raum liegen! Beweis. Die Lage des Balles zu Beginn der zweiten Halbzeit hat sich gegenüber seiner Lage zu Beginn der ersten durch eine Drehung des Raumes verändert, welche sich durch eine Matrix A ∈ SO(R3 ) beschreiben lässt. Nach Satz 3.9 besitzt A den Eigenwert 1, so dass die Drehung also eine Gerade Rv mit einem Eigenvektor v zum Eigenwert 1 fest lässt. Der Schnitt dieser Gerade mit der Oberfläche des Fußballes liefert die gesuchten Fixpunkte. • Aufgaben Aufgabe 66. Verifizieren Sie D(α)D(β) = D(α + β) und schlussfolgern Sie die Additionstheoreme aus Satz 2.16. Aufgabe 67 (Frühjahr 2000, Thema 1, Aufgabe 2). Es ist 1 −8 1 A= −8 1 9 −4 −4 3 −4 −4 7 3 und ϕ : R → R , x 7→ Ax, die zu A gehörige lineare Abbildung. Zeigen Sie, dass ϕ a) orthogonal ist, b) eine Spiegelung an einer Ebene ist. Aufgabe 68 (Frühjahr 2004, Thema 3, Aufgabe 5). Gegeben sei die Abbildung 3 3 ρ : R →R , x y+1 y → 7 x . z 1−z Zerlegen Sie ρ in eine Drehung δ und eine Translation τ so, dass ρ = τ ◦ δ. Bestimmen Sie die Achse der Drehung δ und den Kosinus des Drehwinkels von δ. n Aufgabe 69. Zeigen Sie: Die spezielle orthogonale Gruppe SO(R ) bildet einen RVektorraum der Dimension 21 n(n − 1). Aufgabe 70. Beweisen Sie Formel (11). Zeigen Sie für die entsprechende Drehung ebenso die Darstellung x 7→ nhn, xi + cos α(n × x) × n + sin α(n × x). 86 6. Euklidische Bewegungen Sei Rn zusammen mit einem Skalarprodukt h . , . i ein euklidischer Raum. Wir wollen zwei geometrische Objekte als nicht wesentlich verschieden ansehen, wenn sie durch eine Abbildung f : Rn → Rn ineinander überführt werden können (vgl. etwa die Bewegungen der Ellipse in Satz 3.1, so dass der Mittelpunkt im Nullpunkt zu liegen kommt). Entsprechend nennen wir eine solche Abbildung f eine (euklidische) Bewegung (bzw. Isometrie oder Kongruenzabbildung in einiger Literatur), falls kf (x) − f (y)k = kx − yk für alle x, y ∈ Rn , wenn also die Abstände zwischen irgendwelchen Punkten invariant bleibt. Ein erstes und auch offensichtliches Beispiel sind Translationen (bzw. affine Abbildungen), welche vermöge tb : Rn → Rn , x 7→ x + b mit einem beliebigen Punkt b ∈ Rn definiert sind. Weitere spezielle Bewegungen sind Drehungen und Spiegelungen (siehe §3.5). Der nachstehende Satz klassifiziert euklidische Bewegungen: Satz 3.11. Die Bewegungen der euklidischen Ebene Rn sind genau die Abbildungen f : Rn → Rn , x 7→ f (x) = Ax + b mit einer orthogonalen Matrix A ∈ O(Rn ) und b ∈ Rn . Bis auf Translationen sind Bewegungen also orthogonale und insbesondere lineare Abbildungen! Beweis. Zunächst ist jede Abbildung der obigen Gestalt sicherlich eine Bewegung, denn für f (x) = Ax + b mit A ∈ O(Rn ) rechnet sich mit Satz 3.5 leicht nach: kf (x) − f (y)k = kAx + b − (Ay + b)k = kA(x − y)k = kx − yk für beliebige x, y ∈ Rn . Ist nun g irgendeine Bewegung von Rn , so dürfen wir oBdA annehmen, dass g(0) = 0 gilt (nach Anwendung einer entsprechenden Translation). Dann folgt aus der Definition (12) kg(x)k = kxk und hg(x), g(y)i = hx, yi; erstes gewinnt man aus der Definition mit g(y) = g(0) = 0 = y und letzteres gewinnt man aus dem Satz des Pythagoras −h< g(x), g(y)i = hg(x), −g(y)i = = 2 2 1 2 (kg(x) − g(y)k − kg(x)k 2 2 2 1 2 (kx − yk − kxk − kyk ) = hx, −yi = −hx, yi − kg(y)k2 ) 87 und anschließender Multiplikation mit −1. Hieraus ergibt sich wiederum mit dem Satz des Pythagoras und mühsamer Rechnung kg(x + y) − g(x) − g(y)k2 = kg(x + y)k2 − 2hg(x + y), g(x)i − 2hg(x + y), g(y)i + +2hg(x), g(y)i + kg(x)k2 + kg(y)k2 = kx + yk2 − 2hx + y, xi − 2hx + y, yi + +2hx, yi + kxk2 + kyk2 = 0, was sofort g(x + y) = g(x) + g(y) impliziert. Analog folgt g(λx) = λg(x), womit g also ein Endomorphismus des Rn ist. Damit existiert eine Matrix A ∈ Rn×n mit g(x) = Ax und (12) liefert kAxk = kxk für alle x. Mit Satz 3.5 zeigt sich, dass A orthogonal ist. • Insbesondere ist wegen der Invertierbarkeit orthogonaler Matrizen eine Bewegung f also stets eine bijektive Abbildung! Ist nämlich f gegeben durch x 7→ f (x) = Ax + b mit A ∈ O(Rn ), also als Komposition (bzw. Hintereinanderschaltung) f = tb ◦ dA mit der Translation x 7→ tb (x) = x + b und einer orthogonalen Abbildung x 7→ dA (x) = Ax, so ergibt sich die Umkehrabbildung −1 −1 = At (bzw. als f −1 = d−1 A ◦t−b , wobei dA die entgegengesetze Drehung mit A Umkehrabbildung von dA ) ist, denn t −1 = d−1 f −1 (Ax + b) = (d−1 A (Ax) = A Ax = x. A ◦ t−b )(Ax + b) = f Bei linearen Abbildungen entspricht die Hintereinanderschaltung von Abbildung der Multiplikation der Abbildungsmatrizen. Deren Gruppenstruktur im Falle orthogonaler Matrizen legt folgenden Satz nahe: Satz 3.12. Die Menge Iso(Rn ) aller euklidischen Bewegungen des Rn bilden eine Gruppe bzgl. der Komposition ◦ von Abbildungen; sie heißt die Bewegungsbzw. Isometriegruppe des Rn . Die Menge aller Translationen bildet eine kommutative Untergruppe; die Menge der orthogonalen Abbildungen ist eine nicht-kommutative Unterguppe, nämlich die derjenigen Bewegungen, die den Ursprung als Fixpunkt besitzen. Beweis. Gegeben zwei euklidische Bewegungen f, g ∈ Iso(Rn ), dann ist die Abbildung g ◦ f wohldefiniert und es gilt k(g ◦ f )(x) − (g ◦ f )(y)k = kg(f (x)) − g(f (y))k = kf (x) − f (y)k = kx − yk für alle x, y ∈ Rn . Damit ist g ◦ f ∈ Iso(Rn ). Die Identität id : x 7→ x ist das neutrale Element bzgl. der Komposition: id ◦ f = f ◦ id = f für jedes f ∈ Iso(Rn ). Ferner ist jede Bewegung f eine bijektive Abbildung, wie wir bereits oben angemerkt hatten; die somit existente Umkehrabbildung f −1 ist das zu f inverse Element bzgl. der Komposition, denn (f ◦ f −1 )(x) = f (f −1 (x)) = x bzw. f ◦ f −1 = id 88 sowie analog f −1 ◦ f = id. Die restlichen Eigenschaften zum Nachweis, dass Iso(Rn ) eine Gruppe ist, seien dem Leser/der Leserin zur Übung überlassen. Ebenso zeigt sich, dass die Menge der Translationen bzw. die Menge der orthogonalen Abbildungen jeweils eine Untergruppe bilden; hier ist die zu tb inverse Abbildung gegeben durch t−b , welche offenbar wiederum eine Translation ist. Die Komposition beliebiger Bewegungen ist i.A. nicht kommutativ, wie etwa das Beispiel einer Drehung f um den Winkel π2 um den Ursprung und einer Spiegelung g an der Geraden Re1 zeigt: So ist (f ◦ g)(e1 ) = f (g(e1 ) = f (e1 ) = e2 6= −e2 g(e2 ) = g(f (e1 )) = g ◦ f (e1 ). Für die Untergruppe der Translationen hingegen gilt offensichtlich (tb ◦ tc )(x) = tb (x + c) = x + c + b = tc (x + b) = (tc ◦ tb )(x), womit sich die Kommutativität ergibt. • Abschließend untersuchen wir geometrische Abbildungseigenschaften von Bewegungen: Offensichtlich bleiben Distanzen zwischen Punkten und dsomit auch Längen unverändert. Wie sieht es mit Winkeln aus? Wir erinnern, dass der Winkel α = ∠(v, w) zwischen zwei Vektoren v, w ∈ Rn durch cos α = hv, wi kvk · kwk gegeben ist (siehe §2.5). Entsprechend nennen wir eine Abbildung f winkeltreu, wenn sie die Winkel zwischen Geraden invariant lässt, also stets hf (v), f (w)i hv, wi = kf (v)k · kf (w)k kvk · kwk (13) erfüllt ist. Eine unmittelbare Konsequenz dieser Definition ist Korollar 3.13. Eine Bewegung ist winkeltreu. Beweis folgt sofort mit f statt g aus (13) und (12) im Beweis von Satz 3.11. • Aufgaben n n Aufgabe 71. Zeigen Sie: f : R → R ist genau dann eine Bewegung, wenn f bijektiv ist, die längentreu und geradentreu ist, also Längen invariant lässt und Geraden auf Geraden abbildet. Aufgabe 72 (Frühjahr 2006, Thema 2, Aufgabe 4). Gegeben seien die Vektoren 1 0 0 3 e1 = 0 , e2 = 1 , e3 = 0 ∈ R . 0 0 1 3 3 Weiter sei f : R → R linear mit f (e1 ) = e2 , f (e2 ) = e3 , f (e3 ) = e1 . a) Zeigen Sie, dass f eine Drehung ist. Bestimmen Sie die Drehachse von f und den Cosinus des Drehwinkels α von f . 89 b) Bestimmen Sie das Bild von e1 unter der Spiegelung g1 an der Ebene 1 E1 = Re3 + R 1 . 1 c) Schreiben Sie f als Produkt von zwei Spiegelungen an Ebenen. n n Aufgabe 73. Zeigen Sie: Eine lineare Abbildung f : R → R ist genau dann winkeltreu, wenn λf orthogonal ist für ein λ > 0. n Aufgabe 74. Vervollständigen Sie den Beweis von Satz 3.12. Warum ist O(R ) keine kommutative Untergruppe? * Wiederholung: Eigenwerte und Diagonalisierbarkeit * Wir wiederholen aus der linearen Algebra: Gegeben eine quadratische Matrix A ∈ Rn×n , heißt λ ∈ R (bzw. C) ein Eigenwert von A, falls Av = λv für ein v ∈ Rn \ {0}; in diesem Fall nennt man v einen Eigenvektor zum Eigenwert λ. Man beachte hier, dass der Nullvektor v = 0 ausgeschlossen ist (weil die Gleichung Av = λv sonst mit beliebigem λ lösbar ist). Weil Av = λv ⇐⇒ (A − λE)v = 0 mit v 6= 0 äquivalent dazu ist, dass A−λE keinen vollen Rang besitzt, sind die Eigenwerte genau die Nullstellen des charalteristischen Polynoms χA (λ) = det(λE − A). Beispiel: Die Drehmatrizen D(α) besitzen das charakteristische Polynom χD(α) (λ) = λ2 − 2λ cos α + 1, und nur für ganzzahlige Vielfache von π existieren reelle Nullstellen, wenn also die Drehung die Identität oder eine Spiegelung ist (vgl. §3.5). Es gibt aber komplexe Eigenwerte: im Fall α = π2 etwa λ = ±i. Ist λ ein Eigenwert von A, so berechen sich die die Eigenvektoren zu λ durch das Lösen des homogenen linearen Gleichungssystems (A − λE)v = 0. Der Lösungsraum ist mindestens eindimensional (bereits aufgrund der Existenz eines v 6= 0) und heißt Eigenraum zum Eigenwert λ: EigA (λ) = {v ∈ Rn : (A − λE)v = 0}, und genau die vom Nullvektor verschiedenen Elemente des Eigenraumes sind Eigenvektoren zu λ. Es gibt also stets viele Eigenvektoren! Beispiel: Sei 10 5 10 1 A= 5 −14 2 . 15 10 2 −11 90 Dann rechnet man leicht nach, dass A eine orthogonale Matrix ist (also AAt = E gilt). Insbesondere bedeutet dies, dass die Spaltenvektoren von A eine Orthonormalbasis des R3 bilden! Das charakteristische Polynom berechnet sich (mühsam) als λ − 32 − 31 − 23 14 2 = (λ − 1)(λ + 1)2 . χA (λ) = det − 31 λ + 15 − 15 2 11 2 − 15 λ + 15 −3 Wir sagen: A besitzt die Eigenwerte λ1 = +1 und λ2 = −1 mit der algebraischen Vielfachheit 1 bzw. 2 je nachdem mit welcher Vielfachheit der Linearfaktor λ − λj im charakteristischen Polynom auftritt. Die Eigenräume zu diesen Eigenwerten berechnen sich mit Hilfe der Gauß-Elimination leicht als 5 0 1 EigA (+1) = R 1 und EigA (−1) = R −2 + R −1 , 2 1 −2 sind also eine Gerade und eine Ebene, also mit geometrischer Vielfachheit dim EigA (λj ) = 1 bzw. 2. Da diese geometrischen Vielfachheiten mit den algebraischen übereinstimmen, ist A diagonalisierbar. Hierbei heißt eine Matrix A ∈ Rn×n diagonalisierbar, wenn eine invertierbare Matrix S ∈ Rn×n existiert, so dass λ1 .. S −1 AS = ; . λn hierbei stehen in der Diagonalen rechts die Eigenwerte λj von A und sonst lauter Nullen. Aber nicht jede Matrix kann in diese Gestalt gebracht werden: Beispielsweise sind Drehmatrizen D(α) nur in den Spezialfällen α = mπ mit m ∈ Z diagonalisierbar (weil keine reellen Eigenwerte existieren). Tatsächlich ist A genau dann diagonalisierbar, wenn es eine Basis des Rn bestehend aus Eigenvektoren von A gibt; in diesem Fall bilden die Spalten der Transformationsmatrix S eine Orthonormalbasis! Beispiel (von oben): Wir finden eine Orthonormalbasis des R3 von Eigenvektoren 5 0 1 1 1 1 √ 1 , √ −2 , √ −1 30 5 6 2 1 −2 und bilden entsprechend die Matrix 5 √ S= 30 √1 30 √2 30 0 − √25 √1 5 √1 6 − √16 − √26 ; 91 Dann berechnet sich tatsächlich +1 0 0 S −1 AS = S t AS = 0 −1 0 . 0 0 −1 Hier durften wir S −1 durch S t ersetzen, weil S orthogonal ist. 7. Bewegungen in der Ebene Wir wollen die spezielle Situation in der Ebene etwas genauer betrachten: Zunächst fragen wir nach Punkten, die unter einer Bewegung invariant sind. Beispielsweise lässt die Punktpiegelung an p ∈ R2 , gegeben durch f : x 7→ 2p − x (bzw. in der Form f (x) = −Ex + 2p in der Form von Satz 3.11), genau den Punkt x = p fest. Andererseits fixiert eine Translation x 7→ x + b mit b 6= 0 keinen Punkt. Für eine genauere Analyse nennen wir eine Bewegung x 7→ Ax+b eigentlich, wenn A ∈ SO(Rn ) (also det A = 1) gilt; ansonsten, wenn also det A = −1 gilt, heißt die Bewegung uneigentlich. Eigentliche Bewegungen bewahren die natürliche Orientierung des Rn , uneigentliche drehen sie um. Satz 3.14. Sei f : R2 → R2 eine eigentliche Bewegung gegeben durch x 7→ f (x) = Ax + b. (i) Ist f keine Translation, so besitzt f genau einen Fixpunkt p, nämlich p = (E − A)−1 b; die Bewegung beschreibt in diesem Fall eine Drehung um den Punkt p. (ii) f ist durch die Bilder zweier verschiedener Punkte eindeutig festgelegt. Beweis. Nach Satz 3.11 und Satz 3.7 ist cos α − sin α A = D(α) = sin α cos α für ein α ∈ [0, 2π). Für Ap + b = p bzw. (E − A)p = b ist ein lineares Gleichungssystem zu lösen, welches genau dann lösbar ist, wenn 0 6= det(E − A) = 2(1 − cos α) bzw. α 6= 0 gilt. In diesem Fall ist E − A invertierbar und es gilt p = (E − A)−1 b. Dies beweist (i). Für den Nachweis von (ii) seien f und g zwei eigentliche Bewegungen mit f (p) = g(p) und f (q) = g(q) für p, q ∈ R2 mit p 6= q. Wir betrachten die eigentliche Bewegung h = g−1 ◦ f mit h(x) = Ax + b; hierbei benutzen wir Satz 3.11 und, dass jede Bewegung umkehrbar ist, also die Umkehrabbildung g−1 existiert. Dann gilt h(p) = g −1 (f (p)) = p und ebenso h(q) = q. Damit folgt p − q = h(p) − h(q) = Ap + b − (Aq + b) = A(p − q). 92 Weil A nach Annahme eine Drehung ist und p − q 6= 0, ergibt sich A = E. Somit ist b = 0 und also h = id bzw. f = g. • Für uneigentliche Bewegungen ist die Aussage des Korollars offensichtlich falsch, denn eine Spiegelung an einer Geraden lässt jeden Punkt dieser Gerade fest. Auch gelten nicht die analogen Aussagen im R3 , wie etwa die Drehmatrizen ∆(α) aus §3.5 zeigt, welche die komplette Gerade Re3 festlassen. Satz 3.15 (Dreispiegelungssatz). Die Bewegungsgruppe Iso(R2 ) aller euklidischen Bewegungen der Ebene R2 wird von Spiegelungen erzeugt; genauer gilt: jedes f ∈ Iso(R2 ) ist eine Komposition von höchstens drei Spiegelungen. Beweis. Eine Bewegung f ∈ Iso(R2 ) ist eindeutig durch f (0) und die orthogonalen Spaltenvektoren in ihrer Abbildungsmatrix A = (w1 , w2 ) bestimmt. Ist f gemäß Satz 3.11 gegeben durch f (x) = Ax+b mit orthogonalen Spaltenvektoren w1 , w2 , also A = (w1 , w2 ), dann gelten f (0) = b und f (ej ) = (w1 , w2 )ej + b = wj + b für j = 1, 2 (mit den üblichen Standardbasiseinheitsvektoren e1 , e2 des R2 ). Nun spiegeln wir zunächst die Ebene R2 an der Mittelsenkrechten von 0 und f (0). Dann wird das abgebildete Orthonormalsystem e1 , e2 durch eine oder zwei Abbildung 11. Bilder zum Dreispiegelungssatz. Spiegelungen an Geraden durch f (0) = b in das Orthogonalsystem f (e1 ) = w1 + b, f (e2 ) = w2 + b überführt (siehe Abbildung 11). • Nun klassifizieren wir die Bewegungen der Ebene: Satz 3.16. Jede Bewegungen der Ebene lässt sich einem der folgenden Typen zuordnen: • die Identität: id : x 7→ x, • Translation: tb : x 7→ x + b mit einem b ∈ R2 , 93 • Drehung: x 7→ D(α)x mit D(α) ∈ SO(R2 ), • Spiegelung an einer Geraden, • Gleitspiegelung, d.h. einer Kombinationen einer Spiegelung an einer Geraden G und einer Translation um einen Vektor b 6= 0 parallel zu G. Beweis. Die jeweiligen Typen sind disjunkt.§ Wir betrachten die Menge der Fixpunkte einer Bewegung f ; es gelten: • f lässt alle Punkte des R2 fest ⇐⇒ f = id, • die Menge der Fixpunkte von f ist eine Gerade ⇐⇒ f ist eine Spiegelung an einer Geraden, • f lässt die Geraden einer Schar von Parallelen fest, besitzt aber keine Fixpunkte ⇐⇒ f ist eine Translation, • f besitzt genau einen Fixpunkt ⇐⇒ f ist eine Drehung um den Ursprung, • f führt genau eine Gerade in sich über, besitzt aber keine Fixpunkte ⇐⇒ f ist eine Gleitspiegelung. Diese Äquivalenzen gelten, weil f als Bewegung Abstände, Parallelität und Orthogonalität erhält. Es verbleibt also zu zeigen, dass auch stets mindestens einer dieser Typen auftritt. Hierzu verwenden wir den vorangegangenen Satz: Ist f eine Komposition von null Spiegelungen, so ist f die Identität, ist f hingegen die Komposition von einer Spiegelung, so ist f eine Spiegelung an einer Geraden. Ist f Komposition von zwei Spiegelungen, so ist f vom Typ eine Translation oder Drehung. Es verbleibt der Fall, dass f eine Komposition von drei Spiegelungen ist; dabei dürfen wir annehmen, dass die Geraden, an denen gespiegelt wird, keinen gemeinsamen Punkt besitzen und nicht parallel sind Dann lässt sich f aber darstellen als f = d ◦ s, wobei s eine Spiegelung an einer Geraden G ist und d eine Drehung um einen Punkt p 6∈ G mit Drehwinkel 2α. Dann lassen sich zwei Geraden G1 , G2 konstruieren, für die s(G1 ) = G2 und d(G2 ) = G1 gelten, woraus f (G1 ) = G1 folgt: Diese Geraden schneiden sich in einem Punkt q ∈ G, dem Fußpunkt des Lotes von p auf G und schneiden beide die Gerade G unter dem Winkel α. Wegen f (q) 6= q fixiert f die Gerade G1 aber nicht punktweise; sie hat damit insebsondere keinen Fixpunkt auf G1 . Weil zudem f nicht orientierungserhaltend ist, kann f keine Translation sein, weshalb f also eine Gleitspiegelung ist. • Wir räumen noch mehr auf: Eigentliche Bewegungen der Ebene sind jede Parallelverschiebung, jede Drehung um einen Punkt der Ebene und die Punktspiegelung als Sonderfall einer Drehung um π. Uneigentliche Bewegungen sind § Hierbei gibt es jedoch Beispiele von Bewegungen, die verschiedenen Typen zugehören, wie etwa eine Drehung um 2π um den Ursprung gleich der Identität ist; jedoch sind die Typen trotzdem disjunkt. 94 demzufolge jede Achsenspiegelung und jede Gleitspiegelung bestehend aus eine Achsenspiegelung gefolgt von einer Translation längs dieser Achse. Identifizieren wir einmal mehr die euklidische Ebene R2 mit der komplexen Zahlenebene C (wie schon desöfteren), so können wir fragen, welche komplexen Funktionen f die euklidischen Bewegungen liefern? Translationen sind hier er√ klärt durch Abbildungen z 7→ tb (z) := z + b, wobei nun z = x + iy mit i = −1 für eine komplexe Veränderliche steht und b ∈ C eine beliebige komplexe Zahl sei. Drehungen um einen Winkel α um den Ursprung (die komplexe Zahl null) ergeben sich vermöge z 7→ dα (z) := z exp(iα) (wie man unschwer mit Hilfe der Polarkoordinaten sieht). Eine Rotation um einen Punkt w ∈ C mit einem Winkel α ergibt sich durch Hintereinanderschaltung tw ◦ dα ◦ t−w und die Translationen und Rotationen der euklidischen Ebene lassen sich also durch die komplexen Funktionen z 7→ f (z) := az + b mit a, b ∈ C, |a| = 1 charakterisieren. Aufgaben Aufgabe 75. Gegeben ein reguläres Sechseck, wieviele Bewegungen existieren, die dieses Sechseck auf sich abbilden? Aufgabe 76. Zeigen Sie, dass die Abbildung f : x 7→ x − 2 hx − a, w⊥ i ⊥ w hw, wi eine Geradenspiegelung an der Geraden G = a+Rw ist (wobei w⊥ ein zu w orthogonaler Vektor ist). Beschreiben Sie f ferner in der Form von Satz 3.11. Aufgabe 77. Beweisen Sie, dass eine eigentliche Bewegung f genau dann eine Drehung um den Punkt p ist, wenn 2 kf (x) − pk = kx − pk für alle x ∈ R gilt. Aufgabe 78. Für welche Bewegungen f der Ebene gilt f ◦ f = id? Aufgabe 79. Gegeben reelle Zahlen a, b, c, d mit ad−bc = 1 betrachten wir für komplexe Zahlen z die Abbildungen z 7→ M (z) := az + b cz + d für z 6= − d c (falls c 6= 0). Wie werden Kreise bzw. Geraden in C unter M abgebildet? Was können Sie über die Hintereinanderschaltung von zwei solchen Abbildungen sagen? Zeigen Sie, dass die Abbildung M umkehrbar ist und die Umkehrabbildung von ähnlicher Gestalt ist! 95 *** Weihnachtsvorlesung *** Wieso vertauschen Spiegel links und rechts, aber nicht oben und unten? Diese Frage stellt sich beim morgendlichen Blick in den Spiegel. Aber eigentlich stimmt diese Behauptung überhaupt nicht. Tatsächlich vertauscht ein Spiegel nämlich vorne und hinten! Um dies einzusehen, mache man sich klar, dass beim Betrachten des Spiegelbildes sich der Betrachter um die eigene vertikale Achse um den Winkel π (also 180 Grad) dreht und dabei nach wie vor mit derselben Hand zuwinkt (wenn denn gewunken wird; siehe Abbildung 12). Hingegen werden vorne und hinten vertauscht, denn unsere Nasenspitze und ihr Spiegelbild sind sich nun näher als unser Hinterkopf und sein Spiegelbild. Der Spiegel dreht Abbildung 12. Spieglein, Spieglein an der Wand – wer ist die Schönste im ganzen Land? tatsächlich genau die Richtung um, die senkrecht auf seiner Oberfläche steht! Ein an der Decke angebrachter Spiegel (wie in einigen Aufzügen) vertauscht oben und unten: Wir sehen dann den Kopf zuerst und darunter die Füße (als stünden wir auf dem Kopf). Das war zu einfach; hier ist unsere zweite Frage: Gibt es eine Fläche mit nur eine Seite? Ja! Das Möbius-Band wurde 1858 von Johann Benedict Listing und (unabhängig) August Ferdinand Möbius entdeckt. Man erhält ein Möbius-Band aus einem Streifen Papier, wenn man diesen einmal verdreht und an den Enden miteinander verklebt (siehe Abbildung 13). Das Möbius-Band ist einseitig in dem Sinne, dass jeder Punkt von jedem anderen Punkt erreichbar ist, ohne über eine Kante zu gehen (es gibt ja keine!). Aber es gibt noch mehr Erstaunliches zu berichten: Lässt man einen Spaziergänger auf einem Möbius-Band entlang laufen, so kehrt sie seitenverkehrt zurück. Damit ist das Möbius-Band nicht orientierbar! 96 Möbius-Bänder sind recht populär: Der Film Möbius von Gustavo Musquera R. aus dem Jahr 1996 behandelt u.a. eine verschwundene U-Bahn in Buenos Aires, die auf einem Möbius-Band ähnlichem Parkour verkehrt, und der Künstler Maurits Escher schuf viele Grafiken, die das Möbius-Band zum Thema haben (z.B. etwa Ameisen statt Spaziergänger auf einem Möbius-Band). Möbius-Bänder besitzen viele Anwendungen in der Technik: Abbildung 13. Bastelanleitung für ein Möbius-Band. • Bei Riemengetrieben wird es verwendet, um eine geringere Abnutzung zu gewährleisten; • als Tonträger im Tefifon, um eine längere Spieldauer zu erzielen; dabei ist ein Tefifon ein Wiedergabegerät für spezielle elektromechanische Tonträger, welches seit den 1960ern nicht mehr benutzt wird; • in der Elektrotechnik existiert mit dem Ringzähler mit einer Invertierung ein schaltungstechnisches Analogon; • als Knotenmoleküle mit besonderen Eigenschaften (gewissen Symmetrien). (Für Details und Weiteres sei auf wikipedia verwiesen.) Mathematisch lässt sich ein Möbius-Band im dreidimensionalen Raum zum Beispiel wie folgt parametrisieren: r 2 cos (1 + 2r cos r α 2 sin 2 , x = (1 + y = x = α 2 ) cos α, α 2 ) sin α, für −1 ≤ r ≤ 1 und 0 ≤ α < 2π. Und hier noch eine verwandte Frage: Was passiert, wenn man ein Möbius-Band der Länge nach mittig aufschneidet? Es gibt weitere einseitige Flächen. Eine Kleinsche Flasche entsteht ähnlich wie das Möbius-Band durch kreatives Verkleben von Streifen. Sie ist benannt 97 Abbildung 14. Ein Möbius-Band und eine Kleinsche Flasche. nach dem Mathematiker Felix Klein, der sie 1882 entdeckte (oder erdachte, je nachdem, was für einen Blick auf Mathematik wir haben). Eine Kleinsche Flasche ist eine so genannte nicht orientierbare Fläche. Dieser Begriff der NichtOrientierbarkeit bedeutet, dass wir keine Orientierung auf der Kleinschen Flasche einführen können: Wie auch beim Möbius-Band gibt es weder links noch rechts bzw. vorne oder hinten; jeglicher Versuch eine solche Orientierung einzuführen, muss scheitern. Gegenüber dem Möbius-Band fällt bei der Kleinschen Flasche zudem noch auf, dass sie keinen Rand besitzt. Folgender Limerick enthält eine Konstruktionsanleitung: A mathematician named Klein Thought the Moebius band was divine. Said he: ”If you glue The edges of two, You’ll get a weird bottle like mine.” Wir folgen dieser Konstruktion: Hierzu verkleben wir die gegenüberliegenden Seiten eines Quadrates gemäß Abbildung 15. Dabei entstehen Selbstdurchdringungen, allerdings lässt sich eine Kleinsche Flasche im vierdimensionalen Raum ohne solche Selbstdurchdringungen realisieren! Eine Kleinsche Flasche enthält Abbildung 15. Zwei Quadrate: Verkleben der gegenüberliegenden Seiten führt links zu einem Torus (oder doughnut oder Fahrradschlauch) und rechts zu einer Kleinschen Flasche. Man beachte hierbei die unterschiedliche Orientierung der Seiten! 98 ein Möbius-Band, wie man der Konstruktionsanleitung entnehmen kann – insofern ist also auch die Kleinsche Flasche nicht orientierbar! Ferner besitzt sie auch keinen Rand und also kein Innen und kein Außen; trotzdem kann man aus ihr trinken! Bloß hat sie dabei kein Volumen im mathematischen Sinne. Abbildung 16. Und noch eine Kleinsche Flasche. Eine mathematische Beschreibung der Kleinschen Flasche liefert die folgende Parametrisierung: x = 2(1 − sin α) cos α + (2 − cos α)(2 exp(−( α2 − π)2 ) − 1) cos β, y = (2 − cos α) sin β, z = 6 sin α + 12 (2 − cos α) exp(−(α − 3π 2 2 ) ) sin α cos β, für 0 ≤ α, β < 2π. Eine sehr ansprechende Animation von Ilkay Sakalli und Konstantin Weixelbaum zu den verschiedenen oben angeführten und auch weiteren erstaunlichen Eigenschaften findet sich auf der Webseite www.klein-bottlefilm.com. Und abschließend eine letzte und der festlichen Jahreszeit angemessene Frage, die Anlass geben soll, während der Feiertage nicht nur über euklidische Bewegungen nachzudenken: Wie kann der Himmel nachts dunkel sein, wo es doch so viele leuchtende Sterne im Universum gibt? 99 Gehen wir von einer gleichmäßigen Sternenverteilung im Universum aus – dies ist das so genannte kosmologische Prinzip – und all der Zeit nach dem Urknall, so muss das Licht der Sterne doch mittlerweile das gesamte Universum erleuchtet haben? Frohe Weihnachten und ein gutes neues Jahr! Nachtrag von Anfang Januar: Letzte Frage behandelt das Olberssche Paradoxon¶ aus der Astronom. Heinrich Wilhelm Olbers formulierte diese Fragestellung im Jahre 1826, sie war u.a. aber bereits Johannes Kepler bekannt, der da fragte ”Wenn es wahr ist, dass sie (die Sterne) auch Sonnen sind von ähnlicher Natur wie unsere Sonne, warum übertreffen sie dann nicht alle zusammen die Sonne an Helligkeit?”k Tatsächlich enthält das Universum zu wenig Energie, um den Nachthimmel zu erleuchten! Die durchschnittliche Entfernung der Sterne ist so groß, dass die Zeit, die das sich mit bekanntlich endlicher Geschwindigkeit ausbreitende Licht zur Sichtbarkeitsgrenze in unserem Universum zurück legen muss, größer ist als das Alter des Universums (wohl ca. 13 Millarden Jahre) bzw. die endliche Lebensdauer der Sterne (welche im beobachteten Mittel so ungefähr in der Größenordnung 1010 Jahre geschätzt wird). Ein zusätzlicher Effekt für die Dunkelheit des Nachthimmels ist, dass wir uns allem Anschein nach in einem sich expandierenden Universum befinden. Durch die kosmologische Rotverschiebung reduziert sich die Energie des sich im Raum bewegenden Lichts und die Hintergrundstrahlung des Urknalls entspricht der eines kalten schwarzen Körpers, welcher im Mikrowellenbereich liegt und für das menschliche Auge unsichtbar bleibt.∗∗ Unter Astronomen strittig scheint der Punkt, ob der dunkle Nachthimmel bereits als Indiz angesehen werden kann, dass wir in einem expandierenden Universum leben: Wäre es stationär oder schrumpfend, so müsste überall am Himmel ein Stern zu sehen sein (zumindest nach einer gewissen Zeit) und der Nachthimmel wäre taghell! Auch wäre der Himmel letztlich so heiß wie die Oberfläche eines Sterns. 8. Ähnlichkeitsabbildungen Nun wollen wir eine weitere Klasse von geometrisch interessanten Abbildungen studieren und einige Anwendungen in der Dreiecksgeometrie geben: Eine Abbildung f : Rn → Rn heißt Ähnlichkeitsabbildung, falls ein λ > 0 mit kf (x)k = λkxk für alle x ∈ Rn existiert. Satz 3.17. Für einen Endomorphismus f : Rn → Rn sind äquivalent: ¶ und ist trotz des Namens kein Paradoxon! Gern wird auch folgende Analogie bemüht: In einem dichten Wald sieht man in jeder Richtung schließlich einen Baumstamm. ∗∗ Mehr Informationen in ”Das Olbers’sche Paradoxon” von Rainer Göhring, welches ein leicht auffindbares Skript im Internet ist, sowie der Film von Harald Lesch in BRα: http://www.br.de/fernsehen/br-alpha/sendungen/alpha-centauri/alpha-centauriuniversum-2000 x102.html. k 100 (i) f ist eine Ähnlichkeitsabbildung, (ii) für x, y ∈ Rn folgt aus hx, yi = 0 stets hf (x), f (y)i = 0, (iii) f ist winkeltreu (siehe (13)). Die Menge der Ähnlichkeitsabildungen bildet mit der Komposition eine Gruppe, die so genannte Hauptgruppe. Wir hatten mit euklidschen Bewegungen bereits winkeltreue Abbildungen kennengelernt (Korollar 3.13); obiger Satz liefert aber eine Charakterisierung sämtlicher winkeltreuer Abbildungen! Beweis. Wir zeigen zunächst (i) ⇒ (iii): Nach Definition existiert ein λ > 0 mit kf (x)k = λkxk für alle x. Sei nun g(x) = λ1 f (x). Dann ist offensichtlich g(0) = 0 und 1 kg(x)k = kf (x)k = kxk, λ womit also g nach Satz 3.6 eine orthogonale Abbildung, also insbesondere eine euklidische Bewegung ist. Mit Korollar 3.13 folgt, dass f winkeltreu ist. Als Nächstes zeigen wir (iii) ⇒ (ii): Gemäßder Definition von Winkeltreue, also (13) in §3.5, gilt hf (x), f (y)i hx, yi = ; kf (x)k · kf (y)k kxk · kyk offensichtlich impliziert iii) die Behauptung ii). Es verbleibt (ii) ⇒ (i): Für x, y ∈ Rn mit kxk = kyk gilt hx + y, x − yi = hx, xi + hy, xi − hx, yi +hy, yi = kxk2 − kyk2 = 0. | {z } =0 Mit der Linearität von f folgt somit aus der Annahme (ii) 0 = hf (x + y), f (x − y)i = hf (x) + f (y), f (x) − f (y)i = kf (x)k2 − kf (y)k2 und also kf (x)k = kf (y)k. Speziell für z ∈ Rn mit kzk = 1 und λ := kf (z)k ergibt sich für allgemeines x ∈ Rn wegen kxk = kkzkxk, dass x und y := zkxk dieselbe Länge besitzen und nach dem bereits Gezeigten also kf (x)k = kf (y)k gilt. Durch Einsetzen folgt wiederum mittels der Linearität von f nun kf (x)k = kf (y)k = kf (zkxk)k = kf (z)k · kxk = λkxk, was zu zeigen war. Die Gruppeneigenschaft weist man ähnlich zum Beweis von Satz 3.12 nach (was wir der Leserin/dem Leser als Übungsaufgabe überlassen). • Solch eine Ähnlichkeitsabbildung f : Rn → Rn nennt man auch eine zentrische Streckung: Wie ein Filmprojektor im Kino vergrößert bzw. verkleinert f alle Strecken in einem bestimmten Verhältnis, dabei sind die Bildstrecken parallel zu den ursprünglichen Strecken. In diesem Zusammenhang sei noch an die aus der Schule wohlbekannten Strahlensätze erinnert: Werden zwei durch einen Punkt Z verlaufende Geraden von zwei Parallelen geschnitten, die Z nicht enthalten, so gelten (mit den Bezeichnungen aus Abbildung 17): 101 Abbildung 17. Ein Bild zum Strahlensatz. (1) Je zwei Abschnitte auf der einen Geraden verhalten sich so zueinander wie die diesen entsprechenden Abschnitte auf der anderen Geraden, etwa |ZA| |ZB| = . ′ |AA | |BB ′ | (2) Je zwei Abschnitte auf den Parallelen verhalten sich so zueinander wie die diesen entsprechenden jeweils vom Scheitel Z aus gemessenen Strecken auf den Geraden, etwa |ZA| |AB| = . ′ ′ |A B | |ZA′ | (3) Je zwei Abschnitte auf den Parallelen, welche einander entsprechen, stehen in gleichem Verhältnis zueinander (wobei hier drei Geraden vorrausgesetzt seien). Ferner besteht folgende Umkehrung des ersten Strahlensatzes: Ist (1) erfüllt, dann liegen parallele Geraden vor; hingegen kann man aus (2) i.A. nicht auf eine solche Parallelität schließen. Abbildung 18. Ein Dreieck wird unter einer zentrischen Streckung abgebildet; das Bilddreieck ist ähnlich zu dem Ausgangsdreieck. 102 Im Folgenden begnügen wir uns wieder mit der Ebene R2 . Zwei Figuren heißen ähnlich, wenn sie durch eine Ähnlichkeitsabbildung ineinander überführt werden können. Hierbei erweitern wir den Begriff der Ähnlichkeitsabbildung noch dahingehend, dass wir auch noch die Komposition mit Translationen zulassen; solche Abbildungen sind dann also von der Form x 7→ λAx + b mit λ > 0, A ∈ O(R2 ), b ∈ R2 ; Wir geben eine Anwendung dieses Begriffes auf Dreiecke (siehe Abbildung 18), welche womöglich bereits aus der Schule bekannt ist: Satz 3.18. Zwei Dreiecke sind ähnlich, wenn sie • in zwei Winkeln (und somit in allen drei Winkeln) übereinstimmen, • in allen Verhältnissen entsprechender Seiten übereinstimmen, • in einem Winkel und im Verhältnis der anliegenden Seiten übereinstimmen, • im Verhältnis zweier Seiten und im Gegenwinkel der größeren Seite übereinstimmen. Beweis. Angenommen, in den Dreiecken ABC und A′ B ′ C ′ sind zwei und somit also (nach dem Winkelsummensatz) sogar alle drei Winkel gleich. OBdA dürfen wir mit Hilfe einer passenden Translation und Drehung annehmen, dass die beiden Dreiecke so zur Deckung kommen, dass C und C ′ übereinstimmen, also Z = C = C ′ , und ferner die Richtungsvektoren von Z zu den Punkten den Punkten A und A′ bzw. zu B und B ′ wegen der gleichen Winkel jeweils identisch sind (vgl. Abbildung 17). Nun sind die Winkel β und β ′ bei B bzw. B ′ Stufenwinkel an AB und A′ B ′ mit ZB ′ und also identisch: β = β ′ . Damit sind AB und A′ B ′ parallel und es liegt eine zentrische Streckung vor, d.h. die Dreiecke sind ähnlich. Die weiteren Aussagen beweist man ähnlich. • Ganz ähnliche Sachverhalte gelten für kongruente Dreiecke, wenn also die entsprechenden Seitenlängen übereinstimmen; tatsächlich existiert in diesem Falle eine eindeutig bestimmte Bewegung (Kongruenzabbildung), welche die beiden Dreiecke ineinander überführt (siehe unten stehende Aufgabe). Kongruente geometrische Objekte liefern oft Symmetrien und diese erlauben mitunter interessante Konstruktionen. Wir schließen mit einer solchen Anwendung: Satz 3.19 (Satz von Fermat). Gegeben ein spitzwinkliges Dreieck ABC, werden diesem drei gleichseitige Dreiecke ABC ′ , ACB ′ und BCA′ aufgesetzt. Dann schneiden sich die drei Verbindungsstrecken AA′ , BB ′ und CC ′ in einem Punkt F unter dem Winkel π3 , die Längen sind gleich. Beweis. Sei F der Schnittpunkt der Strecken AA′ und BB ′ . Eine Drehung um den Winkel π3 um C bildet B ′ auf A und B auf A′ ab und die Strecke BB ′ geht in AA′ über; insbesondere sind die Längen gleich. Ferner gilt für die Winkel π ∠(B ′ F A) = ∠(A′ F B) = . 3 103 Abbildung 19. Ein Bild zum Satz von Fermat. Die drei gleichseitigen Dreiecke sind ähnlich. Der Fermatpunkt F liegt im Inneren des Dreiecks ABC. Desweiteren sind ∠(B ′ F A) = ∠(B ′ CA) Peripheriewinkel eines Kreises über AB ′ . Für denselben Kreis ist auch ∠(B ′ F C) Peripheriewinkel über B ′ C. Damit sind alle Winkel bei F gleich π3 ; insbesondere liegt F also auch auf CC ′ und der Beweis ist erbracht. • Aufgaben Aufgabe 80. Zeigen Sie, dass eine zentrische Streckung f im Raum (i) winkeltreu ist, (ii) eine beliebige geometrische Figur genau dann auf eine Figur mit dem m2 fachen Flächeninhalt abgebildet wird, wenn ein beliebiger Körper auf einen Körper mit dem |m|3 -fachen Volumen abgebildet wird. Welche dieser Eigenschaften gelten auch für Ähnlichkeitsabbildungen? Aufgabe 81. Beweisen Sie die Strahlensätze und auch die erwähnte Umkehrung! Aufgabe 82. Vier Punkte A, B, C, D heißen harmonisch, falls |AD| |AC| = . |CB| |DB| Zeigen Sie, dass eine zentrische Streckung von vier harmonischen Punkten wieder auf vier harmonische Punkte führt. Aufgabe 83. Zeigen Sie: Zwei Dreiecke ABC und A′ B ′ C ′ sind genau dann kongruent, wenn es eine Bewegung f gibt, so dass f (A) = A′ , f (B) = B ′ und f (C) = C ′ gilt. Aufgabe 84. Beweisen Sie den Satz von Napoléon, dass die Mittelpunkte der drei aufgesetzten Dreiecke im Satz von Fermat ein gleichseitiges Dreieck bilden. 9. Hauptachsentransformation Wir interessieren uns im Folgenden für die Situation abstandserhaltender Abbildungen der Ebene R2 im Kontext von Kurven, die durch quadratische Gleichungen definiert werden. 104 Beispiel: Gegeben sei die Gleichung 41x21 − 24x1 x2 + 34x22 = 25; welche Menge K steckt hinter all den Punkten x = ( xx12 ) ∈ R2 , die dieser Gleichung genügen? Mit Hilfe der Matrix 41 −12 A= −12 34 gilt x1 = 41x21 − 24x1 x2 + 34x22 . hx, Axi = (x1 , x2 )A x2 Durch Anwendung einer geeigneten Drehung versuchen wir nun die Kurve K = {x ∈ R2 : hx, Axi = 25} vereinfachen, so dass wir auf ihren Typ schließen können: Nach §3.5 werden Drehungen der Ebene um den Ursprung beschrieben durch spezielle orthogonale Matrizen cos α − sin α D := D(α) := sin α cos α mit einem reellen Drehwinkel α. Wir erinnern, dass D(α)−1 = D(−α) = D(α)t . Schreiben wir x = D(α)y mit y = ( yy12 ), so wird die Kurve K in den Koordinaten y = D(−α)x durch hy, Byi = 25 mit B = D t AD beschrieben (denn hy, Byi = hD t x, D t ADD −1 xi = hx, Axi). Nun gilt es also D = D(α) durch geschickte Wahl von α so zu wählen, dass B von möglich einfacher Gestalt ist – bestenfalls ist B eine Diagonalmatrix. Mit dem Ansatz λ1 0 B= 0 λ2 mit reellen λj ist hierzu nach einem Koeffizientenvergleich folgendes nichtlineares Gleichungssystem in u = cos α, v = sin α zu lösen: 41u2 − 24uv + 34v 2 = λ1 , −12u2 − 7uv + 12v 2 = 0, 342 + 24uv + 41v 2 = λ2 . Wir können dies auch als ein lineares Gleichungssystem in u2 , uv und v 2 auffassen: 41 −24 34 λ1 −12 −7 12 = 0 . 34 24 41 λ2 Die Lösung berechnet sich als 2 u 23λ1 + 2λ2 uv = 1 36(λ2 − λ1 ) . 1875 v2 2λ1 + 23λ2 Mit dem Determinantenmultiplikationssatz gilt nebenbei 105 Abbildung 20. Die beiden Ellipsen vor und nach der Hauptachsentransformation. Form und Abstände sind erhalten geblieben, bloß die Lage in der Ebene hat sich geändert. λ1 λ2 = det B = det(D t AD) = det A = 1250 sowie u2 + v 2 = 1 (auf Grund der Setzung u = cos α und v = sin α); bringt man diese Zusatzbedingungen noch mit der Lösungsmenge des obigen Gleichungssystems in Zusammenhang, so ergeben sich 12 25u2 = 9, 25v 2 = 16 und uv = , 25 was auf eine Lösung u = cos α = 53 , v = sin α = 45 des obigen Gleichungssystems führt. Einsetzen liefert die spezielle orthogonale Matrix 1 3 −4 D := D(α) := ; 5 4 3 daraus ergibt sich folglich t B = D AD = 25 0 0 50 . Damit ist K also die um den Winkel α (≈ 53◦ ; siehe Abbildung 20) gegen den Uhrzeigersinn gedrehte Ellipse 25y12 + 50y22 = 25 bzw. y12 + 2y22 = 1; hierbei haben wir die Normalform von Ellipsen gemäß Korollar 3.2 uns zu Nutzen gemacht. Die Achsen der gedrehten Ellipse liegen dabei auf den Koordinatenachsen, weshalb der Typ der Kurve so leicht ablesbar. Da eine Drehung 106 Abstände unverändert lässt, können wir sogar aus den Achsen 1 und gedrehten Ellipse die Längen der Achsen der Ausgangsellipse ablesen. √1 2 der Nun gilt es, dieses Beispiel zu verallgemeinern. Allerdings schweifen wir zunächst ab und erinnern an die alten Begriffe der Bilinearform (siehe §2.3) und der symmetrischen Matrix (§2.4). Bekanntlich kann jede symmetrische Bilinearform mit Hilfe einer symmetrischen Matrix beschrieben werden. Satz 3.20 (Hauptachsentransformation). Es sei A ∈ Rn×n eine symmetrische Matrix und h . , . i : Rn × Rn → Rn , (x, y) 7→ hx, yiA = xt Ay die zugehörige symmetrische Bilinearform. Dann besitzt A reelle Eigenwerte λ1 , . . . , λn und A ist diagonalisierbar, d.h. es gibt eine orthogonale Matrix D, so dass λ1 .. D −1 AD = D t AD = . λn eine Diagonalmatrix ist; deren Diagonaleinträge λj sind die Eigenwerte von A, die weiteren Einträge sind null. Ferner existiert eine Orthonormalbasis B = {w1 , . . . , wn } mit λi falls i = j, hwi , wj iA = 0 falls i 6= j. Symmetrische Matrizen besitzen also reelle Eigenwerte und können mittels geeigneten orthogonalen Matrizen diagonalisert werden! In die transformierende Matrix schreibt man hierzu orthonormierte Eigenvektoren. Beweis. Die Inverse D −1 einer orthogonalen Matrix D ist nach Satz 3.5 gleich der transponierten Matrix D t . Wir zeigen zunächst, dass D t AD = D −1 AD und A dasselbe charakteristische Polynom besitzen, womit dann D −1 AD und A insbesondere dieselben Eigenwerte besitzen. Hierzu berechnen wir mit dem Determinantenmultiplikationssatz und insbesondere det(D −1 ) = (det D)−1 , dass det(λE − D −1 AD) = det(λD −1 ED − D −1 AD) = det(D −1 (λE − A)D) = det(D −1 ) · det(λE − A) · det D = det(λE − A); also stimmen die jeweiligen charakteristischen Polynome überein. Die Eigenwerte symmetrischer Matrizen sind nach Satz 2.12 allesamt reell. Wir betrachten zunächst den Spezialfall n = 2: In diesem Fall existiert zu einer symmetrischen Matrix a b A= b c eine Drehmatrix D = D(α) = cos α − sin α sin α cos α , 107 so dass D t AD eine Diagonalmatrix ist. Um dies zu sehen, berechnen wir mit Hilfe der Additionstheoreme für trigonometrische Funktionen den Eintrag neben der Diagonalen als (c − a) sin α cos α + b((cos α)2 − (sin α)2 ) = c−a sin(2α) + b cos(2α) 2 (die beiden Nebendiagonaleinträge sind auf Grund der Symmetrie und der Orthogonalität identisch). Bei geeigneter Wahl von α verschwindet dieser Aus2b druck: Wenn nämlich a 6= c gilt, so ist α = 12 arctan a−c der gesuchte Winkel; π andernfalls mag man α = 4 verwenden (alternativ kann man mit dem Zwischenwertsatz argumentieren). Damit ist D eine Drehmatrix und nach Satz 3.5 sind die Spaltenvektoren von D orthonormiert und es ist eine einfache Rechenaufgabe zu zeigen, dass diese Spaltenvektoren auch Eigenvektoren zu den jeweiligen Eigenwerten von A sind. Für den allgemeinen Fall ist etwas mehr lineare Algebra notwendig: Nach Satz 2.18 lässt sich eine Orthonormalbasis bestehend aus Eigenvektoren zu den Eigenwerten von A bilden. Sind die Eigenwerte allesamt verschieden, ist dies aus Dimensionsgründen klar; bei mehrfachen Eigenwerten ist zunächst eine Orthonormalbasis aus Eigenvektoren des entsprechenden Eigenraums zu finden. Die Eigenräume zu den verschiedenen Eigenwerten bilden dabei eine direkte Summe, deren Gesamtheit Rn ist. Wir schreiben die so gefundenen n normierten Eigenvektoren in die Spalten einer Matrix D. Mit Hilfe dieses Basiswechsels ist dann D t AD eine Diagonalmatrix mit den Eigenwerten auf der Diagonalen; die Aussage über die von A induzierte Bilinearform folgt auf Grund der Orthonormalität der Spaltenvektoren von D. • Mit dem Satz über die Hauptachsentransformation lässt sich eine beliebige quadratische Form x 7→ hx, xiA = xt Ax also stets wie folgt umformen xt Ax = n X λj yj2 j=1 mit x = Dy; die rechte Seite heißt metrische Normalform und ist frei von gemischten Termen! Dieser Darstellung ist positive Definitheit der von A induzierten symmetrischen Bilinearform unmittelbar abzulesen: (x, y) 7→ xt Ay ist genau dann positiv definit (also xt Ax > 0 für x 6= 0), wenn alle Eigenwerte von A positiv sind. Diese Aussage von Satz 2.13 folgt somit direkt aus der Hauptachsentransformation; die weiteren Aussagen ergeben sich ganz ähnlich. In den Spalten von D stehen orthogonale Eigenvektoren von A; diese werden auch Hauptachsen der quadratischen Form genannt. Die Transformation x = Dy bzw. y = D 1 x ist die Basistransformation von der Standardbasis zur Basis bestehend aus den Hauptachsen, weshalb die Überführung in die metrische Normalform auch Hauptachsentransformation genannt wird. Beispiel: Gegeben die quadratische Form (x1 , x2 , x3 ) 7→ q(x1 , x2 , x3 ) = 6x21 + 5x22 + 7x23 − 4x1 x2 + 4x1 x3 , 108 so gilt 6 −2 2 x1 q(x1 , x2 , x3 ) = (x1 , x2 , x3 ) −2 5 0 x2 . 2 0 7 x3 Die metrische Normalform können wir bereits aus den Eigenwerten λ1 = 3, λ2 = 6 und λ3 = 9 der obigen Matrix herauslesen als y = (y1 , y2 , y3 ) 7→ 3y12 + 6y22 + 9y32 ; diese quadratische Form ist also positiv definit. Zur Berechnung der Hauptachsen bestimmen wir Eigenvektoren zu den genannten Eigenwerten, etwa 2 −1 2 w1 = 2 , w2 = 2 , w3 = −1 . −1 2 2 Da die zugehörige Matrix symmetrisch ist, sind diese Vektoren bereits orthogonal. Nach deren Normierung schreiben wir diese in die Spalten der Matrix D 2 −1 2 1 D= 2 2 −1 . 3 −1 2 2 Dann ergibt sich die Basis der Hauptachsen durch x = Dy bzw. y = D −1 x. Geometrisch beschreibt die Hauptachsentransformation einen geeigneten Koordinatenwechsel. Um dies noch einmal zu betonen, illustrieren wir den obigen Beweis mit einem Spezialfall gewisser 2 × 2-Matrizen: Ist A gegeben durch a b mit a, b ∈ R, A= b a dann berechnet sich das charakteristische Polynom als λ − a −b det(λE − A) = det = λ2 − 2aλ + a2 − b2 , −b λ − a woraus sich die Eigenwerte λ1 = a + b und λ2 = a − b ergeben. Zugehörige Eigenvektoren liest man aus den entsprechenden homogenen linearen Gleichungssytemen ab: x + y = 0 bzw. x − y = 0; nach normieren finden wir etwa 1 1 1 −1 and w2 = √ . w1 = √ 1 2 1 2 Wir bilden aus diesen die Transformationsmatrix 1 1 −1 D=√ 2 1 1 und berechnen (zur Probe) D −1 1 1 1 1 a b 1 −1 √ √ AD = b a 2 −1 1 2 1 1 a+b 0 = =: B. 0 a−b 109 Wir finden die neuen Koordinaten y1 , y2 vermöge x = Dy bzw. y = D −1 x, also 1 y1 1 1 x1 y= =√ . y2 x2 2 −1 1 Die zugehörigen symmetrischen Bilinearformen sind xt Ax = ax21 + 2bx1 x2 + ax22 und y t By = (a + b)y12 + (a − b)y22 ; der gemischte Term ist durch die Koordinatentransformation also beseitigt worden! Eine wichtige Anwendung der Hauptachsentransformation liegt in der Diskussion der durch eine quadratische Gleichung definierten Kurve. In dem obigen zweidimensionalen Beispiel sei etwa der Typ der durch xt Ax = 1 festgelegten Kurve zu bestimmen: Q = {x = (x1 , x2 ) ∈ R2 : ax21 + 2bx1 x2 + ax22 = 1}. Nehmen wir an, dass beide Eigenwerte positiv sind, so wird Q in den Koordinaten y1 , y2 durch die Gleichung 2 2 y2 1 y1 + =1 mit αj = √ α1 α2 a±b beschrieben; hier liegt also wiederum eine Ellipse mit Hauptachsen αj vor. Ist hingegen a + b > 0 > a − b, so ergibt sich eine Hyperbel: 2 2 y2 1 y1 − =1 mit αj = p . α1 α2 |a ± b| Auch hier sind die αj die Hauptachsen von Q. Hierbei haben wir die Sätze über die Normalformen dieser Kurven aus §3.2 und §3.3 benutzt! Im Fall der Hyperbel können wir mittels der weiteren Koordinatentransformation y2 y1 y2 y1 + und z2 = − z1 = α1 α2 α1 α2 alternativ auch durch z1 z2 = 1 darstellen, denn 2 2 y2 y1 y1 y1 y2 y2 + − − . z1 z2 = = α1 α2 α1 α2 α1 α2 Die Transformationsmatrix D ist eine orthogonale Matrix; sie beschreibt eine Drehung um den Winkel π4 = 45◦ (denn cos π4 = sin π4 = √12 ). In beiden Fällen ist die durch ax21 + 2bx1 x2 + ax22 = 1 definierte Kurve Q also durch eine Drehung π 4 auf Hauptachsenform gebracht worden. Aufgaben Aufgabe 85. Gegeben B ∈ R n×n . Zeigen Sie, dass A = 21 (B + B t ) symmetrisch ist. Aufgabe 86. Für welche Parameter λ ∈ R ist die quadratische Form (x, y) 7→ (2 − λ)x2 + 3xy + (λ − 1)y 2 negativ definit? 110 Aufgabe 87. Zeigen Sie, dass die Gleichung √ 7x2 + 6 3xy + 13y 2 = 1 eine Ellipse definiert; berechnen Sie deren Hauptachsen! Um welchen Winkel muss für die Hauptachsenform in welcher Richtung gerdeht werden? Aufgabe 88. Zeigen Sie, dass für reelle x, y, z stets die Ungleichung q(x, y, z) := 5x2 + 6y 2 + 7z 2 − 4xy + 4yz > 0 besteht. Hierzu zeige man zunächst, dass die zu q assoziierte symmetrische Matrix drei positive Eigenwerte besitzt! 10. Allgemeine Kurven zweiter Ordnung Wir wollen nun systematisch die Kurven untersuchen, die durch quadratische Gleichungen definiert werden. Die allgemeine Gleichung zweiten Grades in zwei Veränderlichen x, y ist von der Gestalt (14) ax21 + 2bx1 x2 + cx22 + 2dx1 + 2ex2 + f = 0 mit a, b, c, . . . , f ∈ R; hier haben wir einen Faktor 2 bei einigen Termen auf der linken Seite eingebaut, um diese wie folgt darstellen zu können: 2d a b x1 + (x1 , x2 ) +f (x1 , x2 ) 2e x2 b c bzw. xt Ax + v t x + f mit A= a b b c und v=2 d e . Dann heißt die Menge Q aller x = (x1 , x2 ) ∈ R2 , welche der Gleichung (14) genügt, eine Quadrik Q in R2 (auch quadratische Hyperfläche), also Q = {x ∈ R2 : xt Ax + xt v + f = 0}. Solch eine Quadrik beschreibt eine ebene Kurve zweiter Ordnung. Welche Kurven können sich hinter einer solchen Quadrik Q verbergen? Den Spezialfall, wenn keine gemischten Terme vorhanden sind, hatten wir bereits kennengelernt. Der allgemeine Fall lässt sich durch quadratische Ergänzung auf diesen zurückführen! Beispiel 1 (Staatsexamen Frühjahr 2006, Thema 3, Aufgabe 4): Zeigen Sie, dass die Gleichungen x2 + 2xy + 2x + 2y = 0 eine Hyperbel im R2 definiert und bestimmen Sie deren Asymptoten. Zur Lösung bestimmen wir die affine Normalform: Dazu sei Q die durch x2 + 2xy + 2x + 2y = 0 111 definierte Quadrik. Hierzu finden wir mittels quadratischer Ergänzung die äquivalente Gleichung (x + y + 1)2 − y 2 = 1 und mit u = x + y + 1 und v = y ergibt sich die affine Normalform u2 − v 2 = 1. Nach Korollar 3.4 ist Q also eine Hyperbel mit den Asymptoten u = ±v; letztere Abbildung 21. Die beiden um 45 Grad gedrehten Hyperbeln aus Beispiel 1. lassen sich auch beschreiben durch x + y + 1 = u = +v = y bzw. x = −1 und x + y + 1 = u = −v = −y bzw. x + 2y = −1 (siehe Abbildung 21). Beispiel 2: Gegeben sei die Quadrik Q ⊂ R2 durch die folgende Gleichung x21 + x22 + 6x1 x2 − 2x1 + 6 = 0. Wir binden die zusätzlichen linearen Terme sowie den konstanten Term in einer zusätzlichen Dimension ein; hierzu sei 6 −1 0 A′ = −1 1 3 . 0 3 1 112 Dann gilt 6 −1 0 1 (1, x1 , x2 ) −1 1 3 x1 = x21 + x22 + 6x1 x2 − 2x1 + 6 =: q(x1 , x2 ). x2 0 3 1 Zunächst diagonalisieren wir die Untermatrix 1 3 A= 3 1 die durch Streichen der ersten Zeile und Spalte von A′ entsteht; diese entspricht der quadratischen Form x21 + x22 + 6x1 x2 (also genau den quadratischen Termen in q). Das Charakteristische Polynom ist det(λE − A) = (λ + 2)(λ − 4), die Eigenwerte sind also λ1,2 = −2, 4 und die jeweiligen Eigenräume berechnen sich zu 1 −1 R. R und EigA (4) = EigA (−2) = 1 1 Normieren der Richtungsvektoren liefert die Transformationsmatrix 1 1 −1 D=√ 2 1 1 und A wird diagonalisiert durch 1 1 1 1 3 1 −1 4 0 t D AD = = 3 1 1 1 0 −2 2 −1 1 (man vergleiche dies mit einem allgemeineren Beispiel aus dem vorigen Paragraphen). Wir ergänzen nun D durch Hinzufügen einer ersten Zeile und Spalte zu 1 0 0 1 1 D ′ = 0 √2 − √2 √1 0 √12 2 (gewissermaßen rückwärts zu dem Schritt von A′ zu A). Dann berechnet sich 6 − √1 ′ t ′ ′ (D ) A D = 2 √1 2 − √12 4 0 √1 2 0 . −2 Wir notieren das Ergebnis ebenso als c β1 β2 (D ′ )t A′ D ′ = β1 λ1 0 β2 0 λ2 113 mit also c = 6, β1 = − √12 und β2 = √12 . Hieraus entsteht durch Multiplikation von (1, x1 , x2 ) von links und rechts (als Spaltenvektor) c β1 β2 1 (1, x1 , x2 ) β1 λ1 0 x1 β2 0 λ2 = c + 2β1 x1 + 2β2 x2 + x2 λ1 x21 + λ2 x22 Damit haben wir also den gemischten Term beseitigt. Die linearen Terme lassen sich hier durch quadratische Ergänzung eliminieren: 2 ! β1 β1 2 2 − . 2β1 x1 + λ1 x1 = λ1 x1 + λ1 λ1 Ersetzen wir hierin x1 durch x1 − β1 /λ1 , so beseitigt dies die unerwünschten linearen Terme mit x1 (und analog verfährt man mit dem linearen Term mit x2 ). Multiplikation der Matrix 1 0 0 U ′ = −β1 /λ1 1 0 −β2 /λ2 0 1 von links mit dem Spaltenvektor 1 1 U ′ x1 = −β1 /λ1 x2 −β2 /λ2 (1, x1 , x2 )t liefert nun 0 0 1 1 1 0 x1 = x1 − β1 /λ1 . 0 1 x2 x2 − β2 /λ2 Wir haben also die Koordinaten x1 , x2 transformiert zu y1 = x1 − β1 /λ1 , y2 = x2 − β2 /λ2 , was der gewünschten quadratischen Ergänzung entspricht. In unserem Beispiel ergibt sich so 1 0 0 √ U ′ = √82 1 0 2 0 1 4 sowie die Hauptachsenform 49 8 (D ′ U ′ )t A′ (D ′ U ′ ) = 0 0 Entsprechend ergibt sich die Gleichung 0 0 4 0 ; 0 −2 49 + 4y12 − 2y22 = 0. 8 Also ist Q ähnlich zu der hauptachsentransformierten Hyperbel mit Normalform 2 y1 y2 2 √ − =1 7/4 7/ 24 (siehe Abbildung 22). Gewissermaßen haben wir statt der Quadrik Q die höher- 114 Abbildung 22. Zwei Hyperbeln: vor und nach der Hauptachsentransformation – welche ist welche? dimensionale Quadrik Q′ im Raum R3 gegeben durch die Gleichung q ′ (x0 , x1 , x2 ) = 0 mit q(x0 , x1 , x2 ) := x21 + x22 + 6x1 x2 − 2x0 x1 + 6x20 = 0 behandelt. Wir beobachten q(x1 , x2 ) = q ′ (1, x1 , x2 ); Setzen von x0 = 1 entspricht einer Projektion von R3 in die Ebene und also entsteht Q = {(x1 , x2 ) ∈ R2 : q(x1 , x2 ) = 0} durch Schneiden von Q′ = {(x0 , x1 , x2 ) ∈ R3 : q ′ (x0 , x1 , x2 ) = 0} mit der Ebene x0 = 1 in R3 . Nun wollen wir das obige Verfahren systematisieren: Hierzu sei eine quadratische Gleichung in n Variablen gegeben durch (15) n X i=1 aii x2i + n X 1≤i<j≤n 2aij xi xj + 2 n X bk xk + c = 0 k=1 mit aij , bk , c ∈ R; dann heißt die Menge Q aller x = (x1 , . . . , xn )t ∈ Rn , welche dieser Gleichung genügen eine Quadrik in Rn . Unser Anliegen ist es, durch Hauptachsentransformation (Satz 3.20) den Typ dieser Quadrik zu bestimmen, bzw. die Frage zu klären, welche geometrischen Objekte auftreten können. 1. Quadratische Terme: Hierzu bilden wir die Matrix A = (aij ) bestehend aus den Koeffizienten aij der Q definierenden quadratischen Gleichung bei dem quadratischen Term xi xj als Eintrag in der i-ten Zeile und j-ten Spalte; im Falle i 6= j sei dabei aji = aij . Mittels Hauptachsentransformation ist die symmetrische Matrix A ∈ Rn×n zu diagonalisieren: Hierzu berechnet man zunächst deren Eigenwerte 115 λ1 , . . . , λn und eine Orthonormalbasis von zugehörigen Eigenvektoren w1 , . . . , wn ; diese als Spaltenvektoren in eine Matrix D = (w1 , . . . , wn ) geschrieben, liefert die Diagonalmatrix λ1 0 .. D −1 AD = D t AD = =: B . 0 λn (mit lauter Nullen außerhalb der Diagonalen). 2. Lineare Terme: Zum Beseitigen der linearen Terme sei A′ die symmetrische Matrix, für die n n n X X X 1 t ′ 2 bk xk + c = (1, x )A 2aij xi xj + 2 , aii xi + x i=1 1≤i<j≤n (1, xt ) k=1 n+1 wobei ∈R der um die Komponente 1 erweitere Zeilenvektor 1 x sei und ( x ) sein transponierter Spaltenvektor; es gilt also c bt ′ A = ∈ R(n+1)×(n+1) b A mit bt = (b1 , . . . , bn ) als Zeilen- bzw. Spaltenvektor. Wir bilden ferner 1 0 ′ D = 0 D mit 0 = (0, . . . , 0) ∈ Rn als dem passenden Zeilen- bzw. Spaltennullvektor sowie D aus Schritt 1. Schließlich seien Zahlen β1 , . . . , βn definiert durch c β1 . . . . . . βn β1 λ1 0 . . . 0 .. .. ′ t ′ ′ . (D ) A D = β2 0 . . .. .. . . . . .. . . βn 0 . . . . . . λn Wir bilden ferner 1 −β1 /λ1 .. . U′ = −βn−1 /λn−1 −βn /λn 0 ... ... 1 0 ... .. .. . . 1 0 ... 0 0 0 .. . , 0 1 wobei der j + 1-te Eintrag in der ersten Spalte gleich −βj /λj sei, falls λj 6= 0, und andernfalls gleich null sei. Dann ergibt sich γ λ1 ′ t ′ t ′ ′ ′ (U ) (D ) A (D U ) = =: B ′ , .. . λn 116 wobei γ =c− n X βj2 λj j=1 λj 6=0 und B ′ eine Diagonalmatrix ist mit den Eigenwerten λj von A auf der Diagonalen, falls alle diese Eigenwerte ungleich null sind; ist hingegen λj = 0, so stehen in den j + 1-ten Einträgen der ersten Zeile bzw. der ersten Spalte nicht notwendig verschwindende reelle Zahlen vj und Nullen sonst. 3. Metrische Normalform: Die durch (15) definierte Quadrik Q = {x = (x1 , . . . xn ) ∈ Rn : xt Ax + 2bt x + c = 0} ist kongruent zu einer Quadrik Q′ = {y = (y1 , . . . yn ) ∈ Rn : y t By + 2v t y + γ = 0} mit der Diagonalmatrix B (mit den Eigenwerten von A in der Diagonalen) und einem Vektor v mit Einträgen vj für Λj und Nullen sonst entsprechend Schritt 2. Damit besitzt Q die metrische Normalform n X j=1 λj yj2 + 2 n X vj y j + γ = 0 j=1 λj 6=0 mit den Eigenwerten λj von A und γ aus Schritt 2. Hierbei heißen zwei geometrische Objekte kongruent, wenn es eine euklidische Bewegung gibt, welche diese ineinander überführt; dabei bleiben also Form und Größe erhalten. (Und Q′ mag als die im Raum bewegte Quadrik Q angesehen werden!) Einige Bemerkungen: Die spezielle Form für das Produkt (D ′ )t A′ D ′ ergibt sich aus der Hauptachsentransformation D t AD = B als 1 0 c b 1 0 ′ t ′ ′ (D ) A D = 0 Dt b A 0 D 1 0 c c βt c b bt D = = = Dtb Dt A 0 D D t b D t AD β B mit β t = (β1 , . . . βn ) = bt D (bzw. β = D t b).†† Die zusätzliche Transformation mit der Matrix U ′ steht für die quadratische Ergänzung, welche die linearen Terme beseitigt sofern der zugehörige Eigenwert von null verschieden ist. Geometrisch ist diese quadratische Ergänzung eine Translation. Dabei gilt mit den Rechenregeln für Transposition: (U ′ )t (D ′ )t A′ (D ′ U ′ ) = (D ′ U ′ )t A′ (D ′ U ′ ). †† Hierbei sei darauf hingewiesen, dass die mit dicken Linien unterteilten Matrizen asl Blockmatrizen zu lesen sind! 117 Wegen 1 x ′ =DU ′ 1 y gilt y = (DU )−1 x, so dass also x 7→ (DU )−1 x die euklidische (und damit abstandserhaltende!) Bewegung ist, welche Q in Q′ überführt. Mit diesem Kochrezept wollen wir ein weiteres Beispiel rechnen: Die Quadrik Q sei gegeben durch die Gleichung 4x21 + 2x22 + 3x23 + 4x1 x3 − 4x2 x3 + 12x1 + 30x2 + 36x3 + 2 = 0. Wir bilden die zugehörige symmetrische Matrix 4 0 2 A = 0 2 −2 2 −2 3 und berechnen über deren charakteristisches Poylnom λ3 − 9λ2 + 18λ die Eigenwerte als λ1 = 0, λ2 = 3 und λ3 = 6. Normierte Eigenvektoren sind hierzu −1 2 2 1 1 1 w1 = 2 , w2 = 2 , w3 = −1 . 3 3 3 2 −1 2 Mit der Matrix D = (w1 , w2 , w3 ) ergibt sich die Hauptachsentransformation −1 1 2 D t AD = 9 2 0 0 = 0 3 0 0 2 2 4 0 2 −1 2 2 2 −1 0 2 −2 2 2 −1 −1 2 2 −2 3 2 −1 2 0 0 . 6 Damit ist Q kongruent zu einer Quadrik mit definierender Gleichung ohne gemischte quadratische Terme: 3z22 + 6z32 + 40z1 + 16z2 + 22z3 + 2 = 0; vermöge quadratischer Ergänzung lässt sich diese letzte Gleichung umschreiben als 3(z2 + 38 )2 + 6(z3 + 11 2 6 ) + 40(z1 − 79 80 ) = 0. Hieraus kann man bereits alle notwendigen Daten zu Q ablesen; wir fahren aber trotzdem noch mit dem Kochrezept fort: Mittels der Größen c = 2 sowie b1 = 6, b2 = 15 und b3 = 18, welche man der Q definierenden Gleichung abliest, bildet man A′ sowie D ′ und berechnet (D ′ )t A′ D ′ und liest hieraus die Größen 118 β1 , β2 , β3 ab: (D ′ )t A′ D ′ 3 0 0 1 0 −1 2 = 2 9 0 2 0 2 −1 2 20 8 11 20 0 0 0 = 8 0 3 0 11 0 0 6 0 2 6 15 18 6 4 0 2 2 −1 15 0 2 −2 2 18 2 −2 3 3 0 0 0 0 −1 2 2 0 2 2 −1 0 2 −1 2 . Alternativ lassen sich die βj ’s (gemäß unserer Bemerkung) auch berechnen Abbildung 23. Der noch nicht auf hauptachsentransfomierte Paraboloid. durch β1 20 −1 2 2 6 1 β = β2 = D t b = 2 2 −1 15 = 8 . 3 β3 11 2 −1 2 18 Wir bilden nun mit den Einträgen −bj /λj für ersten Spalte und ansonsten null die Matrix 1 0 0 0 1 0 U′ = −8 0 1 3 − 11 0 0 6 nichtverschwindende λj in der 0 0 0 1 119 und berechnen damit 3 0 0 0 1 −9 −1 2 2 S ′ = D′ U ′ = 7 2 −1 −2 2 3 −1 2 −1 2 sowie − 79 2 20 ′ t ′ ′ (S ) A S = 0 0 20 0 0 0 0 0 3 0 Daraus lesen wir die Normalform 3y22 + 6y32 + 40y1 − 79 2 0 0 . 0 6 =0 ab. Also ist Q kongruent zu einem elliptischen Paraboloid mit Normalform 6 2 79 y2 + 12 2 79 y3 + 80 79 y1 =1 (siehe Abbildung 23); die entsprechende Koordinatentransformation ist in S ′ kodiert. Zweites Beispiel: Sei Qc die Quadrik des R3 , welche durch die Gleichung 3x21 − 2x1 x2 + 3x22 − 6x23 − 2x1 − 4x2 − 2x3 + c = 0 gegeben sei; hierbei ist c ein reeller Parameter. Von welchem Typ ist Qc ? Es ist zu erwarten, dass der Typ von der Wahl von c abhängt. Abbildung 24. c′ = ±1: Ein und zweischalige Hyperboloide. Wir bestimmen die symmetrische Matrix 3 −1 0 A = −1 3 0 0 0 −6 120 gemäß unserem Kochrezept. Das zugehörige charakteristische Polynom berechnet sich als (λ − 2)(λ − 4)(λ + 6), was auf etwa die Transformationsmatrix 1 √ − √12 0 2 √1 D = √12 0 2 0 0 1 führt. Mit den erweiterten Matrizen A′ und D ′ ergibt sich dann (D ′ )t A′ D ′ 1 0 0 0 c −1 −2 −1 0 √1 √1 0 −1 3 −1 0 2 2 = 1 1 0 0 − √2 √2 0 −2 −1 3 −1 0 0 −6 0 0 0 1 c − √32 − √12 −1 − √3 2 0 0 2 = . − √1 0 4 0 2 −1 0 0 6 Mit 1 √ 3 2 4 √ U′ = −1 2 8 − 61 folgt 0 1 0 0 53 c − 24 0 (D ′ U ′ )t A′ D ′ U ′ = 0 0 0 √1 2 √1 2 0 0 − √12 √1 2 0 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 2 0 0 0 0 0 0 . 4 0 0 −6 53 ergibt sich die Normalform 2x21 + 4x22 − 6x23 = 0 und Qc ist Speziell für c = 24 ein Ellipsenkegel. Falls c > 53 24 , ist die definierende quadratische Gleichung von der Gestalt 2 2 c ′ x1 + 4 2 c ′ x2 − 6 2 c ′ x3 = −1 mit c′ = c − 53 24 > 0; 53 in diesem Fall ist Qc ein zweischaliges Hyperboloid; ist schließlich c < 24 , so ′ ist c < 0 und Qc ist ein einschaliges Hyperboloid (siehe Abbildung 24). Weitere Erscheinungsformen von Quadriken werden wir im nächsten Paragraphen kennen lernen. Aufgaben Aufgabe 89. Welches geometrische Objekt verbirgt sich hinter der Quadrik, welche durch die Gleichung x2 − 2y 2 + 3z 2 − 4xy + 5xz − 6yz + 7 = 0 gegeben ist? 121 Aufgabe 90 (Frühjahr 2004, Thema 3, Aufgabe 4). Bestimmen Sie alle Parameter s ∈ R, für welche die Gleichung (sx1 )2 + 2x1 x2 + x22 − 2x1 − 2x2 + s + 1 = 0 eine Hyperbel beschreibt. 11. Klassifikation der Quadriken Mit Hilfe der Hauptachsentransformation und quadratischer Ergänzung können wir nun die verschiedenen Typen von Quadriken klassifizieren; dabei wollen wir aber den trivialen Fall ausschließen, dass die definierende Gleichung keine quadratischen Terme enthält, in welchem die Quadrik eine Hyperebene ist (eine Gerade im Falle der Ebene) oder gar der gesamte Raum (wenn nämlich die Gleichung 0 = 0 gegeben ist). Wesentlich interessanter ist: Satz 3.21 (Metrische Klassifikation der Quadriken). Zu jeder Quadrik Q in Rn existiert eine euklidische Bewegung f sowie m, k ∈ N0 mit m + k ≥ 1 und positive reelle Zahlen αj , so dass die bewegte Quadrik f (Q) durch genau eine der folgenden Gleichungen beschrieben wird. (I) Es treten keine linearen oder konstanten Terme auf: 2 x1 xm 2 xm+1 2 xm+k 2 + ... + − − ... − =0 α1 αm αm+1 αm+k mit m ≥ k. (II) Es treten keine linearen Terme auf; der konstante Term ist normiert gleich eins: 2 xm 2 xm+1 2 xm+k 2 x1 + ... + − − ... − = 1; α1 αm αm+1 αm+k (III) Es tritt genau ein linearer Term auf: 2 xm 2 xm+1 2 xm+k 2 x1 + ... + − − ... − = xm+k+1 , α1 αm αm+1 αm+k wobei m + k < n. Beweis mittels Hauptachsentransformation und quadratischer Ergänzung (wie im vorangegangenen Paragraphen). Im Falle eines verschwindenden Eigenwertes lassen sich die linearen Terme durch eine geeignete zusätzliche, abstandserhaltende Transformation auf einen einzigen reduzieren. (Im R2 tritt dieser letzte Fall tatsächlich gar nicht auf.) • Wir wollen nun die verschiedenen Erscheinungsformen insbesondere für die Ebene und den dreidimensionalen Raum untersuchen. Dabei werden wir mit der Ellipse, Hyperbel und Parabel alte Bekannte treffen (vgl. §3.2 und 3.3). Für die Quadriken in der Ebene R2 liefert der Satz die verschiedenen Typen im Fall (I): 122 • Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 0, womit f (Q) die durch x1 = 0 beschriebene Gerade ist; • für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und durch Faktorisieren der linken Seite zeigt sich, dass f (Q) das Paar sich schneidender Geraden x2 = ± αα12 x1 ist; • für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche nur durch (x1 , x2 ) = (0, 0) gelöst wird, womit f (Q) gleich dem Nullpunkt ist. Die verschiedenen Typen im Fall (II): • Für m = 0, k = 1 liefert die Normalform −( αx11 )2 = 1, welches keine Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist; • für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das Paar paralleler Geraden x1 = ±α1 ; • für m = 0, k = 2 entsteht die Gleichung −( αx11 )2 − ( αx22 )2 = 1, womit f (Q) wiederum leer ist; • für m = 1, k = 1 ergibt sich für f (Q) die Normalform ( αx11 )2 −( αx22 )2 = 1 einer Hyperbel; • für m = 2, k = 0 ergibt sich für f (Q) eine durch ( αx11 )2 + ( αx22 )2 = 1 beschriebene Ellipse. Es verbleibt ein einzelner Typ im Fall (III): • Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) eine Parabel ist. Die jeweiligen Untertypen lassen sich insbesondere noch über den Rang von A und A′ gemäß unserem Kochrezept und die jeweilige Anzahl der positiven und negativen Eigenwerte charakterisieren. In der Ebene genügen sogar Determinantenbedingungen: Beispielsweise liegt genau dann eine Hyperbel vor, wenn det A < 0 und det A′ 6= 0 gilt. Die gegebenen metrischen Normalformen enthalten genaue Informationen über die Quadrik Q. Die Bewegung f aus Satz 3.21 hat Abstände und Winkel unverändert gelassen (nach Satz 3.5 und 3.1). Aus beispielsweise der hauptachsentransformierten Normalform der Ellipse Q 2 2 x2 x1 + =1 α1 α2 liest man unmittelbar die Halbachsen α1 und α2 ab (durch Setzen von xj = 0; vgl. §3.1). Andererseits liefert die Hauptachsentransformation einen Zusammenhang zu den Eigenwerten λ1 , λ2 der zu Q assoziierten Matrix A: Gehen wir von einer quadratischen Gleichung ohne lineare Terme aus, besteht also etwa die hauptachsentransformierte Gleichung λ1 x21 + λ2 x22 = γ p mit positiven γ, λ1 , λ2 , so folgt für die Halbachsen der Ellipse αj = γ/λj . Ähnliche Informationen lassen sich aus den metrischen Normalformen der anderen geometrischen Objekte ziehen. 123 Abbildung 25. Von links nach rechts: Ebenenpaar, Kegel, Hyperbelzylinder Als Nächstes wollen wir Quadriken im dreidimensionalen Raum R3 untersuchen; in diesem Fall entstehen Flächen! Der Satz liefert die verschiedenen Typen im Fall (I): • Für m = 1, k = 0 entsteht wiederum die Normalform ( αx11 )2 = 0 bzw. x1 = 0, jedoch ist im R3 hierdurch eine Ebene beschrieben (während in R2 dies auf eine Gerade führt); • für m = 1, k = 1 lautet die Normalform ( αx11 )2 − ( αx22 )2 = 0 und durch Faktorisieren der linken Seite offenbart sich f (Q) als ein Paar sich schneidender Ebenen x2 = ± αα21 x1 (statt Geraden); • für m = 2, k = 0 entsteht die Gleichung ( αx11 )2 + ( αx22 )2 = 0, welche die Gerade Re3 mit dem dritten Standardeinheitsvektor e3 beschreibt; • für m = 2, k = 1 ist die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 0 und damit entsteht ein Ellipsenkegel f (Q); • für m = 3, k = 0 ergibt sich ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 0, welches nur durch den Nullpunkt (x1 , x2 , x3 ) = (0, 0, 0) gelöst wird. Abbildung 26. Von links nach rechts: Ellipsenzylinder, Ellipsoid, parabolischer Zylinder Die verschiedenen Typen im Fall (II): • Für m = 0, k = 1 liefert die Normalform −( αx11 )2 , welches wiederum keine Lösung besitzt, womit f (Q) in diesem Fall die leere Menge ist; • für m = 1, k = 0 lautet die Normalform ( αx11 )2 = 1 und f (Q) ist das Paar paralleler Ebenen x1 = ±α1 ; 124 • für m = 0, k = 2 kommt −( αx11 )2 − ( αx22 )2 = 1, womit f (Q) wiederum leer ist; • für m = 1, k = 1 entsteht die Gleichung ( αx11 )2 − ( αx22 )2 = 1, womit f (Q) ein Hyperbelzylinder ist; • für m = 2, k = 0 ergibt sich für f (Q) ein durch ( αx11 )2 + ( αx22 )2 = 1 beschriebener Ellipsenzylinder; • für m = 0, k = 3 lautet die Normalform −( αx11 )2 − ( αx22 )2 − ( αx33 )2 = 1 und f (Q) ist mal wieder leer; • für m = 1, k = 2 ergibt sich für f (Q) die Normalform ( αx11 )2 − ( αx22 )2 − ( αx33 )2 = 1 ein zweischaliges Hyperboloid, während • für m = 2, k = 1 die Normalform ( αx11 )2 + ( αx22 )2 − ( αx33 )2 = 1 und damit ein einschaliges Hyperboloid f (Q) entsteht; • für m = 3, k = 0 entsteht ( αx11 )2 + ( αx22 )2 + ( αx33 )2 = 1 und f (Q) ist ein Ellipsoid. Es verbleiben die Typen im Fall (III): • Für m = 1, k = 0 lautet die Normalform ( αx11 )2 = x2 , womit f (Q) ein parabolischer Zylinder ist; • für m = 1, k = 1 entsteht ( αx11 )2 − ( αx22 )2 = x3 und f (Q) ist ein hyperbolisches Paraboloid; • für m = 2, k = 0 lautet die Normalform ( αx11 )2 + ( αx22 )2 = x3 , womit f (Q) ein elliptisches Paraboloid ist. Abbildung 27. Von links nach rechts: hyperbolisches Paraboloid, elliptisches Paraboloid Etliche der neuen Quadriken haben sich in natürlicher Weise aus deren Analoga in der Ebene ergeben: Steht x1 = 0 etwa in R2 eine Gerade, nämlich Re2 mit dem zweiten Standardeinheitsvektor e2 , so existiert mit e3 in R3 ein weiterer linear unabhängiger Vektor, der dieser Gleichung genügt, womit also im dreidimensionalen Raum die entsprechende Quadrik gleich der Ebene Re2 + Re3 ist. Ähnlich wurden beispielsweise aus Paare von Geraden nun Paare von Ebenen. Oder aber aus einer Hyperbel mit der Gleichung x21 − x22 = 1 in der Ebene 125 (Typ (II)) entsteht im Raum ein Hyperbelzylinder (ebenfalls Typ (II)), denn x3 tritt nicht in der definierenden Gleichung auf, kann also beliebig gewählt werden). Ferner ergeben sich einige der Quadriken im dreidimensionalen Raum als so genannte Rotationskörper von ebenen Quadriken: Lassen wir etwa eine Hyperbel in R3 um ihre Achsen rotieren, so entsteht ein Hyperboloid. Abbildung 28. Links: Querschnitte eines Kegels; rechts: Längsschnitte. Aber, gegeben eine quadratische Gleichung, wie erkennt man, welche Fläche sich hinter der Quadrik verbirgt? – ohne Computer! Greifen wir hierzu noch einmal das Beispiel des einschaligen Hyperboloids aus dem vergangenen Paragraphen auf, welcher gegeben ist durch die Gleichung 2x21 + 4x22 − 6x23 = 1 (c′ = −1). Wir können die Normalformdarstellungen aus §3.2 und 3.3 für Kurven in der Ebene benutzen, um die Fläche im dreidimensionalen Raum zu bestimmen: Hierzu schneiden wir etwa die Fläche Q mit Ebenen x3 = κ mit verschiedenen reellen Werten κ. In diesem speziellen Beispiel ergeben sich so für κ = 0, ±1, ±2, . . . jeweils Ellipsen !2 !2 x1 x1 2 2 2 p =1 + p 2x1 + 4x2 = 1 + 6κ bzw. (1 + 6κ2 )/2 (1 + 6κ2 )/4 p p mit |κ| wachsenden Halbachsen (1 + 6κ2 )/2 bzw. (1 + 6κ2 )/4 (siehe Abbildung 28). Durch Zusammenfügen all dieser Schnittkurven entsteht die Fläche Q (ganz ähnlich dem Prinzip von Cavalieri mit dem wir in Analysis mehrerer Veränderlicher das Volumen der Kugel durch Aufintegrieren der Flächeninhalte der Kreise, die als Schnitte der Kugel auftraten, berechnet hatten). Hierbei zeigt sich auch, ob ein ein- oder ein zweischaliges Hyperboloid vorliegt. Zusätzliche Informationen ergeben sich, wenn wir die Schnittkurven mit beispielsweise x2 = κ und variierendem κ ∈ R betrachten. Die Attribute elliptisch, hyperbolisch, parabolisch in den Klassifikationslisten für Ebene und dreidimensionalen Raum kennzeichnen entsprechend die Art der Schnittkurven der jeweiligen Quadrik 126 mit einer Ebene. Im folgenden Paragraphen werden wir uns noch überlegen, welche Schnittkurven bei solchen Schnitten mit Ebenen überhaupt entstehen können... Werden die Eigenvektoren bei der Hauptachsentransformation übrigens nicht normiert, so entsteht zwar noch eine Diagonalmatrix, bloß stehen dann nicht mehr notwendig die Eigenwerte auf der Diagonalen. Beispiel 2 aus §10.: Mit den nicht-normierten Eigenvektoren bilden wir 1 −1 D̂ = 1 1 statt D (also ohne den Faktor (D̂)t AD̂ = A = √1 ), 2 1 1 −1 1 so berechnet sich 1 3 3 1 1 −1 1 1 = 8 0 0 −4 . Tatsächlich ergibt sich das Doppelte der zu A gehörigen√Diagonalmatrix (was nicht überraschend ist hinsichtlich der Normierung 2 = ( 2)2 ). Trotzdem lässt sich der Typ – nämlich eine Hyperbel – bereits aus dieser Diagonalisierung von A ablesen! Ohne Normieren der Eigenvektoren im Kochrezept geht lediglich die Größe, nicht aber die Form der Quadrik verloren, denn nach den Sätzen 3.5 und 3.1 erhalten Abbildungen der Form x 7→ Dx mit orthogonalen Matrizen D Abstände und Winkel. Letztlich entscheidend sind also im Wesentlichen wie viele positive und wie viele negative Eigenwerte die Ausgangsmatrix A besitzt; vergleiche hierzu den Begriff der positiven Definitheit in §2.4. Mit etwas mehr linearer Algebra (dem Trägheitssatz von Sylvester) lassen sich dann die Quadriken in beliebigen euklidischen Räumen Rn klassifizieren. Als illustrierendes Beispiel zeigen wir nun, dass Kreis und Ellipse affin äquivalent sind, also durch eine invertierbare Abbildung ineinander überführt werden können: Hierzu sei eine Ellipse E mit metrischer Normalform 2 2 x2 x1 + =1 α1 α2 gegeben (eine jede Ellipse lässt sich nach obigem ja in diese Gestalt bringen); ebenso nehmen wir unseren Kreis K als den durch die Gleichung x21 + x22 = 1 gegeben an. Dann überführt die Abbildung x1 7→ α1 x1 , x2 7→ α2 x2 die Ellipse E in den Kreis K. So sind also Ellipse und Kreis nicht zu unterscheiden! Darstellungen wie die obige Kreisgleichung mit lauter auf ±1 normierten Koeffizienten nennen wir die affine Normalform; für eine Hyperbel sieht diese beispielsweise wie folgt aus x21 − x22 = 1. 127 Allgemein entstehen die affinen Normalformen durch Setzen von αj = 1 in den Gleichungen von Satz 3.21 über die metrische Normalform. Den Typ der Quadrik können wir so noch einfacher beschreiben; jedoch verlieren wir sämtliche metrischen Informationen. Wir wiederholen: Orthogonale Matrizen D in der Hauptachsentransformation D t AD = B liefern eine Diagonalmatrix B mit den Eigenwerten von A in der Diagonalen (hierzu sind die Eigenvektoren zu normieren!). Ferner bleiben die Abstände bei x 7→ y := Dx zwischen jeweiligen Punkten erhalten und die Quadrik ändert weder Form noch Größe, lediglich die Lage im euklidischen Raum mag sich geändert haben. Insofern liefert die Klassifikation via der metrischen Normalform wesentlich mehr Informationen! Ist D hingegen eine Matrix aus der SLn (R), so bleiben immerhin noch Volumina und Elemente und bei D ∈ GLn (R) nur noch Parallelität erhalten. Aufgaben Aufgabe 91. Sei c ∈ R. Welches geometrische Objekt verbirgt sich hinter der Menge aller x = (x1 , x2 , x3 ), die der Gleichung x21 − 2x22 + 3x33 + c = 0 genügen? Welche Schnittkurven entstehen, wenn x3 konstant einer reellen Zahl gesetzt wird? Aufgabe 92. Welche Kurve zweiter Ordnung wird durch 2 {(ℓ2 + 2ℓ, ℓ2 − 2ℓ − 1)t ∈ R : ℓ ∈ R} dargestellt? Aufgabe 93 (Staatsexamen: Herbst 2003, Thema 2, Aufgaben 1 & 2). Gegeben sei das von den Parametern r, s, t ∈ R abhängige lineare Gleichungssystem x1 + 2x2 + 2x4 = 4 2x1 + 4x2 + rx3 = 1 sx1 + x3 + tx4 = 1 a) Für welche Wahl der Parameter ist die Lösungsmenge des Systems eindimensional, also eine affine Gerade? (Die Antwort ist zu begründen.) b) Es sei C die Menge der Parametertripel (r, s, t), für welche die Lösungsmenge des Systems keine affine Gerade ist. Als Teilmenge des euklidischen R3 mit den Koordinaten r, s, t ist C ein Kegelschnitt, der in einer Koordinatenebene liegt. Was ist der affine Typ des Kegelschnitts und in welcher Koordinatenebene liegt er? c) Bestimmen Sie die Parameter r, s, t im Gleichungssystem so, dass die Lösungsmenge zweidimensional, also eine affine Ebene ist. Lösen Sie das System für diese Wahl der Parameter. 128 12. Kegelschnitte Nachdem wir die verschiedenen Typen von Quadriken klassifiziert haben, wollen wir jetzt den Zusammenhang zwischen diesen geometrischen Objekten in der Ebene und im dreidimensionalen Raum beleuchten. Ein Kreiskegel im euklidischen Raum R3 lässt sich durch die quadratische Gleichung x21 + x22 − x23 = 0 beschreiben (s.o.). Sämtliche Quadriken der Ebene ergeben sich als Schnitte von Ebenen mit einem solchen Kegel im dreidimensionalen Raum, weshalb diese den Namen Kegelschnitt tragen (siehe Abbildungen 29-31) und Analoges gilt für den Fall von mehr als dreidimensionalen Kegeln. Schneiden wir etwa mit der Abbildung 29. Eine Ellipse entsteht als Schnitt eines Kegels mit einer Ebene im Raum. Ebene, die durch x3 = r mit einer fixierten positiven reellen Zahl r definiert ist, so ergibt sich durch Einsetzen in der Kreiskegelgleichung die Gleichung x21 + x22 = r 2 , welches bekanntlich einen Kreis vom Radius r mit Mittelpunkt im Ursprung in der x1 x2 -Ebene beschreibt. Also ist die Schnittkurve unseres Kegels mit besagter Ebene eben dieser Kreis. Wählen wir eine etwas geneigte Ebene statt x3 = r, so 129 ergeben sich Ellipse bzw. Parabel als Schnittkurven, wobei die Parabel genau dann entsteht, wenn die Winkel bei Ebene und Kegel übereinstimmen (siehe Abbildungen 29 und 31). Schneiden wir hingegen mit einer Ebene x2 = r, wobei r ≥ 0 sei, so folgt nach Umstellen die Gleichung x23 − x21 = r 2 ; damit ist die Schnittkurve in diesem Fall ein Geradenpaar (wenn r = 0) oder eine Hyperbel (wenn r > 0; siehe Abbildung 30). Satz 3.22. Die Schnittkurve Q ∩ E einer Quadrik Q ⊂ R3 mit einer Ebene E ist kongruent zu einer Quadrik Q′ ⊂ R2 (also einem Kegelschnitt). Ist Q ein Kreiskegel, so existiert zu jeder Quadrik Q′ eine Ebene E, so dass Q′ ähnlich zu der Schnittkurve Q ∩ E ist. Beweis. Jede Ebene E in R3 lässt sich durch eine lineare Gleichung α1 x1 + α2 x2 + α3 x3 + γ = 0 beschreiben; hierbei können nicht alle Koeffizienten αj verschwinden, also sei oBdA α3 = 1. Auflösen der Ebenengleichung nach x3 und Einsetzen in die Q definierende quadratische Gleichung liefert eine Gleichung in x1 und x2 von einem Grad kleiner oder gleich zwei. Also existiert zu Q nach dem Satz über die metrische Normalform eine Bewegung f , so dass Q′ = f (Q ∩ E). Dass jede Quadrik Q′ ⊂ R2 ähnlich zu einem Schnitt eines Kegels mit einer passenden Ebene ist, also die Quadriken der Ebene den Namen Kegelschnitt zu Recht tragen, hatten wir uns bereits überlegt. • Ellipsen treten beispielsweise als Schnittkurven einer Ebene mit Ellipsoiden, elliptischen Paraboloiden, ein- oder auch zweischaligen Hyperboloiden, Kegeln oder elliptischen Zylindern auf, jedoch nicht als Schnitt einer Ebene mit etwa einem hyperbolischen Zylinder. Die einzige Quadrik, die alle drei Kegelschnitte, also Ellipse, Hyperbel und Parabel, als Schnittkurve mit einer geeigneten Ebene liefert, ist der Kegel! Abschließend diskutieren wir nun die Frage: Wieviele Punkte bestimmen einen Kegelschnitt eindeutig? Wir erinnern: zwei Punkte legen eine Gerade durch ebendiese fest, und mit ein wenig mehr Mühe zeigt sich, dass drei Punkte, welche nicht auf einer Geraden liegen, einen Kreis definieren. Satz 3.23 (Fünfpunktesatz). Durch fünf Punkte, von denen keine vier kollinear sind, gibt es immer einen Kegelschnitt. Ferner existiert zu gegebenen verschiedenen fünf Punkten, von denen keine drei auf einer Geraden liegen, existiert ein ein eindeutiger Kegelschnitt durch diese fünf Punkte. Beweis. Ein Kegelschnitt Q ⊂ R2 ist definiert durch eine quadratische Gleichung: α1 x2 + α2 y 2 + α3 xy + α4 x + α5 y + α6 = 0. 130 Abbildung 30. Eine Hyperbel als Kegelschnitt. Wir nehmen an, dass nicht alle quadratischen Terme verschwinden (ansonsten haben wir es mit einer Gerade zu tun); sei also oBdA α1 verschieden von null. Nach Division durch α1 entsteht die äquivalente Gleichung x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0 mit aj = αj+1 /α1 . Diese quadratische Gleichung beschreibt also nach wie vor unsere gegebenen Kegelschnitt Q! Angenommen, wir wissen nicht, um was für einen Kegelschnitt es sich bei Q handelt, sondern wir kennen lediglich m Punkte Pj = (xj , yj ), die auf unserem Kegelschnitt liegen, also Pj ∈ Q für j = 1, . . . , m. Wie viele solche Punkte m benötigen wir, um den genauen Typ unseres Kegelschnittes bestimmen zu können? Wir schreiben statt Pj = (xj , yj ) ∈ Q die entsprechenden Gleichungen nieder: x21 + a1 y12 + a2 x1 y1 + a3 x1 + a4 y1 + a5 = 0 x22 + a1 y22 + a2 x2 y2 + a3 x2 + a4 y2 + a5 = 0 ... 2 x2m + a1 ym + a2 xm ym + a3 xm + a4 ym + a5 = 0. 131 Abbildung 31. Eine Parabel als Kegelschnitt. Dies sind m lineare Gleichungen in fünf Unbekannten: a1 , a2 , . . . , a5 (die Terme gebildet aus den xj , yj sind hier die Koeffizienten: bei konkreten Punkten Pj sind dies die Koordinaten, also Skalare). Wir können dieses lineare Gleichungssystem auch umschreiben zu 2 −x21 a1 y 1 x1 y 1 x1 y 1 1 .. .. .. = .. ; . . . . y m xm y m xm y m 1 a5 −x2m Die Lösungsmenge dieses inhomogenen linearen Gleichungssystems ist nicht leer (denn wir gehen ja von Punkten Pj aus, deren Koordinaten dieses lösen). Gehen wir von vier Punkten Pj aus , also m = 4, so haben wir einen Freiheitsgrad unter den fünf Unbekannten a1 , . . . , a5 und wir können im Allgemeinen keine eindeutige Lösung finden, die unseren Kegelschnitt festlegt. Aus der linearen Algebra ist bekannt, dass eine eindeutige Lösung unseres linearen Gleichungssystems genau dann existiert, wenn der Rang der Koeffizientenmatrix 2 y 1 x1 y 1 x1 y 1 1 .. A = ... . y m xm y m xm y m 1 132 mit der Anzahl n = 5 der Unbekannten übereinstimmt (bzw. gleich dem Rang der erwiterten Matrix (A, b) mit der rechten Seite b ist). Wir benötigen im Allgemeinen also fünf Punkte um den Kegelschnitt aus fünf auf diesem liegenden Punkten exakt bestimmen zu können. Hierbei ist allerdings auszuschließen, dass drei oder mehr der Punkte Pj auf einer Geraden liegen, ansonsten reduzieren sich die linear unabhängigen Gleichungen, die wir den Punkten Pj ∈ Q zugeordnet hatten (und entsprechend der Rang). • Man beachte hier, dass kollinear gelegene Punkte alleine beispielsweise keine Gerade eindeutig festelegen können! Wir schließen mit einem illustrierenden Beispiel: In der Ebene sei eine uns unbekannte Quadrik Q gegeben, die definierende Gleichung sei x2 + a1 y 2 + a2 xy + a3 x + a4 y + a5 = 0, und wir kennen vier Punkte P1 = (1, 0), P2 = (−1, 0), P3 = (0, 1), P4 = (0, −1), welche allesamt auf Q liegen. Es bestehen somit die folgenden vier linearen Gleichungen in den fünf Unbekannten a1 , . . . , a5 : a1 0 1 0 1 0 1 a2 1 0 −1 0 1 0 . = 0 0 1 0 1 a3 −1 a4 0 0 −1 0 1 −1 a5 Lösen dieses linearen Gleichungssystems liefert a1 = 1, a3 = 0, a4 = 0, a5 = −1 und a2 ist ein freier Parameter. Setzen wir als a3 = α mit beliebigem α ∈ R, so ergibt sich für die Q definierende Gleichung x2 + y 2 + αxy = 1. Wir sehen, dass durch Angabe von vier Punkten Pj ∈ Q, die Quadrik noch nicht eindeutig bestimmt ist. Geben wir einen weiteren Punkt vor, so können verschiedene Dinge passieren. Der Punkt (0, 0) kann einerseits nicht auf Q liegen, andererseits läge er auch mit wei weiteren Punkten der vier anderen auf einer Geraden, was im Fünfpunktesatz ausgeschlossen ist. Hingegen folgt aus der Forderung P5 = (3, 5) sofort, dass α = − 33 15 , also Q durch x2 + y 2 − 33 15 xy 1 2 u + − 12 25 2 12 v = 1. 11 Mit dem Beispiel aus §3.9 (mit a = 1 und b = − 33 30 = − 10 ) ergibt sich dann die hauptachsentransformierte Gleichung = 1, womit Q also die durch die Punkte P1 , . . . , P5 ∈ Q eindeutig bestimmte Hyperbel ist (siehe Abbildung 32). 133 Abbildung 32. Fünfpunkte auf einer Hyperbel. Aufgaben Aufgabe 94. Es sein λ ein reeller Parameter. Welche Kegelschnitte verstecken sich hinter den Schnitten der Ebene Eλ 1 0 0 0 + R λ + R 0 0 1 1 mit dem Kreiskegel Q, der gegeben ist durch die Gleichung x2 + y 2 − z 2 = 0? 3 Aufgabe 95. Für welche Quadriken Q ⊂ R kann ein Schnitt mit einer Ebene eine Hyperbel liefern? Aufgabe 96. Man zeige, dass der Durchschnitt zweier Kugeloberflächen im Raum entweder leer, ein Punkt oder ein Kreis ist, der in einer orthogonal zur Geraden durch die zwei Kugelmittelpunkte liegenden Ebene enthalten ist. Aufgabe 97. Beweisen Sie, dass sich stets ein Kreis durch drei nicht kollineare Punkte legen lässt und dieser eindeutig bestimmt ist.