Inhaltsverzeichnis 0 Zum Einstieg 1 1 Grundlagen 4 1 Grundbegriffe der naiven Mengenlehre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2 Grundbegriffe der Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 4 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 5 Das Prinzip der vollständigen Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2 Zahlen 20 1 Die Körper R und Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2 Einige ordnungstheoretische Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3 Folgen und (Über)abzählbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4 Über Z: Teilbarkeit, Primzahlen und Euklidischer Algorithmus . . . . . . . . . . . . . . . 29 5 Teilbarkeitskriterien und g–adische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . 32 6 Elementare Kombinatorik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 7 Einiges über die Menge der komplexen Zahlen C . . . . . . . . . . . . . . . . . . . . . . . 43 3 Gruppen 50 1 Grundlegendes über Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 2 Weitere Beispiele für Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3 Untergruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4 Isomorphie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4 Lineare Algebra 64 1 Vektorräume und Untervektorräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 2 Lineare Unabhängigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3 Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4 Lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 R2 und R3 5 Beispiele von linearen Abbildungen in . . . . . . . . . . . . . . . . . . . . . . . 77 6 Lineare Abbildungen und Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 7 Reguläre Matrizen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 8 Rang einer Matrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 9 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 10 Spezielle Eigenschaften der Anschauungsebene R2 . . . . . . . . . . . . . . . . . . . . . . . 92 11 Spezielle Eigenschaften des Anschauungsraumes R3 . . . . . . . . . . . . . . . . . . . . . . 97 12 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 13 Über das Lösen von linearen Gleichungssystemen . . . . . . . . . . . . . . . . . . . . . . . 102 5 Analysis 107 0 Ein einführendes Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 1 Konvergenz, Grenzwert und Häufungspunkte . . . . . . . . . . . . . . . . . . . . . . . . . 108 2 Wie erkennt man konvergente Folgen? (1. Teil) . . . . . . . . . . . . . . . . . . . . . . . . 110 3 Wie erkennt man konvergente Folgen? (2. Teil) . . . . . . . . . . . . . . . . . . . . . . . . 113 4 Teilfolgen und der Satz von Bolzano–Weierstraß . . . . . . . . . . . . . . . . . . . . . . . . 116 5 Das Cauchysche Konvergenzprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 6 Drei Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 7 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 8 Einige Konvergenzkriterien für Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 9 Grenzwerte von Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 10 Stetigkeit: Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 11 Einfache Eigenschaften stetiger Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 140 12 Über Abbildungen f : Rn → Rm 13 Die Ableitung einer Abbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 14 Einige Ableitungsregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 15 Weitere Eigenschaften differenzierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . 154 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 6 Geometrie 160 0 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 1 Affine Ebenen: Definition und einfache Beispiele 2 Sphärenmodell und Moultonebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 3 Isomorphie und Kollineationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 4 Schließungssätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 5 Dilatationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174 6 Normale euklidische Ebenen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 7 Bewegungen Teil 1: Punktspiegelungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 8 Orthogonalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 9 Bewegungen Teil 2: Spiegelungen und Drehungen . . . . . . . . . . . . . . . . . . . . . . . 189 10 Winkel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 11 Eulergerade und Feuerbachkreis in der Anschauungsebene . . . . . . . . . . . . . . . . . . 201 . . . . . . . . . . . . . . . . . . . . . . . 161 1 Mathematik I – IV Beginn WS 04/05 Hinweis: Dieses Manuskript ist eine unvollständige Zusammenfassung von Dingen, die in den oben genannten Vorlesungen zum Teil wesentlich ausführlicher behandelt werden. Es ist daher nur verständlich und von Nutzen für Personen, die gleichzeitig regelmäßig und aktiv die zugehörige Vorlesung besuchen (also nicht nur körperlich anwesend sind), und es wurde auch nur für diesen Hörerkreis geschrieben. Es erhebt keinen Anspruch auf Vollständigkeit, Fehler sind zwar ärgerlich, aber leider nicht auszuschließen! 0 Zum Einstieg Ein erster Versuch in drei Teilen, mit den Studierenden Kontakt aufzunehmen. a) Ein typischer Beweis Anhand der Frage Welche Arten von Zahlen gibt es? soll gezeigt werden: √ Beh.: 2 ist keine rationale Zahl. Bew.: Wir zeigen: Es gibt keine natürlichen Zahlen m, n mit der Eigenschaft √ Angenommen, 2 ist doch eine rationale Zahl, d.h. √ m ∃ m, n ∈ N : 2= n √ 2= m n. Hierbei steht ∃ für es gibt . Wir können voraussetzen (Schulwissen), dass n und m nicht beide Vielfache von 2 sind (sonst: Kürzen!). √ √ √ m 2· 2= m Aus 2 = m n folgt n · n , dies ist gleichbedeutend mit 2= m2 n2 ⇐⇒ 2n2 = m2 (∗) Also ist m2 eine gerade Zahl. Hieraus folgt, dass auch m selbst gerade sein muss (warum?). Somit gibt es eine natürliche Zahl k mit der Eigenschaft m = 2k. Dies hat wiederum m2 = 4k 2 zur Folge. Setzen wir diesen Ausdruck in (∗) ein, erhalten wir 2n2 = 4k 2 bzw. (kürze durch 2) n2 = 2k 2 . Wie vorher für m folgt analog, dass auch n eine gerade Zahl ist. Dieses Ergebnis steht aber im Widerspruch zur√Voraussetzung, dass es sich bei m und n nicht um zwei gerade Zahlen handeln soll. Unsere Annahme 2 rational hat zu einem nicht behebbaren Widerspruch geführt, sie war falsch und damit ist die Behauptung bewiesen. b) Ein überraschendes Ergebnis Gibt es mehr ganze als natürliche Zahlen? Nach Klärung des Begriffes mehr Zahlen und Feststellung, ob 0 eine natürliche Zahl ist1 , beweisen wir 1 Es gibt gute Gründe, 0 als natürliche Zahl aufzufassen, und genauso gute Gründe, es nicht zu tun! Wir entscheiden uns in dieser Vorlesung für die zweite Variante: 0 ist für uns keine natürliche Zahl. Später werden wir bei Bedarf die um 0 erweiterte Menge der natürlichen Zahlen mit N0 bezeichnen. 2 0 ZUM EINSTIEG Beh.: Die Anzahl der natürlichen Zahlen stimmt mit der Anzahl der ganzen Zahlen überein. Bew.: Wir ordnen jeder ganzen Zahl folgendermaßen eine natürliche Zahl zu: N Z → f: 2z + 1 falls z ≥ 0 z 7→ −2z falls z < 0 Beispiel : Der ganzen Zahl 5 wird die natürliche Zahl f (5) = 2 · 5 + 1 = 11, der ganzen Zahl −2 wird f (−2) = −2 · (−2) = 4 zugeordnet. Für diese Zuordnung gilt: 1.) Jeder ganzen Zahl wird eine natürliche Zahl zugeordnet. 2.) Verschiedenen ganzen Zahlen werden verschiedene natürliche Zahlen zugeordnet: z1 , z2 verschiedene nicht negative Zahlen =⇒ 2z1 + 1 6= 2z2 + 1 z1 , z2 verschiedene negative Zahlen =⇒ −2z1 6= −2z2 Es bleibt oBdA2 der Fall z1 nicht negativ und z2 negativ zu untersuchen. Hier folgt ebenfalls 2z1 + 1 6= −2z2 ; denn die eine Zahl ist gerade, die andere ungerade. Also gibt es mindestens so viele natürliche wie ganze Zahlen. 3.) Es gibt auch nicht mehr: Sei n eine gerade natürliche Zahl, so ist z := − n2 die (nach 2.) einzige ganze Zahl mit f (z) = n; ist n ungerade, so ist z := n−1 2 die entsprechende ganze Zahl mit f (z) = n. Auf diese Weise wird auch jeder natürlichen Zahl eine (jeweils andere) ganze Zahl zugeordnet, es gibt mindestens so viele ganze wie natürliche Zahlen. Bemerkung : Wir haben soeben die Gleichmächtigkeit der Mengen N und Z nachgewiesen. Später werden wir sogar beweisen, dass auch Q (die Menge der rationalen Zahlen) gleichmächtig zu N und Z ist, nicht aber beispielsweise R (die Menge der reellen Zahlen). c) Zufall oder Methode? g .............................................................................................................................................................................................................................................. sP h ....................................................................................................................................................................................................... ....................................... Gegeben seien zwei Geraden g und h und ein Punkt P , der nicht auf einer der beiden Geraden liegt (siehe obere Skizze). Gesucht ist die Gerade durch P , die, falls g und h nicht parallel sind, durch den Schnittpunkt von g und h verläuft. Falls g parallel zu h liegt, soll die gesuchte Gerade ebenfalls zu diesen parallel sein. Als Konstruktionshilfsmittel ist nur ein Lineal zum Zeichnen von exakten Geraden zugelassen. Wir geben ohne Beweis ein Kochrezept“ für die Lösung an; den Beweis werden wir erst in einigen ” Semestern kennenlernen: 1. Wähle beliebige Punkte G auf g und H auf h so, dass P, G, H ein echtes Dreieck bilden; siehe nächste Skizze. 2 oBdA ist die Abkürzung für ohne Beschränkung der Allgemeinheit: Wir können den anderen theoretisch noch möglichen Fall z1 < 0, z2 ≥ 0 nämlich völlig analog durch Umbenennung erledigen. Statt oBdA findet man in der Fachliteratur manchmal die Abkürzung oE (ohne Einschränkung). 3 2. Wähle auf der Geraden durch P und G einen weiteren beliebigen Punkt S 6= P, G. ..... ..... ..... .... ............ ..... .. ..... . . ... .... ........ . . . . ..... .. .... ..... ..... ... ..... ..... ..... ..... . ..... .... ..... ..... . . . . . ................................................................................................................................................................................................................................................................ . . ... .... ......... .... .......... . . . . . . . . . ...... . ..... ..... .... ..... ...... ..... ..... . ...... ..... ..... ..... ...... .... ......... ..... ..... ... . .. .. ..... ......................................................................................................................................................................................................................... . . . . . ... . . . . . . . . . . . . . . .......... .. ... ......... ......... . ... . . . . . . . . . . . . . . . . . . . . . . . .......... ...... .. .... ..... . .... . . . . . . . . . . . . . . . . . . . . . . . . . .......... ..... . .. ............. . ..... ...................... ...................... .......... ... ...... ..... .. ..... ...................... ..... ................. ... .................... ........... . . . . .......... ..... .... ................ . . .. . . . .......................................................................................................................................................................................................................................... ........................................ ... .... ... ... ... . sS Gs0 g l h Ps0 b a sG Q s sP s s H R s H0 3.Wähle zwei weitere beliebige Geraden a und b durch S (verschieden von P G so, dass die Schnittpunkte Q := a ∩ GH, R := a ∩ P H und G0 := b ∩ g vernünftig‘ eingezeichnet werden können. ’ 4. Verbinde G0 mit Q und nenne den Schnittpunkt dieser Geraden mit h H 0 . 5. Verbinde H 0 mit R und nenne den Schnittpunkt dieser Geraden mit b P 0 . 6. Die Verbindungsgerade l von P und P 0 ist die gesuchte Gerade! In der Skizze liegt der Punkt Q auf der Geraden l. In den Übungen soll geklärt werden, ob dies notwendigerweise so sein muss, oder ob es sich nur zufällig durch geschickte Wahl der Punkte ergeben hat. 4 1 1 GRUNDLAGEN Grundlagen In diesem Kapitel geht es um Begriffe und Methoden, mit denen Sie zum Teil schon in der Schule konfrontiert wurden. Wir werden uns mit Mengen, Aussagenlogik, Relationen, Funktionen und vollständiger Induktion beschäftigen. Auf diesen Grundlagen bauen die nachfolgenden Teile auf, sie werden später immer wieder benötigt. 1 Grundbegriffe der naiven Mengenlehre Die folgende Definition (Festlegung) geht auf den großen deutschen Mathematiker Georg Cantor, der von 1845 bis 1918 gelebt hat, zurück: Def 1.1 Eine Menge ist eine Zusammenfassung von wohlbestimmten und wohlunterschiedenen Objekten unseres Denkens oder unserer Anschauung zu einem Ganzen. Hierbei bedeutet wohlbestimmt, dass es eindeutig feststellbar ist, ob ein Objekt x zu einer Menge M gehört oder nicht, in Zeichen x ∈ M oder x 6∈ M , in Worten: x ist (nicht) Element von M“. Mit ” wohlunterschieden ist gemeint, dass jedes Objekt maximal einmal zu einer Menge gehört. Statt von Objekten spricht man heute von Elementen einer Menge. Beispiele : 1) Die Menge aller Personen im Hörsaal. 2) Die Menge aller Primzahlen zwischen 10 und 20. 3) Die Zahlenmengen aus dem vorherigen Kapitel N, Z, R. 4) Die Menge aller guten Mathematikstudenten. (?) 5) Die Menge der Buchstaben, aus denen das Wort SEMESTER gebildet wird. Mengen können angegeben werden durch eine (unvollständige) Auflistung aller Elemente oder durch Angabe von Eigenschaften, stets eingerahmt durch die Mengenklammern { und }. Die Menge aus dem Beispiel 5) ist {S, E, M, T, R} oder {E, M, R, S, T }, da es nicht auf die Reihenfolge der Elemente ankommt. Weitere Beispiele sind N = {1, 2, 3, . . .}, {z ∈ Z | z 2 − z = 6} = {−2, 3}, {z ∈ N | z 2 − z = 6} = {3}. Def 1.2 Seien A, B beliebige Mengen. a) A heißt Teilmenge von B, geschrieben A ⊆ B oder A ⊂ B : ⇐⇒ Jedes Element von A ist auch Element von B. b) A = B : ⇐⇒ A ⊆ B und B ⊆ A. c) A heißt echte Teilmenge von B, geschrieben A $ B : ⇐⇒ Jedes Element von A ist auch Element von B, aber A 6= B. Auf Grund der Definition ist jede Menge Teilmenge von sich selbst. Das Zeichen ⊂ wird in der Fachliteratur leider nicht einheitlich benutzt (echte/unechte Teilmenge). Die Bedeutung von A ⊃ B liegt auf der Hand, wenn man diese Aussage von rechts nach links betrachtet: B ist Teilmenge von A oder A ist Obermenge von B. Ebenfalls selbsterklärend ist A 6⊂ B: A ist keine Teilmenge von B. Beispiele : {1} ⊂ {1, . . . , 10} ⊂ N ⊂ Z ⊂ Q ⊂ R ⊂ C, {0, 1} 6⊂ N, da für uns 0 6∈ N. Als Nächstes wollen wir einige elementare Rechenoperationen mit Mengen kennenlernen. 1 Grundbegriffe der naiven Mengenlehre 5 Def 1.3 Seien A, B ⊆ M . a) A ∪ B := {x ∈ M | x ∈ A oder x ∈ B} heißt die Vereinigung von A und B. b) A ∩ B := {x ∈ M | x ∈ A und x ∈ B} heißt der Durchschnitt von A und B. c) A\B := {x ∈ M | x ∈ A und x 6∈ B} heißt die Differenzmenge von A und B (Reihenfolge von A und B wichtig!). d) A := {x ∈ M | x 6∈ A} heißt das Komplement von A (in M ). e) A ⊕ B := (A\B) ∪ (B\A) heißt die symmetrische Differenz oder Boolesche Summe von A und B. Mengenoperationen können im Venndiagramm (Einzelheiten in der Vorlesung) veranschaulicht werden. Enthält eine Menge kein einziges Element, so liegt die leere Menge vor, geschrieben ∅ oder manchmal auch {}. Es gibt nur eine leere Menge; so ist die Menge aller Primzahlen zwischen 24 und 28 gleich der Menge aller fliegenden Elefanten im Geomatikum. Die leere Menge ist Teilmenge jeder Menge. Satz 1.1 Es seien A, B, C ⊆ M beliebige Mengen. Dann gelten a) A ∩ B = B ∩ A, A∪B =B∪A b) A ∩ (B ∩ C) = (A ∩ B) ∩ C, A ∪ (B ∪ C) = (A ∪ B) ∪ C c) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), d) A ∩ M = A, e) A ∩ A = ∅, A ∪ M = M, (Kommutativgesetze) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ ∅ = ∅, (Assoziativgesetze) (Distributivgesetze) A∪∅=A A∪A=M f) A = A g) A ∩ B = A ∪ B, A∪B =A∩B (Regeln von de Morgan) Beweis: a), d), e), f) folgen direkt aus der Definition. zu b): x ∈ A ∩ (B ∩ C) ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ x ∈ A ∧ x ∈ (B ∩ C) x ∈ A ∧ (x ∈ B ∧ x ∈ C) (x ∈ A ∧ x ∈ B) ∧ x ∈ C x ∈ (A ∩ B) ∧ x ∈ C x ∈ (A ∩ B) ∩ C Hier bedeutet ⇐⇒ genau dann, wenn. ∧ ist lediglich eine Abkürzung für das Wort und. Wir haben durch korrekte logische Schlüsse gezeigt, dass jedes Element der linken Menge auch in der rechten Menge liegt (⇒, damit ist A ⊆ B bewiesen) und umgekehrt jedes Element der rechten Menge auch zur linken Menge gehört (wegen ⇐ folgt B ⊆ A). Nach Definition 1.2 b) sind damit die Mengen gleich. Ersetzt man ∩ durch ∪ und ∧ durch ∨ (oder), folgt analog das andere Assoziativgesetz. zu c): Wir zeigen A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). Beh. 1: A ∩ (B ∪ C) ⊆ (A ∩ B) ∪ (A ∩ C) Bew.: Sei x ∈ A ∩ (B ∪ C) =⇒ x ∈ A ∧ x ∈ (B ∪ C) 1. Fall: x ∈ B, also x ∈ A und x ∈ B. Damit ist x ∈ (A ∩ B), und erst recht gilt x ∈ (A ∩ B) ∪ (A ∩ C). 2.Fall: x 6∈ B. Dann ist x auf jeden Fall in A und in C, also gilt x ∈ (A ∩ C) und 6 1 GRUNDLAGEN x ∈ (A ∩ B) ∪ (A ∩ C). Beh. 2: A ∩ (B ∪ C) ⊇ (A ∩ B) ∪ (A ∩ C) Bew.: Sei x ∈ (A ∩ B) ∪ (A ∩ C) 1. Fall: x ∈ (A ∩ B) =⇒ x ∈ A ∧ x ∈ B =⇒ x ∈ A ∧ x ∈ (B ∪ C) =⇒ Beh. 2. Fall: x ∈ (A ∩ C) verläuft analog. Das andere Distributivgesetz wird in den Übungen behandelt. zu g): Wir zeigen A ∩ B = A ∪ B, indem wir alle vier möglichen Fälle (1) x ∈ A ∧ x ∈ B (2) x ∈ A ∧ x 6∈ B (3) x 6∈ A ∧ x ∈ B (4) x 6∈ A ∧ x 6∈ B in einer Tabelle untersuchen. In der Tabelle bedeutet 1: ist Element von und 0: ist nicht Element von. A B A∩B A∩B 1 1 1 0 1 0 0 1 0 1 0 1 0 0 0 1 A B A∪B 0 0 0 0 1 1 1 0 1 1 1 1 Da die Einträge in den fett gekennzeichneten Spalten übereinstimmen, ist die Behauptung bewiesen. Der Beweis der anderen Regel verläuft analog. Def 1.4 Seien A, B beliebige Mengen. Dann heißt A × B := {(a, b) | a ∈ A, b ∈ B} kartesisches Produkt der Mengen A und B Ein Beispiel für das kartesische Produkt zweier Mengen ist Ihnen vielleicht (wenn auch sicherlich nicht bewusst) aus langweiligen Schulstunden bekannt: Beim Spiel Schiffe versenken wird die Lage einer jeden Schiffseinheit durch ein Paar (Buchstabe,Zahl) angegeben (kartesisches Produkt!). Analog definiert man A × B × C := {(a, b, c) | a ∈ A, b ∈ B, c ∈ C}, usw. Beispiele : 1) {1, 2} × {x, y} = {(1, x), (1, y), (2, x), (2, y)}. 2) {1, 2}3 := {1, 2} × {1, 2} × {1, 2} = {(1, 1, 1), (1, 1, 2), . . . , (2, 2, 2)} (insgesamt acht Elemente) 3) Z2 := Z × Z als Gitterpunkte der Anschauungsebene. Besteht ein kartesisches Produkt aus endlichen Mengen, ist die Anzahl der Elemente gerade das Produkt der Anzahl der Elemente der beteiligten Mengen. Im Beispiel 2) besteht das kartesische Produkt {1, 2}3 aus 2 · 2 · 2 = 8 Elementen. Wir wollen ein wenig mit den neu gelernten Begriffen herumspielen: Satz 1.2 Seien A, B, S, T beliebige Mengen. Dann gelten (1) (A ∩ B) × (S ∩ T ) = (A × S) ∩ (B × T ) (2) (A ∪ B) × (S ∪ T ) ⊇ (A × S) ∪ (B × T ) Beweis: zu (1): Sei (x, y) ∈ (A ∩ B) × (S ∩ T ) ⇐⇒ x ∈ (A ∩ B) ∧ y ∈ (S ∩ T ) ⇐⇒ (x, y) ∈ A × S, B × T ⇐⇒ Beh. zu (2): Eventuell Übung. 2 Grundbegriffe der Aussagenlogik 7 An dieser Stelle sei noch einmal explizit auf den Unterschied zwischen dem Tupel (a, b) und der Menge {a, b} hingewiesen! Warum sollen die Elemente einer Menge nicht durchaus selbst Mengen sein? Def 1.5 Sei M eine beliebige Menge. Die Potenzmenge von M , geschrieben Pot M , ist die Menge aller Teilmengen von M . Beispiele : 1) Sei M = {1, 2} =⇒ Pot M = {∅, {1}, {2}, {1, 2}}. 2) Pot (Pot M ) = {∅, {∅}, {{1}}, {{2}}, {M }, {∅, {1}}, {∅, {2}}, {∅, M }, {{1}, {2}}, {{1}, M }, {{2}, M }, {∅, {1}, {2}}, {∅, {1}, M }, {∅, {2}, M }, {{1}, {2}, M }, Pot M } 3) Sei A = {x}, B = {a, b}. Dann ist Pot (A × B) = {∅, {(x, a)}, {(x, b)}, {(x, a), (x, b)} }. 4) Pot {∅} = {∅, {∅}}. Frage : Wer kann dieses Beispiel richtig deuten? Später werden wir beweisen, dass im Falle einer endlichen Menge M mit n Elementen die zugehörige Potenzmenge Pot M aus 2n Elementen besteht. Satz 1.3 Seien A, B ⊆ M beliebige Mengen. Dann gelten (1) Pot A ∩ Pot B = Pot (A ∩ B) (2) Pot A ∪ Pot B ⊆ Pot (A ∪ B) Beweis zu (1): Es gilt x ∈ ( Pot A ∩ Pot B) ⇐⇒ x ∈ Pot A ∧ x ∈ Pot B ⇐⇒ x ⊆ A ∧ x ⊆ B ⇐⇒ x ⊆ (A ∩ B) ⇐⇒ x ∈ Pot (A ∩ B) zu (2): Es gilt x ∈ ( Pot A ∪ Pot B) ⇐⇒ x ∈ Pot A ∨ x ∈ Pot B ⇐⇒ x ⊆ A oder x ⊆ B =⇒ x ⊆ (A ∪ B) ⇐⇒ x ∈ Pot (A ∪ B) In der Formel (2) gilt anders als in (1) in der Regel nicht das Gleichheitszeichen (im Beweis kommt man an einer Stelle nicht von rechts nach links, wo?), wir belegen dies durch folgendes Beispiel: Sei A = {1, 2} und B = {2, 3}. Dann gehört die Menge {1, 3} zwar zur Potenzmenge von A ∪ B, aber nicht zu Pot A ∪ Pot B.3 2 Grundbegriffe der Aussagenlogik Eine Aussage ist eine sinnvolle Zusammenstellung von Zeichen (Buchstaben, Zahlen, Sonderzeichen), die entweder wahr oder falsch ist. (Eindeutig entscheidbar, eine andere Möglichkeit gibt es nicht.) Beispiele : 1) Wien ist die Hauptstadt von Österreich. 2) Haltet den Dieb! (?) 3) 1 + 3 = 5 4) Wien ist die Hauptstadt von Österreich oder 1 + 3 = 5. 5) Wenn 1 + 3 = 5 ist, dann ist Wien die Hauptstadt von Österreich. 3 Wir haben eine Behauptung durch ein Gegenbeispiel widerlegt. Man hüte sich vor dem Irrtum, eine Behauptung durch ein Beispiel beweisen zu können! 8 1 GRUNDLAGEN Die letzten zwei der obigen Aussagen sind durch Verknüpfung von Einzelaussagen entstanden. Mit derartigen Verknüpfungen wollen wir uns jetzt befassen. Dabei werden wir uns nur für die Eigenschaft wahr oder falsch, nicht aber für den jeweiligen Inhalt einer Aussage interessieren. Aussagen wollen wir im folgenden mit großen lateinischen Buchstaben A, B, . . . bezeichnen. Außerdem legen wir fest falsch“ wird ausgedrückt durch 0“ ” ” wahr“ wird ausgedrückt durch 1“. ” ” 1. Einstellige Verknüpfung: Negation einer Aussage A, geschrieben A, gesprochen nicht A“ oder non ” ” A“. Die Aussage A ist genau dann wahr, wenn die Aussage A falsch ist. 2. Zweistellige Verknüpfungen A ∧ B, A ∨ B, A ⇒ B, A ⇐⇒ B. Die Konjunktion wird mit ∧ bezeichnet und entspricht dem umgangssprachlichen und“. Definiert wird ” die Konjunktion durch die folgende Wahrheitstafel: A B A∧B 0 0 0 0 1 0 1 0 0 1 1 1 Durch ∧ werden zwei beliebige Aussagen A, B zu einer neuen Aussage A ∧ B verknüpft, die genau dann wahr ist, wenn A und B beide wahr sind. Die Verknüpfung ∨ bezeichnet man als Disjunktion. Sie entspricht dem umgangssprachlichen oder“ (im ” nichtausschließenden Sinne). Die Definition von ∨ wird durch die folgende Tabelle gegeben: A B A∨B 0 0 0 1 0 1 1 0 1 1 1 1 Die durch die Verknüpfung ∨ aus A, B gebildete Aussage A ∨ B ist genau dann falsch, wenn beide Aussagen A, B falsch sind. Die Verknüpfung ⇒ bildet das umgangssprachliche wenn, dann“ nach. Sie heißt Implikation. Die Äqui” valenz wird mit ⇐⇒ bezeichnet und entspricht dem umgangssprachlichen genau dann, wenn“ oder ” dann und nur dann“. Implikation und Äquivalenz werden in der folgenden Tabelle definiert: ” A B A⇒B A⇔B 0 0 1 1 0 1 1 0 1 0 0 0 1 1 1 1 Die durch ⇒ aus A, B gebildete Aussage A ⇒ B ist genau dann falsch, wenn A wahr und B falsch ist; A ⇔ B ist genau dann wahr, wenn A und B denselben Wahrheitswert haben. Diese Verknüpfungen können beliebig kombiniert werden, zum Beispiel 1) A = A (doppelte Verneinung) 2) (A ∨ B) ⇒ (A ∧ C) mit der zugehörigen Wahrheitstafel: 3 Relationen 9 A B C 0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1 A B 1 1 1 1 1 0 1 0 0 1 0 1 0 0 0 0 A∨B A∧C 1 0 1 1 0 0 0 1 1 0 1 0 1 0 1 0 (A ∨ B) ⇒ (A ∧ C) 0 1 1 1 0 0 0 0 3) (A ∧ B) ⇒ (A ⇐⇒ B) Die zugehörige Wahrheitstafel zeigt, dass diese Aussage stets wahr ist. 4) (A ∧ (B ⇒ A)) ⇐⇒ B ergibt eine andere Wahrheitstafel als das Beispiel 3)! Zur Vereinfachung der Schreibweise und um Klammern zu sparen, gilt die Regel vor ⇐⇒ , ferner kann das Konjunktionszeichen ∧ weggelassen werden4 . vor ∧ vor ∨ vor ⇒ Beispiel : A ∧ (B ⇒ C) ist eine andere Aussage als A B ⇒ C . Es gibt weitere (zweistellige) Verknüpfungen; allerdings lässt sich jede n–stellige Verknüfung alleine durch Negation und Konjunktion oder durch Negation und Disjunktion darstellen. Beispiel : A ⇐⇒ B stimmt mit A B ∨ A B überein. Jede mögliche Wahrheitstafel lässt sich sogar mit einer einzigen Verknüpfung realisieren, dem sogenannten Sheffer–Strich |. Dabei ist A|B genau dann wahr, wenn A und B nicht beide wahr sind. So gilt zum Beispiel A = A|A, weitere Beispiele werden in den Übungen behandelt. Wenn man Mengenlehre und Aussagenlogik vergleicht, fallen große Übereinstimmungen auf. Wir halten in einer Tabelle fest: Menge M Aussage A 3 x ∈ M / x 6∈ M A ist wahr / falsch Komplement Negation ∩ ∧ ∪ ∨ ⊆ ⇒ = ⇐⇒ Relationen Wir interessieren uns für Teilmengen eines kartesischen Produktes A × B. Def 3.1 Seien A, B beliebige Mengen. Jede Teilmenge R ⊆ A × B heißt Relation von A nach B. Ist A = B, (also R ⊆ A × A), so heißt R auch Relation auf A. Beispiele : 1) Sei A die Menge aller europäischen Hauptstädte und B die Menge aller Länder. Dann ist R := {(a, b) ∈ A × B | a ist Hauptstadt von b} eine Relation; (Rom, Italien) ∈ R, (Wien, Belgien) 6∈ R. 2) Sei A die Menge aller Personen in diesem Hörsaal. Die Menge aller Personenpaare, die nebeneinander sitzen, bilden eine Relation auf A. 4 So ähnlich wie bei Punktrechnung und Strichrechnung, nur ein wenig umfangreicher! 10 1 GRUNDLAGEN 3) A := N, (a, b) ∈ R ⊆ N × N : ⇐⇒ a ≤ b. Hier gilt (1, 4) ∈ R, (3, 2) 6∈ R. R ist die bekannte ≤ – Relation. Statt (m, n) ∈ R schreibt man üblicherweise kürzer m ≤ n. 4) Sei T := {(a, b) ∈ N × N | a und b haben beim Teilen durch 3 den gleichen Rest}. Statt (2, 5) ∈ T schreibt man auch 2 ≡ 5 mod 3, gelesen 2 ist kongruent 5 modulo 3. Def. 3.2 Sei R eine Relation auf A. Man nennt die Relation R (1) reflexiv, falls (a, a) ∈ R für jedes a ∈ A gilt. (2) symmetrisch, falls aus (a, b) ∈ R stets (b, a) ∈ R folgt. (3) transitiv, falls aus (a, b) ∈ R und (b, c) ∈ R stets (a, c) ∈ R folgt. (4) antisymmetrisch, falls aus (a, b) ∈ R mit a 6= b stets (b, a) 6∈ R folgt. Für die Beispiele 2), 3), 4) gilt: Nachbar ≤ modulo 3 (r) – + + (s) + – + (t) – + + (as) – + – Uns interessieren folgende Fragen : 1) Gibt es Relationen, die alle vier Eigenschaften gleichzeitig erfüllen? 2) Welche Kombinationen der Eigenschaften sind nicht möglich? Die Antwort auf die erste Frage lautet Satz 3.1 Sei M eine beliebige Menge und R ⊆ M × M . Dann gilt: R genügt (r), (s), (t), (as) ⇐⇒ R ist die Gleichheitsrelation. Beweis: Wir haben zwei Beweisrichtungen ⇒“ und ⇐“ zu zeigen. ” ” ⇒“: Vor.: R erfülle die vier Bedingungen (r), (s), (t), (as). ” Beh.: R ist die Gleichheitsrelation, d.h., R = {(m, m) | m ∈ M } =: G Bew.: 1) Wegen (r) gilt (m, m) ∈ R für jedes m ∈ M . Damit ist G ⊆ R. 2) Angenommen, ∃(m1 , m2 ) ∈ R mit m1 6= m2 . Gleichzeitig können wir dann aus den Voraussetzungen (s) und (as) folgern (s) =⇒ (m2 , m1 ) ∈ R (as) =⇒ (m2 , m1 ) 6∈ R Also kann es in R keine Paare (m1 , m2 ) mit m1 6= m2 geben, damit gilt R ⊆ G. Aus 1) und 2) folgt die Behauptung R = G. ⇐“: ” Vor.: R ist die Gleichheitsrelation, d.h., R = {(m, m) | m ∈ M } Beh.: R erfüllt die vier Bedingungen (r), (s), (t), (as). Bew.: zu (r): Nach der Definition der Gleichheit gilt (m, m) ∈ R für jedes Element m aus M . zu (s): (m1 , m2 ) ∈ R =⇒ m1 = m2 =⇒ (m2 , m1 ) ∈ R. zu (t): (m1 , m2 ), (m2 , m3 ) ∈ R =⇒ m1 = m2 = m3 =⇒ (m1 , m3 ) ∈ R. zu (as): Da es keine Paare (m, n) ∈ R mit m 6= n gibt, folgt die Gültigkeit der Antisymmetrie trivialerweise. 3 Relationen 11 Diese letzte Schlussfolgerung ist für Sie eventuell gewöhnungsbedürftig: Ist eine Voraussetzung nicht erfüllt, ist die Behauptung stets richtig; denn es kann ja nichts Falsches passieren. Dies heißt aber nicht, dass Sie eine Klausur bestehen, wenn Sie ein leeres Blatt abgeben! Beschränkt man sich auf die Eigenschaften (r), (s) und (t), so ist jede Kombination hieraus möglich. Beispiel : Sei A := {a, b, c}. Die Relation R1 := {(a, a), (b, c), (c, b)} ist symmetrisch, aber nicht reflexiv und nicht transitiv, R2 := {(a, a), (b, b)} ist nicht reflexiv, erfüllt aber (s) und (t). Weitere Fälle werden in den Übungen behandelt. Jetzt kommen wir zu zwei speziellen Arten von Relationen, die uns im Laufe des Studiums noch häufig begegnen werden. Def. 3.3 Sei R eine Relation auf A. Man nennt die Relation R (1) Äquivalenzrelation, falls sie reflexiv, symmetrisch und transitiv ist. (2) Ordnungsrelation, falls sie reflexiv, antisymmetrisch und transitiv ist. Die Gleichheitsrelation ist nach Satz 3.1 die einzige Relation, die gleichzeitig Äquivalenz– und Ordnungsrelation ist. Weitere Beispiele für Äquivalenzrelationen sind Modulo–Relationen. ≤ bzw. ≥ sind Ordnungsrelationen. Die Kleiner–Relation ist keine Ordnungsrelation, da sie nicht reflexiv ist! Frage : Ist R = {(a, b), (a, c), (b, d), (c, d), (a, d), (a, a), (b, b), (c, c), (d, d)} eine Ordnungs– oder Äquivalenzrelation auf A := {a, b, c, d} ? Wir wollen die Zahlen von 1 bis 10 in einem Mengendiagramm so darstellen, dass die Relation gleicher Rest beim Teilen durch 4 deutlich wird. Hierbei stellen wir fest, dass jede Zahl in genau einer echten nichtleeren Teilmenge liegt, und dies liegt nicht an den speziell gewählten Zahlen. Def 3.4 Sei M eine beliebige Menge, die Mengen Ki seien nichtleere Teilmengen von M . Es gelte: (i) Ki ∩ Kj = ∅ für alle Ki 6= Kj S (ii) Ki = M (Vereinigung aller Ki ) Dann bilden die Teilmengen Ki eine Partition oder Klasseneinteilung von M . Die Mengen Ki heißen Klassen der Partition. Beispiele : 1) M := {1, 2, . . . , 9, 10} mit K0 := {4, 8}, K1 := {1, 5, 9}, K2 := {2, 6, 10}, K3 := {3, 7} (siehe oben). 2) M die Menge der Personen in diesem Hörsaal, Ki := {P ∈ M | P hat am i–ten Tag im Jahr Geburtstag }. (Partition?) 3) M = Z, K1 := {z ∈ Z | z > 0}, K2 := {z ∈ Z | z < 0}, K3 := {0}. 4) M = N, K1 die Menge der geraden, K2 die Menge der ungeraden Zahlen. 5) M = N, Ki := {i} für i ∈ N. Zu jeder gegebenen Partition einer Menge M lässt sich immer eine zugehörige Relation R auf M bilden, indem man definiert R := {(a, b) ∈ M × M | Es gibt ein Ki mit a, b ∈ Ki }. 12 1 GRUNDLAGEN Mit anderen Worten: (a, b) ∈ R, falls a und b in derselben Klasse liegen; (a, b) ∈ / R, falls a und b in verschiedenen Klassen liegen. In diesem Sinn gehört zum Beispiel 1) die Modulo–4–Relation. Satz 3.2 Sei M 6= ∅ eine beliebige Menge. Dann gilt: Jeder Partition von M entspricht eine Äquivalenzrelation und jeder Äquivalenzrelation entspricht eine Partition. Beweis: Wir haben zwei Beweisrichtungen Partition ⇒ Äquivalenzrelation“ und ” Partition ⇐ Äquivalenzrelation“ zu zeigen. ” ⇒“: Sei eine Partition auf M gegeben. Wir definieren wie oben R ⊆ M × M . Der Nachweis, dass R ” eine Äquivalenzrelation ist, ist einfach und wird eventuell als Übung durchgeführt. ⇐“: Sei R eine Äquivalenzrelation, gesucht ist eine zugehörige Partition. Statt (a, b) ∈ R wollen wir ” kürzer a ∼ b schreiben. Die drei Bedingungen, die R nach Voraussetzung erfüllt, sind (1) (2) (3) Reflexivität: Symmetrie: Transitivität: a ∼ a gilt für alle a ∈ M . Aus a ∼ b folgt immer b ∼ a. Aus a ∼ b, b ∼ c folgt immer a ∼ c. Zu jedem a ∈ M definieren wir nun eine Teilmenge Ta von M durch Ta := {x ∈ M | a ∼ x}. Aus (1) folgt dann a ∈ Ta ∀a ∈ M (das Zeichen ∀ bedeutet für alle ). Wir behaupten: Beh : {Ta | a ∈ M } ist Partition auf M Bew : Zu zeigen ist (1) Ta 6= ∅ ∀a ∈ M . (2) S Ta ∩ Tb = ∅ für Ta 6= Tb . (3) a∈M Ta = M . zu (1): Dies ist klar, da a ∈ Ta . zu (2): Wir zeigen: Für je zwei Mengen Ta , Tb gilt entweder Ta ∩ Tb = ∅ oder Ta = Tb . Es seien Ta und Tb gegeben mit Ta ∩ Tb 6= ∅ (sonst fertig), sei c ∈ Ta ∩ Tb , also a ∼ c und b ∼ c. Aus Symmetrie und Transitivität von R folgt a ∼ b und b ∼ a. Für ein beliebiges x ∈ Ta gilt dann a ∼ x, also auch b ∼ x und x ∈ Tb . Damit haben wir gezeigt Ta ⊆ Tb ; analog kann man Tb ⊆ Ta nachweisen (Übung). Somit gilt: Ta = Tb (falls Ta ∩ Tb 6= ∅) und (2) ist bewiesen. S zu S (3): Klar ist a∈M Ta ⊆ M . Da für ein beliebiges x ∈ M stets x ∈ Tx gilt, ist auch a∈M Ta ⊇ M erfüllt und es gilt (3). Es mag sein, dass Ihnen die Ausführungen über den Zusammenhang zwischen Partitionen (eine durch genaue Regeln festgelegte Einteilung der Elemente einer Menge in Teilmengen) und Äquivalenzrelationen sehr abstrakt und mathematisch abgehoben“ erschienen sind. In diesem Fall merken Sie sich mindestens ” folgendes: Jede Äquivalenzrelation auf einer Menge A bewirkt eine Einteilung der Elemente von A in Teilmengen, die den Regeln einer Partition (die Sie natürlich kennen müssen) genügen. Hierbei liegen genau die Elemente in derselben Teilmenge, die untereinander in Relation stehen. Beispiel : Die Modulo–4–Relation auf Z unterteilt die ganzen Zahlen in die vier Teilmengen {0, ±4, ±8, . . .} = {4z | z ∈ Z} (Rest 0), {1, 5, 9, . . . , −3, −7, . . .} = {1 + 4z | z ∈ Z} (Rest 1), {2 + 4z | z ∈ Z} (Rest 2) und {3 + 4z | z ∈ Z} (Rest 3). Frage : Welche Äquivalenzrelationen gehören zu den Beispielen 3), 4) und 5) hinter Def. 3.4? Ein letztes Beispiel soll diesen Abschnitt beenden: Sei M die Menge aller Dreiecke in der Anschauungsebene. Dann bildet die Kongruenzrelation eine Äquivalenzrelation. 4 4 Abbildungen 13 Abbildungen Abbildungen werden Ihnen aus Ihrer Schulzeit bekannt sein. Was Sie (sehr wahrscheinlich) nicht wissen, dass es sich bei Abbildungen um ganz spezielle Relationen handelt. Def 4.1 Seien A, B 6= ∅ beliebige Mengen. Eine Relation f von A nach B heißt Abbildung oder Funktion : ⇐⇒ ∀a ∈ A ∃1 b ∈ B : (a, b) ∈ f Beispiele : 1) A = {0, 1, 2}, B = {x, y}, f = {(0, x), (1, y), (2, x)} 2) A = B = N, f = {(n, 2n + 1) | n ∈ N} In 1) wird den Zahlen 0 und 2 der Buchstabe x und der Zahl 1 der Buchstabe y zugeordnet, in 2) wird jeder natürlichen Zahl n unter der Abbildung f die Zahl 2n + 1 zugeteilt. Allgemein gehört auf Grund der Definition zu jedem Element a ∈ A genau ein Element b ∈ B, daher können wir statt (a, b) ∈ f die üblichere Schreibweise f (a) = b verwenden, statt f ⊆ A × B schreiben wir f : A → B. Das Beispiel 2) sieht dann so aus: N → N f: n 7→ 2n + 1 Bei der Pfeilschreibweise“ sehen wir, dass bei jedem Element aus A genau ein Pfeil beginnt. Das heißt ” aber nicht, dass verschiedene Pfeile nicht dasselbe Ziel haben dürfen (wie in Beispiel 1)), oder dass es Elemente gibt, bei denen überhaupt kein Pfeil ankommt. (Frage : Bei welcher Zahl kommt in Beispiel 2) kein Pfeil an? In der Regel werden wir für Abbildungen die Buchstaben f, g, h, α, β, . . . verwenden. Im Falle f : A → B heißt A Definitionsbereich oder Urbildmenge , B wird auch Bildbereich genannt. f (x) ist der Wert von f an der Stelle x und wird auch als Bildelement von x ∈ A in B bezeichnet. Man sollte f (x) nie mit der Abbildung f verwechseln, auch wenn häufig (gerade auch in der Schule) etwas nachlässig von der Abbildung f (x) gesprochen wird. Für S ⊆ A ist f (S) := {f (x) | x ∈ S} (Bildmenge von S), für T ⊆ B ist f −1 (T ) := {a ∈ A | f (a) ∈ T } (Urbildmenge von T ). Beispiel : 3) f: N×N → N (n, m) 7→ n + m Es ist f −1 ({2, 4}) = {(1, 1), (1, 3), (2, 2), (3, 1)}. Eine Abbildung mit Definitionsbereich A × A und Bildbereich A wird auch binäre Verknüpfung genannt. Frage : Wenn M1 die Menge der Hörer im Hörsaal und M2 die Menge der Tage eines Jahres sind, also M2 = {1, 2, . . . , 366}, was ist dann bei der Abbildung g : M1 → M2 , bei der jeder Person p ihr Geburtstag zugeordnet wird, mit g −1 ({1, 2, . . . , 31}) gemeint? Satz 4.1 Sei f : A → B eine beliebige Funktion und seien A1 , A2 ⊆ A, B1 , B2 ⊆ B. Dann gelten: a) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ) b) f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ) c) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ) d) f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ) 14 1 GRUNDLAGEN Beweis: zu a) ⊆“: Sei y ∈ f (A1 ∪ A2 ) =⇒ ∃x ∈ A1 ∪ A2 : f (x) = y. Da x ∈ A1 oder x ∈ A2 gilt, ist ” auch f (x) ∈ f (A1 ) oder f (x) ∈ f (A2 ), also f (x) = y ∈ f (A1 ) ∪ f (A2 ). ⊇ “: Sei y ∈ f (A1 ) ∪ f (A2 ), also y ∈ f (A1 ) oder y ∈ f (A2 ). In beiden Fällen folgt y ∈ f (A1 ∪ A2 ), ” was zu zeigen war. zu b): Übung! Frage : Warum gilt hier nicht die Gleichheit? zu c): Sei x ∈ f −1 (B1 ∪ B2 ) ⇐⇒ f (x) ∈ B1 ∪ B2 ⇐⇒ f (x) ∈ B1 ∨ f (x) ∈ B2 ⇐⇒ x ∈ f −1 (B1 ) ∪ f −1 (B2 ). zu d): Ersetze in c) ∪ durch ∩ und ∨ durch ∧. Def 4.2 Eine Abbildung f : A → B heißt (1) (2) (3) : ⇐⇒ : ⇐⇒ : ⇐⇒ injektiv surjektiv bijektiv x 6= y =⇒ f (x) 6= f (y) für alle x, y ∈ A zu jedem b ∈ B existiert ein a ∈ A mit f (a) = b f ist injektiv und surjektiv. Die Bedeutung von injektiv, surjektiv und bijektiv müssen Sie im Schlaf“ wissen! Wir untersuchen die ” bisherigen Beispiele auf Injektivität/Surjektivtät/Bijektivität: 1) {(0, x), (1, y), (2, x)} ist nicht injektiv (f (0) = f (2)), aber surjektiv. 2) f mit f (n) = 2n + 1 ist injektiv, aber nicht surjektiv (1 hat kein Urbild). 3) Auf N ist die binäre Verknüpfung + wegen 1 + 2 = 2 + 1 nicht injektiv. Da es zu 1 kein Urbild gibt, ist sie auch nicht surjektiv. Wenn wir + auf N0 betrachten, folgt wegen n = n + 0 die Surjektivität. 4) Die Hörer–Geburtstags–Funktion ist sicherlich nicht surjektiv. (Injektiv?) Wenn A und B Mengen mit m bzw. n Elementen sind, kann es für m > n keine injektive und für m < n keine surjektive Abbildung von A nach B geben. Bei manchen Funktionen, speziell bei reellen Funktionen f : R → R, kann man aus einer Zeichnung auf Injektivität usw. schließen. Def 4.3 Sei f : A → B. Dann heißt die Menge {(x, f (x)) | x ∈ A} Graph von f . Wenn bei einer Funktion f : R → R jede Parallele zur x–Achse den Graphen von f höchstens/mindestens/ genau einmal schneidet, dann ist die Funktion injektiv/surjektiv/bijektiv. Beispiele : 1) 6 @ @ @s @ s .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... @ .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... .... g Die Betragsfunktion f , definiert durch f (x) := |x|, ist nicht injektiv (die Gerade g schneidet den Graphen der Funktion mehr als einmal) und auch nicht surjektiv (die Gerade h schneidet den Graphen keinmal.). - h 2) fi : R → R mit fi (x) := xi mit i ∈ N ist für ungerades i bijektiv. Für i gerade ist fi wegen fi (x) = fi (−x) nicht injektiv, und da fi (R) keine negativen Zahlen enthält, auch nicht surjektiv. 4 Abbildungen 15 Es gibt Funktionen von R nach R, die genau eine der Eigenschaften injektiv/surjektiv besitzen, zum x + 1 für x < 0 Beispiel f (x) := (x − 1)x(x + 1), g(x) := , oder h(x) := ex . x − 1 für x ≥ 0 Frage : Welche Funktion hat welche Eigenschaft? Kehren wir zum Beispiel f : {0, 1, 2} → {x, y} zurück. Frage : Wieviele Abbildungen außer f sind möglich? Antwort : Neben f gibt es sieben weitere Abbildungen (siehe Tabelle): 0 → 7 1 → 7 2 → 7 1. 2. 3. 4. 5. 6. 7. 8. x x x x y y y y x x y y x x y y x y x y x y x y Allgemein gibt es für |A| = m und |B| = n genau |B||A| = nm verschiedene Abbildungen von A nach B; denn jedem der m Elemente von A (daher m Faktoren) kann jedes der n Elemente von B zugeordnet werden. Wie wir bereits wissen, gibt es zwischen A und B für |A| = m 6= n = |B| keine bijektiven Abbildungen. Frage : Wieviele bijektive Abbildungen A → B sind für |A| = m = n = |B| möglich? Antwort : Wenn wir die Elemente von A in irgendeiner Weise nummerieren, gibt es für das erste Element a1 ∈ A n mögliche Bilder, für das zweite Element a2 nur noch n − 1 (wegen der Bijektivität ist f (a2 ) 6= f (a1 )), für das dritte Element a3 nur noch n − 2 (es ist f (a3 ) 6= f (a1 ), f (a2 )), usw. Insgesamt gibt es daher n · (n − 1) · (n − 2) · . . . · 2 · 1 viele bijektive Abbildungen. Mathematiker schreiben diese Produkt kürzer: n! := n · (n − 1) · (n − 2) · . . . · 2 · 1 gesprochen n Fakultät “ ” n! ist für jede natürliche Zahl definiert, man setzt ferner 0! := 1. Beispiel : A = B = {a, b, c}. Es gibt 3! = 6 bijektive Abbildungen: 1. 2. 3. 4. 5. 6. a 7→ a a b b c c b 7→ b c a c a b c 7→ c b c a b a Auf ähnliche Weise kann man sich klarmachen, dass für |A| = m ≤ n = |B| n · (n − 1) · . . . · (n − (m − 1)) viele injektive Abbildungen von A nach B möglich sind. Dieser Ausdruck macht auch im Fall m > n Sinn, n! da dann der Faktor 0 im Produkt auftaucht. Für m ≤ n kann das Produkt kürzer als (n−m)! geschrieben werden. Für die Anzahl surjektiver Abbildungen gibt es leider keine einfache Formel. In den Übungen werden wir einige Spezialfälle untersuchen. Wir fügen dem Hörer–Geburtstags–Beispiel eine weitere Menge M3 = {M o, Di, . . . , Sa, So} hinzu und definieren g : M2 → M3 durch die Zuordnung Jahrestag 7→ entsprechender Wochentag in 2005, beispielsweise g(12) = M i.5 Jetzt kann jedem Hörer der Wochentag seines Geburtstages in 2005 zugeordnet werden, indem die Funktionen f und g miteinander verkettet bzw. hintereinander ausgeführt werden: M1 → M2 → M3 g◦f : p 7→ f (p) 7→ g(f (p)) 5 Da 2005 kein Schaltjahr ist, setzen wir für den 29.02.05 g(60) := g(61) = Di. 16 1 GRUNDLAGEN Es ist also (g ◦ f )(x) := g(f (x)) (beachte: von rechts nach links“). ” Beispiel : Seien f, g, h : R → R definiert durch f (x) := x2 + 1, g(x) := x − 2, h(x) := 2x. Gesucht sind die Funktionen g ◦ h, h ◦ g, (f ◦ g) ◦ h und f ◦ (g ◦ h). Die Verkettung von Funktionen ist in der Regel nicht kommutativ, es gilt nicht immer g ◦ f = f ◦ g. Satz 4.2 Die Verkettung von Funktionen ist assoziativ, d.h. es gilt für f : A → B, g : B → C und h : C → D: h ◦ (g ◦ f ) = (h ◦ g) ◦ f Beweis: Sei a ∈ A beliebig. Dann gilt (h ◦ (g ◦ f ))(a) = h( (g ◦ f )(a) ) = h(g(f (a))) = (h ◦ g)(f (a)) = ((h ◦ g) ◦ f )(a). Der restliche Abschnitt handelt von bijektiven Funktionen. – Umgangssprachlich ausgedrückt bedeutet bijektiv für eine Abbildung f : A → B, dass bei jedem b ∈ B genau ein Pfeil (mit Start in A) ankommt. In diesem Fall können wir die Pfeilrichtung umkehren und erhalten eine Abbildung, die jedem b ∈ B genau ein a ∈ A zuordnet. Wir erhalten eine durch die Abbildungsvorschrift von f eindeutig festgelegte Abbildung g : B → A. B → A A → B wird zu g: f: b 7→ a a 7→ b Beispiele : 1) f : {a, b, c} → {0, 1, 2} mit f (a) = 0, f (b) = 2, f (c) = 1 ⇒ g : {0, 1, 2} → {a, b, c} mit g(0) = a, g(1) = c, g(2) = b 2) f : Z → Z, z 7→ z + 1: Hier ist g : Z → Z, z 7→ z − 1. Bei Bijektionen kann die eineindeutige Zuordnung Urbild – Bild umgekehrt werden. Daher ist folgende Definition sinnvoll: Def 4.4 Sei f : A → B eine bijektive Abbildung. Dann heißt die Abbildung g : B → A mit {g(b)} := f −1 ({b}) die zu f gehörende inverse Abbildung oder Umkehrabbildung, geschrieben g = f −1 . Dr Begriff der Umkehrabbildung macht nur bei Bijektionen Sinn. Ist eine Abbildung f : A → B nicht surjektiv, gibt es b ∈ B, bei denen kein Pfeil ankommt, ist f nicht injektiv, gibt es b ∈ B, bei denen mehrere Pfeile ankommen. Man vergleiche diesen Sachverhalt mit der Definition der Abbildung! −1 = f. Mit f ist f −1 ebenfalls bijektiv und besitzt eine Umkehrabbildung, es gilt f −1 Beispiele : 1) Die identische Abbildung f : R → R, x 7→ x, ist zu sich selbst invers. 2) Zu f : R → R mit f (x) := 2x ist g mit g(x) = f −1 (x) = 21 x invers. Frage : Wie lauten die inversen Abbildungen von x 7→ x3 und x 7→ 5x + 2? In den Übungen werden wir auf die Unterschiede zwischen f −1 , f −1 (T ) mit T ⊂ B und f −1 (b) eingehen. Bijektive Abbildungen sind uns bereits in den Vorbemerkungen begegnet, dort wurde die Existenz einer Bijektion f : Z → N bewiesen. 5 Das Prinzip der vollständigen Induktion 17 Def 4.5 Zwei Mengen A, B heißen gleichmächtig, geschrieben |A| = |B| : ⇐⇒ ∃ f : A → B bijektiv. Man sagt auch, gleichmächtige Mengen besitzen die gleiche Kardinalzahl. Bei endlichen Mengen bedeutet gleichmächtig, dass sie die gleiche Anzahl an Elementen besitzen. In diesem Sinn besagt |M | = n, dass zu M genau n Elemente gehören. Beispiel : |Z| = |N|, später werden wir sehen |Q| = 6 |R|. Frage : Gilt |Z| = |N0 | ? Satz 4.3 Seien f : A → B und g : B → C bijektiv. Dann ist auch g ◦ f bijektiv. Beweis: Übung (es sind injektiv und surjektiv nachzuweisen). Folgerung : Mit f : A → B sind auch f −1 : B → A und die Identitäten f −1 ◦ f : A → A und f ◦ f −1 : B → B bijektiv. 5 Das Prinzip der vollständigen Induktion Die natürlichen Zahlen hat der liebe Gott geschaffen, alles andere ist Menschenwerk“ soll der große ” Zahlentheoretiker Leopold Kronecker (1823–1891) gesagt haben. Wir wollen die wichtigsten typischen Eigenschaften der natürlichen Zahlen angeben und dann eine Methode kennenlernen, mit deren Hilfe man viele Aussagen, die mit natürliche Zahlen zu tun haben, beweisen kann. Die folgende Kennzeichnung der natürliche Zahlen stammt von dem italienischen Mathematiker Giuseppe Peano (1858 – 1932): Def 5.1 Die Peanoschen Axiome: (P1) 1 ist eine natürliche Zahl (P2) Jeder natürlichen Zahl n ist genau eine natürliche Zahl n0 zugeordnet, die der Nachfolger von n genannt wird. (P3) 1 ist kein Nachfolger. (P4) Sind natürliche Zahlen n, m verschieden, so auch ihre Nachfolger n0 , m0 . (P5) Enthält eine Menge M natürlicher Zahlen die Zahl 1 und folgt aus n ∈ M stets n0 ∈ M , so besteht M aus allen natürlichen Zahlen. Erfüllt eine Menge diese fünf Axiome, handelt es sich um die Menge der natürlichen Zahlen bzw. um eine Menge, deren Elemente sich in allen Belangen genau so verhalten wie die natürlichen Zahlen. Häufig wird die Zahl 0 zu den natürlichen Zahlen gezählt; in diesem Fall gelten (P1) – (P5) analog, wenn man 1 durch 0 ersetzt. In (P2) – (P4) wird die Existenz einer injektiven Abbildung verlangt (x 7→ x0 ), die wegen (P3) nicht surjektiv ist. Diese Nachfolgerfunktion kann als Addition von 1 interpretiert werden: x0 = x+1. (P5) ist das sogenannte Induktionsprinzip, mit dem wir uns jetzt ausführlich auseinandersetzen werden. Mit Hilfe des Induktionsprinzips kann man Aussagen für natürliche Zahlen beweisen. Diesen Beweis durch vollständige Induktion werden wir an Hand einiger Beispiele erklären. Zunächst soll die Beweismethode allgemein erläutert werden. 18 1 GRUNDLAGEN Eine Aussage A(n) soll für natürliche Zahlen n bewiesen werden. 1) Induktionsanfang: Man beweist die Aussage für einen Startwert n0 : Zu zeigen : A(n0 ) ist richtig 2) Induktionsannahme: Die Aussage wird für ein n ∈ N als richtig angenommen: Voraussetzung : A(n) ist richtig 3) Induktionsschluss: Man beweist, dass die Aussage dann auch für n + 1 richtig ist: Zu zeigen : Unter der Voraussetzung A(n) ist A(n + 1) richtig. Damit gilt die Aussage A(n) für alle natürlichen Zahlen ab n0 . Die Idee, die dieser Methode zu Grunde liegt, ist denkbar einfach: Nach 1) ist zunächst A(n0 ) richtig. Wendet man 3) auf den Fall n = n0 an, hat man A(n0 + 1) bewiesen. Jetzt folgt aus 3) für den bewiesenen Fall n = n0 + 1 die Gültigkeit von A(n0 + 2), usw. (Dominoprinzip!) Bei den folgenden Beispielen werden wir zur Abkürzung das Summenzeichen n X P verwenden: ai := a1 + a2 + . . . + an−1 + an i=1 Beispiele : 5 P 2 P i2 = 4 + 9 + 16 + 25, i=2 Satz 5.1 c2k = c0 + c2 + c4 . k=0 (Gaußsche Summenformel) Carl Friedrich Gauß (1777 – 1855) n X n(n + 1) 2 i= i=1 Beweis: Durch vollständige Induktion 1) Induktionsanfang: 1 P Für n = 1 ist zu zeigen i= i=1 Wegen 1 P i=1= i=1 2) Induktionsannahme: Für ein n gilt: 1·2 2 n P ist dies klar. i= i=1 3) Induktionsschluss: n(n+1) 2 Wir beweisen für n + 1: n+1 P i= i=1 n+1 P i= i=1 n P 1·(1+1) 2 (n+1)((n+1)+1) 2 i + (n + 1) = i=1 n(n+1) 2 = n(n+1)+2(n+1) 2 (Summenformel) + (n + 1) = (nach Induktionsannahme) (n+1)(n+2) 2 (durch einfaches Rechnen) Analog lassen sich folgende Summenformeln beweisen (zum Teil Übungen): n X i=1 n(n + 1)(2n + 1) i = , 6 2 (n ersetzt durch n + 1) n X i=1 i3 = n2 (n + 1)2 4 5 Das Prinzip der vollständigen Induktion Satz 5.2 (Geometrische Summenformel) 19 Sei q 6= 1 eine beliebige reelle Zahl. Dann gilt n X qi = i=0 q n+1 − 1 q−1 Beweis: Durch vollständige Induktion, Kurzform 0 P 1 −1 1) n = 0 : q i = q 0 = 1 = qq−1 i=0 2) n 7→ n + 1 : n+1 P i=0 qi = n P q i + q n+1 = i=0 q n+1 −1 q−1 + q n+1 (q−1) q−1 = q n+1 −1+q n+2 −q n+1 q−1 =⇒ Behauptung. Satz 5.3 Sei M eine beliebige Menge mit n Elementen. Dann ist | Pot M | = 2n . Beweis: Durch vollständige Induktion, Kurzform 1) n = 0: Für M = ∅ ist Pot M = {∅}, also gilt der Induktionsanfang wegen 1 = 20 . 2) n 7→ n + 1: Sei M = {a1 , . . . , an+1 } = {a1 , . . . , an } ∪ {an+1 } = M 0 ∪ {an+1 }, nach Induktionsannahme gilt | Pot M 0 | = 2n . Für jede Teilmenge A ⊆ M ist genau einer der folgenden Fälle möglich: 1. Fall an+1 6∈ A =⇒ A ⊆ M 0 =⇒ es gibt genau 2n verschiedene solcher Mengen (nach Induktionsannahme). 2. Fall an+1 ∈ A =⇒ es gibt genau 2n verschiedene Mengen A\{an+1 } ⊆ M 0 (nach Induktionsannahme) und damit auch 2n verschiedene solcher Mengen. Also gilt insgesamt: | Pot M | = 2n + 2n = 2 · 2n = 2n+1 . Satz 5.4 Sei n eine natürliche Zahl, n > 4. Dann gilt 2n > n2 . Beweis: Durch vollständige Induktion, Kurzform 1) n = 5: 25 = 32 > 25 = 52 . 2) n 7→ n+1: 2n+1 = 2·2n > 2·n2 = n2 +n2 = n2 +n·n > n2 +3n = n2 +2n+n > n2 +2n+1 = (n+1)2 . Satz 5.4 ist zwar auch für n = 1 richtig, nicht aber für n = 2, 3, 4 (Was wäre, falls in dem Satz > durch ≥ ersetzt worden wäre?) Wir beenden diesen Abschnitt mit dem Beweis einer Aussage, die uns später als Hilfsmittel große Dienste leisten wird. Satz 5.5 (Bernoullische Ungleichung, benannt nach Jakob Bernoulli (1654–1705)) Für alle reellen Zahlen b ≥ −1 und alle n ∈ N gilt (1 + b)n ≥ 1 + nb Beweis: Durch vollständige Induktion, Kurzform: n = 1: (1 + b)1 = 1 + b ≥ 1 + 1 · b. n → n + 1: Wegen b ≥ −1 gilt 1 + b ≥ 0. Es folgt (1 + b)n+1 = (1 + b)n (1 + b) ≥ (1 + nb)(1 + b) = 1 + (n + 1)b + nb2 . Da nb2 ≥ 0 gilt, folgt (1 + b)n+1 ≥ 1 + (n + 1)b. Bemerkung : Für n ≥ 2 und b 6= 0 gilt sogar die strenge Ungleichung (1 + b)n > 1 + nb. 20 2 2 ZAHLEN Zahlen 1 Die Körper R und Q Da wir es in diesem und in den nächsten Semestern sehr viel mit reellen Zahlen zu tun haben werden, wollen wir zunächst unser hoffentlich vorhandenes Wissen hierüber auffrischen. Welche Rechenregeln für reelle und rationale Zahlen sind uns bekannt? – Die Addition oder Multiplikation reeller bzw. rationaler Zahlen a, b ergibt stets eine reelle bzw. rationale Zahl a + b oder a · b. – Es gelten die Kommutativgesetze: a + b = b + a, a · b = b · a – Es gelten die Assoziativgesetze: a + (b + c) = (a + b) + c, a · (b · c) = (a · b) · c – Es gilt das Distributivgesetz: a · (b + c) = a · b + a · c 6 – Es existieren neutrale Elemente: a + 0 = a und a · 1 = a für jede Zahl a. 0 ist das neutrale Element der Addition, 1 das der Multiplikation. – Es existieren inverse Elemente: Zu jeder reellen bzw. rationalen Zahl a gibt es eine reelle bzw. rationale Zahl b mit a + b = 0. Zu jeder reellen bzw. rationalen Zahl a 6= 0 gibt es eine reelle bzw. rationale Zahl c mit a · c = 1. Es ist b = −a und c = a1 . Jetzt gehen wir axiomatisch vor, d.h. wir geben Axiome an, durch die die Menge, deren Elemente wir in der Schule als reelle Zahlen kennengelernt haben, letztendlich eindeutig bestimmt ist. Def 1.1 (Körperaxiome) Auf einer beliebigen Menge K seien binäre Verknüpfungen + und · erklärt. (K, +, ·) heißt Körper : ⇐⇒ (K1) a + (b + c) = (a + b) + c, (K2) a + b = b + a, (K3) a · (b + c) = a · b + a · c (K4) ∃0∈K : a+0=a a·b=b·a ∃1∈K : a·1=a (K5) a · (b · c) = (a · b) · c ∀ a, b, c ∈ K ∀ a, b ∈ K ∀ a, b, c ∈ K ∀a∈K ∀ a ∈ K\{0} (0 6= 1) ∀ a ∈ K ∃ − a ∈ K : a + (−a) = 0, ∀ a ∈ K\{0} ∃ a−1 ∈ K\{0} : a · a−1 = 1 Wenn es klar ist, welche Verknüpfungen zu Grunde liegen, spricht man auch von dem Körper K an Stelle von (K, +, ·). Die Gesetze (K1)–(K3) heißen Assoziativ–, Kommutativ– und Distributivgesetz. Die Forderung nach der Kommutativität der Addition ist eigentlich überflüssig, da sie aus den anderen Axiomen gefolgert werden kann (eventuell Übung). Die Elemente 0 und 1 werden neutrale Elemente bezüglich der jeweiligen Verknüpfung oder auch Null– bzw. Einselement genannt. Analog spricht man 6 Mit der Vereinbarung Punktrechnung vor Strichrechnung 1 Die Körper R und Q 21 in (K5) von den inversen Elementen. Bei einer beliebigen Menge K handelt es sich bei den neutralen Elementen in der Regel nicht um die Zahlen 0 und 1! Erfüllt eine Menge mit nur einer binären Verknüpfung die entsprechenden Bedingungen (K1), (K4) und (K5), so spricht man von einer Gruppe, gilt zusätzlich für diese Verknüpfung (K2), von einer kommutativen oder abelschen Gruppe. Beispiele : (R, +) und (R\{0}, ·) sind abelsche Gruppen. (Z, +) ist eine Gruppe, (N, +) nicht. Bezüglich der Multiplikation ist auch Q\{0} eine Gruppe. Was ist mit Z\{0}? Ist der Gruppenbegriff bekannt, kann ein Körper auch so definiert werden: Def 1.2 1) 2) 3) (Kurzfassung) (K, +, ·) ist ein Körper : ⇐⇒ (K, +) ist abelsche Gruppe (K ∗ , ·) ist abelsche Gruppe mit K ∗ := K\{0} Es gilt das Distributivgesetz (K3) Beispiele : Neben den reellen Zahlen bilden auch die rationalen Zahlen mit der normalen Addition und Multiplikation einen Körper. Die natürlichen bzw. die ganzen Zahlen sind kein Körper. Weitere Körper werden wir in den Übungen kennenlernen. In Gruppen und Körpern gelten viele Rechengesetze, die wir von den reellen Zahlen bereits aus der Schulzeit kennen (sollten). Wir werden einige dieser Regeln beweisen. Im Folgenden sei (K, +, ·) stets ein beliebiger Körper, K∗ := K\{0}. Wem dies zu abstrakt ist, darf sich unter K die rationalen oder besser die reellen Zahlen vorstellen. Satz 1.1 (Kürzungsregel) Seien a, b, x ∈ K, c, d, y ∈ K∗ beliebig. Dann gelten 1) 2) a+x=b+x cy = dy =⇒ =⇒ a=b c=d Beweis: 1): a = a + 0 = a + (x + (−x)) = (a + x) + (−x) = (b + x) + (−x) = b + (x + (−x)) = b + 0 = b. Der Beweis zu 2) verläuft analog (Übung!). Mit Hilfe der Kürzungsregel können wir weitere einfache Aussagen beweisen. Satz 1.2 Seien a, b ∈ K, c ∈ K∗ beliebig. Dann gelten 1) 2) 3) 4) 0·a −(−a) a · (−b) (−a)(−b) = = = = 0 a, (c−1 )−1 = c (−a) · b = −ab ab Beweis: 1): 0a + 0 = 0a = (0 + 0)a = 0a + 0a =⇒ 0 = 0a 2): (−a) + a = a + (−a) = 0 = (−a) + (−(−a)) =⇒ Behauptung 3): a(−b) + ab = a((−b) + b) = a · 0 = 0 · a = 0 =⇒ a(−b) = −ab Die fehlenden Beweisteile werden eventuell in den Übungen erledigt. Zur Erinnerung: −x ist das additiv inverse Element zu x ∈ K und hat zunächst nichts mit positiv oder negativ zu tun. Andererseits gibt es reelle Zahlen, die wir in der Schule als positiv bezeichnet haben, ferner haben wir gelernt, Zahlen der Größe nach zu vergleichen. 22 2 Def 1.3 ZAHLEN (Anordnungsaxiome) Ein Körper (K, +, ·) heißt angeordnet : ⇐⇒ Es existiert eine Relation < auf K mit (A1) ∀ (a, b) ∈ K × K gilt genau eine der Möglichkeiten a < b ∨ a = b ∨ b < a (A2) a < b ∧ b < c =⇒ a < c (A3) a < b =⇒ a + c < b + c (A4) a < b ∧ 0 < c =⇒ ac < bc ∀ a, b, c ∈ K ∀ a, b, c ∈ K ∀ a, b, c ∈ K In (A2) wird die Transitivität gefordert. Gilt a < b oder a = b, schreibt man auch a ≤ b. An Stelle von a < b, a ≤ b werden wir auch b > a, b ≥ a verwenden. Beispiel : Die rationalen Zahlen und die reellen Zahlen bilden jeweils angeordnete Körper. Später werden wir sehen, dass die komplexen Zahlen einen Körper bilden, der nicht angeordnet werden kann. Wir wollen einige Rechenregeln für Ungleichungen in angeordneten Körpern beweisen. Da die Multiplikation kommutativ ist, schreiben wir statt b−1 auch 1b . In diesem Sinne ist ab−1 = ab = b−1 a. Satz 1.3 Sei (K, +, ·) ein angeordneter Körper, seien a, b, c, d ∈ K. Dann gelten 1) 2) 3) 4) a<b ∧ c<d a<b ∧ c<0 0<1 0<a<b =⇒ =⇒ a+c<b+d ac > bc =⇒ 0< 1 b < 1 a Beweis: 1): Aus Axiom (A3) folgt a + c < b + c und c + b < d + b, mit (K2) und (A2) folgt dann die Behauptung a + c < b + d. 2): Für c < 0 ist wegen c + (−c) < 0 + (−c) 0 < −c. Wenn wir (A4) auf a < b anwenden, erhalten wir a(−c) < b(−c). Dies ist nach 3) aus Satz 1.2 gleichbedeutend mit −ac < −bc. Addiert man auf beiden Seiten ac + bc, folgt die Behauptung aus (A3) und den Körperaxiomen. 3): Nach (A1) und (K4) wissen wir, dass 0 < 1 oder 1 < 0 gelten muss. Wäre 1 < 0, so würde aus 2) sofort auch 1 = 1 · 1 > 0 · 1 = 0 folgen, ein Widerspruch. 4): Beweis als Übung. In den folgenden Sätzen und Definitionen sei (K, +, ·) stets ein angeordneter Körper und a, b, c, d ∈ K. Ohne Beweis geben wir einige Regeln für ≤ an: Satz 1.4 1) 2) 3) 4) a≤b a≤b a≤b a≤b Def 1.4 ∧ ∧ ∧ ∧ |a| := b≤c c≤d c>0 c<0 a −a =⇒ =⇒ =⇒ =⇒ falls falls a≤c a+c≤b+d ac ≤ bc ac ≥ bc a≥0 a<0 heißt der (Absolut)betrag von a. Beispiel : | − 5| = −(−5) = 5. Spätestens jetzt ist klar, dass −x nicht automatisch eine negative Zahl ist! 1 Die Körper R und Q Satz 1.5 23 1) 2) Es gilt stets |a| ≥ 0 und es ist |a| = 0 ⇐⇒ a = 0 |a b| = |a| |b| 3) 4) 5) | ab | = |a| falls b 6= 0 |b| |a + b| ≤ |a| + |b| (sogenannte Dreiecksungleichung) |a − b| ≥ |a| − |b| Beweis: 1): Für a > 0 ist |a| = a, für a < 0 ist |a| = −a > 0. 2): Wir führen eine Fallunterscheidung durch: a, b ≥ 0 a ≥ 0, b < 0 a < 0, b ≥ 0 a, b < 0 3): Es ist a = a b =⇒ =⇒ =⇒ =⇒ ab ≥ 0 ab ≤ 0 ab ≤ 0 ab > 0 =⇒ =⇒ =⇒ =⇒ |ab| = ab = |a| |b| |ab| = −ab = a(−b) = |a| |b| |ab| = −ab = (−a)b = |a| |b| |ab| = ab = (−a)(−b) = |a| |b| · b, also |a| = | ab b| = | ab | |b| =⇒ Behauptung 4): Für x ∈ K gilt stets x ≤ |x| und −x ≤ |x|. Damit folgt a + b ≤ |a| + |b| und −(a + b) = (−a) + (−b) ≤ |a| + |b|. Es gibt zwei Möglichkeiten: a + b ≥ 0 =⇒ |a + b| = a + b ≤ |a| + |b| und a + b < 0 =⇒ |a + b| = −(a + b) ≤ |a| + |b| 5): |a| = |b + a − b| ≤ |b| + |a − b| =⇒ Behauptung Mit Hilfe vollständiger Induktion kann man die Dreiecksungleichung 4) auf n Summanden ausdehnen. Mit den bisherigen Voraussetzungen gilt: n n P ai ≤ P |ai |, Satz 1.6 für ai ∈ K i=1 i=1 Alle Aussagen und Definitionen in diesem Abschnitt galten bisher gleichermaßen für R und für Q. Dies wird sich nun ändern! Def 1.5 (Vollständigkeitsaxiom) Ein angeordneter Körper (K, +, ·) heißt vollständig : ⇐⇒ Seien A, B ⊆ K nicht leer und es gelte a < b ∀ a ∈ A, b ∈ B. Dann existiert (mindestens) ein c ∈ K mit a ≤ c ≤ b ∀ a ∈ A, b ∈ B. Jetzt haben wir unser Ziel erreicht, die reellen Zahlen sind eindeutig durch Axiome festgelegt: Die reellen Zahlen bilden den einzigen vollständig angeordneten Körper. Stellt man sich R auf einer Zahlengeraden in der üblichen Weise vor, besagt das Vollständigkeitsaxiom anschaulich, dass man zwischen jeder linken“ ” Menge A und rechten“ Menge B mindestens eine reelle Zahl c finden kann (die zu A oder B gehören ” darf), die die Mengen A und B im obigen Sinn trennt“. Manchmal wird dieses Axiom deshalb auch ” Schnittaxiom genannt. Ohne Beweis geben wir eine weitere wichtige Eigenschaft der reellen Zahlen an: ∀r∈R ∃n∈N : 0 ≤ |r| < n Wegen Teil 4) von Satz 1.3 gilt dann auch Mit Hilfe dieser Tatsache zeigen wir Satz 1.7 Q ist nicht vollständig. ∀ r ∈ R∗ ∃n∈N : 0< 1 n < |r|. 24 2 ZAHLEN √ √ Beweis: Sei A := {a ∈ Q | a < 2} und B := {b ∈ Q | b > 2}. Wäre Q √ vollständig, müsste es eine rationale Zahl q geben mit a ≤ q ≤ b für alle a ∈ A und b ∈ B. Wegen 2 6∈ Q ist Q = A ∪ B. Das gesuchte q muss in A oder in B liegen. √ √ 1. Fall: q ∈ A, also 2 − q > 0. Wie oben gesagt, gibt es eine natürliche Zahl n mit 0 < n1 < 2 − q =⇒ √ q + n1 < 2 =⇒ q < q + n1 ∈ A, Widerspruch. √ √ √ 1 1 1 2. Fall: q ∈ B =⇒ q − 2 > 0 =⇒ ∃ m ∈ N : 0 < m < q − 2 =⇒ 2 < q − m < q. Da q − m ∈ B, ist auch dies nicht möglich. Also ist das Vollständigkeitsaxiom für die rationalen Zahlen nicht erfüllt. 2 Einige ordnungstheoretische Begriffe Dieser Abschnitt handelt vornehmlich von Maxima, Minima, Suprema und Infima. Wir werden zum ersten Mal dem griechischen Buchstaben ε begegnen, der besonders im dritten Semester eine große Rolle spielen wird. M sei stets eine Teilmenge der reellen Zahlen. Def 2.1 1) k ∈ R heißt obere Schranke von M : ⇐⇒ m ≤ k ∀m ∈ M M heißt nach oben beschränkt, falls M eine obere Schranke besitzt. 2) k ∈ R heißt untere Schranke von M : ⇐⇒ k ≤ m ∀m ∈ M M heißt nach unten beschränkt, falls M eine untere Schranke besitzt. 3) M heißt beschränkt, falls M nach unten und nach oben beschränkt ist. Beispiele : 1) {1,2,3} besitzt – neben unendlich vielen anderen – die unteren Schranken −11, 0 oder 1 und die oberen Schranken 3, π oder 50 300. 2) Q ⊆ R ist nach unten und oben unbeschränkt. 3) R+ := {r ∈ R | r > 0} besitzt unendlich viele untere, aber keine obere Schranke und ist deshalb nicht beschränkt. 4) a und b sind Schranken der Intervalle ]a, b[ := {r ∈ R | a < r < b}, [a, b] := {r ∈ R | a ≤ r ≤ b} und [a, b[, ]a, b]. 5) Frage : Welche Schranken hat {q ∈ Q | q 2 < 2}? Def 2.2 1) k ∈ R heißt Maximum von M , geschrieben k = max M : ⇐⇒ k ∈ M ∧ k ist obere Schranke. 2) k ∈ R heißt Minimum von M , geschrieben k = min M : ⇐⇒ k ∈ M ∧ k ist untere Schranke. Wie wir an den Beispielen sehen, besitzt nicht jede Teilmenge von R ein Maximum oder ein Minimum, selbst wenn sie beschränkt ist. Falls Maximum oder Minimum existieren, sind sie eindeutig festgelegt: Angenommen, a und b seien beide Maxima von M =⇒ a ≤ b und b ≤ a =⇒ (a < b oder a = b) und (a > b oder a = b) =⇒ a = b (siehe (A1) von Def. 1.3) Wenn max M existiert, so handelt es sich um die kleinste obere Schranke, analog ist min M die größte untere Schranke. Beispiel : Sei M := { n1 | n ∈ N}. M ist beschränkt mit größter unterer Schranke 0 und kleinster oberer Schranke 1. Während 1 gleichzeitig Maximum ist – also 1 = max M – existiert kein Minimum. 2 Einige ordnungstheoretische Begriffe 25 Größte untere und kleinste obere Schranken interessieren auch, falls sie nicht zu der betreffenden Menge gehören. Def 2.3 1) s ∈ R heißt Supremum von M , geschrieben s = sup M : ⇐⇒ s ist kleinste obere Schranke. 2) t ∈ R heißt Infimum von M , geschrieben t = inf M : ⇐⇒ t ist größte untere Schranke. Beispiel : Für M := { n1 | n ∈ N} ist 1 = max M = sup M und 0 = inf M (Kein Minimum, siehe oben). Wegen s = min{k ∈ R | k ist obere Schranke von M } sind Infimum und analog Supremum – falls existent – eindeutig bestimmt. Wenn Maximum oder Minimum existieren, ist max M = sup M bzw. min M = inf M . Satz 2.1 Sei s eine obere Schranke von M 6= ∅, M ⊆ R. Dann gilt s = sup M ⇐⇒ Beweis: ⇐“: ” ⇒“: ” ∀ε > 0 ∃m ∈ M : s − ε < m Angenommen falsch, also ∃ ε > 0 : s − ε ≥ m ∀ m ∈ M. =⇒ s − ε < s ist obere Schranke =⇒ s 6= sup M , Widerspruch. Sei t ∈ R beliebig mit t < s, also ε := s − t > 0. =⇒ ∃m∈M : t=s−ε<m =⇒ t ist keine obere Schranke =⇒ s = sup M Einen analogen Satz kann man für untere Schranken angeben, dies soll in den Übungen geschehen. Ausdrücke wie ∀ ε > 0 oder ∃ ε > 0 werden Ihnen in der Mathematik mit Sicherheit noch oft begegnen – einigen von Ihnen vielleicht zu oft. Der Buchstabe ε bedeutet für Mathematiker immer eine beliebig kleine positive reelle Zahl. Vielleicht verstehen Sie jetzt den kürzesten Witz, über den nur Mathematiker lachen können: Sei ε ≤ 0. Wie wir gesehen haben, existieren max und min nicht immer für beschränkte Teilmengen von R. Auf Grund der Vollständigkeit von R ist dies für sup und inf anders, es gilt – hier ohne Beweis – Satz 2.2 (Supremumsprinzip für reelle Zahlen) Jede nichtleere nach oben beschränkte Menge besitzt in R ein Supremum. Analog kann man natürlich auch das Infimumsprinzip angeben. Da Q nicht vollständig ist, gelten diese Aussagen nicht, wenn man nur die rationalen Zahlen betrachtet. (Wer kennt ein Gegenbeispiel?) 26 2 3 ZAHLEN Folgen und (Über)abzählbarkeit In einem früheren Kapitel haben wir Abbildungen als spezielle Relationen kennengelernt. Jetzt beschäftigen wir uns mit besonderen Abbildungen. Def. 3.1 Sei M eine beliebige Menge. Eine Abbildung a : N → M oder a : N0 → M heißt eine Folge. Der Funktionswert a(n) wird normalerweise an geschrieben, an ist also das n–te Folgenglied.7 Man schreibt Folgen im Allgemeinen (an )n∈N oder kürzer (an ). Wenn klar ist, welche Folge gemeint ist, reicht auch die Angabe der ersten Folgenglieder a1 , a2 , a3 , . . .. In dieser Vorlesung werden wir uns hauptsächlich mit reellen Folgen beschäftigen, d.h. M = R. Zwei Folgen (an ), (bn ) heißen gleich, wenn alle Folgenglieder übereinstimmen, d.h., wenn an = bn ∀n ∈ N gilt. Frage : Sind die Folgen 1,2,1,2,1,2,. . . und 2,1,2,1,2,1,. . . gleich? Beispiele : 1) 1,2,3,. . . . Gemeint ist die Folge (an ) mit an := n. Es handelt sich um die Folge der natürlichen Zahlen. 2) Für ein fest vorgegebenes q ∈ R sei an := q n . Je nach dem speziellen Wert von q zeigt die Folge unterschiedliches Verhalten: q = 1: 1,1,1,. . . konstante Folge q = −1: -1,1,-1,1,. . . alternierende Folge, das Vorzeichen wechselt ständig. Ferner beschränkt , da kein Glied größer als 1 oder kleiner als −1. q = −2: -2,4,-8,16,. . . ebenfalls alternierend, Folgenglieder werden beliebig groß bzw. klein. 1 1 1 1 q = 21 : Folgenglieder nähern sich beliebig nahe der Zahl 0, erreichen sie jedoch nie. 2 , 4 , 8 , 16 ,. . . 3) Sei a1 := 1, an+1 := an + 1. Diese Folge ist rekursiv definiert: Man gibt das erste Glied bekannt und die Vorschrift, wie die weiteren Glieder zu berechnen sind. Diese Folge kam übrigens bereits unter den anderen Beispielen vor. 4) Sei a1 = a2 := 1, an+2 := an + an+1 . Ebenfalls rekursiv definiert. Diese sogenannte Fibonacci – Folge, benannt nach Leonardo von Pisa (1175 – 1250(?)), kommt an vielen Stellen außerhalb und innerhalb der Mathematik vor. In der Vorlesung werden einige Beispiele hierfür genannt, die hier nicht wiedergegeben werden sollen8 . n 5) Weitere Beispiele: an := 1 + n1 , bn+1 := 12 bn + b2n mit b1 = 2, √ √ cn := 2n1√5 (1 + 5)n − (1 − 5)n . Wir müssen stets den Unterschied zwischen einer Folge (an ) (immer unendlich viele Glieder) und der Menge ihrer Folgenglieder (Wertemenge, kann endlich sein) vor Augen haben. In der ersten Vorlesung haben wir eine Bijektion f : Z → N kennengelernt. Wir wissen inzwischen, dass dann auch f −1 : N → Z bijektiv ist. Wir können somit die ganzen Zahlen als Glieder einer Folge auffassen, wegen der Bijektivität sind die Mengen N und Z gleichmächtig (siehe Def I.4.5). 7 Wenn nicht ausdrücklich etwas anderes gesagt wird, fangen wir mit a1 an. In diesem Zusammenhang soll eventuell von Kaninchenvermehrung, Vorfahren einer Drohne, der Ananasfrucht, Sonnenblumen, einer beliebig langen Treppe und einem zerschnittenen Quadrat die Rede sein. 8 3 Folgen und (Über)abzählbarkeit 27 Def 3.2 Eine beliebige Menge M heißt abzähbar : ⇐⇒ M ist endlich oder es gibt eine bijektive Abbildung von N bzw. N0 nach M . M heißt überabzählbar : ⇐⇒ M ist nicht abzählbar. Unser Wissen aus der ersten Vorlesung können wir jetzt folgendermaßen als Satz formulieren: Satz 3.1 Z ist abzählbar. Für jede unendliche abzählbare Menge M gilt |M | = |N|. Die Menge der Glieder einer beliebigen Folge ist stets abzählbar. Beispiel : Die Menge M = {2, 4, 6, . . .} der geraden natürlichen Zahlen ist abzählbar. Um dies nachzuweisen, müssen wir eine bijektive Abbildung f : N → M angeben; mit anderen Worten: Wir müssen die Elemente von M = {2, 4, 6, . . .} durchnummerieren“. ” n 1 2 3 4 5 6 7 ··· oder f (n) := 2n. f (n) 2 4 6 8 10 12 14 · · · Es gibt also genau so viele ganze wie natürliche Zahlen, obwohl N eine echte Teilmenge von Z ist. Noch überraschender ist die nächste Aussage: Satz 3.2 Q = { pq | p, q ∈ Z, q 6= 0} ist abzählbar. Beweis (nach G. Cantor): Wir zeigen zunächst, dass die Menge Q+ der positiven rationalen Zahlen (d.h. Q+ = {q ∈ Q | q > 0}) abzählbar ist. Wir machen dies mit dem sog. Cantorschen Diagonalverfahren und ordnen die Elemente aus Q+ in dem folgenden Schema an. Wir folgen bei der Nummerierung der Elemente von Q+ (dies entspricht einer Bijektion N → Q+ ) den Pfeilen. Dabei überspringen wir alle Zahlen, die in der Nummerierung schon einmal (in anderer Darstellung) aufgetreten sind. 1 1 ↓ 2 1 % 1 2 2 2 . 1 3 ↓ 2 4 % .. . . 2 6 .. . . . % % 3 6 .. . .. . ··· 6 3 ··· 6 4 ··· 6 5 ··· 6 6 ··· .. . . 5 5 . 4 6 6 2 % 5 4 4 5 ··· . 5 3 4 4 6 1 % % % 3 5 5 1 5 2 4 3 3 4 2 5 1 6 . % → . 4 2 3 3 . . 4 1 % % % 1 5 3 1 3 2 2 3 1 4 ↓ → . % 5 6 .. . .. . Auf diese Art erhält man eine bijektive Abbildung N → Q+ , nämlich q1 = 1, q2 = 12 , q3 = 2, q4 = 3, q5 = 31 , q6 = 14 , . . .. Hieraus kann man dann nach folgendem Schema eine Abzählung aller Elemente von Q gewinnen: 0, q1 , −q1 , q2 , −q2 , q3 , −q3 , . . .. Analog zum letzten Beweis können wir die Abzählbarkeit von Mengen wie Q × Q oder Zn nachweisen. Die endliche Vereinigung von abzählbaren Mengen ist ebenfalls abzählbar. Es gibt aber auch Mengen, die man nicht mehr durchnummerieren kannn. 28 2 ZAHLEN Satz 3.3 R ist überabzählbar. Beweis: Wir zeigen, dass bereits die Menge I aller reeller Zahlen zwischen 0 und 1 nicht mehr abzählbar ist. Wir führen einen Widerspruchsbeweis und nehmen an, dass I doch abzählbar ist. Die Folge r1 , r2 , r3 , . . . sei das Resultat einer möglichen bijektiven Abbildung N → I. Wir stellen die Zahlen r1 , r2 , r3 , . . . als unendliche Dezimalbrüche dar: r1 r2 r3 r4 .. . = = = = 0.s11 s12 s13 s14 s15 0.s21 s22 s23 s24 s25 0.s31 s32 s33 s34 s35 0.s41 s42 s43 s44 s45 ... ... ... ... .. . Allgemein: ri = 0.si1 si2 si3 si4 si5 ... Es bezeichnet sij ∈ {0, 1, 2, . . . , 9} die j-te Stelle der Dezimalbruchdarstellung von ri . Es sei vorausgesetzt, dass in diesen Dezimaldarstellungen nicht alle Ziffern von einer bestimmten Stelle an 9 sind, zum Beispiel schreiben wir 0.2000 . . . anstelle von 0.19999 . . .. Es sei nun r ∈]0, 1[ die Zahl mit der Dezimaldarstellung r = 0.s1 s2 s3 s4 s5 . . ., wobei gelte sii − 1, falls sii ≥ 1 si = 1, falls sii = 0 Es gilt r ∈ I, aber r kommt unter den Zahlen r1 , r2 , . . . garantiert nicht vor, da sich r und ri für jedes i an der i-ten Stelle unterscheiden (i = 1, 2, . . .). Dies ist ein Widerspruch, und Satz 3.3 ist somit bewiesen. Frage : Warum kann man mit dem Beweis von Satz 3.3 nicht analog die Überabzählbarkeit“ von Q ” nachweisen? Aufgrund des letzten Satzes wissen wir, dass es mehr irrationale als rationale Zahlen gibt. Wäre R\Q nämlich abzählbar, müsste auch R = R\Q ∪ Q abzählbar sein. Unmathematisch formuliert können wir sagen, dass bereits die Anzahl der irrationalen Zahlen zwischen 0 und 1 größer ist als die aller rationalen Zahlen. In den Übungen wird die Gleichmächtigkeit von zwei beliebigen echten reellen Intervallen gezeigt. Jedes noch so kleine Intervall enthält also überabzählbar viele reelle Zahlen. Trotzdem ist jede Menge paarweise disjunkter echter Intervalle höchstens abzählbar, da es in jedem Intervall eine rationale Zahl gibt und Q abzählbar ist! Kaum vorstellbar ist ferner, dass man in beliebiger Nähe jeder der überabzählbar vielen reellen Zahlen stets auch unendlich viele rationale Zahlen findet, obwohl es hiervon nur“ abzählbar viele ” gibt! Satz 3.4 Sei r ∈ R beliebig. Dann gilt: ∀ ε > 0 ∃ q ∈ Q : r − ε < q < r + ε Beweis: Wir haben am Ende von §1 festgestellt, dass es zu jeder positiven reellen Zahl, also auch zu 1 1 1 ε > 0, ein m ∈ N gibt mit m < ε. Wir suchen ein q ∈ Q mit q − m ≤r≤q+m , denn dann gilt auch 1 1 r − ε < r − m ≤ q ≤ r + m < r + ε. 1. Fall: r ≥ 0. Zu mr gibt es natürliche Zahlen k mit mr < k: Sei oBdA k die kleinste natürliche Zahl mit dieser Eigenschaft, also es gelte k − 1 ≤ mr < k. 4 Über Z: Teilbarkeit, Primzahlen und Euklidischer Algorithmus Beh. : q := Bew. : q − k m ist die gesuchte rationale k 1 1 m ≤ r < m = q ≤ q + m. 29 Zahl. 2.Fall: r < 0. Dann ist −r > 0, nach dem 1. Fall existiert ein q ∈ Q mit −r − ε < q < −r + ε ⇐⇒ r + ε > −q > r − ε. Also ist −q ∈ Q die gesuchte Zahl. Aufgrund dieser Tatsache sagt man auch, dass die rationalen Zahlen dicht in der Menge der reellen Zahlen liegen. Zum Schluss stellen wir fest, dass es auch verschiedenmächtige überabzählbare Mengen gibt. Satz 3.5 Sei M eine beliebige Menge. Dann gilt |M | = 6 |Pot M |. Beweis: Für endliche Mengen folgt die Behauptung aus Satz I.5.3: |M | = n 6= 2n = |Pot M |. Für unendliche Mengen argumentieren wir indirekt. Angenommen, es gibt eine Bijektion f : M → Pot M , bei der jedem Element x ∈ M eine Teilmenge f (x) ⊂ M zugeordnet wird. Wir interessieren uns für diejenigen x ∈ M , die nicht in ihrem Bild f (x) liegen. Sei A := {x ∈ M | x 6∈ f (x)} ⊆ M . Da f nach Annahme bijektiv ist, hat auch die Menge A ein Urbild a ∈ M . Wir untersuchen, ob a in A liegt. 1. Fall a ∈ A: Geht nicht wegen a ∈ A = f (a) =⇒ a 6∈ A 2. Fall a 6∈ A: Geht nicht wegen a 6∈ A = f (a) =⇒ a ∈ A Damit ist die Annahme der Existenz einer Bijektion zwischen M und ihrer Potenzmenge ad absurdum geführt, diese Mengen sind nicht gleichmächtig. Dieser Beweis erinnert an das Dilemma des Friseurs, der genau die Personen rasieren soll, die sich nicht selbst rasieren! 4 Über Z: Teilbarkeit, Primzahlen und Euklidischer Algorithmus In diesem Abschnitt sollen einige Dinge, die wir bisher als Schulwissen“ bezeichnet haben, näher unter” sucht werden. Mit kleinen lateinischen Buchstaben sind stets ganze Zahlen gemeint. Def 4.1 Man nennt a einen Teiler von b : ⇐⇒ ∃ c ∈ Z : b = c · a (a, b, c ∈ Z). Ist a ein Teiler von b so sagt man auch a teilt b, geschrieben a | b. a - b bedeutet, dass a kein Teiler von b ist. Beispiel : 5 | 15, 5 - −7 Einige Eigenschaften der Teilbarkeitsbeziehung | sind: Satz 4.1 (1) Gilt a | b und b | c, dann auch a | c. (2) Aus a1 | b1 und a2 | b2 folgt a1 · a2 | b1 · b2 . (3) Aus c · a | c · b mit c 6= 0 folgt a | b. (4) Aus a | b1 und a | b2 folgt a | c1 · b1 + c2 · b2 für beliebige ganze Zahlen c1 , c2 . Von der Richtigkeit der Aussagen (1) – (4) kann man sich leicht überzeugen; (1) sieht man beispielsweise so ein: a | b bedeutet, dass b = d · a für ein d ∈ Z gilt; b | c bedeutet, dass c = e · b für ein e ∈ Z gilt. Durch Einsetzen erhält man c = e · d · a; also gilt a | c. 30 2 ZAHLEN Die sogenannten trivialen Teiler jeder ganzen Zahl a sind 1, −1, a und −a. Def 4.2 Eine natürliche Zahl n ≥ 2 heißt Primzahl, wenn n nur die trivialen Teiler 1, −1, n und −n besitzt. Ist n ≥ 2 eine natürliche Zahl und ist p eine Primzahl, für die p | n gilt, so heißt p ein Primteiler von n. Jede natürliche Zahl n ≥ 2 besitzt mindestens einen Primteiler, da die kleinste natürliche Zahl p ≥ 2, die n teilt, ein solcher Primteiler ist. Die ersten zwölf Primzahlen sind 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, eine etwas größere Primzahl ist 845 100 400 152 152 934 331 135 470 251. Wieviele Primzahlen gibt es insgesamt? Schon seit langem ist die Antwort bekannt: Satz 4.2 (Euklid , um 300 v.Chr.) Es gibt unendlich viele Primzahlen. Beweis: Wir nehmen an, es gibt nur endlich viele Primzahlen p1 , p2 , . . . , pn , und führen dies zum Widerspruch. Sei a = p1 · p2 · . . . · pn . Die Zahl a + 1 hat (wie jede natürliche Zahl ≥ 2) einen Primteiler p. Da p1 , p2 , . . . , pn nach unserer Annahme die einzigen Primzahlen sind, muss p = pi für ein i gelten, d.h. pi | a + 1. Wegen a = p1 · p2 · . . . · pn gilt pi | a. Es ist aber unmöglich, dass pi sowohl a + 1 als auch a teilt. Damit haben wir aus unserer Annahme, es gebe nur endlich viele Primzahlen, einen Widerspruch hergeleitet. Leider ist dies ein reiner Existenzbeweis: Wir wissen zwar, dass es unendlich viele Primzahlen gibt, Satz und Beweis helfen aber nicht weiter, wenn wir eine konkrete Primzahl suchen. Primzahlen gehören zu den willkürlichsten Objekten in der Mathematik. So schreibt der bekannte Mathematiker D. Zagier : Sie ” wachsen wie Unkraut unter den natürlichen Zahlen, scheinbar keinem anderen Gesetz als dem Zufall unterworfen, und kein Mensch kann voraussagen, wo wieder eine sprießen wird, noch einer Zahl ansehen, ob sie prim ist oder nicht“.9 Vor dem Einsatz elektronischer Rechenanlagen vor rund 50 Jahren war die größte bekannte Primzahl 2127 − 1, bestehend aus 39 Ziffern, gefunden im Jahr 1876. Erst 75 Jahre später wurde sie übertroffen. Beim Schreiben dieser Zeilen (August 2004) ist die größte bekannte Primzahl 224036583 − 1. Sie wurde erst in diesem Jahr entdeckt und besteht aus 7 235 733 Ziffern. Der Exponent 24 036 583 ist übrigens selbst eine Primzahl. Primzahlen dieser Gestalt 2p − 1 heißen Mersennesche Primzahlen, für p = 2, 3, 5 erhält man so die Primzahlen 3, 7, 31. Frage : Was ist für p = 7, 11? Ohne Beweis merken wir uns folgenden grundlegenden Satz über die Existenz und Eindeutigkeit der Primfaktorzerlegung: Satz 4.3 Jede natürliche Zahl n ≥ 2 ist bis auf die Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellbar: n = p 1 · p2 · . . . · p m (m ≥ 1) Hierbei sind die Primfaktoren p1 , p2 , . . . , pm in der Regel nicht alle verschieden. 9 Zitat entnommen aus D. Zagier: Die ersten 50 Millionen Primzahlen, Basel 1977 4 Über Z: Teilbarkeit, Primzahlen und Euklidischer Algorithmus Beispiel : 6600 = 2 · 2 · 2 · 3 · 5 · 5 · 11, 31 126 = 2 · 3 · 3 · 7 Zur besseren Übersicht fasst man gleiche Faktoren zusammen: 6600 = 23 · 3 · 52 · 11, 126 = 2 · 32 · 7. Das Ergebnis von Satz 4.3 lautet somit: n = pα1 1 · pα2 2 · . . . · pαs s Hierbei sind die pi verschiedene Primzahlen (α1 , . . . , αs ∈ N). Wir wollen uns nun mit den Begriffen größter gemeinsamer Teiler (ggT) und kleinstes gemeinsames Vielfaches (kgV) beschäftigen. Gilt c | a und c | b, so heißt c ein gemeinsamer Teiler von a und b. Als eine Folgerung aus Satz 4.3 lässt sich zeigen: Zu je zwei natürlichen Zahlen a, b gibt es immer einen gemeinsamen Teiler t ∈ N derart, dass für jeden gemeinsamen Teiler d von a und b gilt: d | t. Man nennt t den größten gemeinsamen Teiler von a und b (Zeichen: ggT(a, b)). Ist die Primfaktorzerlegung von a und b gegeben, so kann man den ggT(a, b) leicht bestimmen. Beispiel : a = 24 · 3 · 52 · 7 · 134 , b = 22 · 5 · 72 · 133 · 17 · 23, ggT(a, b) =22 · 5 · 7 · 133 . Gilt a | c und b | c, so heißt c ein gemeinsames Vielfaches von a und b. Ebenfalls als Folgerung aus Satz 4.3 erhält man: Zu je zwei natürlichen Zahlen a, b gibt es immer ein gemeinsames Vielfaches v ∈ N derart, dass für jedes andere gemeinsame Vielfache w von a und b gilt: v | w. Man nennt v das kleinste gemeinsame Vielfache von a und b (Zeichen: kgV(a, b)). Beispiel : Für a und b wie vorhin ist kgV(a, b) = 24 · 3 · 52 · 72 · 134 · 17 · 23. Es gilt allgemein ggT(a, b) · kgV(a, b) = a · b (∗) Sind a und b gegeben, so genügt es, ggT(a, b) zu berechnen, kgV(a, b) kann dann aus (∗) bestimmt werden. Wir kommen zum Euklidischen Algorithmus, mit dem man für m, n ∈ N den größten gemeinsamen Teiler ggT(m, n) berechnen kann. Hierzu benötigen wir die folgende Feststellung über die Division mit Rest“: ” Satz 4.4 Zu m, n ∈ N gibt es immer eindeutig bestimmte Zahlen q, r ∈ Z mit 0 ≤ r < n, so dass m = q · n + r gilt. (Man nennt q den Quotienten und r den Rest.) Beweis: 1. Existenz : Sei q := max{z ∈ Z | z ≤ m n} =: b m n c, also q ≤ m n < q + 1. Damit ist nq ≤ m < nq + n ⇐⇒ 0 ≤ m − nq < n. Für r := m − nq folgt 0 ≤ r < n und m = nq + r. 2. Eindeutigkeit : Sei m = nq 0 + r0 mit q 0 , r0 ∈ Z und 0 ≤ r0 < n, also 0 geht nur für q 0 = b m n c = q, und damit ist auch r = m − nq = r. m n = q0 + r0 n mit 0 ≤ r0 n < 1. Dies Beispiel : m = 27, n = 12: Es ist 27 = 2 · 12 + 3, d.h. q = 2 und r = 3. Dem Euklidischen Algorithmus liegt die folgende einfache Beobachtung zu Grunde: Satz 4.5 Sei m = q · n + r (0 ≤ r < n), so folgt ggT(m, n) = ggT(n, r). Beweis: Es gelte m = q · n + r. Ist t ein gemeinsamer Teiler von n und r, so auf Grund von Satz 4.1 (4) auch von m und n. 32 2 ZAHLEN Ist umgekehrt t ein gemeinsamer Teiler von m und n, so ist wegen r = m − q · n gemäß (4) t auch ein gemeinsamer Teiler von n und r. Die Menge der gemeinsamen Teiler von n und r ist gleich der Menge der gemeinsamen Teiler von m und n; insbesondere gilt ggT(n, r) = ggT(m, n). Es folgt ein Kochrezept zur Anwendung des Euklidischen Algorithmus, es sei oBdA m ≥ n: 1. Teile m durch n und bestimme den Rest r (d.h. bestimme r, so dass gilt m = q · n + r, wobei q, r ∈ Z, 0 ≤ r < n). 2. Im Fall r = 0 ist man fertig, n ist der gesuchte Wert. 3. Andernfalls setze man m := n, n := r und gehe nach 1. Bestimme r mit m = q · n + r, wobei q, r ∈ Z, 0 ≤ r < n Beispiel : m = 816, n = 294: 816 294 228 66 30 = = = = = m := n, n := r @ r = 0@ @ @ Nein Ja 2 · 294 + 228 1 · 228 + 66 3 · 66 + 30 2 · 30 + 6 5·6+0 ⇒ ggT(816, 294) = 6 Der Algorithmus endet nach endlich vielen Schritten, da bei jeder Ausführung der Anweisung n := r der Wert von n verkleinert wird. Dass der Euklidische Algorithmus tatsächlich den ggT(m, n) berechnet, lässt sich wie folgt einsehen: Ist r > 0, so wird in 3. die Anweisung m := n, n := r ausgeführt und anschließend nach 1. gegangen. Dies bedeutet, dass man die Aufgabe, den ggT(m, n) zu berechnen, durch die Aufgabe, den ggT(n, r) zu berechnen, ersetzt hat; wegen Satz 4.5 gilt aber ggT(m, n) = ggT(n, r). Ist r = 0, so gilt m = q · n, d.h. n ist ein Teiler von m; also ist in diesem Fall n der größte gemeinsame Teiler von m und n. 5 Teilbarkeitskriterien und g–adische Darstellung Zunächst sollen aus der Schule bekannte Teilbarkeitsregeln bewiesen werden, dann werden wir uns mit anderen Zahlsystemen als dem Dezimalsystem beschäftigen. Beispiel : Ist 26 333 384 durch 7, 8, 9 oder 11 teilbar? Im vorherigen Kapitel haben wir für Teilbarkeit unter anderen folgende Eigenschaft angegeben (hier in Kurzform wiedergegeben): a | b und a | c =⇒ a | (αb + βc) (∗) Bevor wir mit den Kriterien beginnen, rufen wir uns ins Gedächtnis, dass beispielsweise n = 123 = 1 · 102 + 2 · 101 + 3 · 100 bedeutet. 5 Teilbarkeitskriterien und g–adische Darstellung Satz 5.1 Sei n = r P 33 ai · 10i mit ai ∈ {0, 1, 2, . . . , 9} und r ∈ N. Dann ist i=0 (1) 2|n ⇐⇒ 2 | a0 (2) 4|n ⇐⇒ 4 | (10a1 + a0 ) (3) 8|n ⇐⇒ 8 | (100a2 + 10a1 + a0 ) (4) 5|n ⇐⇒ 5 | a0 Beweis: (1) Für bi ∈ {0, 1, 2, . . . , 9} und r ∈ N folgt wegen 2 | 10 aus (∗) 2| r P bi · 10i . i=1 r P ⇒“: Wir wenden (∗) auf 2 | n und 2 | ai · ” i=1 r P 10i ⇐“: Wir wenden (∗) auf 2 | a0 und 2 | ai · ” i=1 an und erhalten 2 | n− r P ai · 10i = a0 . i=1 10i an und erhalten 2 | a0 + r P ai · 10i =n . i=1 Die Beweise zu (2) – (4) verlaufen analog, man beachte nur 2i | 10i für alle i ∈ N (Übung). Um Teilbarkeitsregeln für 3, 9 und 11 angeben zu können, führen wir eine Hilfsbetrachtung durch. Satz 5.2 Für n ∈ N gilt (1) 3 | (10n − 1) (2) 9 | (10n − 1) (3) 11 | (10n − (−1)n ) Beweis durch vollständige Induktion: Zu (1): n = 1: Es gilt 3 | 9. n 7→ n + 1: Sei 10n − 1 = a · 3, dann ist 10n+1 − 1 = 10 · 10n − 1 = 10 · (10n − 1) + 10 − 1 = 10 · a · 3 + 9 = (10 · a + 3) · 3. ( Oder 10n+1 − 1 = (9 + 1) · 10n − 1 = 9 · 10n + 10n − 1 = 3 · (3 · 10n ) + a · 3 = (3 · 10n + a) · 3 ). Zu (2): Eine fast wörtliche Übertragung des Beweises von (1), einfache Übung. Zu (3): n = 1: Es gilt 11 | 11. n 7→ n + 1: Sei 10n − (−1)n = a · 11, dann ist 10n+1 − (−1)n+1 = 10 · (10n − (−1)n ) + 10 · (−1)n − (−1)n+1 = 10 · a · 11 + (−1)n · 11 = b · 11 Jetzt können wir die bekannten Quersummenregeln für 3 und 9 und die weniger bekannte alternierende Quersummenregel für 11 beweisen: Satz 5.3 Sei n = r P ai · 10i mit ai ∈ {0, 1, 2, . . . , 9} und r ∈ N. Dann ist i=0 (1) (2) (3) 3|n 9|n 11 | n ⇐⇒ ⇐⇒ ⇐⇒ 3| r P 9| i=0 r P ai ai i=0 r P 11 | i=0 (−1)i · ai 34 2 ZAHLEN r P ai · 10i . Da 3 nach Satz 5.2 und (∗) Beweis: (1): ⇒“: Nach Voraussetzung ist 3 ein Teiler von n = ” i=0 r P auch ein Teiler von ai · 10i − 1 ist, folgt aus (∗) i=1 3| n− r X ai · (10i − 1) = i=1 r X ! ai i=0 r r P P ai an und erhalten ai · 10i − 1 und 3 | ⇐“: Wir wenden (∗) auf 3 | ” i=0 i=1 3| r X ai · (10i − 1) + i=1 r X i=0 ai = r X ! ai · 10i + a0 = n i=1 Mit den analogen Beweisen von (2) und (3) beschäftigen wir uns in den Übungen. Auch für 7 kann man ein Teilbarkeitskriterium angeben. Wir verzichten auf die formale Wiedergabe der Beweise und geben nur die Ergebnisse an: Satz 5.4 Für n ∈ N gilt 7 | 103n − (−1)n Diesen Satz beweist man wie Satz 5.2 durch vollständige Induktion. Um die Aussage des folgenden Teilbarkeitskriteriums für 7 zu verstehen, muss man sich die Bedeutung von b 3r c (kam im Beweis von Satz 4.4 vor) ins Gedächtnis zurückrufen. r P Satz 5.5 Sei n = ai · 10i mit ai ∈ {0, 1, 2, . . . , 9} und r ∈ N. Dann ist i=0 r 7|n ⇐⇒ 7| b3c X (−1)i · a3i+2 · 102 + a3i+1 · 10 + a3i i=0 (Falls nötig, setze man ar+1 = ar+2 = 0) Beispiele : 1) 7 | 12 208: Es ist b 3r c = b 43 c = 1, also 1 P (−1)i · a3i+2 · 102 + a3i+1 · 10 + a3i = (2 · 102 + 0 · 10 + 8) − (0 · 102 + 1 · 10 + 2) = 208 − 12 = 196, i=0 und diese Zahl ist ein Vielfaches von 7. 2) 7 - 1 204 208, denn 208 − 204 + 1 ist kein Vielfaches von 7 3) Frage : Für welche Ziffer x gilt 7 | 23 304 10x ? Teilbarkeitsregeln für 7 können bei der Zuordnung von Wochentagen zu Datumsangaben (wer ist ein Sonntagskind?) nützlich sein. Jetzt können wir die eingangs gestellte Frage nach der Teilbarkeit von n = 26 333 384 durch 7, 8, 9 oder 11 beantworten: 8 | n, denn 384 = 48 · 8 9 - n, denn 2 + 6 + 3 + 3 + 3 + 3 + 8 + 4 = 32 ist kein Vielfaches von 9 5 Teilbarkeitskriterien und g–adische Darstellung 35 11 | n, denn 4 − 8 + 3 − 3 + 3 − 3 + 6 − 2 = 0 ist ohne Rest durch 11 teilbar 7 | n, denn 384 − 333 + 26 = 77 ist ohne Rest durch 7 teilbar. Bei den Überlegungen zu den Teilbarkeitskriterien haben wir eine Zahlendarstellung mit Hilfe von Zehr r P P ar−i · 10r−i ai · 10i = nerpotenzen benutzt: n = i=0 i=0 Beispiel : n = 345 = 3 · 102 + 4 · 10 + 5 · 100 Diese Darstellung an Hand des Dezimalsystems ist nicht selbstverständlich. In früheren Kulturkreisen (Maya, Babylonier) wurden andere Zahlen als 10 zur Grundzahl von Rechnungen gewählt. Computer rechnen intern mit Zahlen, die aus Zweierpotenzen zusammengesetzt sind. Es gibt also gute Gründe, sich zumindest kurz mit anderen Darstellungen zu beschäftigen und vor allem zu klären, wie man Zahlen in andere Systeme umformen kann. In den folgenden Aussagen bis zum Ende dieses Kapitels steht der Buchstabe g ∈ N\{1} für die verschiedenen Grundzahlen. Zunächst etwas Theorie: Satz 5.6 Sei x eine beliebige reelle Zahl und g ∈ N\{1}. Dann gibt es m ∈ N mit x < g m . Beweis: Wie wir wissen, gibt es zu jeder reellen Zahl eine größere natürliche Zahl, also auch ein n ∈ N x mit n > g−1 . Wir zeigen, dass n die von m verlangte Eigenschaft besitzt: x <n g−1 ⇐⇒ x < n(g − 1) < 1 + n(g − 1) Auf g − 1 können wir die Bernoullische Ungleichung (Satz I.5.6) anwenden und erhalten x < 1 + n(g − 1) ≤ (1 + (g − 1))n = g n Ohne Beweis halten wir fest: Korollar Sei r ∈ N und g ∈ N\{1}. Dann gibt es genau ein n ∈ N0 mit g n ≤ r < g n+1 . Bei den folgenden Aussagen sei Zn := {0, 1, 2, . . . , n − 1}, beispielsweise ist Z4 = {0, 1, 2, 3}. Satz 5.7 Seien r, m ∈ N0 und g ∈ N\{1} mit r < g m+1 . Dann existiert genau ein zm ∈ Zg und genau ein rm ∈ Zgm mit r = zm · g m + rm . Beweis: Da aus Satz 4.4 die eindeutige Existenz von zm , rm ∈ Z und rm < g m folgt, ist nur noch zm ∈ Zg zu zeigen. Dies geschieht indirekt: Angenommen, zm < 0 ⇒ rm = r − zm · g m ≥ g m , Widerspruch zu Satz 4.4. Angenommen, zm ≥ g ⇒ r = zm · g m + rm ≥ g m+1 , Widerspruch zur Voraussetzung. Beispiel : r = 123, g = 5, m = 2 erfüllen die Voraussetzung 123 < 53 . Die eindeutig bestimmten Zahlen z2 und r2 sind 4 bzw. 23: 123 = 4 · 52 + 23. Sehen wir uns Satz 5.7 etwas genauer für den interessanten Fall g m ≤ r < g m+1 mit m > 1 an. Da in der gefundenen Darstellung r = zm · g m + rm auch rm < g m gilt, können wir den Satz erneut anwenden, und 36 2 ZAHLEN zwar auf rm , m − 1 und g. Wir erhalten eindeutig bestimmte Zahlen zm−1 ∈ Zg und rm−1 ∈ Zgm−1 mit rm = zm−1 · g m−1 + rm−1 . Falls m − 1 > 0 ist, können wir das Spiel fortsetzen. Den gleichen Satz auf rm−1 , m − 2, g angewandt ergibt rm−1 = zm−2 · g m−2 + rm−2 mit rm−2 ∈ Zgm−2 , usw. Beispiel (Fortsetzung) : 123 = 4 · 52 + 23, 23 = 4 · 51 + 3, 3 = 3 · 50 + 0 Wir fassen zusammen: Sind r und g gegeben, gibt es genau ein n mit g n ≤ r < g n+1 . Mehrfache n P zn−i · g n−i . Anwendung von Satz 5.7 liefert n + 1 Zahlen zn , zn−1 , . . . , z0 ∈ Zg mit r = i=0 Beispiel (Fortsetzung) : 123 = 4 · 52 + 4 · 51 + 3 · 50 Als Satz formuliert lauten unsere Erkenntnisse Satz 5.8 Sei r ∈ N, n ∈ N0 und g ∈ N\{1} mit g n ≤ r < g n+1 . Dann existieren eindeutig bestimmte Zahlen zi ∈ Zg mit n X r= zn−i · g n−i i=0 Def. 5.1 Sei g ∈ N\{1} und zi ∈ Zg . Dann heißt (zn zn−1 . . . z1 z0 )g := n X zn−i · g n−i = r i=0 die g–adische Darstellung der Zahl r, man setzt außerdem (0)g := 0. Beispiel (Fortsetzung) : 123 = (443)5 Im Fall g = 10, also der bei uns üblichen Dezimaldarstellung von Zahlen, verzichtet man auf die Wiedergabe des unteren Index, Beispiel (1203)10 = 1203. So weit die Theorie, nun zur Praxis! Die Umrechnung vom Dezimalsystem in ein g–adisches System führt man am Einfachsten mit einer Variante des Euklidischen Algorithmus durch. Beispiele : 1) 350 soll in eine 6–adische Zahl umgewandelt werden: 350 : 6 58 : 6 9:6 1:6 =⇒ = = = = 58 9 1 0 Rest Rest Rest Rest 2 4 3 1 ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ 350 58 9 1 = = = = 58 9 1 0 · · · · 6 6 6 6 + + + + 2 4 3 1 350 = 58 · 6 + 2 = (9 · 6 + 4) · 6 + 2 = . . . = 1 · 63 + 3 · 62 + 4 · 61 + 2 · 60 = (1342)6 2) r = 345 = 2 · 53 + 3 · 52 + 4 · 51 + 0 · 50 = (2340)5 . 3) r = 100, g=2: 100 = (? . . .?)2 Die Umrechnung von g–adisch in dezimal ist wesentlich einfacher. Beispiel : (123)7 = 1 · 72 + 2 · 7 + 3 = 66 = (66)10 = (? . . .?)4 Wenn man Zeit und Muße hat, kann man mit jeder Grundzahl g Arithmetik betreiben (Addition, Subtraktion, Multiplikation, Division, . . . ), dies ist weniger schwierig als gewöhnungsbedürftig. Wir wollen uns hier auf ein Beispiel beschränken und verweisen für weitere Rechnungen auf die Übungen. 5 Teilbarkeitskriterien und g–adische Darstellung Beispiel : (203)4 · (33)4 = ?? 37 Wir rechnen schriftlich modulo 4: 2 0 3 · 1 2 2 1 2 2 0 0 3 3 1 2 1 3 1 Damit ist (203)4 · (33)4 = (20031)4 Wir hätten natürlich auch die gegebenen Zahlen in das Zehnersystem umrechnen, sie dort multiplizieren und dann das Ergebnis zurück in das Vierersystem übertragen können. Für Grundzahlen g > 10 erfindet man zur eindeutigen Darstellung weitere Ziffern, zum Beispiel setzt man für g = 11 (diese Grundzahl kommt im Buchhandel vor) Z11 = {0, 1, . . . , 9, X}. Frage : Wie lautet (230)11 im Zwölfersystem? g–adische Darstellung beschränkt sich nicht auf natürliche Zahlen. So wie es10im Dezimalsystem Brüche 2 oder Kommazahlen“ gibt, kann man Ausdrücke wie 5 6 oder (0.21)3 bilden . Wir beschränken uns im ” Wesentlichen auf die Angabe von Kochrezepten“, wie man zu solchen Zahlen kommt. Hierzu ein letzter ” Satz: Satz 5.9 Sei r ∈ [0, 1[⊂ R, g ∈ N\{1}. Dann gibt es für jedes n ∈ N eine eindeutige Darstellung r= n X z−i · g −i + rn · g −n mit z−i ∈ Zg und rn ∈ [0, 1[ i=1 Beweisskizze: Mit Induktion zeigt man n = 1: Für r ∈ [0, 1[ ist 0 ≤ r · g < g und damit r · g = z−1 + r1 mit z−1 ∈ Zg und r1 ∈ [0, 1[, also r = z−1 · g −1 + r1 · g −1 . n P n 7→ n + 1: Sei r = z−i · g −i + rn · g −n mit z−i ∈ Zg und rn ∈ [0, 1[. Dann gilt rn · g −n = (rn · g) · g −(n+1) i=1 mit rn · g < g, also rn · g = z−(n+1) + rn+1 mit z−(n+1) ∈ Zg und rn+1 ∈ [0, 1[. Insgesamt folgt n n n+1 P P P r= z−i · g −i + rn · g −n = z−i · g −i + (z−(n+1) + rn+1 ) · g −(n+1) = z−i · g −i + rn+1 · g −(n+1) . i=1 i=1 i=1 Interessanter als der Beweis ist die Anwendung: Wie kommt man bei beliebigen n ∈ N zu den gesuchten Ziffern z−i ? Die Antwort, die wir nicht formal nachweisen werden, lautet z−1 = br · gc und für i > 1 Beispiel : Gesucht ist die 5–adische Darstellung von 3 50 3 10 1 2 1 2 10 11 · 5 = 0 + · 5 = 1 + · 5 = 2 + · 5 = 2 + 3 10 1 2 1 2 1 2 3 50 z−i = bri−1 · gc. = (0.06)10 : ⇒ z−1 = 0 ⇒ z−2 = 1 ⇒ z−3 = 2 ⇒ z−4 = 2 = z−5 = z−6 = . . . Wir benutzen wie international üblich an Stelle des Kommas einen Punkt. Zur Erinnerung: bxc := max{z ∈ Z | z ≤ x} . 11 38 2 Damit ist 3 50 ZAHLEN = (0.012)5 . Wie bereits gesehen ist die umgekehrte Umwandlung einer gegebenen g–adischen Zahl in das Dezimalsystem einfach zu bewerkstelligen: Beispiel : (0.122)3 = 1 · 3−1 + 2 · 3−2 + 2 · 3−3 = 17 27 Zum Schluss geben wir an, wie man zu einer beliebigen reellen Zahl r eine g–adische Darstellung findet: 1. Fall r ≥ 0: Es gilt r = m + s mit m ∈ N0 und s ∈ [0, 1[. Die g–adische Darstellungen von m und s sind bekannt: m = (zn zn−1 . . . z0 )g , s = (z−1 z−2 . . .)g ⇒ r = (zn zn−1 . . . z0 .z−1 z−2 . . .)g 2. Fall r < 0: Es ist −r = m + s > 0. Wie im ersten Fall folgt r = −(zn zn−1 . . . z0 .z−1 z−2 . . .)g . 6 Elementare Kombinatorik Am Ende dieses Abschnitts können Sie (hoffentlich) folgende Fragen beantworten: Wieviele Möglichkeiten gibt es a) fünf Studierende auf drei Arbeitsgruppen aufzuteilen, wenn jede Arbeitsgruppe aus mindestens einer Person bestehen muss? b) fünf nicht unterscheidbare Bonbons auf drei Kinder aufzuteilen, wenn jedes Kind mindestens ein Bonbon erhalten soll? c) Drei Exemplare eines Lehrbuchs unter fünf Studierende aufzuteilen, wenn kein Studierender mehr als ein Buch benötigt? d) die drei Medaillen (Gold, Silber, Bronze) eines Wettbewerbs unter fünf Nationen aufzuteilen, wenn jede Nation mit drei Sportlern vertreten ist? Wir beginnen mit einer einfachen Überlegung und erinnern an den Begriff kartesisches Produkt aus dem Grundlagenkapitel. Frage : Wieviel verschiedene k–Tupel (b1 , . . . , bk ) ∈ A1 × . . . × Ak gibt es, wenn jede Menge Ai aus ni Elementen besteht ? k Q Antwort : Für jedes bi gibt es ni Wahlmöglichkeiten, also gibt es n1 · n2 · . . . · nk =: ni viele k–Tupel. i=1 Dieses einfache Ergebnis wird auch Multiplikationsregel genannt. Beispiel : 1) A1 = {a, b}, A2 = {b, c, d} =⇒ A1 × A2 = {(a, b), (a, c), (a, d), (b, b), (b, c), (b, d)}, es ist |A1 × A2 | = 2 · 3 = 6. 2) Fridolin darf von seinen sechs Stoffhunden, vier Plüschhasen und fünf Märchenbüchern insgesamt nur drei Dinge mit in den Urlaub nehmen. Wieviele Wahlmöglichkeiten hat Fridolin, wenn er auf jeden Fall drei wesentlich verschiedene Dinge mitnehmen will? Wieviele Wahlmöglichkeiten hat er, wenn ihm nur die Mitnahme von zwei Sachen erlaubt wird? Frage : Wieviele verschiedene k–Tupel kann man aus einer n–elementigen Menge bilden? 6 Elementare Kombinatorik 39 Antwort : Wende die Multiplikationsregel auf n1 = . . . = nk = n an, die gesuchte Anzahl ist k Q n = nk . i=1 Beispiele : 1) Die Anzahl aller möglichen Tripel aus A = {a, b} ist acht. (Man beachte, dass z.B. (a, b, a) 6= (a, a, b) gilt.) 2) Wieviele Bücher kann eine Bibliothek katalogisieren, wenn jedes Buch durch drei Buchstaben und drei Ziffern gekennzeichnet wird? Unsere Frage nach der Anzahl aller k–Tupel einer n–elementigen Menge kann auch als Urnenproblem gedeutet werden: Gegeben sei eine Urne mit n Kugeln, aus der k–mal eine Kugel gezogen wird. • Mit Beachtung der Reihenfolge und mit Zurücklegen gibt es nk viele Möglichkeiten. Bei den bisher untersuchten k–Tupel (b1 , . . . , bk ) war natürlich bi = bj erlaubt. Frage : Wieviele verschiedene k–Tupel kann man aus einer n–elementigen Menge A bilden, wenn in keinem Tupel Elemente mehrfach auftreten dürfen? n! Antwort : Die gesuchte Zahl ist n · (n − 1) · . . . · (n − k + 1) = (n−k)! . Man kann jedes dieser k–Tupel als injektive Abbildung der k–elementigen Menge {1, . . . , k} auf A deuten. Beispiele : 1) Sei A = {a, b, c}. Es gibt genau 3 · 2 = 6 erlaubte 2–Tupel (ohne Wiederholungen). Dem Tupel (a, c) entspricht die injektive Abbildung {1, 2} → {a, b, c} mit 1 7→ a und 2 7→ c. 2) In der Fußballbundesliga gibt es pro Saison 306 Spiele. Dies ist die Zahl aller aus den Mannschaften gebildeten 2–Tupel. Da jeweils Hin– und Rückspiel ausgetragen wird, kommt es auch auf die Reihenfolge der Vereine an. 3) Wieviele (sinnvolle oder sinnlose) Worte mit drei oder vier Buchstaben können aus der Buchstabenmenge {A, B, D, E, G, R, S, T, U } gebildet werden, wenn kein Buchstabe pro Wort mehrfach benutzt werden darf? Als Urnenproblem formuliert lautet unser Ergebnis (n Kugeln, k Ziehungen): • Mit Beachtung der Reihenfolge und ohne Zurücklegen gibt es n! (n−k)! viele Möglichkeiten. Die folgende Definition hätte in diesem Skript auch an anderer Stelle auftauchen können. Def 6.1 Jede Bijektion einer endlichen Menge auf sich heißt Permutation. Weil jeder Permutation eine Anordnung von Elementen einer endlichen Menge in einer beliebigen Reihenfolge entspricht, gibt es n! viele Permutationen einer n–elementigen Menge auf sich. Frage : Wieviele verschiedene k–elementige Teilmengen enthält eine n–elementige Menge? Beispiel : Die zweielementigen Teilmengen von {a, b, c, d} sind {a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}. Es gibt vier dreielementige Teilmengen. 40 2 Allgemeine Antwort : 1) Eine n–elementige Menge besitzt n! (n−k)! ZAHLEN viele k–Tupel (ohne Zurücklegen). 2) Jeweils k! viele k–Tupel gehören zur gleichen k–elementigen Teilmenge (es gibt k! viele Umordungen). n! 3) Die gesuchte Anzahl ist daher (n−k)!k! =: nk . Def 6.2 Seien n, k ∈ N mit n ≥ k. Dann heißt n n! := k k!(n − k)! Binomialkoeffizient n k wird n über k“ gesprochen. Man kann Binomialkoeffizienten auch für n = 0 oder k = 0 berechnen. ” Es ist beispielsweise n0 = 1 (auch für n = 0) und 42 = 6 (siehe vorheriges Beispiel). Wir haben folgenden Satz bewiesen Satz 6.1 Die Anzahl aller k–elementigen Teilmengen einer n–elementigen Menge ist n k . Auch dieser Fall kann im Urnenmodell beschrieben werden: • Ohne Beachtung der Reihenfolge und ohne Zurücklegen gibt es n k viele Möglichkeiten. Beispiel : Will man im Lotto genau x Treffer erzielen (0 ≤ x ≤ 6, ohne Zusatzzahl) und sind a1 , . . . a6 die gezogenen Zahlen, so muss man aus den möglichen 49 6 Kombinationen eine Menge A tippen mit |A ∩ {a1 , . . . , a6 }| = x und |A ∩ ({1, . . . , 49}\{a1 , . . . , a6 })| = 6 − x. 43 6 Hierfür gibt es x6 bzw. 49−6 6−x Möglichkeiten. Nach der Multiplikationsregel sind x · 6−x Kombinationen erfolgreich (von insgesamt 49 6 ). Die Chancen für einen Volltreffer liegen damit bei 1:13 983 816, genau 3 Richtige“ kann man circa in ” einem von 57 Fällen erwarten. Frage : Wie groß ist die Chance für 5 Richtige mit Zusatzzahl“? ” Wir wollen uns etwas intensiver mit Binomialkoeffizienten beschäftigen. Satz 6.2 Für 1 ≤ k ≤ n − 1 gilt n n−1 n−1 = + k k k−1 Beweis: n−1 n−1 + = k k−1 = = (n − 1)! (n − 1)! + k!(n − 1 − k)! (k − 1)!(n − k)! (n − 1)!(n − k) + (n − 1)!k k!(n − k)! n (n − 1)!(n − k + k) = k!(n − k)! k 6 Elementare Kombinatorik Satz 6.3 41 (Binomischer Lehrsatz) n (a + b) = n X n i i=0 an−i bi Beweis: Vollständige Induktion12 n=1: 1 0 (a + b)1 = 1 · a · 1 + 1 · 1 · b = a1 b0 + 1 1 a0 b1 = 1 P i=0 1 i a1−i bi . n 7→ n + 1: (a + b)n+1 = (a + b)n · (a + b) ! n X n n−i i = a b (a + b) i i=0 = n X n i=0 i n+1−i i a b + n X n i=0 i an−i bi+1 n n−1 n n+1 0 X n n+1−i i X n n−i i+1 n 0 n+1 = a b + a b + a b + a b 0 i i n i=1 i=0 n n n + 1 n+1 0 X n n+1−i i X n n 0 n+1 n−(i−1) i−1+1 a b + a b + a b + a b 0 i i−1 n n n + 1 n+1 0 X n n n + 1 0 n+1 n+1−i i a b + + a b + a b 0 i i−1 n+1 = i=1 = i=1 i=1 = n+1 X i=0 n + 1 n+1−i i a b i Beispiele : (a + b)2 = a2 + 2ab + b2 , (a + b)3 = a3 + 3a2 b + 3ab2 + b3 . Das Pascalsche Dreieck liefert eine Anordnung der Binomialkoeffizienten. Man erhält beiden versetzt über nk stehenden Zahlen addiert. n k , indem man die Mit Hilfe der Binomialkoeffizienten können wir Satz I.5.3 ( Sei |M | = n =⇒ |Pot M | = 2n ) auf eine weitere elegante Weise beweisen: Wir sortieren alle Teilmengen von M nach der Anzahl ihrer Elemente. n P n−i i n |Pot M | = n0 + . . . + nn = · 1 = (1 + 1)n = 2n . i ·1 i=0 In unserem Urnenmodell fehlt uns noch eine Formel für den Fall ohne Reihenfolge, mit Zurücklegen. Frage : Wieviele n–Tupel kann man aus Elementen der Menge {a1 , . . . , ar } bilden, wenn jedes Element r P ai genau ni –mal vorkommen soll? Hierbei muss n = ni gelten. i=1 12 Man hätte auch mit n = 0 starten können. 42 2 Beispiele : 1) r = 2, n = 3, n1 = 2, n2 = 1: 2) r = 2, n = 4, n1 = n2 = 2: ZAHLEN 3 Möglichkeiten 6 Möglichkeiten 3) r = 3, n = 3, ni = 1 für i = 1, 2, 3: 6 Möglichkeiten Allgemeine Antwort : Sei (a1 , . . . , a1 , a2 , . . . a2 , . . . . . . , ar ) eine mögliche Lösung. Es gibt insgesamt n! viele Umordnungen dieses n–Tupels. Nichts Neues erhält man hierbei, wenn jeweils die ai untereinander vertauscht werden. Dies ist genau n1 ! · n2 ! · . . . · nr ! mal möglich. Somit ist die gesuchte Anzahl n! n1 ! · . . . · nr ! Beispiele : 1) Gesucht sind alle sinnvollen und sinnlosen Buchstabenkombinationen, die aus den Wörtern a) RAUM, b) KLASSE, c) ANANAS gebildet werden können. 2) Wieviele verschiedene Wahlergebnisse sind möglich, wenn k Wähler zwischen n Parteien (oder Personen) wählen können? (Jeder Wähler habe genau eine Stimme, Stimmenthaltung sei nicht erlaubt.) Lösung : Fassen wir die k Stimmen als k–fache Wiederholung eines Elementes a auf, entspricht jeder mögliche Wahlausgang einer Zuordnung der Art a, . . . , a, t, a, . . . , a, t, . . . . . . , t, a, . . . , a, wobei die a’s zwischen zwei Trennern“ t jeweils die Stimmen für eine Partei wiedergeben. Da es k ” Stimmen gibt und zu n Parteien n − 1 Trenner gehören, existiert zu jedem möglichen Wahlausgang genau ein n + k − 1–Tupel aus Elementen der Menge {a, t}, genauer aus k–fachem Auftreten von a und n − 1–fachem Vorkommen von t. Die gesuchte Anzahl ist also (n + k − 1)! n+k−1 n+k−1 = = k n−1 k!(n − 1)! Zusatzfrage : Wieviele Wahlausgänge sind möglich, wenn Stimmenthaltung erlaubt ist? Wir übertragen die Wahlproblematik auf das Urnenmodell: Jeder der k Wähler zieht eine von n Parteien, wobei es nicht auf die Reihenfolge der Stimmen ankommt. Da Parteien mehrfach gewählt werden können, liegt der Fall mit Zurücklegen vor: • Ohne Beachtung der Reihenfolge und mit Zurücklegen gibt es n+k−1 k viele Möglichkeiten. Jetzt sollte man in der Lage sein, die zu Beginn dieses Abschnitts gestellten Fragen zu beantworten, auch mit anderen Zahlen als 3 und 5. Wir schließen mit einem Beispiel, zu dessen Lösung ein wenig Wahrscheinlichkeitsrechnung benötigt wird. Wie groß ist die Wahrscheinlichkeit, dass die Hörer–Geburtstags–Funktion aus Abschnitt 4 des ersten Kapitels nicht injektiv ist? Wir gehen von n Personen, einem Jahr mit 365 Tagen und der Annahme aus, dass jeder Tag im Jahr als Geburtstag gleich wahrscheinlich ist. Jede Verteilung der Geburtstage entspricht einer Abbildung der Hörer auf die durchnummerierten Tage {1, . . . , 365}. Hiervon gibt es 365n verschiedene, davon sind 365! 365 · . . . · (365 − n + 1) = (365−n)! injektiv. 7 Einiges über die Menge der komplexen Zahlen C 43 Die Wahrscheinlichkeit, dass alle Geburtstage an verschiedenen Tagen liegen, berechnet man aus dem Quotienten der Anzahl der injektiven zu allen Abbildungen. Summiert man alle möglichen Wahrscheinlichkeiten zu 1, ist die gesuchte Zahl 1− 365! (365−n)! 365n Will man eine Prozentangabe, muss man diese Zahl mit 100 multiplizieren. Erstaunlicherweise liegt bereits bei nur 23 Personen die Wahrscheinlichkeit für eine gemeinsame Feier bei über 50 Prozent; ab 57 Personen ist es extrem unwahrscheinlich, dass keine Geburtstage zusammenfallen (Wahrscheinlichkeit unter einem Prozent). 7 Einiges über die Menge der komplexen Zahlen C Zu Beginn dieses zweiten Kapitels wurde der abstrakte Begriff Körper eingeführt. Wir haben als Beispiele den Körper der reellen Zahlen und den der rationalen Zahlen kennengelernt. Jetzt wird ein weiterer wichtiger Körper untersucht. Auch die Menge der komplexen Zahlen C := {a + ib | a, b ∈ R} mit der Festsetzung i2 = −1 (i 6∈ R) bildet einen Körper, wenn man mit der imaginären Einheit i wie mit einer reellen Zahl rechnet. Da die Multiplikation in R kommutativ ist, spielt es für uns keine Rolle, ob die imaginäre Einheit i von rechts oder von links mit einer reellen Zahl (oder mit i) multipliziert wird. (a + ib) + (c + id) = (a + c) + i(b + d) (a + ib) · (c + id) = ac + iad + ibc + i2 bd = (ac − bd) + i(ad + bc). Beispiele : (5 + 2i) − (1 − 7i) = 4 + 9i, (5 + 2i) · (1 − 7i) = 19 − 33i Der Nachweis der Körperaxiome erfordert einige Schreibarbeit, wir geben hier nur die inversen Elemente zu a + ib bezüglich Addition und Multiplikation an: Additiv invers zu z = a + ib ist −z = −a − ib Multiplikativ invers zu z = a + ib 6= 0 und damit a2 + b2 6= 0 ist z −1 = a a2 +b2 b − i a2 +b 2 Wozu werden komplexe Zahlen benötigt? In dem empfehlenswerten Lehrbuch Analysis I schreibt der Autor H. Heuser, dass Geronimo Cardano (1501–1576) bei der Aufgabe, eine Strecke der Länge 10 so in zwei Stücke zu zerlegen, √ dass das aus ihnen gebildete Rechteck die Fläche 40 hat, auf die für ihn absurde Lösung x1,2 = 5 ± −15 kommt und nur durch rein formales Rechnen tatsächlich x1 + x2 = 10 und x1 · x2 = 40 erhält. Der Körper der komplexen Zahlen ist somit der erste Rechenbereich, in dem alle Grundrechenarten uneingeschränkt möglich sind (natürlich bis auf Division durch Null). Beispiel : Es gibt keine natürliche Zahl n mit n + 3 = 2, es gibt keine ganze Zahl z mit z · 3 = 2, es gibt keine rationale Zahl q mit q · q = 2 und es gibt keine reelle Zahl r mit r · r = −1. Sei C := {(a, b) | a, b ∈ R}. Definiert man auf C die komponentenweise Addition und folgende Multiplikation: (a, b) · (c, d) := (ac − bd, ad + bc) 44 2 ZAHLEN erhält man eine weitere Darstellung der komplexen Zahlen. Um dies einzusehen, betrachtet man die Abbildung f : C → C, z = a + ib 7→ (a, b). f ist bijektiv (leicht einzusehen) und strukturerhaltend; denn man kann nachprüfen, dass für alle z1 , z2 ∈ C gilt f (z1 · z2 ) = f (z1 ) · f (z2 ) f (z1 + z2 ) = f (z1 ) + f (z2 ), Alle Körpereigenschaften von C werden so auf C übertragen. Später werden wir für eine bijektive und strukturerhaltende Abbildung den Namen Isomorphismus kennenlernen. Frage : Was sind die Bilder von 1 bzw. i unter f ? Def 7.1 a) Es sei z = a + ib ∈ C. Dann heißt a Realteil von z, b Imaginärteil von z, √ |z| := a2 + b2 absoluter Betrag von z, z̄ := a − ib konjugiert komplexe Zahl zu z. b) Es seien z1 , z2 ∈ C. Dann heißt |z1 − z2 | der Abstand von z1 und z2 . Diese Definition ist in Einklang mit der gewohnten Definition des Abstands zweier Punkte in der Ebene, es gilt nämlich für z1 = x1 + iy1 , z2 = x2 + iy2 : p |z1 − z2 | = |x1 − x2 + i(y1 − y2 )| = (x1 − x2 )2 + (y1 − y2 )2 , und dies ist genau die übliche Abstandsdefinition zweier Punkte (x1 , y1 ), (x2 , y2 ) in der Ebene ( Lehrsatz ” des Pythagoras“). y2 6 y1 s z2 |z1 − z2 | z1s x1 x2 - Wie Sie ganz leicht selbst nachrechnen können, besteht folgender Zusammenhang zwischen z, |z| und z̄: Satz 7.1 Sei z = a + ib ∈ C. Dann ist z · z̄ = a2 + b2 = |z|2 . Damit ist auch klar, dass für jedes z ∈ C das Produkt z · z̄ eine reelle Zahl ist. Für den Quotienten zweier komplexer Zahlen a + ib und c + id 6= 0 gilt: (a + ib)(c − id) a + ib = c + id (c + id)(c − id) = (ac + bd) + i(bc − ad) ac + bd bc − ad = 2 +i 2 . 2 2 2 c +d c +d c + d2 Besser als das Ergebnis auswendig zu lernen ist es, sich den ersten Rechenschritt der Herleitung zu merken: Man erweitert a+ib c+id mit der konjugiert komplexen Zahl des Nenners. Im Nenner steht dann die 2 2 reelle Zahl c + d und man benötigt nur noch eine Multiplikation im Zähler. Beispiel : z = 3+4i 2+3i = (3+4i)(2−3i) (2+3i)(2−3i) = 6−9i+8i+12 4+9 = 18 13 − 1 13 i. 7 Einiges über die Menge der komplexen Zahlen C 45 Wir stellen Rechenregeln für den Übergang zur konjugiert komplexen Zahl zusammen: Satz 7.2 Es seien z1 , z2 ∈ C. Dann gilt: z1 + z2 = z1 + z 2 , z1 − z2 = z1 − z 2 , z1 · z2 = z1 · z 2 , z1 z2 = z1 z2 , z1 = z1 . Beweis: Wir zeigen nur z1 · z2 = z1 · z2 , der Rest sei als einfache Übungsaufgabe empfohlen: z1 · z2 = (a + ib)(c + id) = (ac − bd) + i(ad + bc) = (ac − bd) − i(ad + bc) = ac − (−b)(−d) + i(a(−d) + (−b)c) = (a − ib)(c − id) = z1 · z2 Im folgenden Satz werden ohne Beweis Eigenschaften des absoluten Betrags für komplexe Zahlen genannt. Es sind dieselben Eigenschaften, die wir für reelle Zahlen in Satz 1.5 kennengelernt haben. Satz 7.3 Für alle z1 , z2 ∈ C gilt: 1. |z1 | ≥ 0; |z1 | = 0 gilt genau dann, wenn z1 = 0. 2. 3. |z1 z2 | = |z1 | |z2 | z1 |z1 | z2 = |z2 | (z2 6= 0) 4. |z1 + z2 | ≤ |z1 | + |z2 | 5. |z1 − z2 | ≥ |z1 | − |z2 |. (Dreiecksungleichung) Der Name Dreiecksungleichung hat einen geometrischen Hintergrund, denn in einem Dreieck ist die Summe der Längen zweier Seiten immer mindestens so groß wie die Länge der dritten Seite. Daher findet man die Dreiecksungleichung auch in der Gestalt |z1 − z3 | ≤ |z1 − z2 | + |z2 − z3 | (für alle z1 , z2 , z3 ∈ C) vor. Ebenso wird die Ungleichung | |z1 |−|z2 | | ≤ |z1 −z2 | (für alle z1 , z2 ∈ C) manchmal als Dreiecksungleichung bezeichnet. Wie wir wissen, handelt es sich bei Q und R um angeordnete Körper. Dies gilt für C nicht: Satz 7.4 Es gibt keine Relation auf C, die die Anordnungsaxiome erfüllt. Beweis: Angenommen, < ist eine Relation auf C, die die Anordnungsaxiome erfüllt (Def 1.3). Wir vergleichen die Elemente 0 und i und zeigen, dass beide theoretische Möglichkeiten 0 < i und i < 0 zu einem Widerspruch führen. Als Hilfsmittel benutzen wir Teile des Satzes 1.3: In angeordneten Körpern gilt stets 0 < 1, und aus a < b, c < 0 folgt ac > bc. 1. Fall: Angenommen 0 < i. Dann ist 0 · i < i · i ⇐⇒ 0 < −1. 2. Fall: Angenommen i < 0. Dann ist i · i > 0 · i ⇐⇒ −1 > 0. Stets ist 0 < −1. Da aber auch 0 < 1 gilt, folgt der Widerspruch 0 + 0 < (−1) + 1 = 0. Wir können die komplexen Zahlen als Punkte der Anschauungsebene (Gaußsche Zahlenebene) interpretieren. Hierzu legt man auf die übliche Art ein rechtwinkliges, kartesisches13 Koordinatensystem in der 13 kartesisch“ bedeutet, dass auf beiden Achsen dieselbe Längeneinheit gewählt ist, d.h. der Punkt (1, 0) hat in der ” Zeichnung denselben Abstand vom Ursprung wie der Punkt (0, 1). 46 2 ZAHLEN Zeichenebene zu Grunde. Komplexe Zahlen z = a + ib und Punkte mit den Koordinaten (a, b) entsprechen sich dann umkehrbar eindeutig. Manchmal stellt man eine komplexe Zahl a + ib durch einen Pfeil (Vektor) vom Punkt (0, 0) zum Punkt (a, b) dar. Man nennt die x–Achse reelle Achse und die y–Achse imaginäre Achse. Der Betrag |z| einer komplexen Zahl läßt sich ( Lehrsatz des Pythagoras“) als Abstand ” von z = a + ib vom Punkt (0, 0) veranschaulichen. b 6 * z = a + ib 1 √ 2 2 |z| = a + b 0 1 - a Die Addition komplexer Zahlen lässt sich als Vektoraddition ( Parallelogramm der Kräfte“) veranschau” lichen. Die konjugiert komplexe Zahl z̄ zu z erhält man durch Spiegelung von z an der x–Achse, die negative Zahl −z durch Punktspiegelung am Ursprung: : z1 + z2 = + ib# (a + c) + i(b + d) 6z1 = a # b # # # # # d : # # z2 = c + id # - a z = a + ib 6 @ @ @ c −z = −a − ib R z = a − ib @ Zur zeichnerischen Deutung der Multiplikation komplexer Zahlen holen wir etwas weiter aus. Es sei z = a + ib 6= 0 eine komplexe Zahl, r = |z| sei der Betrag von z, d.h. der Abstand von z zum Koordinatenursprung. Mit ϕ bezeichnen wir den Winkel zwischen der positiven x–Achse und dem Vektor“ z, gemessen im mathematisch positiven Sinn, d.h. entgegen dem Uhrzeigersinn. Wir können ϕ ” in Grad oder im Bogenmaß angeben. Falls Sie es nicht aus Ihrer Schulzeit wissen: Das Bogenmaß eines Winkels α ∈ [0◦ , 360◦ [ ist die Länge des zugehörigen Einheitskreisbogens. Beispiel : Zum Winkel 90◦ gehört das Bogenmaß π 2, welcher Gradzahl gehört zu 2π? Ab jetzt werden wir Winkel weitgehend im Bogenmaß angeben. y 6 z = a + ib * r (Diese Zeichnung wird in der Vorlesung ergänzt.) - x 7 Einiges über die Menge der komplexen Zahlen C Zwischen ϕ, r, a und b besteht der Zusammenhang cos ϕ = ⇒ 47 a r und sin ϕ = rb .14 z = a + ib = r cos ϕ + i r sin ϕ = r(cos ϕ + i sin ϕ) Diese Beziehung gilt für alle a, b ∈ R (nicht beide Null). Beispiele : 1) z = 4 − 3i: Es ist r = 5, cos ϕ = 54 , sin ϕ = − 35 =⇒ ϕ ≈ 323◦ bzw. ϕ ≈ 5.637. √ √ √ √ √ 2) ϕ = 34 π, r = 2 2: Es ist a = r cos ϕ = 2 2 · − 22 = −2 und b = r sin ϕ = 2 2 · 22 = 2, damit ist z = −2 + 2i. Man nennt z = r(cos ϕ + i sin ϕ) die Polarkoordinatendarstellung von z, der Winkel ϕ wird auch das Argument von z genannt. Koordinatenangaben durch Winkelgrößen sind beispielsweise in der Geografie üblich, die Lage eines Ortes wird durch zwei Winkel festgelegt. Beispiel : Berlin hat die Koordinaten 13.4◦ östliche Länge und 52.5◦ nördliche Breite. Da der Einheitskreis in beiden Richtungen auch mehrfach durchlaufen werden kann (Winkel modulo 2π), sind die Winkelfunktionen Sinus und Cosinus für jede reelle Zahl definiert, als Bilder kommen nur Werte aus dem Intervall [−1, 1] in Frage, also sin, cos : R → [−1, 1]. Fragen : Welche der beiden Kurven stellt die Sinusfunktion dar? Ist sie injektiv oder surjektiv? Für alle x ∈ R gilt cos(−x) = cos x, cos(π + x) = − cos x, sin(−x) = − sin x, sin(π + x) = − sin x. In der linearen Algebra werden wir die Additionstheoreme für Sinus und Cosinus beweisen: sin(α + β) = sin α cos β + cos α sin β cos(α + β) = cos α cos β − sin α sin β Zurück zur Multiplikation komplexer Zahlen! Satz 7.5 Es sei z1 = r1 (cos ϕ1 + i sin ϕ1 ) und z2 = r2 (cos ϕ2 + i sin ϕ2 ). Für das Produkt z1 z2 gilt dann: z1 z2 = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )) Beweis: Der Beweis folgt direkt aus den Additionstheoremen. z1 z2 = r1 (cos ϕ1 + i sin ϕ1 ) · r2 (cos ϕ2 + i sin ϕ2 ) = r1 r2 (cos ϕ1 cos ϕ2 − sin ϕ1 sin ϕ2 + i(cos ϕ1 sin ϕ2 + sin ϕ1 cos ϕ2 )) = r1 r2 (cos(ϕ1 + ϕ2 ) + i sin(ϕ1 + ϕ2 )) 14 Wir verzichten auf eine exakte Einführung der Winkelfunktionen und benutzen die in der Schule übliche Definition. 48 2 ZAHLEN Formuliert man das Ergebnis in Worten, so erhält man die geometrische Interpretation der Multiplikation komplexer Zahlen: Bei der Multiplikation komplexer Zahlen werden die Beträge multipliziert und die Winkel addiert. (Siehe Zeichnung: Dort ist |z1 | = 3, |z2 | = 2, also |z1 z2 | = 6.) z1 · z2 ..................... ... ... ... ... ... ... ...... ... ... .. ... ... ... ... ... ....... ... ... .......... ... . .. ... . . ... ... ... ... ... ... .. ... .. . . ... ... ... ................ ........................ ... . ..................... ..... . . ... ....... . . . ... .... . . ... .. ................... ... ... ...... ... ... ........... ... ... ... y z1 z2 ϕ2 −4 −3 −2 −1 1 2 3 4 ....... .. ....... x Wie im Reellen werden in C die Potenzen mit ganzzahligen Exponenten erklärt, für n ∈ N und z ∈ C definiert man z n := z · . . . · z, z −n := z1n (nur für z 6= 0) und z 0 := 1. Satz 7.6: Es sei z ∈ C, z 6= 0, und m ∈ Z. Es gelte z = r(cos ϕ + i sin ϕ). Dann ist z m = rm (cos(mϕ) + i sin(mϕ)). Beweis: Für m = 0 und m = 1 ist die Behauptung klar; m ≥ 2 folgt direkt aus Satz 5. Es sei nun m < 0. Wir setzen n = −m. Dann gilt n ∈ N und es folgt z m = z −n = = r−n 1 zn = 1 r n (cos(nϕ)+i sin(nϕ)) cos(nϕ)−i sin(nϕ) (cos(nϕ)+i sin(nϕ))(cos(nϕ)−i sin(nϕ)) = r−n cos(nϕ)−i sin(nϕ) cos2 (nϕ)+sin2 (nϕ) = r−n (cos(nϕ) − i sin(nϕ)) = rm (cos(−mϕ) − i sin(−mϕ)) = rm (cos(mϕ) + i sin(mϕ)) Mit Hilfe des letzten Satzes können wir alle komplexen Lösungen der Gleichung z n = 1 konstruieren: Man zeichne in den Einheitskreis ein regelmäßiges n–Eck mit einer Ecke in (1, 0). Genau jede der n Ecken liefert uns eine Lösung. Beispiel : n = 4 ⇒ z1 = 1, z2 = i, z3 = −1, z4 = −i. Das Verfahren funktioniert auch bei Gleichungen der Art z n = a + ib. Aufgabe : Sei n ∈ N und z = a + ib ∈ C gegeben, gesucht sind alle zk mit zkn = z. Lösung : Wir suchen zk = rk (cos ϕk + i sin ϕk ) mit zkn = rkn (cos(nϕk ) + i sin(nϕk )) = z = r(cos ϕ + i sin ϕ) √ 1. Alle Lösungen haben die gleiche Länge rk = n r. √ 2. Eine Lösung ist einfach anzugeben: z0 = n r cos ϕn + i sin ϕn . 3. Sämtliche Lösungen sind Ecken eines regelmäßigen n–Ecks, eingezeichnet in den Kreis um den √ Ursprung mit Radius n r und einer Ecke in z0 . √ ϕ 2π 4. Die Lösungen sind zk = n r cos( ϕn + k 2π n ) + i sin( n + k n ) für k = 0, . . . , n − 1. 7 Einiges über die Menge der komplexen Zahlen C 49 √ √ √ Beispiel : z 3 = 2i = 2 cos π2 + i sin π2 . Gemäß 2. ist z0 = 3 2 cos π6 + i sin π6 = 3 2 21 3 + 21 i . √ √ √ 3 π 2π 1 1 ) + i sin( + ) = 2 − Als weitere Lösungen erhält man z1 = 3 2 cos( π6 + 2π 3 6 3 2 3 + 2 i und √ √ 3 π 2π z2 = 3 2 cos( π6 + 2 · 2π 2 · i. ) + i sin( + 2 · ) = − 3 6 3 Man nennt die Gleichung (cos ϕ + i sin ϕ)m = cos(mϕ) + i sin(mϕ), m ∈ Z auch Moivresche Formel. 50 3 1 3 GRUPPEN Gruppen Grundlegendes über Gruppen Bereits zu Beginn des zweiten Kapitels über Zahlen haben wir den Begriff Gruppe erwähnt und einige Beispiele kennengelernt. Jetzt wollen wir unser Wissen vertiefen und systematisieren. Def 1.1 Jede nichtleere Menge G mit einer binären Verknüpfung ∗ : G × G → G heißt Gruppoid, geschrieben (G, ∗). An Stelle von binäre Verknüpfung sagt man auch binäre Operation (auf G). Beispiele : Bei welchen der folgenden Mengen mit den zugehörigen Operationen handelt es sich um Gruppoide? Menge N N N {1} {2} Q+ Operation + − ∗ · + ? √ Hierbei sollen ∗ und ? so definiert sein: n ∗ m := max{4n + 3m, 315}, r ? s := r · s. Bei den Elementen von Gruppoiden muss es sich nicht um Zahlen handeln, auch (Pot M, ∪), (Pot M, ∩) oder (Abb (R, R), ◦) sind Gruppoide (mit ◦ als Verkettung von Abbildungen). Besteht ein Gruppoid nur aus endlich vielen Elementen, können wir alle möglichen Verknüpfungsergebnisse in Form einer Verknüpfungstafel aufschreiben: ◦ a b c ··· a b X c .. . An der Stelle X wird das Ergebnis b ◦ c eingetragen usw. Beispiele : Gesucht sind die Verknüpfungstafeln der Gruppoide (Z4 , ·4 ) und (Z4 , +4 ) ·4 0 1 2 3 0 1 2 3 +4 0 1 2 3 0 1 2 3 Wir werden diese Tafeln in Vorlesung und/oder Übung ergänzen. Für eine endliche Menge G sind zwei Gruppoide (G, ◦) und (G, ∗) verschieden, falls sich die zugehöri2 gen Verknüpfungstafeln an mindestens einer Stelle unterscheiden. Für |G| = n gibt es also n(n ) viele verschiedene Gruppoide – zu jeder Verknüpfungstafel gehören n2 Einträge, für jeden Eintrag gibt es n Möglichkeiten. Da die Gruppoid–Definition recht allgemein ist, sind sehr viele der Beispiele uninteressant. Wir wollen daher nur noch Gruppoide mit zusätzlichen Eigenschaften untersuchen. Wenn die Verknüpfung eindeutig klar ist oder wenn es nicht auf die spezielle Verknüpfung ankommt (wie in einer 1 Grundlegendes über Gruppen 51 Definition oder in einem Satz) werden wir kürzer von einem Gruppoid G reden und die Verknüpfung je nach Laune mit ◦ oder ∗ bezeichnen. Def 1.2 e ∈ G heißt neutrales Element oder Einselement : ⇐⇒ e ◦ x = x ◦ e = x ∀x ∈ G. Beispiele : 1) In (Z, +) ist 0, in (R, ·) ist 1 neutrales Element. 2) In (Z, −) ist 0 nicht neutral, denn es gilt nicht für alle Zahlen 0 − z = z, (setze beispielsweise z = 1). 3) (N, kgV): Hier ist 1 neutrales Element, denn kgV (n, 1) = n = kgV (1, n) für alle n ∈ N. 4) Das Gruppoid (Pot (M ), ∪) hat ∅ als neutrales Element. Satz 1.1 Jedes Gruppoid G hat höchstens ein neutrales Element. Beweis: Angenommen, e1 und e2 sind beide neutrale Elemente von G. Wir untersuchen e1 ∗ e2 : e1 ist neutral, also e1 ∗ e2 = e2 . Da e2 ebenfalls neutral ist, gilt e1 ∗ e2 = e1 . Insgesamt folgt e1 = e2 . Def 1.3 Ein Gruppoid G heißt kommutativ oder abelsch (nach N. H. Abel , 1802–1829) : ⇐⇒ x ∗ y = y ∗ x ∀x, y ∈ G. Beispiele : 1) (N, +) und (R, ·) sind kommutativ, (Z, −) ist nicht kommutativ, denn es ist beispielsweise 1 − 0 6= 0 − 1. 2) ∗ a b c a a b c b b c b c c a b ist nicht abelsch wegen b ∗ c 6= c ∗ b. ( a ist neutrales Element.) Bei endlichen Gruppoiden kann man Kommutativität und Existenz von neutralen Elementen an der Verknüpfungstafel erkennen: – G ist abelsch ⇐⇒ Die Verknüpfungstafel ist symmetrisch bzgl. der Hauptdiagonalen (links oben nach rechts unten). – x ist neutral ⇐⇒ Die Elemente in der zugehörigen Zeile und Spalte stimmen mit der Reihenfolge der Elemente am Rande der Verknüpfungstafel überein. Für den Rest dieses Kapitels sei e stets das neutrale Element. Def 1.4 In einem Gruppoid G mit x, y ∈ G heißt (1) x linksinvers zu y (2) x rechtsinvers zu y : ⇐⇒ : ⇐⇒ x∗y =e y∗x=e (3) x invers zu y oder inverses Element von y : ⇐⇒ x ist rechts– und linksinvers zu y. Wenn x linksinvers zu y ist, ist y gleichzeitig rechtsinvers zu x (und umgekehrt). Wenn x invers zu y ist, schreibt man häufig x = y −1 oder x = −y. Das neutrale Element e ist wegen e ∗ e = e stets selbstinvers. 52 3 GRUPPEN Beispiele : 1) In (Z, +) ist −z zu z invers: z + (−z) = −z + z = 0. Jedes Element hat genau ein Inverses, nur das neutrale Element 0 ist selbstinvers. 2) In (R, ·) mit neutralem Element 1 ist a−1 = und −1 existieren zwei selbstinverse Elemente. 1 a zu a 6= 0 invers, 0 besitzt kein inverses Element. Mit 1 3) Im Gruppoid (N, kgV) besitzt nur das Einselement 1 ein inverses Element (1−1 = 1). 4) Analoges gilt für (Pot (M ), ∪): ∅−1 = ∅, keine andere Teilmenge von M besitzt ein Inverses. 5) Aus der Verknüpfungstafel von Beispiel 2) (nach Def 1.3) mit Einselement a erkennen wir: Wegen b ∗ c = a ist b linksinvers zu c und c rechtsinvers zu b. Da für alle Elemente x stets x ∗ b 6= a und c ∗ x 6= a ist, besitzt b kein Links– und c kein Rechtsinverses. Def 1.5 Ein Gruppoid G heißt Halbgruppe : ⇐⇒ Die Verknüpfung ∗ ist assoziativ, d.h. es gilt x ∗ (y ∗ z) = (x ∗ y) ∗ z für alle x, y, z ∈ G. In Halbgruppen kann man auf das Setzen von Klammern verzichten. Die n–fache Verknüpfung eines Elementes mit sich selbst schreibt man x ∗ · · · ∗ x = xn oder x ∗ · · · ∗ x = nx, beispielsweise in (N, +) 5 + 5 + 5 = 3 · 5 oder in (R, ·) π · π · π · π = π 4 . Beispiele : 1) (N, +), (R, ·), (Pot (M ), ∪) sind Halbgruppen. 2) (Z, −) ist keine Halbgruppe, denn für a 6= 0 ist a − (a − a) = a 6= (a − a) − a = −a. 3) ∗ a b c a c b a b b c a c a a c ist keine Halbgruppe, denn a ∗ (a ∗ b) 6= (a ∗ a) ∗ b. Dieses Gruppoid besitzt kein neutrales Element, ist aber abelsch. Frage : Ist (Pot (M ), ⊕) eine Halbgruppe, A ⊕ B := (A\B) ∪ (B\A) = (A ∪ B)\(A ∩ B))? Satz 1.2 In einer Halbgruppe G mit neutralem Element hat jedes Element höchstens ein Inverses. Beweis: Sei e das neutrale Element. Angenommen, a1 und a2 sind beide invers zu a. ⇒ a1 = a1 ◦ e = a1 ◦ (a ◦ a2 ) = (a1 ◦ a) ◦ a2 = e ◦ a2 = a2 Zur Überprüfung unseres bisherigen Wissens über Gruppoide sehen wir uns ein Mengendiagramm an. Hierbei steht N für die Gruppoide mit neutralem Element, H für Halbgruppe und K für Kommutativität. N K H 1 Grundlegendes über Gruppen 53 Frage : In welche Teilmengen gehören die folgenden Beispiele? 1) ∗ e 4) a b (Z, −) e e a b a a b a 2) b b b a ∗ e 5) a b 7) (Abb ({a, b}, {a, b}), ◦) (N, +) e e a b a a b a 3) b b a a (Z, +) ∗ x 6) y z x z y x y y z x z x x z 8) ({f ∈ Abb ({a, b}, {a, b}) | f nicht bijektiv }, ◦) Die Halbgruppen mit neutralem Element, bei denen jedes Element ein Inverses besitzt, sind besonders interessant. Def 1.6 Eine Halbgruppe G heißt Gruppe : ⇐⇒ (1) (2) G besitzt ein neutrales Element e mit a ◦ e = e ◦ a = a ∀a ∈ G Zu jedem a ∈ G existiert ein Inverses a−1 mit a ◦ a−1 = a−1 ◦ a = e Beispiel : (Z, +) ist eine Gruppe mit neutralem Element 0, zu z ist −z invers. Satz 1.3 In jeder Gruppe existiert genau ein neutrales Element. Zu jedem Element gibt es genau ein inverses Element. Beweis: Die erste Aussage wurde bereits in Satz 1.1 für beliebige Gruppoide bewiesen. Die zweite Behauptung folgt direkt aus der Definition (Existenz) und aus Satz 1.2 (Eindeutigkeit); denn jede Gruppe ist insbesondere eine Halbgruppe mit neutralem Element. Wir fassen zusammen: Ist eine Menge M mit einer Verknüpfung ◦ gegeben und wollen wir wissen, ob (M, ◦) eine Gruppe ist, müssen wir überprüfen: • Ist M = 6 ∅? Dies ist fast immer trivial und wird häufig durch den Nachweis des neutralen Elements (siehe unten) erledigt, darf aber z.B. in Aufgaben nicht vergessen werden! • Ist ◦ eine Verküpfung, d.h. ist ◦ auf M abgeschlossen? • Ist die Verknüpfung assoziativ? • Gibt es ein neutrales Element? • Gibt es zu jedem Element ein Inverses? Einige Gruppen sollte man kennen, wenn man in Prüfungen nicht unangenehm auffallen will: 1) Wichtige Beispiele für Gruppen sind (Z, +), (Q, +), (R, +), (C, +), (Q∗ , ·), (R∗ , ·), (C∗ , ·). 2) Alle bijektiven Abbildungen einer Menge M 6= ∅ auf sich bilden eine Gruppe bezüglich der Verkettung ◦ als Verknüpfung. (◦ ist assoziativ, id ist neutrales Element, zu f ist die Umkehrabbildung f −1 invers.) Mindestens genau so wichtig ist es zu wissen, dass (N, +) und (N0 , +) keine Gruppen sind. Es gibt in N0 zwar ein neutrales Element, nämlich die Zahl 0, aber keine Zahl außer 0 besitzt ein inverses Element; auch (Z∗ , ·) und (Q, ·) sind keine Gruppen (Begründung?) 54 3 GRUPPEN Jede einelementige Menge M = {x} wird durch x ◦ x := x zu einer Gruppe (M, ◦). Gibt es auch für M = {a, b} eine Verknüpfung ◦, so dass (M, ◦) eine Gruppe ist? OBdA sei a das notwendige neutrale Element. In der zugehörigen Verknüpfungstafel sind damit alle Einträge bis auf b ◦ b vorgegeben: ∗ a b a a b b b ? Ferner muss b ein inverses Element besitzen: ∃x ∈ {a, b} : b ◦ x = x ◦ b = a. Dies bedeutet b ◦ b = a. Die Verknüpfungstafel einer Gruppe mit den Elementen a und b kann nur so aussehen: ◦ a b a a b b b a Gilt das Assoziativgesetz? Es sind acht Gleichungen zu untersuchen, hierbei kürzen wir ab jetzt x ◦ y usw. durch xy ab: a(aa) = (aa)a b(aa) = (ba)a a(ab) = (aa)b b(ab) = (ba)b a(ba) = (ab)a b(ba) = (bb)a a(bb) = (ab)b b(bb) = (bb)b Nach Erledigung dieser Fleißaufgabe wissen wir: (M, ◦) ist eine Gruppe. Analog fragen wir uns, ob es eine Gruppe mit drei Elementen gibt. Sei M = {a, b, c}, gesucht ist eine passende Verknüpfung. Wenn wir oBdA a als Einselement voraussetzen, haben wir folgende Verknüpfungstafel zu ergänzen: ◦ a b c a a b c b b ? ? c c ? ? Für die vier Fragezeichen kommen theoretisch 3 · 3 · 3 · 3 = 81 mögliche Kombinationen aus a, b und c in Frage. Wir wollen diese Zahl durch allgemeingültige Aussagen einschränken. Satz 1.4 Sei G eine Gruppe und a, b ∈ G. Dann sind die Gleichungen ax = b und ya = b mit den Unbekannten x, y in G eindeutig lösbar. (Beachte: mit ax ist a ◦ x gemeint). Beweis: Wir zeigen die eindeutige Lösbarkeit von ax = b: Sei a−1 das inverse Element zu a und e das Einselement von G. Dann gilt für x := a−1 b ∈ G: ax = a(a−1 b) = (aa−1 )b = eb = b Damit ist die Existenz einer Lösung von ax = b bewiesen. Zur Eindeutigkeit : Sei v eine weitere Lösung, also av = b. Es folgt x = a−1 b = a−1 (av) = (a−1 a)v = ev = v Den Beweis zu ya = b möge man zur Übung selbst durchführen. Beispiel : Ist (R∗ , ◦) mit x ◦ y := x + y − xy eine Gruppe? 1 Grundlegendes über Gruppen 55 Antwort : Für jedes y ∈ R∗ ist y ◦ 1 = y + 1 − y · 1 = 1, es gibt kein Element y mit y ◦ 1 = 2. Die Gleichung ya = b ist für a = 1 und b = 2 nicht lösbar, damit kann keine Gruppe vorliegen. Eine oft benutzte Folgerung aus dem letzten Satz ist die bereits von den Körpern bekannte Kürzungsregel : Korollar In jeder Gruppe G gilt für alle a, x1 , x2 , y1 , y2 ∈ G ax1 = ax2 ⇒ x1 = x2 y1 a = y2 a ⇒ y 1 = y2 Für endliche Gruppen bedeutet Satz 1.4, dass in der Verknüpfungstafel einer Gruppe in jeder Zeile und in jeder Spalte jedes Element genau einmal vorkommen muss. Für unser Problem, ob es eine Gruppe mit drei Elementen gibt, bedeutet dies, dass es nicht 81, sondern nur eine mögliche Ergänzung für die ? geben kann: Wir untersuchen bc =?. Aus Satz 1.4 folgt bc = a (b kommt in der zugehörigen Zeile, c in der entsprechenden Spalte bereits vor). Aus den gleichen Gründen folgt bb = c, cb = a, cc = b: ◦ a b c a a b c b b c a c c a b Fazit : Wenn es eine Gruppe mit den drei Elementen a, b, c gibt (a neutral), dann muss sie die vorliegende Verknüpfungstafel besitzen. Direkt können wir die Inversenbedingung ablesen: b und c sind zueinander invers. Nicht direkt erkennen können wir, ob das Assoziativgesetz gilt und daher eine Halbgruppe vorliegt. Ohne es explizit zu beweisen, halten wir fest, dass das Assoziativgesetz erfüllt ist und es sich somit tatsächlich um eine Gruppe handelt. In Satz 1.4 haben wir gesehen, dass in jeder Gruppe die eindeutige Lösbarkeit der Gleichungen ax = b und ya = b gelten muss. Es gilt sogar Satz 1.5 Eine Halbgruppe ist eine Gruppe ⇐⇒ Die Gleichungen ax = b und ya = b sind in G lösbar für alle a, b ∈ G. ⇒“ ist bereits durch Satz 1.4 bewiesen. Neu ist die andere Richtung ⇐“, die aber nur für Halbgruppen ” ” gilt. Für Interessenten folgt ein formaler Beweis, in der Vorlesung werden wir ihn nicht durchführen. Beweis : von ⇐“: Zu zeigen ist: Wenn in einer Halbgruppe ax = b und ya = b lösbar sind, dann gelten ” (1) Es existiert ein Einselement e (2) Zu jedem a ∈ G existiert ein Inverses a−1 Zu (1): Sei g ∈ G beliebig. (Da G nach Voraussetzung Halbgruppe, ist G 6= ∅). Wegen der Lösbarkeit gibt es e ∈ G mit eg = g. (Setze in ya = b für a und b jeweils g ein und nenne die Lösung e.) Beh : Dieses Element e ist das gesuchte neutrale Element. Bew : Sei a ∈ G beliebig. Wegen der Lösbarkeitsvoraussetzung gibt es zu g von oben ein x ∈ G mit gx = a. Insgesamt folgt ea = e(gx) = (eg)x = gx = a ∀a ∈ G, 56 3 GRUPPEN analog zeigt man ae = a. Zu (2): Da die Gleichungen ya = e und az = e für jedes a ∈ G lösbar sind, ist y linksinvers und z rechtsinvers zu a. Wie im Beweis zu Satz 1.2 folgt y = z, damit ist y das gesuchte inverse Element a−1 . Satz 1.6 In jeder Gruppe G gilt (1) (2) (a−1 )−1 = a für jedes a ∈ G (ab)−1 = b−1 a−1 für alle a, b ∈ G Beweis : (1) Folgt direkt aus der Kürzungsregel: a−1 a = e = a−1 (a−1 )−1 ⇒ a = (a−1 )−1 (2): Nach Definition ist (ab)(ab)−1 = e, ferner gilt (ab)(b−1 a−1 ) = a(bb−1 )a−1 = aea−1 = e. Aus der Kürzungsregel folgt dann die Behauptung (ab)−1 = b−1 a−1 . −1 Korollar Für a1 , a2 , . . . , an ∈ G gilt (a1 . . . an )−1 = a−1 n . . . a1 . 2 Weitere Beispiele für Gruppen Wir haben bereits Gruppen mit einem, zwei oder drei Elementen kennengelernt. Def 2.1 Eine Gruppe G hat die Ordnung n, geschrieben ord G = n oder |G| = n, falls G aus n Elementen besteht. Im Fall einer unendlichen Gruppe schreiben wir ord G = ∞ und sprechen von unendlicher Ordnung. Beispiele : (Z, +) ist eine Gruppe unendlicher Ordnung, (Pot (M ), ⊕) hat für |M | = n die Ordnung 2n . Satz 2.1 Für jedes n ∈ N gibt es mit (Zn , +n ) eine Gruppe der Ordnung n. Beweisidee : Es ist Zn = {0, 1, . . . , n − 1}. +n (Addition modulo n) ist abgeschlossen und assoziativ, damit liegt eine Halbgruppe vor. 0 ∈ Zn ist neutrales Element, zu k ∈ Zn \{0} ist n − k ∈ Zn invers. Untersuchen wir (Zn , +n ) genauer stellen wir fest, dass jedes Element als Verknüpfungsergebnis der 1 mit sich selbst geschrieben werden kann: 1 = 1, 2 = 1 +n 1, ... n − 1 = 1 +n . . . +n 1 (n − 1 mal), 0 = 1 +n . . . +n 1 (n mal) Kürzen wir jeweils die k–fache modulo–Addition durch k · 1 ab und beachten n · 1 = 0 = 0 · 1, ist Zn = {k · 1 | k = 0, . . . , n − 1} = {k · 1 | k = 1, . . . , n} Man sagt, das Element 1 erzeugt die Gruppe. Allgemein kürzt man in Gruppen die k–fache Verknüpfung eines Elementes g mit sich selbst je nach Schreibweise der Verknüpfung durch k · g = kg oder g k ab, bei multiplikativer Schreibweise ist g 0 = e (für jedes Element g) das neutrale Element. Frage : Was ist g −k für k ∈ N? Antwort : g −k = g (−1)k = g −1 . . . g −1 = (g . . . g)−1 = (g k )−1 . 2 Weitere Beispiele für Gruppen 57 Nicht in jeder Gruppe findet man ein einziges Element, das die ganze Gruppe erzeugt, beispielsweise wird man in (R, +) vergeblich danach suchen. Def 2.2 Eine Teilmenge S ⊆ G heißt Erzeugendensystem von G, wenn jedes Element von G als Verknüpfung von endlich vielen Elementen, die entweder selbst oder deren Inverse in S liegen, geschrieben werden kann. Jede Gruppe besitzt verschiedene Erzeugendensysteme. Als sparsame Menschen suchen wir in den folgenden Beispielen Erzeugendensysteme mit möglichst wenig Elementen. Beispiele : 1) In allen Gruppen (Zn , +n ) und in (Z, +) ist S = {1} ein Erzeugendensystem. 2) In (Z3 , +3 ) ist auch {2} ein Erzeugendensystem: 2 +3 2 = 1, 2 +3 2 +3 2 = 0. 3) In der Gruppe Z×Z mit komponentenweiser Addition gilt S = {(0, 1), (1, 0)}. Frage : Warum ist {(1, 1)} kein Erzeugendensystem? Warum gibt es in dieser Gruppe kein einelementiges Erzeugendensystem? 4) (R, +) besitzt kein endliches Erzeugendensystem. Def 2.3 Eine Gruppe G mit einem einelementigen Erzeugendensystem heißt zyklisch. Beispielsweise ist (Z5 , +5 ) eine zyklische Gruppe der Ordnung 5, (Z, +) ist eine unendliche zyklische Gruppe, Z × Z mit komponentenweiser Addition und (R, +) sind nicht zyklisch. Satz 2.2 Jede zyklische Gruppe ist abelsch.15 Der einfache Beweis dieses Satzes wird in den Übungen erledigt. Frage : Gilt auch die Umkehrung von Satz 2.2? Man kann zeigen, dass jede Gruppe von Primzahlordnung zyklisch sein muss. Für Gruppen anderer Ordnung gilt dies nicht. Hierzu sehen wir uns ein Quadrat mit den Eckpunkten A, B, C, D und Mittelpunkt (=Schwerpunkt) M an. Es gibt vier Drehungen um M , die das Quadrat auf sich abbilden. Die Menge der Drehungen sei Dreh () = {id = δ0 , δ1 , δ2 , δ3 } mit Drehwinkel i · π 2 für δi , i = 0, 1, 2, 3. Mit der Verkettung als Verknüpfung erhalten wir ◦ id δ1 δ2 δ3 id id δ1 δ2 δ3 δ1 δ1 δ2 δ3 id δ2 δ2 δ3 id δ1 δ3 δ3 id δ1 δ2 Wir untersuchen weitere Quadrat–Abbildungen. Spg () := {id, s1 , s2 , δ2 } enthält dieGeradenspiegelun A B C D gen (Spiegelachse jeweils durch gegenüberliegende Seitenmitten des Quadrats) s1 : D C B A 15 Anders ausgedrückt: G zyklisch ⇒ G abelsch 58 3 GRUPPEN A B C D und s2 : , die Drehung δ2 können wir auch als Punktspiegelung an M auffassen. Wir B A D C geben die Verknüpfungstafel für (Spg (), ◦) an: ◦ id s1 s2 δ2 id id s1 s2 δ2 s1 s1 id δ2 s2 s2 s2 δ2 id s1 δ2 δ2 s2 s1 id Man kann den Verknüpfungstafeln leicht entnehmen, dass es sich in beiden Fällen um Gruppen handelt16 . Die Drehgruppe ist zyklisch, da δ1 oder δ3 die Gruppe erzeugen. Die Spiegelungsgruppe ist nicht zyklisch: Weil hier jedes Element selbstinvers ist, kann es kein Erzeugendensystem mit nur einem Element geben. Es gibt bei einem Quadrat zweiweitere Geradenspiegelungen, die wir bisher nicht berücksichtigt haben, A B C D A B C D nämlich s3 : und s4 : mit Achsen durch diagonal gegenüberlieC B A D A D C B gende Punkte. Insgesamt existieren vier Drehungen (inklusive der Identität) und vier Spiegelungen, die das Quadrat auf sich abbilden. Dies kann man auf beliebige regelmäßige n–Ecke übertragen: Jedes n–Eck besitzt n solcher Drehungen (inklusive der Identität) und n Geradenspiegelungen. Drehungen hintereinander ausgeführt ergeben wieder eine Drehung (man addiere die Drehwinkel modulo 360◦ ), zwei Spiegelungen ergeben ebenfalls eine Drehung. Verknüpft man Drehung und Spiegelung (egal in welcher Reihenfolge), erhält man (von der Reihenfolge abhängig unterschiedliche) Spiegelungen. Insgesamt gilt Def 2.4 und Satz 2.3 Die Menge aller Drehungen und Spiegelungen eines regelmäßigen n–Ecks auf sich bildet mit der Verkettung die sogenannte Diedergruppe17 Dn . Die Diedergruppe hat die Ordnung 2n und ist für n ≥ 3 nicht kommutativ, ein Erzeugendensystem besteht aus einer Drehung (beispielsweise δ1 ) und einer Spiegelung. Bezeichnen wir die Ecken eines regelmäßigen n–Ecks mit den Zahlen 1, 2, . . . , n erkennen wir, dass jede Abbildung der Diedergruppe als Permutation der Eckenmenge {1, 2, . . . , n} aufgefasst werden kann. Für alle Permutationen einer n–elementigen Menge gilt Def 2.5 und Satz 2.4 Die Menge aller Permutationen einer n–elementigen Menge bildet mit der Verkettung die sogenannte symmetrische Gruppe vom Index n, geschrieben Sn . Die symmetrische Gruppe hat die Ordnung n! und ist für n ≥ 3 nicht kommutativ. Beispiele : 1) S1 = {f : {1} → {1} bijektiv } = {id} 12 2) S2 = {f : {1, 2} → {1, 2} bijektiv } = id, . 21 123 123 123 123 123 123 3) S3 = , , , , , . 123 132 213 231 312 321 16 17 gut! Beachte: die Verkettung von Abbildungen ist nach Satz I.4.2 assoziativ. Getrennt gesprochen Di – eder..., nicht mit langem i. Falsche Aussprache in mündlichen Prüfungen macht sich nicht so 3 Untergruppen 59 Hier sind jeweils Urbild und zugehöriges Bild untereinander geschrieben worden. Mit der sogenannten Zykelschreibweise kennt der Mathematiker für Permutationen eine elegante kürzere Schreibweise. Im Fall S3 lautet sie S3 = {id = (1), (2, 3), (1, 2), (1, 2, 3), (1, 3, 2), (1, 3)}. Frage : Wer hat das Prinzip der Zykelschreibweise erkannt? Später werden wir es intensiv mit einer weiteren Gruppe zu tun bekommen: Satz 2.5 Sei n ∈ N. Dann ist (Rn , +) mit (x1 , . . . , xn ) + (y1 , . . . , yn ) := (x1 + y1 , . . . , xn + yn ) eine abelsche, nicht zyklische Gruppe. Der einfache Beweis erfordert nur wenig geistige Anstrengung, ist aber bei exakter Ausführung etwas länglich und sei als Übung empfohlen. 3 Untergruppen Betrachten wir noch einmal die Diedergruppe Dn . Beschränken wir uns auf die Teilmenge aller Drehungen, erkennen wir, dass diese bezüglich der Verkettung ebenfalls eine Gruppe bildet – anders als die Teilmenge aller Spiegelungen. Def 3.1 Sei (G, ∗) eine Gruppe. U ⊂ G heißt Untergruppe von G : ⇐⇒ (U, ∗) ist Gruppe. In Untergruppe und Gruppe muss die gleiche Verknüpfungsvorschrift gelten, beispielsweise ist (Z2 , +2 ) keine Untergruppe von (Z, +). Beispiele : 1) Jede Gruppe G besitzt die trivialen Untergruppen G und {e}. (e neutrales Element von G) 2) Jede Gruppe der Ordnung 2 oder 3 besitzt nur triviale Untergruppen. 3) G = S3 besitzt außer {id} und S3 die nichttrivialen Untergruppen {id, (12)}, {id, (13)}, {id, (23)} und {id, (123), (132)}, alle anderen Teilmengen sind keine Untergruppen. 4) ({1, −1}, ·) und (Q∗ , ·) sind Untergruppen von (R∗ , ·). Frage : Welche Untergruppen besitzt (Z, +)? Ob eine Teilmenge einer Gruppe selbst eine Gruppe ist, kann man natürlich durch Überprüfung der Gruppenaxiome feststellen. Es geht aber auch einfacher: Satz 3.1 Für ∅ = 6 U ⊂ G gelte ab−1 ∈ U ∀a, b ∈ U . Dann ist U eine Untergruppe. Beweis: Zu zeigen sind nach Def. 1.6: 1. U Gruppoid: Wird am Ende des Beweises erledigt. 2. Die Verknüpfung ist assoziativ: Dies ist klar, da U Teilmenge einer Gruppe ist. 3. U besitzt ein neutrales Element: Da U 6= ∅ ⇒ ∃ a ∈ U ⇒ aa−1 = e ∈ U . 4. Zu jedem u ∈ U ist auch u−1 ∈ U : Sei u ∈ U . Zusammen mit e ∈ U folgt eu−1 = u−1 ∈ U . Jetzt zu 1., wir zeigen die Abgeschlossenheit der Verknüpfung auf U : Seien a, b ∈ U . Mit b ist wie in 4. gezeigt auch b−1 ∈ U und es folgt a(b−1 )−1 = ab ∈ U . 60 3 GRUPPEN An Stelle von ab−1 ∈ U kann man auch a−1 b ∈ U überprüfen, in endlichen Gruppen reicht sogar der Nachweis von ab ∈ U . Beispiel : G = (Z, +), U := {5 · z | z ∈ Z} ist Untergruppe von G: Wegen 0 = 0 · 5 ∈ U ist U 6= ∅, mit 5 · z1 ∈ U und 5 · z2 ∈ U ist auch 5z1 + (−5z2 ) = 5(z1 − z2 ) ∈ U . Für jede natürliche Zahl n ist somit nZ := {nz | z ∈ Z} eine Untergruppe von Z (bezüglich der Addition), abgekürzt geschrieben (nZ, +) ≤ (Z, +). Beispiele : 1) (8Z, +) ≤ (4Z, +) ≤ (2Z, +) ≤ (Z, +) ≤ (Q, +) ≤ (R, +) ≤ (C, +). 2) ({0}, +8 ) ≤ ({0, 4}, +8 ) ≤ ({0, 2, 4, 6}, +8 ) ≤ (Z8 , +8 ). 3) ({0, 3}, +6 ) ≤ (Z6 , +6 ), ({0, 2, 4}, +6 ) ≤ (Z6 , +6 ), aber ({0, 3}, +6 ) ist keine Untergruppe von ({0, 2, 4}, +6 ) (oder umgekehrt). Interessiert man sich für alle Untergruppen einer Gruppe und deren Abhängigkeiten untereinander, bietet sich eine zeichnerische Darstellung als Untergruppenverband an. Beispiel : Die Untergruppenverbände von (Z8 , +8 ) (links), (Z6 , +6 ) (Mitte), (D3 , ◦) (rechts, wird in der Vorlesung weiter beschriftet): sZ ... ... .. ... ... ... ... ... ... ... ... ... ... ... ... ... D3 Z6 s s 8 .. ......... ...... ..... ...... ... ...... ... ........ ... ... ... ... ... ... ... ... ... ... ... ... . ... ...... ... ...... . . . ... . . ... ........... ..... s {0, 2, 4, 6} .... ......... .......... ......... .... ............. . . . ......... .. .... ......... ......... . . . . . . . . . ... ..... . ..... ............. ... ... ..... ...... ... ... ..... ...... ... .. ..... ...... ... .. ..... ...... . . . . ... ...... . . ....... . ...... . ....... .. . . . . . ...... .... . . . ...... ... .... ............ ........ ... ........ ................. {0, 2, 4} s s {0, 4} s s{0, 3} s s {0} s s s s {0} {0} Frage : Wie sieht der Untergruppenverband von D4 aus? (Hinweis: Es gibt fünf Untergruppen der Ordnung 2 und drei der Ordnung 4). Steigt man etwas tiefer in die Gruppentheorie ein, kann man beweisen, dass bei endlichen Gruppen die Ordnung einer Untergruppe immer ein Teiler der Gruppenordnung sein muss. Das heißt aber nicht, dass es immer zu jedem Teiler der Gruppenordnung eine Untergruppe mit dieser Ordnung gibt. Beispiele : 1) Z12 hat keine echte Untergruppe mit mehr als sechs Elementen. 2) (Z11 , +11 ) besitzt nur triviale Untergruppen, da 11 eine Primzahl ist. 4 Isomorphie Wir wollen drei bekannte Gruppentafeln vergleichen und uns die Frage stellen, wie verschieden“ die ” zugehörigen Gruppen (Dreh (), ◦), (Spg (), ◦) und (Z4 , +4 ) sind: ◦ id δ1 δ2 δ3 id id δ1 δ2 δ3 δ1 δ1 δ2 δ3 id δ2 δ2 δ3 id δ1 δ3 δ3 id δ1 δ2 ◦ id s1 s2 δ2 id id s1 s2 δ2 s1 s1 id δ2 s2 s2 s2 δ2 id s1 δ2 δ2 s2 s1 id +4 0 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 3 0 1 3 3 0 1 2 4 Isomorphie 61 Wir stellen fest: Durch Umbenennung (id 7→ 0, δ1 7→ 1, δ2 7→ 2, δ3 7→ 3) geht Dreh () in Z4 über, eine analoge Übertragung von oder nach Spg () ist nicht möglich. Def 4.1 Eine Gruppe (G, ◦) heißt isomorph zu einer Gruppe (H, ∗), geschrieben (G, ◦) ' (H, ∗) oder G ' H : ⇐⇒ ∃f : G → H bijektiv mit f (x ◦ y) = f (x) ∗ f (y) für alle x, y ∈ G, f : G → H heißt Isomorphismus von G nach H. Beispiel : (Dreh (), ◦) ' (Z4 , +4 ) 6' (Spg (), ◦) Abbildungen mit der Eigenschaft von Definition 4.1 nennt man strukturerhaltend. Ist (G, ◦) zu (H, ∗) isomorph, dann auch umgekehrt (H, ∗) zu (G, ◦) (eventuell Übung), daher kann man sagen: (G, ◦) und (H, ∗) sind zueinander isomorph. Die Relation isomorph zu“ ist symmetrisch. Es gilt sogar ” Satz 4.1 Die Isomorphie–Relation für Gruppoide ist eine Äquivalenzrelation. Beweis: Wir haben Reflexivität (r), Symmetrie (s) und Transitivität (t) zu zeigen. zu (r): Beh: Für jedes Gruppoid gilt (G, ◦) ' (G, ◦). Bew: Die Identität id : G → G ist die gesuchte Bijektion: id(x◦y) = x◦y = id(x)◦id(y) für alle x, y ∈ G. zu (s): Eventuell Übung. zu (t): Sei (G, ?) ' (H, ∗) und (H, ∗) ' (K, ×), zu zeigen ist (G, ?) ' (K, ×). Auf Grund der Voraussetzungen gibt es Bijektionen f : G → H und g : H → K mit f (a ? b) = f (a) ∗ f (b) ∀a, b ∈ G und g(x ∗ y) = g(x) × g(y) ∀x, y ∈ H Dann ist g ◦ f : G → K nach Satz I.4.3 bijektiv mit (g ◦ f )(a ? b) = g(f (a ? b)) = g(f (a) ∗ f (b)) = g(f (a)) × g(f (b)) = (g ◦ f )(a) × (g ◦ f )(b) ∀a, b ∈ G Warum interessiert man sich für Isomorphismen? Isomorphe Gruppen unterscheiden sich im Wesentlichen nur durch unterschiedliche Bezeichnungen, in den interessanten Eigenschaften stimmen sie überein. Kann man beispielsweise feststellen, dass eine unbekannte Gruppe G isomorph zur Gruppe (Zn , +n ) ist, so gelten alle Sätze über zyklische Gruppen der Ordnung n auch für G. Beispiel : Wir untersuchen (Q\{1}, ∗) mit x∗y := xy −x−y +2. Die Abbildung f : Q∗ → Q\{1}, f (x) := x + 1, ist bijektiv (für jedes x ∈ Q∗ ist f (x) 6= 1) und bezüglich der üblichen Multiplikation in Q∗ strukturerhaltend, denn es gilt für alle x, y ∈ Q∗ : f (xy) = xy + 1 = (x + 1)(y + 1) − (x + 1) − (y + 1) + 2 = (x + 1) ∗ (y + 1) = f (x) ∗ f (y) Damit ist (Q\{1}, ∗) eine zu (Q∗ , ·) isomorphe Gruppe. Wie wir gleich sehen werden, können wir ohne große Mühe neutrales Element und inverse Elemente angeben. Satz 4.2 Sei f ein Isomorphismus von der Gruppe (G, ◦) mit neutralem Element eG auf die Gruppe (H, ∗) mit neutralem Element eH . Dann ist f (eG ) = eH . Beweis: eH ∗ f (eG ) = f (eG ) = f (eG ◦ eG ) = f (eG ) ∗ f (eG ), die Behauptung folgt mit der Kürzungsregel. 62 3 GRUPPEN Korollar Isomorphe Gruppen haben die gleiche Anzahl an selbstinversen Elementen. Beweis: x selbstinvers ⇒ f (x)2 = f (x2 ) = f (eG ) = eH ⇒ f (x) selbstinvers, der Rest folgt aus der Symmetrie der Isomorphie. Beispiele : 1) (Fortsetzung) (Q\{1}, ∗) hat das neutrale Element 2 (wegen f (1) = 2) und genau zwei Selbstinverse, nämlich 2 und 0 (wegen f (−1) = 0). 2) (Z4 , +4 ) 6' (Spg (), ◦) ist jetzt noch einmal bewiesen worden: Im Gegensatz zu den Elementen von Z4 ist jede Spiegelung selbstinvers. Die Spiegelungsgruppe Spg (), ◦) ist isomorph zur sogenannten Kleinschen Vierergruppe V4 (benannt nach F. Klein , 1849–1925) mit der Gruppentafel ◦ e a b c e e a b c a a e c b b b c e a c c b a e Wir merken uns: Bis auf Isomorphie gibt es – jeweils genau eine Gruppe der Ordnung 1,2,3,5. (Dies gilt für jede Primzahl). – genau zwei Gruppen der Ordnung 4: Jede Gruppe der Ordnung 4 ist entweder zu Z4 oder zu V4 isomorph. – genau zwei Gruppen der Ordnung 6: Jede abelsche Gruppe der Ordnung 6 ist zu Z6 , jede nicht abelsche zu S3 isomorph. Es gilt D3 ' S3 . – genau eine unendliche zyklische Gruppe, nämlich Z. Alle anderen unendlichen Gruppen sind nicht zyklisch. Bei größeren Gruppen kann es bezüglich der (Nicht)isomorphie kompliziert zugehen, beispielsweise gibt es 14 nichtisomorphe Gruppen der Ordnung 16. Außer Isomorphismen gibt weitere Morphismen, denn leider ist nicht jede Bijektion zwischen Gruppen strukturerhaltend und nicht jede strukturerhaltende Abbildung bijektiv. Homomorphismus ist ein anderer Name für Strukturerhaltung (ohne Bijektivitätsvoraussetzung). Einen Homomorphismus einer Gruppe in sich nennt man Endomorphismus . Interessant sind Isomorphismen einer Gruppe auf sich, sie nennt man Automorphismen. Alle Automorphismen einer Gruppe G bilden mit der Verkettung selbst eine Gruppe, die sogenannte Automorphismengruppe Aut G. So ähnlich wie ein Arzt Krankheiten an Hand ihrer Symptome erkennen kann, verrät die Automorphismengruppe Aut G einem Mathematiker viele Einzelheiten über die zugehörige Gruppe G. Beispiel : Gesucht ist Aut Z4 . Weil das neutrale Element unter jedem Automorphismus f auf sich abgebildet wird und f (2) = 2 gelten muss (2 ist außer dem neutralen Element das einzige Selbstinverse), kann es nur zwei Kandidaten für einen Automorphismus geben, nämlich die identische Abbildung und 0123 . Nachrechnen ergibt, dass beide Abbildungen strukturerhaltend sind. Da es bis auf Isomor0321 phie nur eine Gruppe mit zwei Elementen gibt, ist Aut Z4 ' Z2 . 4 Isomorphie 63 Frage : Zu welcher Ihnen bekannten Gruppe ist Aut V4 isomorph? Wir beenden den Abschnitt mit zwei Fragen, die auch schon in Prüfungen gestellt wurden. Fragen : 1) Ist (Q, +) ' (Q∗ , ·)? 2) Ist (Q, +) ' (R, +)? Antworten : Jeweils nein; die Anzahl der Selbstinversen ist unterschiedlich bzw. es gibt keine Bijektion. Aber welche Begründung hilft bei welcher Frage? 64 4 4 LINEARE ALGEBRA Lineare Algebra 1 Vektorräume und Untervektorräume Wir erinnern uns an die Gruppe (R2 , +) mit komponentenweiser Addition und die Darstellung der k – fachen Summe (a, b) + . . . + (a, b) durch k · (a, b) = (ka, kb). Es stellt sich die Frage, ob auch Ausdrücke wie (−3) · (a, b), 32 · (a, b) oder π · (a, b) sinnvoll gedeutet werden können. Mathematisch betrachtet handelt es sich um eine Abbildung R × R2 → R2 : Jeder reellen Zahl α und jedem Zahlenpaar x = (x1 , x2 ) wird ein neues Zahlenpaar α · x = (αx1 , αx2 ) zugeordnet. Diese Abbildung nennt man skalare Multiplikation oder Skalarmultiplikation : R × R2 → R2 · : (α, (x1 , x2 )) 7→ (αx1 , αx2 ) Für alle α, β ∈ R und für alle x = (x1 , x2 ), y = (y1 , y2 ) ∈ R2 gelten leicht zu beweisende Regeln wie (1) (2) (3) (4) α · (x + y) (α + β) · x (α · β) · x 1·x = = = = α·x+α·y α·x+β·x α · (β · x) x Man beachte, dass · und + in unterschiedlichen Bedeutungen vorkommen! (Welchen?) Frage : Sind (1) – (4) auch für (R3 , +) gültig? Interessante Frage : Kann man beide Fälle R2 und R3 sinnvoll zusammenfassen? Def 1.1 Sei V eine Menge mit einer binären Verknüpfung + (genannt Addition) und einer Abbildung · : R × V → V (genannt skalare Multiplikation). Das Tripel (V, +, ·) heißt reeller Vektorraum : ⇐⇒ (V1) (V2) (V, +) ist abelsche Gruppe Für die skalare Multiplikation gelten sinngemäß die Regeln (1) bis (4). Für jede natürliche Zahl n ist (Rn , +, ·) ein reeller Vektorraum. Ängstliche Zeitgenossen dürfen sich zunächst auf die anschaulichen Fälle n = 2 oder n = 3 beschränken. Sie sollten aber nie vergessen, dass die Vektorraumdefinition viel allgemeinere Strukturen zulässt. Deshalb wollen wir an dieser Stelle einmal einen ganz anderen Vektorraum vorstellen. Beispiel : V = Abb ([0, 1], R) = {f : [0, 1] → R} mit f + g : x 7→ f (x) + g(x), α · f : x 7→ α · f (x) ist ein reeller Vektorraum, dessen Elemente Funktionen sind.18 Wir wollen den Nachweis der Eigenschaften (V1) und (V2) teilweise hier und teilweise in den Übungen durchführen: (V1): (V, +) ist abelsche Gruppe: • V 6= ∅; beispielsweise wird durch o(x) := 0 für alle x ∈ [0, 1] eine Abbildung o ∈ V definiert. • + ist eine binäre Verknüpfung (warum?). • (V, +) ist assoziativ, da die Addition in R assoziativ ist: f + (g + h) = (f + g) + h; denn für alle x ∈ [0, 1] ist (f + (g + h))(x) = f (x) + (g + h)(x) = f (x) + (g(x) + h(x)) = (f (x) + g(x)) + h(x) = (f + g)(x) + h(x) = ((f + g) + h)(x). 18 Es sei noch einmal darauf hingewiesen, dass + und · jeweils zwei verschiedene Bedeutungen haben! 1 Vektorräume und Untervektorräume 65 • o ∈ V ist neutrales Element (zur Erinnerung: o(x) := 0 ∀x ∈ [0, 1]) • Zu f ist −f : x 7→ −f (x) invers. • (V, +) ist abelsch: (f + g)(x) = f (x) + g(x) = g(x) + f (x) = (g + f )(x) =⇒ f + g = g + f . (V2): Es gelten die Regeln der Skalarmultiplikation: • Für alle α ∈ R und für alle f, g ∈ V ist α · (f + g) = α · f + α · g; denn für alle x ∈ [0, 1] ist (α · (f + g))(x) = α · ((f + g)(x)) = α · (f (x) + g(x)) = α · f (x) + α · g(x) = (α · f )(x) + (α · g)(x) = (α · f + α · g)(x). • Für alle α, β ∈ R und für alle f ∈ V ist (α + β) · f = α · f + β · f • Für alle α, β ∈ R und für alle f ∈ V ist (αβ) · f = α · (β · f ) • Für alle f ∈ V ist 1 · f = f Wenn in einem Vektorraum (V, +, ·) Klarheit über Addition und Skalarmultiplikation besteht, spricht man auch vom Vektorraum V . (Frage : Was ist in diesem Sinn der Vektorraum R4 ?) Die abkürzende Schreibweise g − h für g + (−h), die wir aus Gruppen kennen, ist auch in Vektorräumen üblich, also beispielweise x − y = x + (−y), ebenfalls gilt α(−v) = −αv usw. Reelle Vektorräume sind spezielle Vektorräume. Ersetzt man in der Definition R durch einen anderen Körper K, spricht man von einem Vektorraum über dem Körper K. Um Verwechslungen auszuschließen, werden wir das neutrale Element der Gruppe (V, +) mit o und das neutrale Element der Gruppe (K, +) mit 0 bezeichnen. Während die Notwendigkeit der Forderungen (1) – (3) der skalaren Multiplikation (mehr oder weniger) einsichtig ist, liegt die Bedeutung des vierten Axioms 1 · x = x zunächst nicht auf der Hand: Es wird lediglich benötigt, um Sonderfälle auszuschließen. Sonst hätte beispielsweise jede abelsche Gruppe (G, ◦) R×G → G das Recht auf mit neutralem Element e zusammen mit der langweiligen Abbildung (r, g) 7→ e die Bezeichnung reeller Vektorraum! Frage : Warum fordert man nicht auch 0 · x = o ∀x ∈ V ? Antwort : Weil es aus den anderen Axiomen folgt, es gilt Satz 1.1 Sei (V, +, ·) ein reeller Vektorraum mit neutralem Element o. Dann gelten (1) 0·x = o ∀x ∈ V (2) r·o = o ∀r ∈ R Beweis: Wir benutzen in beiden Teilen die Kürzungsregel aus der Gruppentheorie: zu (1): 0 · x + o = 0 · x = (0 + 0) · x = 0 · x + 0 · x =⇒ o = 0 · x zu (2): r · o + o = r · o = r · (o + o) = r · o + r · o =⇒ o = r · o Bezeichnet man sinnvollerweise die Elemente eines Vektorraumes als Vektoren, folgt für den R2 , dass jedes Zahlenpaar ein Vektor ist. Eventuell ist man es von der Schule gewohnt, Pfeile“ im R2 als Vektoren ” 66 4 aufzufassen. Für uns sind diese Pfeile freie Vektoren, festgelegt durch Anfangs– und Endpunkt (Länge) und Richtung. Jeder freie Vektor lässt sich als Differenz zweier Vektoren (Endpunkt minus Anfangspunkt oder Spitze minus Schaft) schreiben. Jeder Vektor ist ein freier Vektor mit Anfangspunkt (0, 0), manchmal spricht man dann auch von einem Ortsvektor. LINEARE ALGEBRA 6 * - Wir interessieren uns für spezielle Teilmengen von Vektorräumen. Als Beispiel untersuchen wir im reellen Vektorraum R2 die folgende Mengen T1 := {(x, y) ∈ R2 | x, y ∈ Z} T3 := {(x, y) ∈ R2 | y = 1} T5 := {(x, y) ∈ R2 | x2 + y 2 = 1} T2 := {(x, y) ∈ R2 | y = x} T4 := {(x, y) ∈ R2 | x, y ≥ 0} Frage : Für welche i = 1, 2, 3, 4, 5 ist (Ti , +, ·) selbst ein reeller Vektorraum? Diese Frage werden wir in der Vorlesung beantworten und erkennen, dass nur wenige Teilmengen eines Vektorraumes selbst Vektorräume sind. Ist dies der Fall, spricht man von einem Untervektorraum. Beispiele : 1) T2 ist Untervektorraum von R2 , anschaulich handelt es sich um eine Gerade durch (0, 0). 2) {(x1 , x2 , x3 , 0) | xi ∈ R} ist Untervektorraum von R4 . 3) {o}, wobei mit o der Nullvektor gemeint ist, und V sind stets Untervektorräume von V . Will man überprüfen, ob eine Teilmenge U eines Vektorraums V ein Untervektorraum ist, muss man ähnlich wie bei Untergruppen zum Glück nicht alle Vektorraumaxiome überprüfen. Dafür sorgt Satz 1.2 Sei V ein Vektorraum. U ⊂ V ist (Unter)vektorraum ⇐⇒ U erfüllt (U1) U 6= ∅ (U2) x+y ∈U (U3) α·x∈U ∀x, y ∈ U ∀α ∈ K, ∀x ∈ U Vor dem Beweis wollen wir kurz etwas zur Bedeutung dieses Satzes sagen. Nicht beide Richtungen ⇐⇒ sind mathematisch gleich wichtig. Während die Aussage ⇒ ziemlich uninteressant ist, bedeutet die Kenntnis von ⇐ große Arbeitserleichterung: Um eine nicht leere Teilmenge eines Vektorraumes als Untervektorraum zu erkennen, genügt der Nachweis der Abgeschlossenheit der Addition und Skalarmultiplikation in dieser Teilmenge. Beweis: ⇒“: Aus den Voraussetzungen U Vektorraum und U ⊂ V sind die Eigenschaften (U1) – (U3) ” nachzuweisen. Dies ist einfach, denn (U1) und (U2) sind direkte Konsequenzen aus der Vorgabe (U, +) abelsche Gruppe, während (U3) gilt, weil · eine Skalarmultiplikation auf U ist. ⇐“: Hier ist aus den Voraussetzungen V Vektorraum, U ⊂ V und (U1) – (U3) der Nachweis zu führen, ” dass U Vektorraum ist. Zur Skalarmultiplikation: Wegen (U3) ist die auf V gegebene Skalarmultiplikation auch auf U abgeschlossen. Die Bedingungen (1) – (4) sind für · : K × U → U erfüllt, da sie wegen der Voraussetzung V Vektorraum sogar für jeden Vektor aus V gelten. 1 Vektorräume und Untervektorräume 67 Zur abelschen Gruppe (U, +): Wegen (U3) ist mit u auch (−1) · u ∈ U . Aus den Übungen wissen wir (−1) · u = −u. Zusammen mit (U2) folgt dann x − y ∈ U ∀x, y ∈ U . Weil U 6= ∅ wegen (U1), folgt die Behauptung aus Satz III.3.1 (Nachweis Untergruppe). Da die Bedingung (U3) auch für α = 0 erfüllt sein muss, und weil für jeden Vektor x gilt 0 · x = o, muss der Nullvektor in jedem Unterraum enthalten sein. Gehört umgekehrt der Nullvektor nicht zu einer Teilmenge eines Vektorraumes, so liegt garantiert kein Untervektorraum vor! Wir interessieren uns für alle Untervektorräume (ab jetzt kurz Unterräume) des R2 . Wie bereits bekannt, gibt es die beiden trivialen Unterräume {(0, 0)} und R2 . Was ist sonst noch möglich? Sei (0, 0) 6= u ∈ U ⊂ R2 . Damit U Unterraum sein kann, muss U außer u auch alle Vielfachen von u enthalten (warum?): u ∈ U und U Unterraum =⇒ αu ∈ U ∀α ∈ R, d.h. {αu | α ∈ R} ⊂ U Anschaulich handelt es sich bei {αu | α ∈ R} um eine Gerade durch (0, 0). Jede solche Gerade ist ein Unterraum: Beh. 1 : Sei u ∈ R2 \{(0, 0)} =⇒ Ru := {αu | α ∈ R} ist Unterraum Beweisskizze : Die Bedingungen (U1) – (U3) aus Satz 1.2 sind erfüllt; denn (U1): Ru 6= ∅, beispielsweise ist u = 1 · u ∈ Ru. (U2): x ∈ U und y ∈ U =⇒ x = αu, y = βu =⇒ x + y = αu + βu = (α + β)u ∈ Ru (U3): α ∈ R und x ∈ U =⇒ α · x = α · (β · u) = (αβ)u ∈ Ru. Damit haben wir bereits alle Unterräume gefunden! Beh. 2 : Sei U ⊂ R2 Unterraum. Dann ist U = {(0, 0)} oder U = Ru (Gerade durch den Ursprung) oder U = R2 . Beweis : Wir müssen zeigen: Besteht U nicht nur aus einer Geraden der Gestalt Ru, so ist U bereits der gesamte Vektorraum R2 . Sei also v = (v1 , v2 ) ∈ U, u = (u1 , u2 ) ∈ U , beide von Null verschieden, und v 6∈ Ru. Wir zeigen u1 v2 −u2 v1 6= 0. Hierzu leiten wir, ausgehend vom Gegenteil u1 v2 −u2 v1 = 0 ⇐⇒ u1 v2 = u2 v1 , einen Widerspruch zur Voraussetzung v 6∈ Ru her. Angenommen, u1 v2 = u2 v1 : v2 u2 (0, u2 ) ∈ Ru v1 u1 (u1 , u2 ) ∈ Ru 1. Fall u1 = 0 =⇒ u2 6= 0 = v1 =⇒ v = (0, v2 ) = 2. Fall u1 6= 0 =⇒ v2 = u2 u1 v1 =⇒ v = (v1 , v2 ) = Da U nach Voraussetzung ein Unterraum ist, der u und v enthält, gilt αu + βv ∈ U für alle α, β ∈ R. Dies und u1 v2 − u2 v1 6= 0 nutzen wir aus, um U = R2 zu zeigen: Sei (c1 , c2 ) ∈ R2 beliebig. Durch einfaches Nachrechnen erhält man für α = (c1 , c2 ) = c1 v2 −c2 v1 u1 v2 −u2 v1 und β = u1 c2 −u2 c1 u1 v2 −u2 v1 c1 v2 − c2 v1 u1 c2 − u2 c1 · (u1 , u2 ) + · (v1 , v2 ) ∈ U. u1 v2 − u2 v1 u1 v2 − u2 v1 Außer den sogenannten trivialen Unterräumen {(0, 0)} und R2 ist (geometrisch gesprochen) genau jede Gerade durch den Nullpunkt (0, 0) ein Untervektorraum von R2 . Frage : Wie sehen alle Unterräume von R3 aus? Kehren wir zu beliebigen Vektorräumen zurück! 68 4 LINEARE ALGEBRA Satz 1.3 Sei V ein beliebiger Vektorraum mit Untervektorräumen U1 , U2 . Dann gelten (a) U1 ∩ U2 ist Untervektorraum von V (b) U1 ∪ U2 ist Untervektorraum von V ⇐⇒ U1 ⊂ U2 oder U2 ⊂ U1 Beweis: Zu (a): Wir haben (U1) – (U3) für U1 ∩ U2 zu zeigen; wir wissen, dass diese Regeln in U1 und U2 gelten. (U1): Da o ∈ U1 und o ∈ U2 =⇒ o ∈ U1 ∩ U2 . (U2): Seien x, y ∈ U1 ∩ U2 =⇒ x, y ∈ U1 ∧ x, y ∈ U2 =⇒ x + y ∈ U1 , U2 =⇒ x + y ∈ U1 ∩ U2 . (U3): Seien α ∈ R, x ∈ U1 ∩ U2 =⇒ αx ∈ U1 ∧ αx ∈ U2 =⇒ αx ∈ U1 ∩ U2 . Zu (b): Da ⇐“ trivial ist (warum?), ist nur ⇒“ zu zeigen. Wir gehen indirekt vor: ” ” Angenommen, U1 ∪ U2 ist ein Untervektorraum und es gelte U1 6⊂ U2 und U2 6⊂ U1 . Damit gibt es Elemente u1 ∈ U1 \U2 und u2 ∈ U2 \U1 . Nach (U2) ist u1 + u2 ∈ U1 ∪ U2 , aber u1 + u2 6∈ U1 , denn sonst wäre u2 = u2 + o = u2 + (u1 − u1 ) = (u1 + u2 ) + (−1)u1 ∈ U1 , Widerspruch! u1 + u2 6∈ U2 , denn sonst wäre u1 = u1 + o = u1 + (u2 − u2 ) = (u1 + u2 ) + (−1)u2 ∈ U2 , Widerspruch! D.h. u1 + u2 kann nicht in U1 ∪ U2 liegen. Wenn U1 ∪ U2 Untervektorraum ist, muss also eine der beiden Teilmengenbeziehungen gelten. 2 Lineare Unabhängigkeit In diesem Abschnitt werden mit linear (un)abhängig und Basis grundlegende Begriffe der linearen Algebra eingeführt. V sei stets ein beliebiger reeller Vektorraum. Def 2.1 Seien v1 , . . . , vr ∈ V . Dann heißt L(v1 , . . . , vr ) := {α1 v1 + . . . + αr vr | αi ∈ R für alle i = 1, . . . , r} ⊂ V lineare Hülle von v1 , . . . , vr . Man nennt α1 v1 +. . .+αr vr = r P αi vi auch Linearkombination von v1 , . . . , vr . Wenn die Summationsgren- i=1 zen klar sind, werden wir sie manchmal der Übersichtlichkeit wegen weglassen. Die lineare Hülle besteht aus allen Vektoren, die durch skalare Multiplikation und Vektoraddition aus den gegebenen Vektoren v1 , . . . , vr erzeugt werden. Beispiele : 1) L(o) = {αo | α ∈ R} = {o}. 2) V = R2 : L((u1 , u2 )) = R((u1 , u2 )) 3) V = R2 : L((1, 0), (0, 1)) = {α1 (1, 0) + α2 (0, 1) | αi ∈ R} = {(α1 , α2 ) | . . .} = R2 . 4) V = R2 : L((1, 0), (2, 0)) = {α1 (1, 0) + α2 (2, 0) | αi ∈ R} = R((1, 0)). 5) V = R2 : L((1, 1), (1, −1)) = {α1 (1, 1) + α2 (1, −1) | αi ∈ R} = ? 6) V = R3 : Gesucht sind L((1, 0, 0), (0, 1, 0)); L((1, 0, 0), (1, 2, 0)); L((1, 2, 0), (2, 4, 0)). 7) Nur der Vollständigkeit halber sei L(∅) := {o} erwähnt. 2 Lineare Unabhängigkeit 69 Verschiedene Vektoren können durchaus die gleiche lineare Hülle haben. Allen linearen Hüllen ist eine andere wichtige Eigenschaft gemeinsam: Satz 2.1 Jede lineare Hülle L ist ein Untervektorraum. Beweis: Einmal mehr haben wir die Gültigkeit von (U1) – (U3) zu zeigen. (U1): (U2): (U3): L 6= ∅; denn wegen o = 0 · v1 + . . . + 0 · vr liegt o in jeder linearen Hülle. P P Seien x, y ∈ L =⇒ ∃α1 , . . . , αr , β1 , . . . , βr ∈ R : x = αi vi , y = βi vi P P P =⇒ x + y = αi vi + βi vi = (αi + βi )vi ∈ L. P P Sei x ∈ L, α ∈ R. Analog folgt α · x = α · αi vi = (ααi )vi ∈ L. Beispiele : L((1, 0), (1, 1), (1, 2)) = R2 , L((1, 0, 1), (0, 0, 1)) ist eine Ebene im R3 . (Welche?) Wie gerade im Beweis Pausgenutzt, liegt o in jeder linearen Hülle. Wir interessieren uns jetzt für die Linearkombinationen αi vi der Vektoren v1 , . . . , vr , die den Nullvektor ergeben. Natürlich gibt es immer die (triviale) Linearkombination mit αi = 0 für alle i = 1, . . . , r. Frage : Gibt es in L(v1 , . . . , vr ) weitere Linearkombinationen α1 v1 + . . . + αr vr = o? Beispiele : 1) V = R2 , L((1, 0), (1, 1), (0, 1)). Hier gilt beispielsweise (0, 0) = 1 · (1, 0) − 1 · (1, 1) + 1 · (0, 1). 2) V = R2 , L((1, 0), (0, 1)). Die Suche nach α, β ∈ R mit (0, 0) = α · (1, 0) + β · (0, 1) = (α, β) ergibt zwangsweise α = β = 0. Feststellung: r–Tupel von Vektoren (v1 , . . . , vr ) können unterschiedliche Eigenschaften bzgl. der Darstellung des Nullvektors als Linearkombination haben: Manchmal geht es wie im letzten Beispiel ausschließlich auf triviale Weise, manchmal sind wie im Beispiel davor auch andere Linearkombinationen möglich. Def 2.2 Sei V ein beliebiger Vektorraum, vi ∈ V . (1) (v1 , . . . , vr ) heißt linear unabhängig : ⇐⇒ Für alle α1 , α2 , . . . , αr ∈ R gilt α1 v1 + . . . + αr vr = o =⇒ α1 = α2 = . . . = αr = 0 Man sagt auch: Der Nullvektor lässt sich nur trivial aus v1 , . . . , vr kombinieren. (2) (v1 , . . . , vr ) heißt linear abhängig : ⇐⇒ (v1 , . . . , vr ) ist nicht linear unabhängig. Beispiel : Im Vektorraum R2 ist ((1, 0), (0, 1)) linear unabhängig, während ((1, 0), (1, 1), (0, 1)) linear abhängig ist. Auch folgende Ausdrucksweisen für lineare (Un)abhängigkeit sind üblich: Die Vektoren v1 , . . . , vr sind linear (un)abhängig, {v1 , . . . , vr } ist linear (un)abhängig, usw. Frage : Wie steht es um lineare Abhängigkeit in den Fällen ((1, 0), (2, 0)), ((1, 1, 1), (0, 1, 2)), ((0, 0), (1, 2))? Wir können lineare Unabhängigkeit auch anders beschreiben: 70 4 LINEARE ALGEBRA Satz 2.2 (v1 , . . . , vr ) linear unabhängig ⇐⇒ Keiner der Vektoren vi ist eine Linearkombination der übrigen Vektoren v1 , . . . , vr (ohne vi ). Beweis: Wir zeigen beide Richtungen indirekt. ⇒“: Sei oBdA vr doch als Linearkombination der übrigen Vektoren darstellbar: ” vr = α1 v1 + . . . + αr−1 vr−1 ⇐⇒ α1 v1 + . . . + αr−1 vr−1 + (−1)vr = o =⇒ (v1 , . . . , vr ) linear abhängig, ein Widerspruch zur Voraussetzung der linearen Unabhängigkeit dieser Vektoren. ⇐“: Angenommen (v1 , . . . , vr ) linear abhängig =⇒ ∃α i ∈ R, nicht alle 0, mit α1 v1 + . . . + αr vr = o. ” α2 αr Sei oBdA α1 6= 0 =⇒ v1 = − α1 v2 + . . . + − α1 vr ist doch als Linearkombination der übrigen Vektoren darstellbar. Will man Vektoren auf lineare (Un)abhängigkeit untersuchen, muss man stets alle beteiligten Vektoren im Auge behalten. Beispiel : ((1, 0), (1, 1), (0, 1)) ist linear abhängig, obwohl je zwei Vektoren linear unabhängig sind. Wir fassen zusammen: Sind Vektoren v1 , . . . , vr linear abhängig, kann man mindestens einen von ihnen als Linearkombination der übrigen aufschreiben (OBdA vr = α1 v1 + . . . + αr−1 vr−1 ). Dies bedeutet in unserem Fall L(v1 , . . . , vr−1 ) = L(v1 , . . . , vr ). Um unnötigen Schreib– und Rechenaufwand zu vermeiden, ist man an linear unabhängigen Vektoren interessiert. Def 2.3 Sei V ein beliebiger Vektorraum, vi ∈ V . (v1 , . . . , vr ) heißt Basis von V (B1): (v1 , . . . , vr ) ist linear unabhängig (B2): L(v1 , . . . , vr ) = V : ⇐⇒ Eine Basis ist ein minimales Erzeugendensystem eines Vektorraumes. Jeder Vektor aus V liegt in der linearen Hülle einer Basis. Entfernt man einen Vektor aus einer Basis, umfasst die lineare Hülle der restlichen Vektoren nicht mehr alle Vektoren aus V . Anstelle von einer Basis (v1 , . . . , vr ) spricht man auch von einer Basis {v1 , . . . , vr } oder man sagt, die Vektoren v1 , . . . , vr bilden eine Basis.19 Ist eine Basis (b1 , . . . , bn ) gegeben, kann jeder Vektor v wegen (B2) als Linearkombination dieser Basisvektoren geschrieben werden. Weil die Basisvektoren wegen (B1) linear unabhängig sind, ist diese Darstellung eindeutig: ∀v∈V ∃1 (α1 , . . . , αn ) ∈ Rn : v = α1 b1 + . . . + αn bn Beispiele : 1) V = R2 : ((1, 0), (0, 1)) und ((1, 1), (1, 2)) sind Basen, für (2, 5) ∈ R2 gilt (2, 5) = 2 · (1, 0) + 5 · (0, 1) bzw. (2, 5) = (−1) · (1, 1) + 3 · (1, 2) . 2) ((1, 2), (1, 3), (1, 4)) ist keine Basis, denn (B1) ist verletzt. 19 In dieser Vorlesung werden wir nicht auf Unterschiede eingehen, die sich aus der Schreibweise einer Basis als geordnetes Tupel oder ungeordnete Menge ergeben und je nach Gutdünken eine der beiden Darstellungen wählen. 3 Dimension 71 3) V = R3 : ((1, 0, 0), (0, 1, 0), (0, 0, 1)) ist eine Basis. ((1, 0, 0), (0, 0, 1)) ist keine Basis, denn (B2) ist verletzt. 3) V = Rn mit n ∈ N: Sei ei := (0, . . . , 0, 1, 0, . . . , 0) mit der 1 an i–ter Stelle. Diese besonders einfache Basis (e1 , . . . , en ) wird kanonische Basis genannt. 4) In der Schule haben Sie bereits mehr oder weniger bewusst die kanonische Basis benutzt, um Punkte der Anschauungsebene R2 eindeutig anzugeben: P = (x, y) bedeutet nichts Anderes als P = (x, y) = x · (1, 0) + y · (0, 1) = x · e1 + y · e2 . In der Schule wird Ihnen wahrscheinlich nie eine andere als die kanonische Basis begegnen, trotzdem ist es manchmal von Vorteil, mit anderen Basen zu arbeiten. 3 Dimension Wir haben gesehen, dass ein Vektorraum viele verschiedene Basen haben kann. Es wird uns allerdings nicht gelingen, eine Basis des R2 mit nur einem oder eine mit mehr als zwei Vektoren zu finden. Jede Basis des Rn besteht aus genau n Vektoren. Niemand von Ihnen wird bezweifeln, dass jeder Vektorraum eine Basis besitzt. Der Beweis dieser simplen Aussage ist allerdings so schwierig, dass er in dieser Vorlesung nicht durchgeführt werden kann. Satz 3.1 (v1 , . . . , vn ) und (w1 , . . . , wm ) seien Basen eines Vektorraumes. Dann gilt n = m. Bevor wir Angaben zum Beweis machen, halten wir als wichtige Folgerung fest: Def 3.1 a) Sei (v1 , . . . , vn ) eine Basis eines Vektorraumes V . Dann heißt n die Dimension von V , geschrieben dim V = n oder dimK V = n. b) Sei V ein Vektorraum, der für kein n ∈ N eine Basis (v1 , . . . , vn ) besitzt. Dann heißt V dimensional, geschrieben dim V = ∞. Beispiel : Für die uns vertrauten reellen Vektorräume Rn gilt dim Rn = n unendlich (auch für n = 1). Um Satz 3.1 beweisen zu können, benötigen wir zwei Hilfsmittel. Satz 3.2 (Basisergänzungssatz, BErg) Sei V ein beliebiger Vektorraum, {v1 , . . . , vr }, {w1 , . . . , ws } seien Teilmengen von V und es gelte L(v1 , . . . , vr , w1 , . . . , ws ) = V . Wenn (v1 , . . . , vr ) linear unabhängig ist, kann (v1 , . . . , vr ) durch Hinzufügen von Vektoren aus {w1 , . . . , ws } zu einer Basis von V ergänzt werden. Beweisskizze: 1. Wenn L(v1 , . . . , vr ) = V gilt, sind keine Vektoren hinzuzufügen – auch dieser Fall wird vom BErg eingeschlossen. 2. Sei L(v1 , . . . , vr ) 6= V = L(v1 , . . . , vr , w1 , . . . , ws ). Man kann zeigen, dass es wi ∈ {w1 , . . . , ws } gibt mit wi ∈ / L(v1 , . . . , vr ) =⇒ (v1 , . . . , vr , wi ) linear unabhängig. 3. Man überprüft, ob L(v1 , . . . , vr , wi ) = V gilt. Wenn ja, ist man fertig, sonst führt man 2. analog für L(v1 , . . . , vr , wi ) 6= V durch: ∃wj ∈ {w1 , . . . , ws }\{wi } mit wj ∈ / L(v1 , . . . , vr , wi ) =⇒ (v1 , . . . , vr , wi , wj ) linear unabhängig, usw. 4. Wegen s < ∞ ist man nach endlich vielen Schritten fertig. 72 4 LINEARE ALGEBRA Beispiel : Im R3 ist (v1 , v2 ) = ((1, 0, 0), (0, 1, 0)) linear unabhängig, für (w1 , w2 , w3 ) = ((1, 1, 0), (0, 1, 1), (1, 1, 1)) gilt (ohne Beweis) L(v1 , v2 , w1 , w2 , w3 ) = R3 . Wegen L(v1 , v2 ) = {(α1 , α2 , 0) | αi ∈ R} = 6 R3 gibt es wi ∈ {w1 , w2 , w3 } mit wi 6∈ L(v1 , v2 ). Wegen w1 = v1 + v2 ∈ L(v1 , v2 ) kommt w1 nicht in Frage, aber es ist w2 6∈ L(v1 , v2 ). (v1 , v2 , w2 ) ist linear unabhängig, man kann zeigen, dass dies eine Basis von R3 ist. Frage : Was ist mit (v1 , v2 , w3 )? Satz 3.3 (Austauschlemma, ATL) Seien {v1 , . . . , vn }, {w1 , . . . , wm } Basen eines beliebigen Vektorraumes V . Dann gilt: ∀vi ∈ {v1 , . . . , vn } ∃wj ∈ {w1 , . . . , wm } mit {v1 , . . . , vn }\{vi } ∪ {wj } ist Basis von V. Beweisskizze: OBdA sei i = 1. Wegen L(w1 , . . . , wm ) = V 6= L(v2 , . . . , vn ) gibt es wj ∈ {w1 , . . . , wm } mit (wj , v2 , . . . , vn ) linear unabhängig. BErg sagt uns, dass wir (wj , v2 , . . . , vn ) durch Hinzufügen von Vektoren aus {v1 } zu einer Basis von V ergänzen können. Die einzige Möglichkeit, dies zu tun, ist aber nichts hinzuzufügen! {wj , v2 , . . . , vn } ist bereits eine Basis, wir haben v1 durch wj ausgetauscht. Beispiel : (e1 , e2 , e3 ) und ((1, 1, 0), (1, 0, 1), (0, 1, 1)) sind zwei Basen des R3 . Wir wenden zweimal ATL an (die Lücken werden in der Vorlesung ausgefüllt): ((1, 0, 0), (0, 1, 0), ) und ((1, 0, 0), , ) sind Basen des R3 . Der Beweis von Satz 3.1 folgt direkt aus ATL; denn nur Basen gleicher Länge können vollständig ausgetauscht werden. Beispiele : 1) C ist Vektorraum über R. Da jede komplexe Zahl in der Form z = a + ib mit a, b ∈ R geschrieben werden kann, ist (1, i) eine Basis, damit ist dimR C = 2. 2) Was sind dimR R, dimQ R? Der Nachweis der linearen (Un)abhängigkeit konkreter Vektoren ist oft nicht einfach. In einem Fall können Sie sich allerdings jede Rechenarbeit ersparen, nämlich wenn Sie in einem Vektorraum der Dimension n mehr als n Vektoren auf lineare Unabhängigkeit untersuchen sollen. In Satz 1.3 wurde bewiesen, dass der Durchschnitt von Untervektorräumen ebenfalls ein Vektorraum ist. Was wissen wir über dim(U1 ∩ U2 )? Wir wollen diese Problematik zuerst an einem Beispiel erörtern. Sei V = R3 , Ui = L(ei ) für i = 1, 2, 3 und U4 = L(e1 , e2 ). Was ist dim Ui , dim(U1 ∩ U2 ), dim(U1 ∩ U4 ), dim(U3 ∩ U4 )? Wie wir (hoffentlich) gesehen haben, hängt die Dimension des Durchschnitts nicht nur von den Dimensionen der beteiligten Räume ab, sondern auch von ihrer Lage zueinander. Ab jetzt kürzen wir U ist Untervektorraum von V durch U ≤ V ab. Def 3.2 Seien U1 , U2 ≤ V . Dann heißt U1 + U2 := {x + y | x ∈ U1 , y ∈ U2 } Frage : Was unterscheidet U1 + U2 von U1 ∪ U2 ? Summe von U1 und U2 3 Dimension 73 Wir greifen das letzte Beispiel auf und erkennen U1 + U2 = {(α, 0, 0) + (0, β, 0) | α, β ∈ R} = L(e1 , e2 ) U1 + U4 = {(α, 0, 0) + (β1 , β2 , 0) | α, βi ∈ R} = {(α + β1 , β2 , 0) | α, βi ∈ R} = {(γ, 0, 0) + (0, β2 , 0) | γ, β2 ∈ R} = L(e1 , e2 ) U3 + U4 = {(0, 0, γ) + (β1 , β2 , 0) | γ, βi ∈ R} = {(β1 , 0, 0) + (0, β2 , 0) + (0, 0, γ) | βi , γ ∈ R} = L(e1 , e2 , e3 ) In allen Beispielen war die Summe von Untervektorräumen selbst ein Vektorraum. Dies ist kein Zufall: Satz 3.4 U1 , U2 ≤ V =⇒ U1 + U2 ≤ V Beweis: Wir überprüfen (U1) – (U3): Zu (U1): Es ist o = o + o ∈ U1 + U2 Zu (U2): x, y ∈ U1 + U2 =⇒ ∃xi , yi ∈ Ui mit x = x1 + x2 , y = y1 + y2 =⇒ x + y = (x1 + x2 ) + (y1 + y2 ) = (x1 + y1 ) + (x2 + y2 ) ∈ U1 + U2 Zu (U3): x ∈ U1 + U2 =⇒ ∃xi ∈ Ui mit x = x1 + x2 =⇒ αx = α(x1 + x2 ) = αx1 + αx2 ∈ U1 + U2 für jedes α ∈ K. Für die untersuchten Mengen gilt U1 ∩U2 ⊂ Ui ⊂ U1 ∪U2 ⊂ U1 +U2 (i = 1, 2). Wir wollen das Verhältnis der Mengen U1 ∪ U2 und U1 + U2 zueinander genauer untersuchen. Satz 3.5 Für Vektorräume U1 , U2 gilt U1 ∪ U2 = U1 + U2 ⇐⇒ U1 ⊂ U2 oder U2 ⊂ U1 Der Beweis ist eine Übungsaufgabe. (Hinweis: Man erinnere sich an den Beweis von Satz 1.3.) Wir merken uns: Während die Summe von Untervektorräumen stets selbst wieder einen Vektorraum ergibt, trifft dies für die Vereinigung nur in uninteressanten Spezialfällen zu. Satz 3.6 Dimensionsformel für Untervektorräume Seien U1 , U2 endlichdimensionale Untervektorräume. Dann gilt: dim(U1 + U2 ) = dim U1 + dim U2 − dim(U1 ∩ U2 ) Beweisskizze: Sei (v1 , . . . , vr ) eine Basis des kleinsten der beteiligten Untervektorräume U1 ∩ U2 . Mit Hilfe vom BErg können wir diese Basis einerseits zu einer Basis (v1 , . . . , vr , w1 , . . . , ws ) von U1 mit dim U1 = r + s und andererseits zu einer Basis (v1 , . . . , vr , z1 , . . . , zt ) von U2 mit dim U2 = r + t ergänzen. Man zeigt dann, dass (v1 , . . . , vr , w1 , . . . , ws , z1 , . . . , zt ) eine Basis von U1 + U2 ist. Hieraus folgt dim(U1 + U2 ) = r + s + t = (r + s) + (r + t) − r = dim U1 + dim U2 − dim(U1 ∩ U2 ). Die Hauptarbeit dieses Beweises steckt im Nachweis der Basiseigenschaft (B1) von (v1 , . . . , vr , w1 , . . . , ws , z1 , . . . , zt ); für Interessierte hier der vollständige Beweis (kein Vorlesungsstoff): Sei r P ν=1 αν vν + s P ν=1 βν wν + t P ν=1 γν zν = o (∗) 74 4 =⇒ t P γν zν = − ν=1 Da t P r P ν=1 γν zν ∈ U2 =⇒ ν=1 =⇒ t P αν vν − s P LINEARE ALGEBRA βν wν ∈ L(v1 , . . . , ws ) = U1 ν=1 t P γν zν ∈ U1 ∩ U2 = L(v1 , . . . , vr ) ν=1 γν zν = ν=1 r P µν vν ⇐⇒ ν=1 t P γν zν + ν=1 r P (−µν )vν = o ν=1 Da (v1 , . . . , vr , z1 , . . . , zt ) als Basis von U2 linear unabhängig ist, folgt γ1 = . . . = γt = 0. r s P P Wenn wir dies in (∗) einsetzen, folgt αν vν + βν wν = o ν=1 ν=1 Da (v1 , . . . , vr , w1 , . . . , ws ) eine Basis von U1 ist, folgt αi = βj = 0 für alle i = 1, . . . , r und j = 1, . . . , s, damit ist (B1) bewiesen. Für endlichdimensionale Vektorräume V kann man mit Hilfe dieses Satzes zeigen, dass echte Unterräume von V stets eine kleinere Dimension als V haben müssen. Beispiel : Im R3 ist für U = L((1, 2, 4), (1, 0, 2)) und V = L((2, 0, 4), (3, 1, 2)) die Dimension von U ∩ V gesucht. (Geometrisch handelt es sich um den Schnitt zweier Ebenen.) Lösung : ((1, 2, 4), (1, 0, 2)) und ((2, 0, 4), (3, 1, 2)) sind jeweils linear unabhängig: dim U = dim V = 2. =⇒ dim(U ∩ V ) = dim U + dim V − dim(U + V ) = 2 + 2 − dim(U + V ) mit dim(U + V ) ∈ {2, 3}. dim (U + V ) = 2 ist nicht möglich: dim (U + V ) = 2 =⇒ U = U + V = V , aber (1, 2, 4) ∈ U \V . Daher muss dim(U + V ) = 3 sein. Der gesuchte Schnitt hat die Dimension 1, es handelt sich um eine Gerade durch den Ursprung. 4 Lineare Abbildungen Grob gesprochen sind lineare Abbildungen bei Vektorräumen dasselbe wie Homomorphismen bei Gruppen, nämlich strukturerhaltende Abbildungen. Auch in diesem Kapitel seien V, W endlichdimensionale reelle Vektorräume. Wenn nicht ausdrücklich etwas Anderes erwähnt wird, geht es in den Beispielen um Vektorräume Rn mit kanonischen Basen (e1 , . . . , en ). Def 4.1 f : V → W heißt lineare Abbildung oder Homomorphismus : ⇐⇒ (L1) f (x + y) = f (x) + f (y) (L2) f (αx) = αf (x) ∀x, y ∈ V ∀α ∈ R, ∀x ∈ V Die Menge aller Homomorphismen von V nach W schreibt man Hom (V, W ) := {f : V → W | f linear }. Man beachte, dass in (L1) und (L2) jeweils für verschiedene Verknüpfungen das gleiche Symbol benutzt wurde. Um die Nullvektoren der verschiedenen Vektorräume V und W unterscheiden zu können, bezeichnen wir sie mit oV und oW . Beispiele : 1) V = W = R : f (x) := x + 1 ist nicht linear, g(x) := 5x ist linear. 2) V = R2 , W = R : f ((x1 , x2 )) := x1 − x2 ist linear, g((x1 , x2 )) := x1 x2 ist nicht linear. 3) V = R3 , W = R2 : f ((x1 , x2 , x3 )) := (x1 + x2 , x3 ) ist linear. 4 Lineare Abbildungen 75 Spezielle lineare Abbildungen haben besondere Namen. Eine lineare Abbildung f : V → W heißt Endomorphismus, falls V = W gilt, und Isomorphismus, falls f bijektiv ist. Treffen beide Bedingungen zu, liegt ein Automorphismus vor.20 Man wird bei beliebigen linearen Abbildungen f : V → W nicht erwarten können, dass jeder Vektor aus W ein Urbild besitzt. Stets gilt aber f (oV ) = oW : f (oV ) = f (0 · oV ) = 0 · f (oV ) = oW Def 4.2 Sei f ∈ Hom (V, W ). Dann heißt Kern f := {v ∈ V | f (v) = oW } Kern von f Bild f := {w ∈ W | ∃v ∈ V mit f (v) = w} = {f (v) | v ∈ V } Bild von f Der Kern einer linearen Abbildung besteht aus allen Vektoren, deren Bild der Nullvektor ist. Bild f wird in der Literatur auch im V ( image“) oder f (V ) genannt. ” R2 → R2 ? Beispiel : Was sind Bild f und Kern f von f : (x, y) 7→ (x, x) Für jede lineare Abbildung f : V → W ist Kern f ⊆ V und Bild f ⊆ W . Es gilt sogar Satz 4.1 Sei f ∈ Hom (V, W ). Dann gelten (a) Kern f ≤ V (b) Bild f ≤ W (c) f injektiv ⇐⇒ Kern f = {oV } Beweis: Um (a) und (b) zu beweisen, müssen wir jeweils (U1) – (U3) überprüfen. zu (a), (U1): Wir wissen bereits oV ∈ Kern f , also Kern f 6= ∅. (U2): v, w ∈ Kern f =⇒ f (v + w) = f (v) + f (w) = oW + oW = oW =⇒ v + w ∈ Kern f . (U3): α ∈ R, v ∈ Kern f =⇒ f (αv) = αf (v) = αoW = oW =⇒ αv ∈ Kern f . zu (b), (U1): Da V 6= ∅ =⇒ ∃v ∈ V mit f (v) ∈ W =⇒ Bild f 6= ∅ (U2), (U3): α ∈ R, x, y ∈ Bild f =⇒ ∃v, w ∈ V mit f (v) = x, f (w) = y =⇒ f (v + w) = f (v) + f (w) = x + y =⇒ x + y ∈ Bild f , f (αv) = αf (v) = αx =⇒ αx ∈ Bild f . zu (c): ⇒“: Ist klar, da wir den wesentlichen Schritt bereits bewiesen haben (wo?). ” ⇐“: Seien v, w ∈ V mit f (v) = f (w) ⇐⇒ oW = f (v) − f (w) = f (v − w) ” =⇒ v − w ∈ Kern f =⇒ v − w = oV =⇒ v = w =⇒ f injektiv. Wir stellen einen Zusammenhang zwischen den Dimensionen der Untervektorräume Kern f und Bild f her. Aus Kern f ≤ V folgt 0 ≤ dim Kern f ≤ dim V und aus Bild f ≤ W folgt 0 ≤ dim Bild f ≤ dim W . V → W Beispiele : 1) f : =⇒ dim Kern f = dim V, dim Bild f = 0. v 7→ oW 20 Man vergleiche die analogen Bezeichnungen bei Gruppen! 76 4 2) f : V v → V 7 → v =⇒ dim Kern f = 0, LINEARE ALGEBRA dim Bild f = dim V . R3 → R2 : Wegen f ((1, 0, 0)) = (1, 0) und f ((0, 0, 1)) = (0, 1) enthält das Bild (x, y, z) 7→ (x + y, z) zwei linear unabhängige Vektoren, damit ist dim Bild f = 2. 3) f : (x, y, z) ∈ Kern f ⇐⇒ f (x, y, z) = (x + y, z) = (0, 0) =⇒ x = −y, z = 0. Damit ist Kern f = {(x, −x, 0) | x ∈ R} = L((1, −1, 0)) =⇒ dim Kern f = 1. Satz 4.2 Dimensionsformel für lineare Abbildungen Sei f : V → W linear. Dann gilt dim V = dim Kern f + dim Bild f Beweisskizze: Jede Basis (v1 , . . . , vr ) des Kerns können wir dank BErg zu einer Basis von V ergänzen, sei (v1 , . . . , vr , vr+1 , . . . , vn ) die ergänzte Basis. Für ein beliebiges v ∈ V gilt dann ! ! ! n r n n n X X X X X f (v) = f αi vi = f αi vi + f αi vi = oW + αi f (vi ) = αi wi i=1 i=1 i=r+1 i=r+1 i=r+1 Damit ist Bild f = L(wr+1 , . . . , wn ). Aus der linearen Unabhängigkeit von (wr+1 , . . . , wn ) (Beweis für Interessierte anschließend) folgt dim Bildf = n − r, was zu zeigen war. Beh : (wr+1 , . . . , wn ) linear unabhängig Bew : Sei βr+1 wr+1 + . . . + βn wn = oW . Wegen wi = f (vi ) folgt oW = n X βi f (vi ) = f i=r+1 n P βi vi gehört damit zu Kern f = L(v1 , . . . , vr ). Es folgt i=r+1 n X ! βi vi i=r+1 n P βi vi = i=r+1 r P γi vi i=1 ⇐⇒ γ1 v1 + . . . + γr vr − βr+1 vr+1 − . . . − βn vn = oV =⇒ γ1 = . . . = γr = βr+1 = . . . = βn = 0 In der Dimensionsformel taucht dim W aus leicht erklärlichen Gründen nicht explizit auf: Bei jeder linearen Abbildung f : V → W kann W durch einen größeren“ Vektorraum W 0 ersetzt werden, also ” W ≤ W 0 , ohne dass sich Kern f und Bild f und damit deren Dimensionen ändern. Im Fall dim W < dim V kann f nicht injektiv sein, denn dim Kern f = dim V − dim Bild f ≥ dim V − dim W > 0. Weil die Dimension des Bildes auch Rang von f genannt wird, ist dim V = dim Kern f + Rang f eine andere Fassung dieser Formel. Frage/Beispiel : Wieviele lineare Abbildungen f : R2 → R3 gibt es mit f (e1 ) = (2, 4, 0) und f (e2 ) = (1, 0, 2)? 5 Beispiele von linearen Abbildungen in R2 und R3 77 Antwort : Sei (x, y) ∈ R2 beliebig. Wegen (x, y) = xe1 + ye2 folgt aus den Eigenschaften einer linearen Abbildung f ((x, y)) = f (xe1 + ye2 ) = xf (e1 ) + yf (e2 ) = x(2, 4, 0) + y(1, 0, 2) = (2x + y, 4x, 2y). Damit hat genau eine lineare Abbildung die verlangten Eigenschaften. Das ist kein Zufall: Ist (b1 , . . . , bn ) eine Basis von V und sind w1 , . . . , wn beliebige, nicht notwendig verschiedene Vektoren aus W , so gibt es immer genau eine lineare Abbildung f : V → W mit f (bi ) = wi für i = 1, . . . , n. Damit wir diesen Sachverhalt nicht so schnell vergessen, sei er hier noch einmal als Satz (ohne formalen Beweis) formuliert: Satz 4.3 Sei (b1 , . . . , bn ) eine Basis von V , sei (w1 , . . . , wn ) ein beliebiges n–Tupel von Vektoren aus W . Dann gilt ∃1 f ∈ Hom (V, W ) f (bi ) = wi für i = 1, . . . , n , n n n P P P nämlich f (v) = f αi f (bi ) = αi wi ∀ v ∈ V . αi bi = i=1 i=1 i=1 Feststellung : Die gesamte Information über eine lineare Abbildung ist bereits in den Bildern der Basisvektoren enthalten! Gemessen an der Gesamtzahl aller Abbildungen zwischen zwei Vektorräumen gibt es relativ wenige lineare Abbildungen. Wir wollen diese Behauptung ausnahmsweise am Beispiel der endlichen Vektorräume K3 und K2 für K = Z2 belegen: Es gibt (Kombinatorik!) insgesamt 48 > 65 000 Abbildungen von Z32 nach Z22 . Da man 4 · 4 · 4 = 64 Tripel (w1 , w2 , w3 ) mit wi ∈ Z22 bilden kann, sind nur 64 dieser Abbildungen linear. Die Verkettung linearer Abbildungen ergibt allerdings stets wieder eine lineare Abbildung. (Versuchen Sie den einfachen Nachweis!) 5 Beispiele von linearen Abbildungen in R2 und R3 In diesem Abschnitt gibt es keine neue Theorie und keine Sätze. Es werden nur einige hoffentlich bekannte Abbildungen behandelt. Wir legen jeweils die kanonische Basis zu Grunde, alle Überlegungen beziehen sich auf Satz 4.3, wonach jede lineare Abbildung eindeutig durch die Bilder der Basiselemente festliegt. A. Wir untersuchen lineare Abbildungen der Anschauungsebene R2 . 1. Sei f (e1 ) = e2 und f (e2 ) = −e1 . Für alle (x, y) ∈ R2 ist dann f ((x, y)) = f (xe1 + ye2 ) = xf (e1 ) + yf (e2 ) = xe2 − ye1 = (−y, x) 6 .. .. ... .. .. ... ... ........ . . . . ... . . . ................................. ......... ... ......... ... .. ... ... . ... . m l Es handelt sich um eine Drehung mit Drehzentrum ((0, 0)), der Drehwinkel beträgt π2 = 90◦ . m . ..................................................... ... .... . ... .. .. ..... . ......... ... .... ..... ... ... ... ........... ... ............ ... l - 78 4 LINEARE ALGEBRA Alle Drehungen um (0, 0) sind lineare Abbildungen, bezüglich der Hintereinanderausführung bilden sie eine abelsche Gruppe. Drehungen α 6= id mit anderem Drehzentrum sind wegen α((0, 0)) 6= (0, 0) nicht linear. Ab jetzt soll bei Drehungen stets der Nullvektor das Drehzentrum sein. 2. Sei f eine Drehung um 45◦ , gesucht ist f ((x, y)). Wir benötigen die Bilder der Basisvektoren. 6 f (e1 ) = αe1 + βe2 mit α = β und α2 + β 2 = 1 s f (e1 ) ......... ..... ... ..... ..... .. ... ..... .... ..... . . . . ... .... .... ... ..... ... ... ..... ... ..... ... ..... . . ... . . . . ... ... ... . . . . ... ... ... . . . . . ... ... .... . . . . .. ... α s e1 √ =⇒ f (e1 ) = (α, α) mit α = 2 2 . f (e2 ) und damit f werden in den Übungen bestimmt. - 3. Sei g die Spiegelung an der Geraden (Achse) y = −x, gesucht ist g((x, y)). Da auch Spiegelungen mit einer Achse durch den Ursprung lineare Abbildungen sind, ist g((x, y)) = xg(e1 ) + yg(e2 ) = x(−e2 ) + y(−e1 ) = (−y, −x) 4. Gesucht ist f ◦ g mit f von 1. und g von 3. Für die lineare Abbildung f ◦ g gilt (f ◦ g)((x, y)) = f (g((x, y))) = f ((−y, −x)) = (x, −y) Es handelt sich um eine Spiegelung an der x–Achse. 5. Translationen (Verschiebungen) bilden zwar mit der Hintereinanderausführung eine abelsche Gruppe, sind aber mit Ausnahme der Identität nicht linear (warum?). 6. Fragen : Wie lautet h((x, y)), wenn h eine zentrische Streckung um (0, 0) mit Streckungsfaktor 2 ist? Was passiert mit dem Fußballspieler von 1. unter der linearen Abbildung e1 7→ e1 , e2 7→ e1 + e2 ? B. Wir untersuchen lineare Abbildungen des Anschauungsraumes R3 , hierbei beschränken wir uns auf spezielle Drehungen und Spiegelungen. Die Drehungen haben als Drehachse eine Gerade durch den Koordinatenursprung. Der Drehwinkel wird in einer Ebene senkrecht zur Drehachse gemessen, wobei auf die eindeutige Angabe des Drehwinkels (Drehrichtung) geachtet werden muss. Gespiegelt wird an einer Ebene, die ebenfalls durch (0, 0, 0) verläuft. 1. Drehung um die z–Achse mit Drehwinkel von 90◦ . (Wir blicken in z–Richtung und drehen entgegen dem Uhrzeigersinn.) e1 7→ −e2 , e2 7→ e1 , e3 7→ e3 Für ein beliebiges (x, y, z) ∈ R3 erhalten wir f ((x, y, z)) = −xe2 + ye1 + ze3 = (y, −x, z). 2. Spiegelung an der yz–Ebene: e1 7→ −e1 , e2 7→ e2 , e3 7→ e3 , g((x, y, z)) = (−x, y, z). 3. Wir untersuchen g ◦ f : (g ◦ f )((x, y, z)) = g(f ((x, y, z))) = g((y, −x, z)) = (−y, −x, z). Es handelt sich um eine Spiegelung, die zugehörige Achse“, an der gespiegelt wird, ist die Ebene {(x, −x, z) | x, z ∈ R}. ” 4. Frage : Welche Abbildung ist f ◦ g? 6 Lineare Abbildungen und Matrizen 79 6z–Achse Frage : Wo befindet sich der Fußballspieler nach Durchführung der Abbildungen f ◦ g bzw. g ◦ f ? m .. ...................................................... ... ..... . ... ... .. .... . ... ... ... .. ........... ............ - l y–Achse + x–Achse 5. Für die Abbildung h mit e1 7→ e2 , e2 7→ e3 , e3 7→ e1 gilt h((x, y, z)) = (z, x, y). Wir untersuchen, welche Punkte unter h festbleiben: (x, y, z) = h((x, y, z)) = (z, x, y) ⇐⇒ x = y = z. Genau die Punkte auf der Geraden R((1, 1, 1)) = L(e1 + e2 + e3 ) sind Fixpunkte, h ist eine Drehung. Wie groß ist der Drehwinkel? Alle Drehungen mit einer Drehachse durch (0, 0, 0), alle Spiegelungen an einer Ebene durch (0,0,0) und alle zentrischen Streckungen mit Zentrum (0, 0, 0) sind lineare Abbildungen. 6 Lineare Abbildungen und Matrizen Noch einmal zur Aussage von Satz 4.3: Jede lineare Abbildung f : Rn → Rm ist eindeutig bestimmt durch n Vektoren f (e1 ) = (a11 , . . . , am1 ), . . . , f (en ) = (a1n , . . . , amn ) ∈ Rm , also durch n · m viele reelle Zahlen aij , die nicht verschieden sein müssen. Umgekehrt legt jedes n · m–Tupel reeller Zahlen genau eine lineare Abbildung von Rn nach Rm fest: f (x) = f n X ! xi ei = n X i=1 xi f (ei ) = i=1 n X xi (a1i , . . . , ami ) i=1 Wir wollen hierfür eine übersichtlichere Schreibweise kennenlernen. Def 6.1 Seien aij reelle Zahlen. Das Schema a11 a21 .. . a12 a22 .. . am1 am2 ··· ··· a1n a2n .. . ··· · · · amn heißt (m × n)–M atrix . Die Menge aller (m × n) – Matrizen schreiben wir M (m × n). Beispiel : 1 2 3 4 0 1 −1 5 1 ist eine (2 × 4) – Matrix, 0 eine (3 × 1)–Matrix. 1 Eine (m × n) – Matrix hat m Zeilen und n Spalten, geschrieben A = (aij ) ∈ M (m × n), und besteht aus m · n vielen Zahlen. 80 4 LINEARE ALGEBRA Was haben Matrizen mit linearen Abbildungen zu tun? Jede lineare Abbildung f : Rn → Rm ist ebenfalls durch m · n viele Zahlen eindeutig festgelegt. Schreiben wir jeden der n die lineare Abbildung bestimmenden Bildvektoren f (ei ) = (a1i , . . . , ami ) als Spaltenvektor 21 a1i f (ei ) = (a1i , . . . , ami ) = ... , ami erhalten wir als zugehörige Matrix a11 · · · a1n .. ∈ M (m × n) A = (f (e1 ) . . . f (en )) = ... ··· . am1 · · · amn Feststellung: Zu jeder linearen Abbildung f : Rn → Rm gehört eine Matrix A ∈ M (m × n). Beispiel : Zur Drehung in der Anschauungsebene (Anfang Kapitel 5) gehört die Matrix 0 −1 ∈ M (2 × 2) (f (e1 ) f (e2 )) = (e2 − e1 ) = 1 0 Wir sind es gewohnt, Abbildungen f in der Form f (x) = . . . anzugeben, beispielsweise die eben erwähnte Drehung durch f ((x, y)) = (−y, x). Auch diese Darstellung kann man bei linearen Abbildungen leicht aus der zugehörigen Matrix gewinnen; denn es gibt folgende Verbindung zwischen Matrix A und Urbild x einerseits und Bild f (x) andererseits: x1 Def 6.2 Sei A ∈ M (m × n), x = ... ∈ Rn = M (n × 1). Dann ist xn a11 · · · a1n .. · A · x = ... ··· . am1 · · · amn x1 a11 x1 + . . . + a1n xn .. := .. m ∈ M (m × 1) = R . . xn am1 x1 + . . . + amn xn Matrizen und Vektoren kann man genau dann miteinander multiplizieren, wenn die Matrix so viele Spalten wie der Vektor Zeilen hat, die Rechenvorschrift kann man sich gut durch die Regel Zeile mal Spalte merken. x 1 1 2 3 y Beispiele : = , −1 2 = 4 5 6 z 1 1 0 3 1 0 −1 1 2 3 2 = = , −1 1 1 1 21 Wir erlauben uns die Freiheit, Vektoren wahlweise in einer Zeile (x1 , . . . , xn ) (beachte die Kommata) oder als (n × 1) – Matrix (Spaltenvektor) zu schreiben. 6 Lineare Abbildungen und Matrizen 81 Kehren wir zu der linearen Abbildung f zurück! Wir stellen fest: Das Ergebnis der soeben definierten Multiplikation A · x ist nichts anderes als f (x), geschrieben als Spaltenvektor: n R → Rm Satz 6.1 a) Sei A ∈ M (m × n). Dann ist f : eine lineare Abbildung. x 7→ Ax b) Sei f : Rn → Rm linear. Dann ist f (x) = Ax mit A = (f (e1 ) . . . f (en )) ∈ M (m × n). Beispiele : 1) Zur Drehung aus Kapitel 5: Es ist 2) f ((x, y)) = 1 1 0 1 x y = x+y y 0 −1 1 0 x y = −y x = (−y, x). P s y 6 f (P ) s = (x + y, y). - Diese Abbildung der Anschauungsebene wird Scherung genannt. x 3) f : R3 → R3 , Projektion auf die xy–Ebene: e1 7→ e1 , e2 7→ e2 , e3 7→ 0. 1 0 0 Die zugehörige Matrix ist A = 0 1 0 0 0 0 R3 → R4 Wie lautet die zugehörige Matrix? 4) f : (x, y, z) 7→ (2x − z, 3y, x + y − z, y − 3z) 3 0 ? 5) Welche Abbildung gehört zu 0 3 6) Gesucht ist im R2 eine Drehung um den Ursprung mit dem Drehwinkel α = 27◦ . s .. .... ..... ..... .... . . . .... .... . .......... ........ ..... ..... ................. .... .. ..... . . . ... ............... . . . ................ ........... αI e2 s6 ................................. ............... ......... ......... ....... ............................................. ...... ...... ....... ...... . . . . ..... ... ... .... . . . ..... . . ... ... . ..... . . . . .... .... ... ... . . ... ... .... ... .. . . ... ... .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .................... . . ... .. .. ... .. . . . . . ... ... .... ........ . . . .. . . . . . . . . . . . . . . . . ..... ...... ..... ..... .... ... ... ....... ... ....... .... .... ... .... ......... ... . . . . . . ... . .... . ... ... .......... .. ... ... .... ... .. ........... .. .. . .. s 6 s (a, b) s α - s e1 - Es ist b = sin α und a = cos α Wegen f (e1 ) = ae1 + be2 und f (e2 ) = −be1 + ae2 ist die zugehörige Matrix cos α − sin α a −b A= = , damit ist f ((x, y)) = (ax − by, bx + ay). sin α cos α b a Wir erinnern uns an die Verkettung von Abbildungen. f : Rm → Rl und g : Rn → Rm können hintereinander ausgeführt werden, und zwar erst g und dann f . Sind beide Abbildungen linear, ist auch die Verkettung f ◦ g : Rn → Rl linear: (f ◦ g)(x + y) = f (g(x + y)) = f (g(x) + g(y)) = f (g(x)) + f (g(y)) = (f ◦ g)(x) + (f ◦ g)(y) (f ◦ g)(αx) = f (g(αx)) = f (αg(x)) = αf (g(x)) = α(f ◦ g)(x) 82 4 LINEARE ALGEBRA Nach Satz 6.1 gibt es Matrizen A, B, C mit f (x) = Ax, g(x) = Bx, (f ◦ g)(x) = Cx. Wir untersuchen den Zusammenhang dieser Matrizen: Cx = (f ◦ g)(x) = f (g(x)) = f (Bx) = A(Bx) 1 1 Beispiel : f : → 7→ (x + y, 2x − y) mit A = 2 −1 1 −1 2 2 g : R → R , (x, y) 7→ (x − y, x) mit B = . 1 0 R2 R2 , (x, y) , Es ist (f ◦ g)((x, y)) = f (g((x, y))) = f ((x − y, x)) = (x − y + x, 2(x − y) − x) = (2x − y, x − 2y) und (g ◦ f )((x, y)) = g(f ((x, y))) = g((x + y, 2x − y)) = (x + y − (2x − y), x + y) = (−x + 2y, x + y). x 2 −1 Die Matrix C ∈ M (2 × 2) mit (f ◦ g)((x, y)) = C(x, y) = C ist daher C = , zu g ◦ f y 1 −2 −1 2 gehört . 1 1 Wir untersuchen allgemeiner f, g ∈ Hom (R2 , R2 ) mit zugehörigen Matrizen (aij ), (bij ): a11 a12 b11 b12 x1 (f ◦ g)(x) = A(Bx) = a21 a22 b21 b22 x2 a11 a12 b11 x1 + b12 x2 = a21 a22 b21 x1 + b22 x2 a11 (b11 x1 + b12 x2 ) + a12 (b21 x1 + b22 x2 ) = a21 (b11 x1 + b12 x2 ) + a22 (b21 x1 + b22 x2 ) (a11 b11 + a12 b21 )x1 + (a11 b12 + a12 b22 )x2 = (a21 b11 + a22 b21 )x1 + (a21 b12 + a22 b22 )x2 a11 b11 + a12 b21 a11 b12 + a12 b22 x1 = = Cx a21 b11 + a22 b21 a21 b12 + a22 b22 x2 Analog ergibt (g ◦ f )(x) = B(Ax) = b11 a11 + b12 a21 b11 a12 + b12 a22 b21 a11 + b22 a21 b21 a12 + b22 a22 x1 x2 . Def 6.3 Sei A ∈ M (m × r), B ∈ M (r × n). Dann ist A ◦ B = (aij ) ◦ (bij ) = (cij ) ∈ M (m × n) definiert r P durch cij := aiν bνj für i = 1, . . . , m und j = 1, . . . , n. ν=1 Diese Multiplikation von Matrizen ist eine Verallgemeinerung der Definition 6.2 auf mehrere Spalten, auch hier gilt die Merkregel Zeile mal Spalte. A ◦ B ist nur möglich, falls die Spaltenzahl von A mit der Zeilenzahl von B übereinstimmt. Statt A ◦ B schreiben wir kürzer AB. 1 2 0 1 4 7 3 4 Beispiele : 1) A = ,B = =⇒ AB = , BA = . 3 4 2 3 8 15 11 16 6 Lineare Abbildungen und Matrizen 2) A = 3) A = 83 1 0 1 2 3 0 −1 ,B = =⇒ AB = 0 1 2 1 1 0 1 1 1 1 , B = 0 0 =⇒ AB = 1 0 1 2 3 , BA = . , BA ist nicht definiert. Wie wir an den Beispielen gesehen haben, ist die Multiplikation von Matrizen nicht kommutativ. Dies ist aber kein Wunder: Feststellung: Die Matrizenmultiplikation entspricht genau der Verkettung von linearen Abbildungen: Wenn Matrix A zur Abbildung f und Matrix B zu g gehört, liefert f ◦ g die Matrix A ◦ B. Satz 6.2 (Assoziativgesetz für Matrizenmultiplikation) Seien A ∈ M (m × r), B ∈ M (r × s), C ∈ M (s × n). Dann ist A(BC) = (AB)C. Wir geben wir zwei ganz unterschiedliche Beweise an: 1. Beweis: (Elegant) Nach Satz 6.1 gibt es zu den Matrizen A, B und C eindeutig bestimmte lineare Abbildungen f, g und h. Auch die verketteten Abbildungen f ◦ (g ◦ h) und (f ◦ g) ◦ h sind linear, hierzu gehören die Matrizen A(BC) bzw.(AB)C. Da die Hintereinanderausführung von Funktionen grundsätzlich assoziativ ist, folgt f ◦ (g ◦ h) = (f ◦ g) ◦ h und damit die Behauptung A(BC) = (AB)C. 2. Beweis: (Brutal) A(BC) = (aij ) ((bij )(cij )) = (aij ) s X ! biν cνj ν=1 = r X s X = r X µ=1 aiµ s X ! bµν cνj ν=1 s r r X X X aiµ bµν cνj = aiµ bµν cνj = aiµ bµj (cij ) µ=1 ν=1 ν=1 µ=1 µ=1 = ((aij )(bij )) (cij ) = (AB)C Beispiel : Im R2 seien f die Spiegelung an der y–Achse und g die Spiegelung an der Geraden y = x, gesucht sind die Matrizen für die verketteten Abbildungen f ◦ g ◦ f und g ◦ f ◦ g: Wegen f (e1 ) = −e1 , f (e2 ) = e2 , g(e1 ) = e2 , g(e2 ) = e1 folgt für die zugehörigen Matrizen −1 0 0 1 F = , G= . 0 1 1 0 0 −1 =⇒ Zu f ◦ g ◦ f gehört F GF = , zu g ◦ f ◦ g die Matrix GF G = . −1 0 Die bekannte und in jedem Körper gültige Regel xy = 0 =⇒ x = 0 oder y = 0 gilt nicht für die Matrizenmultiplikation: 1 1 0 1 Beispiel : Was ist = ?? 0 −1 0 0 84 4 LINEARE ALGEBRA Man sagt hierzu auch: Matrizen sind nicht nullteilerfrei. Wir schließen diesen inhaltsreichen Abschnitt mit einem interessanten Nebenprodukt unserer teilweise abstrakten Überlegungen. Satz 6.3 Für sin und cos gelten die Additionsregeln sin(α + β) = sin α cos β + cos α sin β cos(α + β) = cos α cos β − sin α sin β Beweis: Wie wir gesehen haben, gehört inder Anschauungsebene zu einer Drehung um den Nullpunkt cos γ − sin γ mit einem beliebigen Winkel γ die Matrix . Für eine Drehung um den Winkel α + β sin γ cos γ lautet die entsprechende Matrix cos(α + β) − sin(α + β) M= sin(α + β) cos(α + β) Die gleiche lineare Abbildung und damit die gleiche Matrix M erhalten wir, wenn wir nacheinander um die Winkel β und α drehen. Für die zugehörigen Matrizen folgt dann cos α − sin α cos β − sin β sin α cos α sin β cos β = cos α cos β − sin α sin β −(sin α cos β + cos α sin β) sin α cos β + cos α sin β cos α cos β − sin α sin β Aus der Gleichheit von M mit der letzten Matrix folgt die Behauptung. Wir erhalten übrigens die gleiche Matrix, wenn die beiden Drehungen in anderer Reihenfolge vorgenommen werden. 7 Reguläre Matrizen Matrizen und lineare Abbildungen gehören eineindeutig zusammen22 , wobei der Verkettung der Abbildungen genau die Matrizenmultiplikation entspricht. Da die bijektiven linearen Abbildungen (Automorphismen) f : Rn → Rn für jedes n ∈ N mit der Verkettung eine Gruppe bilden, gilt dies auch für die zugehörigen Matrizen mit der Matrizenmultiplikation als Verknüpfung. Def 7.1 und Satz 7.1 Die zu einem Automorphismus f gehörende Matrix heißt invertierbar oder regulär. Für jedes n ∈ N bilden alle regulären (n × n)–Matrizen bzgl. ◦ eine Gruppe. Neutrales Element der Matrizengruppe ist die zur Identität gehörende Einheitsmatrix En , bei der genau die Einträge auf der Hauptdiagonalen den Wert 1 und alle anderen den Wert 0 haben. 1 0 .. En = ∈ M (n × n) . 0 22 1 Wir beziehen uns weiterhin auf die kanonische Basis. Bei anderen Basen ist der Zusammenhang komplizierter. 7 Reguläre Matrizen 85 Wie üblich bezeichnen wir die zu A inverse Matrix mit A−1 . Frage : Wie erkennt und berechnet man inverse Matrizen? a11 a12 Satz 7.2 Sei A = . Dann gelten a21 a22 a) b) Antwort für n = 2: A regulär =⇒ a11 a22 − a12 a21 6= 0 a11 a22 − a12 a21 6= 0 =⇒ A regulär mit inverser Matrix A−1 = 1 a11 a22 −a12 a21 a22 −a12 −a21 a11 Hierbei bedeutet αA, dass α mit jedem Element der Matrix A multipliziert wird. Beweis: a) Aus der Regularität von A folgt für die zugehörige lineare Abbildung f nach Satz 4.1 (c) Kern f = {((0, 0))}. Es müssen auch (f (e1 ), f (e2 )) linear unabhängig sein: (0, 0) = αf (e1 ) + βf (e2 ) = f (αe1 + βe2 ) =⇒ αe1 + βe2 = (0, 0) =⇒ α = β = 0 Damit ist f (e1 ) = (a11 , a21 ) kein Vielfaches von f (e2 ) = (a12 , a22 ). Wir können oBdA a12 6= 0 annehmen und erhalten a11 a11 a22 a11 a22 (a11 , a21 ) 6= (a12 , a22 ) = a11 , =⇒ a12 a21 6= a11 a22 =⇒ a21 6= a12 a12 a12 a22 −a12 b) Sei erneut f die lineare Abbildung zu A. Auch zur Matrix B = gehört −a21 a11 eine Abbildung, nennen wir sie g. Wir müssen zeigen, dass f bijektiv ist und dass g die zu f inverse Abbildung ist. 1 a11 a22 −a12 a21 Beh. 1 : f ◦ g = id Beweis : Wir führen die Matrizenmultiplikation A ◦ B durch und erhalten durch simples Rechnen a22 −a12 a22 −a12 a11 a12 a11 a12 1 1 = a11 a22 −a12 a21 A◦B = a11 a22 −a12 a21 −a21 a11 −a21 a11 a21 a22 a21 a22 = 1 a11 a22 −a12 a21 a11 a22 − a12 a21 0 0 −a21 a12 + a22 a11 = 1 0 0 1 = E2 . Weil zur Einheitsmatrix die identische Abbildung gehört, folgt f ◦ g = id.23 Wir wissen jetzt (f ◦ g)((x, y)) = (x, y) für jedes Paar (x, y) und Kern (f ◦ g) = {(0, 0)}. Beh. 2 : Kern g = {(0, 0)} Beweis : Für (x, y) ∈ Kern g, d.h. g((x, y)) = (0, 0), untersuchen wir (f ◦ g)((x, y)) = f (g((x, y))) = f ((0, 0)) = (0, 0). Es folgt (x, y) ∈ Kern (f ◦ g) = {(0, 0)}, also (x, y) = (0, 0). Damit ist g injektiv, aus dem Dimensionssatz folgt wegen 2 = dim Kern g+dim Bild g die Surjektivität von g, also ist g bijektiv mit inverser Abbildung g −1 . Beh. 3 : f ist bijektiv. Beweis : g −1 = (f ◦ g) ◦ g −1 = f ◦ (g ◦ g −1 ) = f . 23 Dies heißt leider noch nicht, dass f bijektiv ist, wie man am Beispiel f : R3 → R2 , (x, y, z) 7→ (x, y) und g : R2 → R3 , (x, y) 7→ (x, y, y) sieht: Auch hier ist f ◦ g = id. 86 4 LINEARE ALGEBRA Der Rest ist einfach: Weil f bijektiv ist, ist A regulär. Die inverse Matrix A−1 gehört zur Abbildung f −1 = g und deshalb ist wie gefordert A−1 = B. Beispiele : 1) Im R2 ist die Drehung um (0,0) mit α = 90◦ ein Automorphismus, die zugehörige Matrix 0 −1 0 1 −1 ist A = . Wegen a11 a22 − a12 a21 = 1 ist A = (Drehung um (0,0) mit 270◦ ). 1 0 −1 0 0 1 2 −1 2) Wenn wir im R an der Geraden y = x spiegeln, ist A = A = . 1 0 −1 (Beachte a11 a22 − a12 a21 = −1, also A 0 −1 −1 0 = −1 3) Gesucht ist die inverse Matrix zu A = 1 2 1 −1 = 0 1 1 0 .) : Wegen a11 a22 −a12 a21 = −3 ist A−1 = 1 3 1 3 2 3 ! − 13 . Die Kenntnis von inversen Matrizen kann auch bei der Lösung von Gleichungssystemen nützlich sein. Beispiel : Gesucht sind alle reelle Zahlen x1 und x2 , die folgende Gleichungen erfüllen: 3x1 + 2x2 = 3 7x1 + 5x2 = 2 ⇐⇒ 3 2 7 5 x1 x2 = 3 2 ⇐⇒ Ax = b . Wenn A regulär ist, gilt allgemein Ax = b ⇐⇒ A−1 (Ax) = A−1 b ⇐⇒ En x = x = A−1 b Im obigen Beispiel erhalten wir die Lösung x1 = 11 und x2 = −15 aus x1 x2 = 3 2 7 5 −1 3 2 = 5 −2 −7 3 3 2 = 11 −15 Für uns sind damit im Zusammenhang mit dem Lösen von Gleichungen folgende Fragen aktuell: • Wie erkennt man die Regularität von A ∈ M (n × n) und wie berechnet man gegebenenfalls A−1 ? • Was macht man andernfalls (A nicht regulär oder A nicht quadratisch, d.h. die Anzahl der Unbekannten ist verschieden von der Anzahl der Gleichungen)? Wir merken uns: Lineare Abbildungen f : Rn → Rm und Matrizen gehören eindeutig zusammen, zu bijektiven linearen Abbildungen passen reguläre Matrizen. Im nächsten Abschnitt werden wir untersuchen, wie der Begriff des Rangs einer linearen Abbildung (zur Erinnerung: Dies ist die Dimension des Bildraumes) auf die zugehörige Matrix übertragen werden kann. 8 Rang einer Matrix 8 87 Rang einer Matrix Wir erinnern an rang f = dim Bild f für lineare Abbildungen. Inzwischen wissen wir, dass zu jeder linearen Abbildung f : Rn → Rm eine Matrix A = (f (e1 ) . . . f (en )) gehört mit Bild f = L(f (e1 ), . . . , f (en )). Der Rang von f ist daher nichts Anderes als die maximale Anzahl linear unabhängiger Spalten von A, an Stelle von rang f können wir gleichwertig vom Spaltenrang SR A von A sprechen: rang f = SR A. 1 0 2 R3 → R2 Beispiel : Zu A = gehört f : , es ist SR A = 2. 1 1 0 (x, y, z) 7→ (x + 2z, x + y) Was Spalten recht ist, sollte Zeilen billig sein! Frage : Was ist der Zeilenrang ZR A einer Matrix A? Antwort : Die maximale Anzahl linear unabhängiger Zeilen von A. 1 0 2 Beispiel : Was ist der Zeilenrang von A = ? 1 1 0 Obwohl die Matrix im Beispiel mehr Spalten als Zeilen hat, stimmen Spalten– und Zeilenrang überein, weiter Beispiele verhalten sich analog. Satz 8.1 Für jede Matrix A ∈ M (m × n) gilt SR A =ZR A. Einen Beweis findet man beispielsweise in den Lehrbüchern von Beutelspacher und Jänich, jeweils mit dem Titel Lineare Algebra.24 Insgesamt gilt für jede lineare Abbildung f mit zugehöriger Matrix A: Def 8.1 Sei A ∈ M (m × n). Dann heißt rg A := rang f = SR A = ZR A rang f = SR A = ZR A. Rang von A. Wir wollen in einigen Beispielen den Rang bestimmen. 1 2 3 : Wir sehen uns die Zeilen von A an. Da sie linear unabhängig sind, Beispiele : 1) A = 3 2 1 ist rg A = 2. Wir können auch die Spalten betrachten: Da die ersten beiden linear unabhängig sind, ist rg A = 2. Frage : Warum ist rg A = 3 unmöglich? 1 3 4 2) B = 2 5 7 Zeilen 1 und 3 linear abhängig, Zeilen 1 und 2 unabhängig, daher rg B = 2. 2 6 8 1 2 3 4 3) C = 0 5 6 7 , rg C = ?? (einfach) 0 0 8 9 1 2 1 3 4) D = 1 1 0 2 , rg D = ?? (nicht so einfach) −1 0 1 −1 Schön wäre es, wenn wir die Matrix D von oben auf eine Gestalt ähnlich zur Matrix C bringen könnten, ohne ihren Rang zu verändern. Welche Manipulationen von Zeilen oder Spalten ändern den Rang nicht? 1. Überlegung: Vertauschung zweier Zeilen [Spalten] ändert den Rang nicht; denn lineare (Un)abhängigkeit hängt nicht von der Reihenfolge der Vektoren ab. 24 Diese Bücher sind insgesamt gut als ergänzende Lektüre für den Stoff dieses Semesters geeignet. 88 4 LINEARE ALGEBRA 2. Überlegung: Multiplikation einer Zeile [Spalte] mit α ∈ R∗ ändert den Rang nicht; denn lineare (Un)abhängigkeit hängt nicht von der Vielfachheit einzelner Vektoren ab. 3. Überlegung: Addition des Vielfachen einer Zeile [Spalte] zu einer anderen Zeile [Spalte] ändert den Rang nicht; denn lineare (Un)abhängigkeit hängt nicht von Linearkombinationen der beteiligten Vektoren ab. Wir wollen von elementaren Umformungen sprechen, genauer von elementaren Zeilenumformungen EZU bzw. elementaren Spaltenumformungen ESU, noch genauer von EZU 1 – EZU 3 bzw. ESU 1 – ESU 3 und merken uns: Elementare Umformungen ändern den Rang nicht. Nehmen wir uns 1 Beispiel : 1 −1 noch einmal die Matrix D 2 1 3 1 1 0 2 → 0 0 1 −1 0 aus Beispiel 4 vor: 2 1 3 1 2 1 3 1 1 1 → 0 1 1 1 =⇒ rg D = 2. 2 2 2 0 0 0 0 Frage : Welche Umformungen wurden benutzt? Elementare Umformungen können wir als Kochrezept“ benutzen, um den Rang einer beliebigen Matrix ” zu bestimmen: 1. Sorge für a11 6= 0 (Hilfsmittel: EZU 1, ESU 1). Ist dies nicht möglich, so liegt die Nullmatrix mit rg A = 0 vor. a11 0 2. Überführe die erste Spalte von A in . (alle Umformungen erlaubt, günstig EZU 3). . . 0 a11 ∗ · · · ∗ 0 überführt ist, fahre mit der Teilmatrix A0 mit dem ersten Schritt 3. Wenn A in 0 0 A 0 fort, bis eine Matrix erreicht ist, der man den Rang ansieht“. ” Für quadratische Matrizen A kann man auf diese Weise feststellen, ob A regulär ist und ob A−1 existiert. Es gilt sogar (ohne Beweis) Satz 8.2 A regulär =⇒ die gleichen EZU, die A in E überführen, verwandeln E in A−1 . 1 2 Beispiele : 1) Die Matrix A = ist wegen 1 · 7 − 2 · 3 = 1 6= 0 regulär, nach Satz 7.2 ist 3 7 7 −2 A−1 = . Wir wollen das Ergebnis mit dem neuen Verfahren verifizieren: −3 1 1 2 1 0 1 0 7 −2 1 2 1 0 → → = (E|A−1 ) (A|E) = 3 7 0 1 0 1 −3 1 0 1 −3 1 2) (A|E) = 1 2 1 0 3 6 0 1 → 1 2 1 0 0 0 −3 1 → ??? Falls A nicht regulär ist, bricht das Verfahren ohne Ergebnis ab. An Stelle von EZU kann man auch ESU benutzen. Satz 8.2 gilt allerdings nicht, falls EZU und ESU gemischt angewandt werden. 9 9 Determinanten 89 Determinanten In Satz 7.2 haben wir festgestellt A = a11 a12 a21 a22 regulär ⇐⇒ a11 a22 − a12 a21 6= 0, in Kapitel 4.8 haben wir für 2 × 2–Matrizen gelernt A regulär ⇐⇒ rg A = 2 ⇐⇒ Alle Spaltenvektoren bzw. Zeilenvektoren von A sind linear unabhängig. a11 a12 Damit können wir mit der Abbildung A = 7→ |A| := a11 a22 −a12 a21 feststellen, ob zwei Veka21 a22 toren linear unabhängig sind. Wir werden den Funktionswert |A| später als Determinante kennenlernen. Vorher wollen wir interessante Eigenschaften dieser Abbildung erwähnen: 1) Genau dann, wenn eine Matrix A linear abhängige Zeilen oder Spalten enthält, ist |A| = 0. 2) Für alle reelle Zahlen α, aij , a0ij ist wegen α(a11 a22 − a12 a21 ) = αa11 a22 − αa12 a21 a11 a12 αa11 a12 a11 αa12 αa11 αa12 a11 a12 , = = = = α a21 a22 αa21 a22 a21 αa22 a21 a22 αa21 αa22 ferner ist a11 + a011 a12 a11 a12 a011 a12 = + , a21 + a0 a21 a22 a0 21 a22 21 a22 gleiches gilt für die zweite Spalte und für beide Zeilen. Frage : Wie lauten die entsprechenden Aussagen? 1 0 = |E2 | = 1. 3) 0 1 Frage : Gibt es auch zu anderen n ∈ N eine Abbildung M (n × n) → R mit analogen Eigenschaften? Die Antwort erfolgt im nächsten Satz, den wir nicht beweisen werden. Gleichzeitig wird die sogenannte Determinantenfunktion allgemein vorgestellt und für die Fälle n = 2 und n = 3 explizit angegeben: Def 9.1 und Satz 9.1 Zu jedem n ∈ N gibt es genau eine Determinantenfunktion M (n × n) → R, A 7→ |A|, die die Eigenschaften 1) – 3) erfüllt. Speziell gilt für n = 2 : |A| = a11 a22 − a12 a21 n = 3 : |A| = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 Als Eselsbrücke merken wir uns für n = 2: Hauptdiagonale – Nebendiagonale. Der Fall n = 3 läuft auch unter den Begriffen Jägerzaunregel oder Regel von Sarrus (wird in der Vorlesung näher erklärt). 1 3 0 1 3 0 1 3 Beispiel : Determinante von 2 1 4 mit der Eselsbrücke 2 1 4 2 1 : 0 1 2 0 1 0 1 2 1 3 0 2 1 4 = 1 · 1 · 2 + 3 · 4 · 0 + 0 · 2 · 1 − 0 · 1 · 0 − 1 · 4 · 1 − 3 · 2 · 2 = −14 . 0 1 2 Eine der Behauptungen von Satz 9.1 ist die Eindeutigkeit der Determinantenfunktion. Wir wollen uns dies für n = 1 explizit vor Augen führen, zumal wir auf diese Weise einiges des bisher Gelernten anwenden können: 90 4 LINEARE ALGEBRA Für n = 1 ist bis auf Klammern M (1 × 1) = R. Wegen 2) ist eine lineare Abbildung R → R gesucht, die wegen 3) |(1)| = 1 erfüllen soll. Da jede lineare Abbildung durch die Bilder der Basisvektoren eindeutig festgelegt ist (siehe Satz 4.3), und weil 1 die kanonische Basis des reellen Vektorraumes R ist, kann es höchstens eine Abbildung der gesuchten Art geben, nämlich |(r)| = |(r · 1)| = r · |(1)| = r · 1 = r. Es liegt die identische Abbildung vor. Da sie auch die bisher noch nicht beachtete erste Forderung erfüllt (warum?), gibt es für n = 1 genau eine Determinantenfunktion. Beispiel : Die durch f (x) = −2x auf R definierte Funktion ist bijektiv und linear. Die zugehörige Matrix ist A = (−2) mit Determinante |A| = |(−2)| = −2; die Determinantenstriche dürfen nicht mit dem Betrag einer Zahl verwechselt werden! Die Jägerzaunregel ist nur für n = 3 und kein anderes n anwendbar. Frage : Wie berechnet man die Determinante bei größerem n? Def 9.2 Sei A ∈ M (n × n). Dann ist Aij ∈ M ((n − 1) × (n − 1)) die Matrix, die durch Streichen der i–ten Zeile und j–ten Spalte aus A entsteht. (Streichungsmatrix) 1 5 Beispiel : A = 9 c 2 6 0 d 3 7 a e 4 8 =⇒ A23 = b f , (A23 )23 = Ohne Beweis geben wir den Entwicklungssatz für Determinanten an: Satz 9.2 Sei A ∈ M (n × n). Dann gilt a) b) |A| = |A| = n X i=1 n X (−1)i+j aij |Aij | für alle j = 1, . . . , n (−1)i+j aij |Aij | für alle i = 1, . . . , n j=1 Man spricht bei a) von der Entwicklung nach der j–ten Spalte und bei b) von der Entwicklung nach der i–ten Zeile. Beispiel : 1 2 3 Sei A = a b c , Entwicklung nach der ersten Zeile (i = 1 fest): x y z 3 a b b c a c P 1+j = ··· +3· |A| = (−1) a1j |A1j | = 1 · −2· x y x z y z j=1 In der Vorlesung soll auch noch nach der zweiten Spalte (j = 2 fest) entwickelt werden: |A| = 3 P i=1 (−1)i+2 ai2 |Ai2 | = 9 Determinanten 91 Der Einsatz des Entwicklungssatzes lohnt sich besonders, wenn es Zeilen oder Spalten mit vielen Nullen gibt. Dieser angenehme Fall lässt sich zum Glück mit relativ einfachen Mitteln herbeiführen. Zum besseren Verständnis des Folgenden dient a11 a12 a11 a12 . Beweis : Nachrechnen! Beh. : = a21 a22 a21 + αa11 a22 + αa12 Allgemein gilt für jedes n ∈ N: • Der Wert einer Determinante ändert sich nicht, wenn zu einer Zeile [Spalte] einer Matrix das Vielfache einer anderen Zeile [Spalte] addiert oder subtrahiert wird. • Multipliziert man eine Zeile [Spalte] mit einer reellen Zahl α, ändert sich die Determinante um den Faktor α. • Vertauscht man zwei Zeilen [Spalten], ändert sich das Vorzeichen der Determinante. Hier sind wieder uns die elementaren Umformungen aus Kapitel 4.8 begegnet! 1 1 Beispiel : A = 1 0 Spalte: 0 1 0 1 1 0 2 1 1 1 . Da in der zweiten Spalte zwei Nullen stehen, entwickelt man nach dieser 1 1 1 1 1 1 1 1 |A| = −0 · · · · + 1 · 1 2 1 − 0 · · · · + 1 · 1 0 1 = · · · = 1. 0 1 1 1 2 1 Für das richtige Vorzeichen im Entwicklungssatz bietet das Schachbrettmuster eine Eselsbrücke: + − + − ··· − + − ··· + − ··· .. . oder Vorzeichen aij = + − falls falls i + j gerade i + j ungerade 1 0 2 Beispiele : 1) Die Determinante von A = 3 2 1 soll auf verschiedene Weisen berechnet werden. 1 2 3 a) Regel von Sarrus : |A| = 1 · 2 · 3 + 0 + 2 · 3 · 2 − 2 · 2 · 1 − 1 · 1 · 2 − 0 = 12 3 2 2 1 = (6 − 2) + 2(6 − 2) = 12 + 2 b) Entwicklung nach erster Zeile: |A| = 1 1 2 2 3 c) Anwendung von Zeilenoperationen, um durch Umwandlung Determinante einfach berechnet werden kann: 1 0 2 1 0 2 1 |A| = 3 2 1 = 0 2 −5 = 0 1 2 3 0 2 1 0 eine Dreiecksmatrix zu erhalten, deren 0 2 2 −5 = 1 · 2 · 6 = 12 0 6 92 4 LINEARE ALGEBRA 2) Im folgenden Beispiel subtrahieren wir zuerst die zweite von der fünften Zeile, um auch an der Stelle a52 den Eintrag 0 zu haben. Dann entwickeln wir nach dieser Spalte: |A| = 1 2 1 0 1 0 2 3 4 3 0 0 1 0 2 3 5 0 1 2 3 3 −2 2 1 1 2 = 1 0 −1 0 2 3 4 3 0 0 1 0 2 3 5 0 1 2 3 0 −2 2 0 1 2 3 4 1 2 3 5 = 3 · 0 1 2 3 −1 −2 2 0 Erneut zwei Zeilenoperationen und Vertauschen der neuen Zeilen 2,3,4 liefert eine Dreiecksmatrix, deren Determinante durch Entwicklung nach der jeweils ersten Zeile leicht bestimmt werden kann: |A| = 3 · 1 0 0 0 2 0 1 0 3 0 2 5 4 1 = 3 · (−1)2 · 3 4 1 0 0 0 2 1 0 0 3 2 5 0 4 3 = 3 · 1 · 1 · 5 · 1 = 15 4 1 Ohne Beweis schließen wir mit dem nützlichen Determinantenmultiplikationssatz: Satz 9.3 A, B ∈ M (n × n) =⇒ |AB| = |A||B| Hieraus folgt Korollar A regulär =⇒ |A−1 | = |A|−1 . Beweis: 1 = |E| = |A−1 A| = |A−1 ||A| =⇒ |A−1 | = |A|−1 . 10 Spezielle Eigenschaften der Anschauungsebene R2 Es geht ausschließlich um den reellen Vektorraum R2 , dessen Elemente jetzt auch Punkte genannt und mit großen Buchstaben geschrieben werden, beispielsweise A = (a1 , a2 ), B, P, X ∈ R2 . Mit A + B ist die übliche Vektorraumaddition gemeint. Im Kapitel 4.1 haben wir alle eindimensionalen Untervektorräume von R2 kennengelernt und unter Berücksichtigung unseres Schulwissens festgestellt, dass es sich genau um die Geraden durch O := (0, 0) handelt. Jetzt wollen wir Geraden offiziell“ einführen. ” Def 10.1 Seien A, B ∈ R2 verschiedene Punkte. Dann heißt gA,B := {X = A + λ(B − A) ∈ R2 | λ ∈ R} Gerade des R2 . Man nennt A auch einen Aufpunkt und B−A einen Richtungsvektor der Geraden. Wegen der Abhängigkeit von λ nennt man gA,B auch Parameterform einer Geraden. Manchmal findet man statt gA,B auch die Bezeichnungen AB oder < A, B >. Letzteres ist nicht zu empfehlen, da < , > üblicherweise (wie in dieser Vorlesung) für einen anderen Sachverhalt benötigt wird. Fragen : 1) Wo liegen die Punkte mit λ = 0, 1, 21 ? 2) Warum heißt es ein und nicht der Aufpunkt bzw. Richtungsvektor? 10 Spezielle Eigenschaften der Anschauungsebene R2 93 Wir stellen einige einfache Tatsachen über Geraden zusammen. Bei den folgenden Sätzen sind A und B stets verschiedene Punkte. Satz 10.1 Für alle Geraden gilt A, B ∈ gA,B und gA,B = gB,A Beweis: Für λ = 0 ist A = A + 0 · (B − A) ∈ gA,B , für λ = 1 ist B = A + 1 · (B − A) ∈ gA,B . Für X ∈ gA,B =⇒ ∃α ∈ R : X = A + α(B − A) = B + (1 − α)(A − B) ∈ gB,A , damit ist gA,B ⊆ gB,A . Die umgekehrte Teilmengenbeziehung zeigt man analog, man vertausche nur A und B. Satz 10.2 Für alle Geraden gA,B sind folgende Aussagen äquivalent: (1) O ∈ gA,B (2) A, B linear abhängig (3) B − A ∈ gA,B (4) gA,B ≤ R2 (≤ bedeutet Untervektorraum) Beweis: Wir beweisen (4) ⇒ (3) ⇒ (2) ⇒ (1) ⇒ (4), durch diesen Ringschluss sind alle Äquivalenzen gezeigt. (4) ⇒ (3): Aus Satz 10.1 wissen wir A, B ∈ gA,B . Auf Grund der Voraussetzung Untervektorraum gilt dann auch B − A ∈ gA,B . (3) ⇒ (2): Nach Voraussetzung ∃λ ∈ R : B − A = A + λ(B − A) ⇐⇒ (λ − 2)A + (1 − λ)B = O. Da nicht gleichzeitig λ − 2 = 0 und 1 − λ = 0 sein kann, gilt (2). (2) ⇒ (1): Für A = 0 oder B = 0 wurde die Behauptung bereits in Satz 10.1 gezeigt. Wir untersuchen den Fall A 6= 0 und B 6= 0: Die vorausgesetzte lineare Abhängigkeit zusammen mit A 6= B bedeutet B = αA 1 1 mit α ∈ R\{0, 1}. Für λ := 1−α folgt A + λ(B − A) = A + 1−α (αA − A) = 1 + α−1 1−α A = O ∈ gA,B . (1) ⇒ (4): Dies wurde bereits in Kapitel 4.1 bewiesen. Satz 10.3 Für alle Geraden gA,B und für alle Punkte C gilt C ∈ gA,B ⇐⇒ B − A, C − A linear abhängig. Der Beweis ist entweder eine einfache Übungsaufgabe oder wird in der Vorlesung erledigt. Wegen gA,B = {A + λ(B − A) | λ ∈ R} = {A + (O + λ((B − A) − O)) | λ ∈ R} =: A + gO,B−A sagt man, dass die Gerade gA,B eine Nebenklasse des eindimensionalen Untervektorraumes gO,B−A ist. B................................................... gA,B As.........................................................................s. ... ................... B−A ................... .............. gO,B−A ........s ................... ................... . . . . . . . . . . . . . . . . . . ........... .s . . . . . . . . . . . . . . . . . . . ................... ................... ................... O 6 Wir wollen die Geraden gA,B der Anschauungsebene aus einem anderen Blickwinkel betrachten, hierzu setzen wir A = (a1 , a2 ), B = (b1 , b2 ). Es sind zwei Fälle möglich: 94 4 LINEARE ALGEBRA 1. Fall: a1 = b1 : Es ist gA,B = {(a1 , a2 + λ(b2 − a2 )) | λ ∈ R} mit a2 6= b2 . In der zweiten Komponente steckt die bijektive Abbildung λ 7→ a2 + λ(b2 − a2 ), zusammen mit den Umbenennungen k := a1 = b1 und y = a2 + λ(b2 − a2 ) erhalten wir gA,B = {(k, y) | y ∈ R} =: gk 2. Fall: a1 6= b1 : Es ist gA,B := {(a1 + λ(b1 − a1 ), a2 + λ(b2 − a2 )) | λ ∈ R}. Die erste Komponente 1 und erhalten durchläuft alle reelle Zahlen (Bijektion!), wir setzen x = a1 + λ(b1 − a1 ) ⇐⇒ λ = bx−a 1 −a1 x − a1 gA,B = x, a2 + (b2 − a2 ) | x ∈ R b1 − a1 a2 b1 − a1 b2 b2 − a2 x+ | x ∈ R =: gm,b = x, b1 − a1 b1 − a1 wobei m := angibt. b2 −a2 b1 −a1 die Steigung und b := a2 b1 −a1 b2 b1 −a1 den Schnittpunkt (0, b) der Geraden mit der y–Achse Satz 10.4 a) Zu jeder Geraden gA,B gibt es genau ein k ∈ R oder genau ein (m, b) ∈ R × R mit gA,B = gk oder gA,B = gm,b b) Zu jedem k ∈ R gibt es eine Gerade gA,B = gk c) Zu jedem (m, b) ∈ R × R gibt es eine Gerade gA,B = gm,b Beweis: a) wurde bereits bewiesen, b) und c) sind einfache Übungsaufgaben25 An Stelle von Geraden gA,B können wir daher ebenso von Geraden gk und gm,b reden. Im Gegensatz zur Parameterdarstellung gA,B spricht man wegen der Abhängigkeit von den festen reellen Zahlen k bzw. m, b von einer Koordinatenform: gk = {(x, y) ∈ R2 | 1 · x + 0 · y = k}, gm,b = {(x, y) ∈ R2 | (−m) · x + 1 · y = b} Zum Glück stimmt unsere Anschauung mit der formalen Definition von Geraden überein. Auch mit dem Begriff parallel verbinden wir bereits eine feste Vorstellung. Def 10.2 Geraden g und h der Anschauungsebene heißen parallel, geschrieben g k h, : ⇐⇒ g = h oder g ∩ h = ∅. Den folgenden Satz werden wir aus Zeitgründen nicht beweisen: Satz 10.5 Es seien gk , gl , gm,b , gn,c Geraden der Anschauungsebene. Dann gelten a) Parallel ist eine Äquivalenzrelation auf der Geradenmenge. b) gk k gl c) gm,b k gn,c d) gk ∦ gm,b ∀k, l ∈ R ⇐⇒ m = n ∀k, m, b ∈ R Für mathematisch besonders interessierte Studierende stellen wir zwei Fragen im Zusammenhang mit der Koordinatenform von Geraden: 25 Hinweis: Man zeichne gk und gm,b und überlege, welche Punkte darauf liegen! 10 Spezielle Eigenschaften der Anschauungsebene R2 95 Frage : Für welche u, v, w ∈ R ist g = {(x, y) ∈ R2 | u · x + v · y = w} eine Gerade? Antwort : g Gerade ⇐⇒ (u, v) 6= (0, 0) Zusatzfrage : Wie kann man aus dieser allgemeinen Koordinatenform den Richtungsvektor (die Steigung) erkennen? Jetzt wenden wir uns den Punkten zu. Bei der folgenden Definition lasse man sich nicht durch die ungewohnte Schreibweise für eine Abbildung irritieren! Def 10.3 Seien X = (x1 , x2 ), Y = (y1 , y2 ) ∈ R2 . Dann heißt die Abbildung < , >: R2 × R 2 → R ((x1 , x2 ), (y1 , y2 )) 7→ < X, Y > := x1 y1 + x2 y2 Beispiele : < (1, 3), (1, 3) > = 10, Skalarprodukt < (1, 3), (−3, 1) > = 0 Wegen der Bijektion R2 → C, (a, b) 7→ a + ib, können wir Punkte mit komplexen Zahlen identifizieren. √ In diesem Sinn ist < X, X > = |X|2 bzw. |X| = < X, X >. Satz 10.6 Das Skalarprodukt ist a) eine bilineare Abbildung, d.h., linear in jeder der beiden Komponenten.26 b) symmetrisch, d.h. < X, Y > = < Y, X > c) positiv definit, d.h. < X, X > > 0 ∀X, Y ∈ R2 . ∀X 6= O. Der Beweis erfolgt in allen Teilen durch einfaches Nachrechnen. Das Skalarprodukt aus Definition 10.3 ist nicht die einzige Abbildung R2 × R2 → R, die Satz 10.6 erfüllt. In der Tat nennt man jede Abbildung mit diesen Eigenschaften Skalarprodukt oder auch positiv definite symmetrische Bilinearform. Weil unser“ Skalarprodukt besonders einfach ist, dürfen wir es kanonisches ” Skalarprodukt nennen. Jeder reelle Vektorraum zusammen mit einem Skalarprodukt heißt euklidischer Vektorraum. Wie wir in den Beispielen gesehen haben, kann für Vektoren X, Y 6= O das zugehörige Skalarprodukt trotzdem den Wert 0 annehmen. Def 10.4 Vektoren X, Y ∈ R2 heißen orthogonal , geschrieben X ⊥ Y, : ⇐⇒ < X, Y > = 0. Statt von orthogonalen Vektoren spricht man auch von Vektoren, die aufeinander senkrecht stehen. Stimmt dies mit unserer Anschauung überein? Satz 10.7 Seien X, Y ∈ R2 \{(0, 0)}, sei ϕ der von X, Y eingeschlossene Winkel27 . Dann gilt < X, Y > = |X| · |Y | · cos ϕ X X , |Y | · |YY | > = |X| · |Y |· < |X| , |YY | >, daher behandeln wir nur den Beweis: Es ist < X, Y > = < |X| · |X| Spezialfall |X| = |Y | = 1 und beweisen hierfür < X, Y > = cos ϕ. 26 27 Ähnliches ist uns bereits bei der Determinantenfunktion begegnet! Wegen cos(2π − ϕ) = cos ϕ ist es egal, ob man den Winkel von X nach Y oder von Y nach X misst. 96 4 LINEARE ALGEBRA sX .... ........ .. ... ... ... .... ...... . . ... ... . ... ... ... ... ... ... ... ... ... ... .. . ... ... . ... ... ... . ... . ... . . ... ... .. ... . . ... ... .......... . ... . ..... ....... . . . . . . . .................... .... ... ... . . . . ... ........ . . . . . . . . . . . . . . . . . ....... ... .................. ............... 6 d h ϕ s O sY s H - Sei H der Höhenfußpunkt von X auf die Gerade gO,Y . Ferner sei c = |H|, h = |X − H|, d = |X − Y |. Aus d2 = |X − Y |2 = < X − Y, X − Y > = < X, X > −2 < X, Y > + < Y, Y > folgt d2 = 2 − 2 < X, Y >. Wegen des Satzes von Pythagoras gilt c2 + h2 = 1 und (1 − c)2 + h2 = d2 , durch Subtraktion folgt d2 − 1 = 1 − 2c ⇐⇒ d2 = 2 − 2c. Insgesamt erhalten wir 2 − 2c = 2 − 2 < X, Y > =⇒ < X, Y > = c = cos ϕ. Korollar | < X, Y > | ≤ |X| · |Y | ∀X, Y ∈ R2 . Man hätte das Korollar, in der Fachliteratur als Cauchy–Schwarzsche Ungleichung bekannt, auch direkt mit Hilfe des Skalarproduktes beweisen und dann Satz 10.7 für eine elegante Winkeleinführung benutzen können. Wir wollen an dieser Stelle aber nicht näher auf Winkel eingehen und verweisen stattdessen auf die Geometrievorlesung. In einem früheren Abschnitt haben wir uns mit linearen Abbildungen des R2 beschäftigt, dort ging es um Drehungen, Streckungen, Spiegelungen und Scherungen. Def 10.5 Eine lineare Abbildung f : R2 → R2 heißt orthogonal : ⇐⇒ < X, Y > = < f (X), f (Y ) > ∀X, Y ∈ R2 . Man kann leicht nachweisen, dass orthogonale Abbildungen Längen und Winkel erhalten. Ohne Beweis cos α − sin α halten wir fest, dass die Matrix einer orthogonalen Abbildung entweder von der Gestalt sin α cos α cos α sin α ist. Im ersten Fall liegt eine Drehung mit Determinante 1 vor, im anderen Fall oder sin α − cos α handelt es sich um eine Geradenspiegelung mit Determinante −1. Fragen : 1) Zur Drehung: Welcher Punkt ist das Drehzentrum und um welchen Winkel wird gedreht? 2) Zur Geradenspiegelung: Wie hängt α aus der Matrix mit der Spiegelachse zusammen? Zum Abschluss folgt eine Anwendung der Determinantenfunktion. a1 a2 der (mit Vorzeichen versehene) Satz 10.8 Seien A = (a1 , a2 ), B = (b1 , b2 ) ∈ R2 . Dann ist b1 b2 Flächeninhalt des von (a1 , a2 ) und (b1 , b2 ) aufgespannten Parallelogramms. Je nach Größe der Zeitnot wird in der Vorlesung eine mehr oder weniger ausführlicher Beweis dieses Satzes gegeben, der nur Schulwissen wie Flächenvergleiche und eine Anwendung des Strahlensatzes benötigt. 11 Spezielle Eigenschaften des Anschauungsraumes R3 6 a2 + b2 b2 x a2 sA + B ........ ......... ... A1................................ ....... ... ... .........s ... ......... .. .. ........ ... ........ .. ......... .. ........ . . . . . . . . . .. ......... ... ......... ... .......... ... ......... .. .. ........ .... . . . . . . . . . ... . ......... ... ... ......... ... ... ... ... .. ... . . .. ... .. .. ... .. ... ... . . . .. . . . . . ... ......... ... ........ ... ........ ......... ... ........ . . . ... . . . . . ... ......... ... ........ ... ........ .. ......... .. ........ . . . . . . . . . . ... ........... .......... B s s Y s X s A s O 11 97 b1 a1 a1 + b1 Spezielle Eigenschaften des Anschauungsraumes R3 Vieles von dem, was wir im R2 behandelt haben, lässt sich problemlos auf höhere Dimensionen übertragen. Def. 11.1 Seien A, B ∈ R3 verschiedene Punkte. Dann heißt gA,B := {X = A + λ(B − A) ∈ R3 | λ ∈ R} Gerade des R3 . Erneut spricht man von Aufpunkt und Richtungsvektor. Die Sätze 10.1 bis 10.3 gelten analog im R3 . Satz 10.4 kann man nicht übertragen, da im R3 weitere Fälle möglich sind. Punkte in der Ebene oder im Raum heißen kollinear, wenn sie gemeinsam auf einer Geraden liegen. Def 11.2 Seien A, B, C ∈ R3 nicht kollinear. Dann heißt EA,B,C := {X = A + α(B − A) + β(C − A) ∈ R3 | α, β ∈ R} Ebene des R3 . Neben einem Aufpunkt besitzt eine Ebene zwei wegen Satz 10.3 linear unabhängige Richtungsvektoren. (in Def 11.2 sind dies B − A und C − A). Die Sätze 10.1 und 10.2 für Geraden im R2 lassen sich einfach auf Ebenen im R3 mit ähnlichen Beweisen übertragen: Satz 11.1 Für alle Ebenen gilt A, B, C ∈ EA,B,C und EA,B,C = EA,C,B = EB,A,C = EB,C,A = EC,A,B = EC,B,A Satz 11.2 Für alle Ebenen EA,B,C sind folgende Aussagen äquivalent: (1) O ∈ EA,B,C (2) A, B, C linear abhängig (3) B − A, C − A ∈ EA,B,C (4) EA,B,C ≤ R3 (≤ bedeutet Untervektorraum) Ebenen sind Nebenklassen der zweidimensionalen Untervektorräume, es gilt EA,B,C := A + EO,B−A,C−A . In der Anschauungsebene sind Geraden entweder parallel oder sie haben genau einen Schnittpunkt. Bei Geraden im Anschauungsraum ist die Lage etwas komplizierter. Zwei Geraden ohne gemeinsamen Punkt heißen nur dann parallel, wenn es eine Ebene gibt, in der beide Geraden liegen, andernfalls spricht 98 4 LINEARE ALGEBRA man von windschief. Zwei verschiedene Ebenen im Anschauungsraum heißen parallel, wenn sie keinen gemeinsamen Punkt besitzen. Beispiel : Die Geraden gO,E1 , gE2 ,E3 sind windschief. (Es ist E1 = (1, 0, 0), usw.) Frage : Was weiß man über den Schnitt von nichtparallelen Ebenen E, F ? Wegen E ∩ F 6= ∅ können wir oBdA O ∈ E ∩ F annehmen, d.h. E und F als zweidimensionale Untervektorräume des R3 voraussetzen. Aus der Dimensionsformel (Satz 3.6) erhalten wir dim(E ∩ F ) = dim E + dim F − dim(E + F ) = 2 + 2 − 3 = 1 Antwort : Zwei nichtparallele Ebenen schneiden sich stets in einer Geraden. Das Skalarprodukt mit seinen Eigenschaften kann ebenfalls ohne Mühe vom R2 auf den R3 übertragen werden. Zur Erinnerung schreiben wir die Definition noch einmal auf: Def 11.3 Seien X = (x1 , x2 , x3 ), Y = (y1 , y2 , y3 ) ∈ R3 . Dann heißt die Abbildung < , >: R3 × R3 → R ((x1 , x2 , x3 ), (y1 , y2 , y3 )) 7→ < X, Y > := x1 y1 + x2 y2 + x3 y3 Skalarprodukt Selbstverständlich gelten Satz 10.6 (Eigenschaften des Skalarprodukts), Definition 10.4 (Orthogonalität), Satz 10.7, die Cauchy–Schwarzsche Ungleichung und Definition 10.5 (orthogonale lineare Abbildungen) analog. Orthogonale lineare Abbildungen im Raum sind Drehungen um eine Gerade, Spiegelungen an einer Ebene oder Kombinationen daraus. Im ebenen Fall kann man die Fläche eines Parallelogramms mit Hilfe der Determinante bestimmen. Im Raum gilt Satz 11.3 Seien a = (a1 , a2 , a3 ), b = (b1 , b2 , b3 ), c = (c1 , c2 , c3 ) ∈ R3 . Dann ist a1 a2 a3 b1 b2 b3 c1 c2 c3 das (mit Vorzeichen versehene) Volumen des von den drei Vektoren a, b, c aufgespannten Parallelotops (auch Spat genannt). Beispiel : Im Spezialfall (a1 , a2 , a3 ) = (l, 0, 0), (b1 , b2 , b3 ) = (0, b, 0), (c1 , c2 , c3 ) = (0, 0, h) erhalten wir die bekannte Formel Länge · Breite · Höhe für das Volumen eines Quaders. Fragen : 1) Wann hat ein Spat das Volumen V = 0? 2) Welches Volumen hat ein Tetraeder mit den Eckpunkten A, B, C, D? 3) Welches 4–dimensionale Volumen hat das 4–dimensionale Parallelotop mit den Seiten (1, 0, 2, 0), (1, 1, 0, 1), (0, 1, 1, 2), (1, 0, 0, 0)? Außer der skalaren Multiplikation (R × V → V ) und dem Skalarprodukt (V × V → R) gibt es im Anschauungsraum eine weitere interessante Abbildung. 12 Lineare Gleichungssysteme 99 Def 11.4 Seien X = (x1 , x2 , x3 ), Y = (y1 , y2 , y3 ) ∈ R3 . Dann heißt die Abbildung 3 R × R3 → R3 ×: (X, Y ) 7→ X × Y := (x2 y3 − x3 y2 , x3 y1 − x1 y3 , x1 y2 − x2 y1 ) Vektorprodukt oder Kreuzprodukt. Beispiel : e1 × e2 = e3 (sogenannte Rechte Hand – Regel) e1 Als Merkhilfe für die Rechenvorschrift des Kreuzprodukts kann die Determinante“ x1 ” y1 e2 x2 y2 e3 x3 dienen: y3 Man tut so, als seien die Einheitsvektoren ei normale Zahlen und berechnet nach der Regel von Sarrus e1 (x2 y3 − x3 y2 ) − e2 (x1 y3 − x3 y1 ) + e3 (x1 y2 − x2 y1 ). Dann erinnert man sich an die wahre Bedeutung der Einheitsvektoren und erhält das gewünschte Resultat X × Y . Satz 11.4 Seien X, Y ∈ R3 Dann gelten a) X × Y = −(Y × X) b) X ⊥ (X × Y ), (Das Vektorprodukt × ist schiefsymmetrisch) Y ⊥ (X × Y ) c) |X × Y | = |X| · |Y | · sin ϕ, wobei ϕ der kleinere der von X und Y gebildeten Winkel ist. Beweis: a) und b) erledigt man durch direktes Nachrechnen. c): Nach Definition von Betrag und Skalarprodukt ist |X × Y |2 = < X × Y, X × Y >. Elementare Rechnerei ergibt < X × Y, X × Y > = |X|2 · |Y |2 − < X, Y >2 . Zusammen mit Satz 10.7, der auch im R3 gilt, folgt die Behauptung aus < X × Y, X × Y > = |X|2 · |Y |2 · (1 − cos2 ϕ) = |X|2 · |Y |2 · sin2 ϕ Nachdem wir das Vektorprodukt kennengelernt haben, können wir das Volumen des Parallelotops (Satz 11.3) auch als < a, b × c > schreiben. Man nennt diese Kombination aus Skalar– und Vektorprodukt deshalb auch Spatprodukt . 12 Lineare Gleichungssysteme Nachdem wir schon mehrfach Lösungen für Gleichungen gesucht haben, soll diese Problematik jetzt systematisch untersucht werden. Um uns auf das Wesentliche konzentrieren zu können, bleiben wir bei dem Körper der reellen Zahlen, obwohl die Theorie für beliebige Körper gültig ist. Ferner identifizieren wir die Menge der entarteten Matrizen mit nur einer Zeile oder einer Spalte mit der entsprechenden Menge Rk . Auf das folgende Beispiel wird mehrfach zurückgegriffen: Gesucht sind alle reelle Zahlen x1 , x2 , x3 mit 2x1 + 3x2 + x3 = 1 x1 − 2x2 + 2x3 = 0 Unter Verwendung der Matrizenrechnung sieht unser Problem folgendermaßen aus: x 2 3 1 1 1 x2 = oder allgemein Ax = b, x = (x1 , x2 , x3 ) 1 −2 2 0 x3 100 4 LINEARE ALGEBRA Def 12.1 Sei A ∈ M (m × n), b ∈ M (m × 1) = Rm . Ax = b heißt lineares Gleichungssystem (LGS) für ein unbekanntes x ∈ M (n × 1) = Rn . Ist b der Nullvektor, heißt das System homogen, andernfalls inhomogen. Ausführlich aufgeschrieben sieht ein LGS folgendermaßen aus: a11 x1 a21 x1 .. . + + .. . a12 x2 a22 x2 .. . am1 x1 + am2 x2 + . . . + a1n xn = b1 + . . . + a2n xn = b2 .. .. .. .. .. .. . . . . . . + . . . + amn xn = bm Hierbei sind die Einträge der Matrix A und b bekannt, gesucht sind die Komponenten x1 , . . . , xn von x. In unserem Beispiel handelt es sich um ein inhomogenes LGS. Im Folgenden bezeichnen wir die gesuchte Menge aller Lösungen von Ax = b mit Lös (A, b) und nennen ein LGS lösbar, falls Lös (A, b) 6= ∅. Beispiel : Das Gleichungssystem 2x1 + 3x2 + z3 = 1 x1 − 2x2 + 2x3 = 0 Nicht jedes LGS ist lösbar, wie uns das Beispiel 1 2 ist lösbar, es gilt (−2, 1, 2) ∈ Lös (A, b). x= 3 2 zeigt. Um ein Kriterium für die Lösbarkeit von LGS zu bekommen, ist es sinnvoll, den Umweg über Untervektorräume zu gehen. Für A ∈ M (m × n, R) ist Lös (A, b) ⊆ Rn . Wann ist dies ein Untervektorraum? Im folgenden Satz sei mit o der Nullvektor gemeint. Satz 12.1 Lös (A, b) ≤ Rn ⇐⇒ b = o ( ⇐⇒ LGS ist homogen) Beweis: ⇒“: Lös (A, b) Untervektorraum =⇒ o ∈ Lös (A, b) =⇒ b = Ao = o. ” ⇐“: Für b = o ist Lös (A, b) = Lös (A, o) = {x ∈ Rn | Ax = o} = Kern A ≤ Rn (Satz 4.1). ” Homogene LGS besitzen stets die Lösung x = o, inhomogene LGS müssen nicht lösbar sein. a11 · · · a1n b1 .. .. erweiterte Matrix, Def 12.2 Für das LGS Ax = b heißt die Matrix (A, b) := ... . . am1 · · · amn bm es ist (A, b) ∈ M (m × (n + 1)). 2 3 1 1 In unserem Beispiel ist die erweiterte Matrix (A, b) = . 1 −2 2 0 Wie bereits festgestellt, ist x = (−2, 1, 2) eine Lösung dieses LGS: −2 1 2 3 1 2 · (−2) + 3 · 1 + 1 · 2 2 3 1 1 = b= = = (−2) +1 +2 0 1 −2 2 1 · (−2) − 2 · 1 + 2 · 2 1 −2 2 2 Weil eine Lösung existiert, kann b mit Hilfe dieser Lösung als Linearkombination der Spaltenvektoren von A geschrieben werden. Mit anderen Worten: b ist linear abhängig von den Spalten der Matrix A oder 12 Lineare Gleichungssysteme 101 noch anders ausgedrückt: b liegt in der linearen Hülle der Spaltenvektoren von A. Durch Hinzunahme von b zu den Spaltenvektoren von A (= Übergang zur erweiterten Matrix) wird der Rang von A (= maximale Anzahl der linear unabhängigen Spalten, Einzelheiten im Abschnitt 4.8) nicht verändert. Wir fassen dies im folgenden Satz zusammen, der nicht formal bewiesen wird: Satz 12.2 Ax = b lösbar ⇐⇒ rg A = rg (A, b) 2x + 3y + z = 1 Beispiele : 1) x − 2y + 2z = 0 2) 1 2 x= 3 2 : rg A = rg 2 3 1 1 −2 2 : rg A = 1 6= rg (A, b) = rg 1 3 2 2 = 2 = rg (A, b). = 2, daher ist dieses LGS nicht lösbar. Mit (−2, 1, 2) kennen wir eine Lösung des ersten Beispiels, aber auch (6, −2, −5) oder (−802, 301, 702) sind Lösungen. Wir sind an allen Lösungen interessiert. Satz 12.3 Sei x0 eine beliebige Lösung von Ax = b. Dann gilt Lös (A, b) = x0 + Kern A = {x0 + x | Ax = 0} Beweis: ⊆“: Für jede Lösung v gilt A(v − x0 ) = Av − Ax0 = b − b = o. Also ist v − x0 aus dem Kern ” von A bzw. v ∈ x0 + Kern A. ⊇“: Sei x ∈ Kern A =⇒ A(x0 + x) = Ax0 + Ax = b + o = b, damit ist x0 + x ∈ Lös (A, b). ” Feststellung: Wir erhalten alle Lösungen eines LGS Ax = b, wenn wir zu einer speziellen Lösung alle Lösungen des zugehörigen homogenen Systems (= Kern von A) addieren. x = (5): Beispiele : 1) Gesucht sind alle Lösungen (x, y) von x − 2y = 5 ⇐⇒ (1 − 2) y Wegen rg A = rg (1 − 2) = 1 = rg (A, b) = (1 − 2 5) existieren Lösungen. Eine spezielle Lösung ist (5, 0) (in die umgeformte Gleichung x = 5 + 2y wurde y = 0 eingesetzt). Wir bestimmen den Kern: Kern A = {(x, y) | x − 2y = 0} = {(2y, y) | y ∈ R} = L((2, 1)). Die gesuchte Lösungsmenge ist Lös (A, b) = (5, 0) + L((2, 1)). 2) In unserem Standardbeispiel ist (−2, 1, 2) ∈ Lös (A, b), gesucht ist Kern A = {x ∈ R3 | Ax = 0}. Durch Rechnung (hierzu mehr im nächsten Kapitel) erhält man Kern A = L((−8, 3, 7)), damit ist Lös (A, b) = (−2, 1, 2) + L((−8, 3, 7)). Frage : Was ist die geometrische Gestalt dieser Lösungsmenge? Mit Satz 12.2 haben wir ein notwendiges und hinreichendes Kriterium für die Existenz von Lösungen eines LGS kennengelernt. Gibt es auch Kriterien für eindeutige Lösbarkeit? Satz 12.4 Sei A ∈ M (m × n). Dann gilt Ax = b eindeutig lösbar ⇐⇒ rg A = rg (A, b) = n Beweis: Wir benutzen die Dimensionsformel für lineare Abbildungen (A ist lineare Abbildung von Rn nach Rm ): n = dim Kern A + dim Bild A = dim Kern A + rg A. 102 4 LINEARE ALGEBRA ⇒“: Nach Satz 12.3 bedeutet die eindeutige Lösbarkeit, dass der Kern von A nur aus dem Nullvektor ” besteht, also die Dimension 0 hat; aus der Formel folgt dann n = rg A. Da wenigstens eine Lösung existiert, ist nach Satz 12.2 rg A = rg (A, b). ⇐“: Wegen rg A = rg (A, b) ist das LGS lösbar, sei x0 ∈ Lös (A, b). Wegen rg A = n ist die Dimension ” des Kerns 0. Nach Satz 12.3 ist damit Lös (A, b) = {x0 }. In unserem Standardbeispiel gilt rg A = 2 = rg (A, b) 6= 3 = n, es ist nicht eindeutig lösbar. Generell gilt : Enthält ein LGS Ax = b mehr Unbekannte als Gleichungen, kann es nie eindeutig lösbar sein, denn rg A kann nicht größer sein als die Anzahl m der Gleichungen, und es ist m < n (Anzahl der Unbekannten). Wenn die Anzahl der Gleichungen mit der Anzahl der Unbekannten übereinstimmt, ist die zugehörige Matrix quadratisch und besitzt deshalb eine Determinante. In diesem Spezialfall haben wir wegen Satz 9.1 ein weiteres Kriterium für eindeutige Lösbarkeit: Satz 12.5 Sei A ∈ M (n × n). Dann gilt Ax = b eindeutig lösbar ⇐⇒ |A| = 6 0. 3x + 2y = α : Es ist m = n = 2, |A| = 3 · 4 − 4 · 2 6= 0 =⇒ Das LGS ist unabhängig 4x + 4y = β von speziellen Werten α und β stets eindeutig lösbar. Beispiele : 1) 2) 3x + 2y = α : 6x + 4y = β 13 Über das Lösen von linearen Gleichungssystemen |A| = 3 · 4 − 6 · 2 = 0 =⇒ Das LGS ist auf keinen Fall eindeutig lösbar. Wegen 3 2 α ist es für β 6= 2α nicht lösbar und für β = 2α mehrdeutig lösbar. rg A = 1 und rg (A, b) = rg 6 4 β Während es im vorherigen Kapitel im Wesentlichen um die Theorie ging, sollen jetzt für den reellen Fall LGS konkret gelöst werden. Satz 13.1 Cramersche Regel Sei das LGS Ax = b mit A ∈ M (n×n) und |A| = 6 0 gegeben. Dann gilt für die Unbekannte x = (x1 , . . . , xn ) a11 · · · b1 · · · a1n |Ai | .. .. xi = mit Ai := ... . . |A| an1 · · · bn · · · ann Ai entsteht aus A, indem man die i–te Spalte von A durch b ersetzt. Beweis: Wir wissen aus Satz 12.5 des letzten Kapitels, dass Ax = b eindeutig lösbar ist: ∃x1 , . . . , xn ∈ R : x1 s1 + . . . + xn sn = b Hierbei sei sj die j–te Spalte der Matrix A. Eine einfache Umformung und ein kleiner Trick in der Schreibweise ergeben x1 s1 + . . . + 1 · (xj sj − b) + . . . + xn sn = o (Nullvektor) 13 Über das Lösen von linearen Gleichungssystemen 103 Die Vektoren s1 , . . . , sj−1 , xj sj − b, sj+1 , . . . , sn sind also linear abhängig, damit gilt für die zugehörige Determinante s1 · · · xj sj − b · · · sn = 0 xj a1j − b1 b1 .. .. = . . xj anj − bn bn a1j xj sj − b = xj ... − anj Man beachte die j–te Spalte Wir entwickeln die Determinante nach der j–ten Spalte: 0 = n X (−1)i+j (xj aij − bi )|Aij | i=1 = xj n X (−1)i+j aij |Aij | − n X i=1 i=1 = xj |A| − |Aj | Beispiel : 3x + 2y = 1 4x + 3y = 2 =⇒ (−1)i+j bi |Aij | ⇒ 1 2 x = 3 4 Behauptung 2 3 2 3 = , 3 4 y = 3 4 1 2 2 3 = Die Cramersche Regel hat zwei entscheidende Nachteile: Sie ist nur für reguläre Matrizen anwendbar und der Rechenaufwand nimmt bei größeren n in einem unerträglichen Maß zu. Um ein allgemein anwendbares Verfahren zu finden, erinnern wir uns an das Kochrezept zur Rangbestimmung einer Matrix, denn LGS mit zugehörigen Matrizen in Dreiecksgestalt lassen sich leicht lösen: x − y + 2z = 5 2y − z = 4 Beispiel : 3z = 6 =⇒ z = 2 2y = 4+z x = 5 − 2z + y =⇒ z = 2 y = 3 x = 4 Satz 13.2 Sei Ax = b ein LGS, durch EZU sei aus der erweiterten Matrix (A, b) die erweiterte Matrix (A0 , b0 ) entstanden. Dann gilt Lös (A, b) = Lös (A0 , b0 ). Der Beweis dieses Satzes ist anschaulich klar (auf beiden Seiten einer Gleichung werden dieselben Operationen durchgeführt). Die sinnvolle Anwendung des Satzes ist der Gaußsche Algorithmus, den wir zuerst für den Spezialfall A ∈ M (n × n) und |A| = 6 0 kennenlernen wollen. Problem : Gesucht ist die eindeutige Lösung x von Ax = b mit A ∈ M (n × n) regulär. (A, b) durch EZU in (A0 , b0 ). · · · ∗ b01 · · · ∗ b02 .. .. . . .. .. . ∗ . · · · 0 a0nn b0n Lösung : 1) Mit Hilfe des Kochrezepts“ (Seite 88) überführen wir ” 0 a11 ∗ · · · 0 a0 ∗ a11 · · · a1n b1 22 . .. .. .. .. → .. . 0 . . . .. . . .. .. an1 · · · ann bn . 0 0 104 4 LINEARE ALGEBRA Da A als regulär vorausgesetzt war, ist a0ii 6= 0 für alle i. 2) Wir bestimmen (x1 , . . . , xn ) rückwärts“: ” 0 b 1 xn = 0n , xn−1 = 0 b0n−1 − a0n−1,n xn , ann an−1,n−1 Allgemein gilt für k = n − 1, n − 2, . . . , 1 : xk = 1 a0kk b0k − n P ν=k+1 usw. ! a0kν xν . Durch weitere Umformungen kann man (A, b) auf die Gestalt (E, b00 ) mit Einheitsmatrix E bringen. Die Lösung erhält man dann recht einfach durch xi = b00i . Welche Methode günstigster ist, hängt häufig von weiteren (Neben)bedingungen ab. Bei umfangreichen Systemen ist es enorm wichtig, den Rechenaufwand zu optimieren. Solche Fragestellungen werden neben vielen anderen in der Numerischen Mathematik oder auch in der Komplexitätstheorie untersucht. Beispiel : 2x2 − 2x3 = 3 x1 + x2 + x3 = 1 x1 + 3x2 + 7x3 = −1 ⇐⇒ (A, b) = 0 2 −2 3 1 1 1 1 1 3 7 −1 1 3 . Die gesuchte Lösung ist −5 1 1 1 0 2 −2 Durch EZU erhalten wir aus (A, b) die Matrix 0 0 8 7 x3 = − 85 , x2 = 12 3 − (−2) −5 = 8 , x1 = 1 − x2 − x3 = 34 . 8 zum allgemeinen Fall A ∈ M (m × n) und versuchen die gleiche Vorgehensweise wie im einem Beispiel : x −1 1 2 x2 −1 5 , wobei wir für das Fragezeichen erst später eine konkrete Zahl = x3 −1 ? x4 einsetzen werden. Durch EZU erhalten wir die Matrix (A0 , b0 ) 1 2 −1 −1 2 0 0 4 2 −1 0 0 2 1 ?? Wir kommen Spezialfall an 1 2 −1 3 6 1 2 4 0 Der nächste Schritt (Ziel: a022 6= 0) ist durch erlaubte EZU nicht möglich. Wir ignorieren diesen Mangel und gelangen mit weiteren EZU zur sogenannten Zeilenstufenform 1 2 −1 −1 2 0 0 4 2 −1 0 0 0 0 ??? An den Stellen x1 und x3 liegen Stufen vor, durch die Stellen x2 und x4 werden freie Parameter ins Spiel gebracht, ihre Anzahl ist stets gleich der Dimension von Kern A. Zwei verschiedene Fälle können eintreten: 1. Fall: ??? 6= 0: Das gegebene LGS Ax = b ist nicht lösbar. 13 Über das Lösen von linearen Gleichungssystemen 105 2. Fall: ??? = 0: Das LGS ist lösbar. Wenn wir in unserem Beispiel ? = x4 : x3 : x2 : x1 : keine Stufe Stufe keine Stufe Stufe 7 2 setzen, erhalten wir ??? = 0. Es ist ⇒ ⇒ ⇒ ⇒ frei wählbar, x4 = λ1 4x3 = −1 − 2x4 ⇒ x3 = − 41 − 12 λ1 frei wählbar, x2 = λ2 x1 = 2 − 2x2 − (−1)x3 − (−1)x4 ⇒ x1 = 47 − 2λ2 + 12 λ1 =⇒ Lös (A, b) = 47 − 2λ2 + 12 λ1 , λ2 , − 14 − 21 λ1 , λ1 | λ1 , λ2 ∈ R = 74 , 0, − 14 , 0 + −2λ2 + 21 λ1 , λ2 , − 12 λ1 , λ1 | λ1 , λ2 ∈ R = 74 , 0, − 41 , 0 + L ((1, 0, −1, 2), (−2, 1, 0, 0)). Beispiel : x1 − 2x2 + 3x3 + 5x4 − 4x5 2x1 − 4x2 + 6x3 + 5x4 + 2x5 2x1 − 4x2 + 7x3 + 7x4 + 3x5 −x1 + 2x2 − 2x3 − 3x4 + 5x5 = 2 = −6 = −7 = −3 2 1 −2 3 5 −4 2 −4 6 5 2 −6 =⇒ (A, b) = 2 −4 7 7 3 −7 −1 2 −2 −3 5 −3 Durch EZU erhält man irgendwann die Zeilenstufenform 1 −2 3 5 −4 2 0 0 1 0 5 −5 0 0 0 1 −2 2 0 0 0 0 0 0 Wir stellen fest, daß das LGS lösbar ist mit Stufen für x1 , x3 , x4 . Durch die anderen Stellen x2 , x5 kommen zwei freie Parameter in unserer Lösungsmenge vor. Wir bestimmen eine beliebige Lösung x = (x1 , . . . , x5 ) ∈ Lös (A, b): x5 : x4 : x3 : x2 : x1 : keine Stufe Stufe Stufe keine Stufe Stufe ⇒ ⇒ ⇒ ⇒ ⇒ frei wählbar, x5 = λ1 x4 = 2 − (−2)x5 = 2 + 2λ1 x3 = −5 − 5x5 = −5 − 5λ1 frei wählbar, x2 = λ2 x1 = 2 − (−2)x2 − 3x3 − 5x4 − (−4)x5 = 7 + 2λ2 + 9λ1 =⇒ Lös (A, b) = {(7 + 2λ2 + 9λ1 , λ2 , −5 − 5λ1 , 2 + 2λ1 , λ1 ) | λ1 , λ2 ∈ R} oder Lös (A, b) = (7, 0, −5, 2, 0) + L((9, 0, −5, 2, 1), (2, 1, 0, 0, 0)) Die Darstellung der Lösungsmenge ist nicht eindeutig, da die spezielle Lösung und die Basis des Kernes anders gewählt werden können. Beispiel : Lös (A, b) = (0, 1, 0, 0, −1) + L((7, −1, −5, 2, 1), (11, 1, −5, 2, 1)) ist ebenfalls Lösung des vorherigen Beispiels, wobei es sich natürlich um die gleiche Lösungsmenge handelt. LGS, die ähnlich“ aussehen, müssen nicht ähnliche“ Lösungen besitzen: ” ” Frage : Welche Lösungen besitzen die LGS 1 1 x 2 1 1 x 2 = , = 1 1.001 y 2 1 1.001 y 2.001 1 1 x 2 = ? 1 1.001 y 2.01 106 4 LINEARE ALGEBRA Genaues Rechnen ist manchmal dringend erforderlich! Wir beenden das Thema Lineare Algebra mit einer Aufgabe, die aus einem Rechenbuch aus dem alten China stammt und hier verkürzt wiedergegeben werden soll: Frage : Wieviele Hähne, Hennen und Küken kann man für (genau) 100 Münzen kaufen, wenn man 100 Vögel haben will und ein Hahn fünf Münzen, eine Henne vier Münzen und vier Küken eine Münze kosten? Es handelt sich um ein LGS Ax = b mit einer Nebenbedingung, denn man ist schließlich nur an ganzen Tieren interessiert – gesucht ist Lös (A, b) ∩ (N × N × N). Lösung : Mit den Abkürzungen Ha, Hu und K erhalten wir das LGS Ha + Hu + 5Ha + 4Hu + Wir formen (A, b) in Zeilenstufenform um: 1 1 1 100 5 4 14 100 K = 100 = 100 1 4K → Damit ist K = λ (freier Parameter), Hu = 400 − 19 4 λ, 1 1 0 1 1 19 4 100 400 Ha = 100 − 400 + 19 4 λ − λ = −300 + 15 4 λ. Aus der Nebenbedingung folgt 4|λ ∧ ⇐⇒ λ = 4l, l ∈ N ∧ ⇐⇒ l∈N ∧ 400 ≥ 19 4 λ 300 15 ∧ ≤l≤ 300 ≤ 15 4 λ 400 19 20 ≤ l < 21, 06 Damit kommt nur l ∈ {20, 21} in Frage und wir erhalten genau zwei Lösungen (0, 20, 80) und (15, 1, 84). 107 5 Analysis In diesem Kapitel geht es zunächst um reelle Folgen und Reihen, anschließend werden wir Stetigkeit und Differenzierbarkeit bei reellen Funktionen untersuchen. 0 Ein einführendes Beispiel Zur Zeit der Wiedervereinigung wohnten in der ehemaligen BRD circa 60 Millionen, in der ehemaligen DDR circa 15 Millionen Menschen. Seitdem wechseln in jedem Jahr 3% der Bürger der alten in die neuen Bundesländer und umgekehrt circa 17% der Bewohner der neuen in die alten Länder. Wie ändert sich das Bevölkerungsverhältnis im Laufe der Zeit, falls die Gesamtbevölkerung konstant bleibt? Lösungsansatz: 1) Die Einwohnerzahl der alten Länder in den ersten Jahren beträgt 60, 60.75, 61.35, 61.83, . . . Millionen Menschen, dies folgt aus 2) Sei an die Einwohnerzahl der alten Länder am Ende des n–ten Jahres mit dem Startwert a0 = 60. Dann gilt an+1 = an − 3 17 an + (75 − an ) = 12.75 + 0.8 · an 100 100 3) Die Einwohnerzahl in den alten Ländern nimmt ständig zu: Für alle n ∈ N gilt an+1 = 12.75 + 0.8 · (12.75 + 0.8 · an−1 ) = 12.75 · (1 + 0.8) + 0.82 · an−1 = 12.75 · (1 + 0.8 + 0.82 + . . . + 0.8n ) + 0.8n+1 · a0 = 12.75 · 1 − 0.8n+1 + 0.8n+1 · a0 1 − 0.8 (geometrische Summenformel) = 12.75 · 5 + 0.8n+1 · (a0 − 12.75 · 5) = 63.75 − 0.8n+1 · 3.75 Damit ist an+1 − an = (63.75 − 0.8n+1 · 3.75) − (63.75 − 0.8n · 3.75) = 0.8n · 0.2 · 3.75 > 0, also wächst an in jedem Jahr. 4) Einerseits wird die Einwohnerzahl in den alten Ländern immer größer, andererseits gilt an ≤ 75 für alle n ∈ N. Daher ist zu vermuten, dass sich die Einwohnerzahl in den alten Ländern einem Grenzwert“ ” g annähern wird, d.h. für sehr große n ist näherungsweise an+1 = an = g. Damit folgt aus 2) g = 12.75 + 0.8 · g =⇒ g = 63.75 5) Versuch eines allgemeinen Ansatzes: Bei einer konstanten Gesamtbevölkerung G, einem Startwert a0 (Einwohnerzahl alte Länder), festen Wanderungsquoten 0 ≤ α ≤ 1 (alt nach neu) und 0 ≤ β ≤ 1 (umgekehrt) erhalten wir aus der Rechnung 3) β β 1 − (1 − α − β)n+1 an+1 = G · β · + (1 − α − β)n+1 · a0 = G · + (1 − α − β)n+1 · a0 − G · 1 − (1 − α − β) α+β α+β Für α + β 6= 0 und |1 − α − β| < 1 folgt hieraus analog zu 4) der Grenzwert“ ” β g =G· α+β 6) Fragen : Ist α + β = 0 oder |1 − α − β| ≥ 1 möglich? 108 1 5 ANALYSIS Konvergenz, Grenzwert und Häufungspunkte Bereits im ersten Semester haben wir Folgen als Abbildungen von N oder N0 in eine beliebige Menge M kennengelernt, in diesem Sinn handelt es sich bei den Bevölkerungszahlen a0 , a1 , . . . um eine Folge a : N0 → R. In den nächsten Abschnitten werden wir uns ausführlich mit unterschiedlichen Eigenschaften von reellen Folgen beschäftigen. Wir beginnen mit einem der wichtigsten Begriffe der Analysis: Def 1.1 Eine reelle Folge (an ) konvergiert gegen einen Grenzwert a, geschrieben lim an = a n→∞ : ⇐⇒ ∀ε ∈ R, ε > 0 ∃n0 ∈ N : |an − a| < ε ∀n ∈ N, n ≥ n0 Eine Folge, die nicht konvergiert, heißt auch divergent. Statt lim an = a schreiben wir kürzer lim an = a, (an ) → a oder an → a. Die natürliche Zahl n0 wird in n→∞ der Regel von dem vorgegebenen ε abhängen, daher findet man in Definitionen an Stelle von n0 auch oft die Bezeichnung n0 (ε). Mit Uε (a) := {x ∈ R | |x − a| < ε}, genannt die ε–Umgebung von a, kann man Konvergenz auch folgendermaßen definieren: Def 1.1’ Eine reelle Folge (an ) konvergiert gegen einen Grenzwert a a liegen fast alle Folgenglieder. : ⇐⇒ In jeder ε–Umgebung von Fast alle bedeutet hierbei alle bis auf endlich viele Ausnahmen. Dies ist etwas anderes als unendlich viele! Ganz wichtig ist, dass man jede (noch so kleine) Umgebung von a beachten muss. Die Gleichwertigkeit der beiden Definitionen 1.1 und 1.1’ soll hier nicht explizit bewiesen werden. Beispiele : 1) Jede konstante Folge an := a hat a als Grenzwert, denn für jedes ε > 0 und für jede natürliche Zahl n gilt |an − a| = 0 < ε. In diesem Fall liegen sogar alle Glieder der Folge in jeder ε–Umgebung von a. 2) Für die Folge (an ) mit an = n1 ist zu vermuten, dass der Grenzwert 0 ist. Es ist |an − 0| = n1 ; zum Beweis, daß an → 0 gilt, müssen wir also zu jedem gegebenen ε > 0 ein n0 ∈ N finden, so dass n1 < ε für alle n ≥ n0 gilt. Im ersten Semester haben wir gelernt (Skript Seite 23): ∃n∈N : 0< 1 < |r| n ∀ ε > 0 ∃ n0 ∈ N : 0< 1 <ε n0 ∀ r ∈ R∗ Auf unseren Fall übertragen bedeutet dies Dieses n0 benutzen wir für den Konvergenznachweis: Für alle n ≥ n0 gilt |an − 0| = | 1 1 1 − 0| = ≤ <ε. n n n0 3) Die Folge an := (−1)n ist nicht konvergent. Hätte die Folge einen Grenzwert a, so müsste es zu jedem ε > 0 ein n0 ∈ N geben mit |an − a| < ε für alle n ≥ n0 . Wir führen dies für ε = 1 zu einem Widerspruch: 2 = |an+1 − an | ≤ |an+1 − a| + |an − a| < 1 + 1 = 2 (wo steckt der Widerspruch?) 1 Konvergenz, Grenzwert und Häufungspunkte 109 3 4) an := 3n+4 2n+2 hat den Grenzwert 2 . Um dies zu beweisen, müssen wir zu jedem ε > 0 ein n0 mit der verlangten Eigenschaft finden. Wir formen um: 3n + 4 3 1 1 − < ε ⇐⇒ < ε ⇐⇒ n > − 1 =: r |an − a| = 2n + 2 2 2n + 2 2ε Jedes n0 mit n0 > r erfüllt unsere Bedingung. (Frage : Welches n0 kann für ε = 1 100 gewählt werden?) Eine Folge mit Grenzwert 0 heißt Nullfolge. Def 1.2 Sei (an ) eine beliebige Folge. Für jedes m ∈ N heißt am , am+1 , am+2 , . . . ein Endstück der Folge (an ). Mit Hilfe des Endstück–Begriffs können wir Konvergenz auch folgendermaßen formulieren: Def 1.1” Es gilt an → a ⇐⇒ In jeder ε– Umgebung von a liegt ein Endstück der Folge. Die endlich vielen Ausnahmen aus Definition 1.1’ stammen aus {a1 , . . . , am−1 }, als Zahl n0 (ε) aus Definition 1.1 kann n0 = m gewählt werden. Folgen können keinen oder einen Grenzwert haben, nie aber mehrere: Satz 1.1 Jede Folge besitzt höchstens einen Grenzwert. Beweis: Angenommen, die Folge (an ) hat zwei verschiedene Grenzwerte a und b. Zu ε := |b−a| 2 > 0 gibt es dann k0 , l0 ∈ N mit |ak − a| < ε für alle k ≥ k0 und |al − b| < ε für alle l ≥ l0 . Für alle n ∈ N größer als k0 und l0 folgt der Widerspruch 2ε = |b − a| ≤ |b − an | + |an − a| < ε + ε = 2ε. Im vorherigen Beispiel 3) gibt es unendlich viele Folgenglieder, die in jeder Umgebung von 1 liegen, trotzdem ist 1 kein Grenzwert dieser Folge. Def 1.3 a heißt Häufungspunkt einer Folge (an ) : ⇐⇒ In jeder Umgebung von a liegen unendlich viele Folgenglieder. Beispiele : 1) 1 und −1 sind die Häufungspunkte der Folge an := (−1)n . 2) Jede konvergente Folge besitzt den Grenzwert als Häufungspunkt. 3) Die Folge (an ) := n besitzt weder einen Grenzwert noch einen Häufungspunkt, da in jeder Umgebung jeder reellen Zahl nur endlich viele Folgenglieder liegen. 4) 0, −1, 0, 1, −2, −1, 0, 1, 2, −3, . . . , 3, −4, . . . Häufungspunkte. hat die abzählbar unendliche Menge Z als Menge der 5) Was sind die Häufungspunkte der Cantor–Folge, mit der Q abgezählt wurde? Wir geben ein einfaches Kriterium für die Existenz von Häufungspunkten an. Satz 1.2 Wenn in jeder Umgebung von a mindestens ein von a verschiedenes Folgenglied liegt, ist a Häufungspunkt der Folge. Beweis: Zu zeigen ist, dass unter den gegebenen Voraussetzungen in jeder Umgebung von a unendlich viele Folgenglieder liegen. 110 5 ANALYSIS Sei an1 ein Folgenglied mit an1 ∈ Uε (a), an1 6= a. Dann ist ε1 := |an1 − a| > 0, nach Voraussetzung liegt auch in Uε1 (a) ein von a verschiedenes Folgenglied an2 6= an1 . Auch in Uε2 (a) mit ε2 := |an2 − a| > 0 liegt ein von a verschiedenes Folgenglied an3 , usw. In jeder Umgebung liegen somit unendlich viele Folgenglieder, also ist a Häufungspunkt. Satz 1.2 besagt nicht, dass a kein Häufungspunkt ist, falls die Voraussetzung nicht erfüllt ist, wie die Folge (−1)n zeigt. Ein Häufungspunkt (ebenso wie der Grenzwert) kann, muss aber nicht selbst Folgenglied sein. Satz 1.3 Jede konvergente Folge besitzt genau einen Häufungspunkt. Beweis: Da jeder Grenzwert auch Häufungspunkt ist, liegt mindestens ein Häufungspunkt a vor. Kein b ∈ R\{a} kann ebenfalls Häufungspunkt sein, denn für ε := |a−b| > 0 liegen in Uε (b) nur endlich viele 2 Folgenglieder. Satz 1.3 besagt nicht, dass jede Folge mit genau einem Häufungspunkt konvergiert, wir geben weiter unten ein diesbezügliches Beispiel an. Manchmal findet man in der Literatur den Begriff der uneigentlichen Konvergenz: Eine Folge (an ) konvergiert uneigentlich gegen ∞ , falls es zu jeder reellen Zahl r > 0 ein n0 ∈ N gibt, so dass an > r für alle n ≥ n0 gilt. Analog sagt man: (an ) konvergiert uneigentlich gegen −∞, falls es zu jeder reellen Zahl r < 0 ein n0 ∈ N gibt, so dass an < r für alle n ≥ n0 gilt. Wir schließen uns dieser Ausdrucksweise nicht an, sprechen statt dessen von Divergenz gegen +∞ bzw. −∞ und schreiben an → ∞ oder an → −∞. √ Beispiele : 1) Für die Folge (an ) mit an = n gilt an → ∞. Denn: Es sei r > 0 eine beliebige reelle Zahl. √ Wir müssen ein n0 ∈ N angeben, so dass n > r für alle n ≥ n0 gilt. Wir wählen irgendeine natürliche √ Zahl n0 > r2 . Für alle n ≥ n0 gilt dann n > r2 , woraus an = n > r folgt. 2) Die Folge 1, 2, 1, 3, 1, 4, 1, 5, 1, 6, 1, . . . konvergiert weder eigentlich noch uneigentlich und besitzt genau einen Häufungspunkt. 2 Wie erkennt man konvergente Folgen? (1. Teil) Bisher haben wir zum Nachweis der Konvergenz einen konkreten Grenzwert vermutet und diesen dann mit Hilfe der Definition überprüft. So eine Vorgehensweise ist in der Praxis nur selten möglich, da man häufig n keinen Anhaltspunkt hat, welches der Grenzwert sein könnte, wie man an dem Beispiel an = 1 + n1 sieht. Wir können zwar vermuten – nachdem wir mühsam diverse Folgenglieder ausgerechnet haben – , dass die obige Folge (an ) konvergent ist mit einem Grenzwert zwischen 2.71 und 2.72, aber das hilft uns für den Nachweis der Konvergenz nicht weiter.28 Wir werden jetzt Methoden kennenlernen, mit deren Hilfe man in vielen Fällen entscheiden kann, ob eine Folge konvergent ist, ohne dass man den exakten Grenzwert erahnen muss. 28 Einige Werte von (an ): a5 = 2.48832, a10 = 2.593742460, a100 = 2.704813815, a1000 = 2.716923842, a10000 = 2.718145918, a1000000 = 2.718281828 2 Wie erkennt man konvergente Folgen? (1. Teil) 111 Def 2.1 1) Eine Folge (an ) heißt monoton wachsend, falls an ≤ an+1 für alle n ∈ N gilt. 2) Eine Folge (an ) heißt monoton fallend, falls an ≥ an+1 für alle n ∈ N gilt. 3) Eine Folge heißt monoton, falls sie monoton wachsend oder monoton fallend ist. Gilt in 1) bzw. 2) < statt ≤ bzw. > statt ≥ spricht man von strenger Monotonie. An Stelle von monoton wachsend sagt man auch monoton steigend. Beispiele : 1) (n)n∈N ist streng monoton wachsend und ( n1 ) streng monoton fallend. 2) Gibt es Folgen, die monoton wachsend und gleichzeitig monoton fallend sind? 3) an = 3n+4 2n+2 ist monoton fallend: an+1 ≤ an ⇐⇒ 3n + 7 3n + 4 ≤ ⇐⇒ (3n + 7)(n + 1) ≤ (3n + 4)(n + 2) ⇐⇒ 7 ≤ 8 2n + 4 2n + 2 Für Folgen, deren Glieder alle positiv sind, kann man Monotonie auch auf eine zweite Weise feststellen: (an ) ist monoton wachsend (fallend), falls an+1 an ≥ 1 (≤ 1) ist: Beispiel : an = 4n+3 3n+2 ist monoton fallend: an+1 = an 4n+7 3n+5 4n+3 3n+2 = (4n + 7)(3n + 2) 12n2 + 29n + 14 = <1 (3n + 5)(4n + 3) 12n2 + 29n + 15 Monotone Folgen können, müssen aber nicht konvergent sein. Satz 2.1 Monotone Folgen mit Häufungspunkt sind konvergent. Beweis: Wir haben zu zeigen, dass ein Grenzwert existiert. Sei a ein Häufungspunkt der oBdA monoton fallenden Folge (an ). Für ein beliebiges (und damit jedes) ε > 0 gibt es ein m ∈ N mit am ∈ Uε (a). Wegen der gegebenen Monotonie gilt dann ak ≤ am für alle k ≥ m. Beh.: a ≤ ak für alle k ∈ N. Bew.: Gäbe es ein l ∈ N mit al < a, so wäre wegen der Monotonie aj ≤ al für alle j ≥ l; für ε1 := a−al > 0 gilt dann aj 6∈ Uε1 (a) für alle j ≥ l, a wäre nach Definition 1.3 kein Häufungspunkt. Insgesamt gilt also a ≤ ak ≤ am < a + ε für alle k ≥ m. Damit liegt ein Endstück der Folge in jeder ε–Umgebung von a, wir haben mit a den Grenzwert nachgewiesen. Zusammen mit Satz 1.3 haben wir damit bewiesen Satz 2.2 Monotone Folgen haben höchstens einen Häufungspunkt. Wir kommen zu einer weiteren wichtigen Eigenschaft von Folgen. Def 2.2 Eine Folge (an ) heißt beschränkt, falls die Menge der Folgenglieder {an | n ∈ N} beschränkt ist. Beispiele : 1) ( n1 ) ist beschränkt, denn für alle Folgenglieder gilt 0 ≤ 1 n ≤1. 2) Für die Folge der natürlichen Zahlen gilt zwar ebenfalls 0 ≤ n, trotzdem ist diese Folge nicht beschränkt. 3) an = 3n+4 2n+2 ist beschränkt: Erneut ist 0 eine untere Schranke, wegen ist beispielsweise 2 eine obere Schranke. 3n+4 2n+2 ≤ 4n+4 2n+2 = 2 für alle n ∈ N 112 5 Satz 2.3 ANALYSIS Jede konvergente Folge ist beschränkt. Beweis: Sei (an ) → a. Wegen der Konvergenz gibt es ein n0 ∈ N mit an ∈ U1 (a) für alle n ≥ n0 . Für t := min{a0 , a1 , . . . , an0 −1 , a − 1} und s := max{a0 , a1 , . . . , an0 −1 , a + 1} gilt dann t ≤ an ≤ s für alle Folgenglieder, (an ) ist somit beschränkt. Satz 2.4 Jede monotone und beschränkte reelle Folge ist konvergent. Beweis: Es sei (an ) oBdA eine monoton wachsende beschränkte Folge. Da (an ) beschränkt ist, besitzt die Menge M der Folgenglieder ein Supremum (Satz II.2.2). Es sei a = sup M . Zu jedem ε > 0 ist dann a − ε keine obere Schranke von M , d.h. es gibt eine natürliche Zahl k mit a − ε < ak . Da (an ) monoton wachsend ist, folgt ak ≤ an für alle n ≥ k. Ferner gilt an ≤ a (da a = sup M ). Fassen wir diese Ungleichungen zusammen, so erhalten wir a − ε < ak ≤ an ≤ a für alle n ≥ k. Damit haben wir nachgewiesen, dass |an − a| = a − an < ε für alle n ≥ k gilt und (an ) → a gezeigt. 29 Mit Hilfe dieses letzten Satzes und der Bernoullischen Ungleichung (Satz I.5.5) weisen wir die Konver1 n genz von an = 1 + n nach: Wir zeigen 1. (an ) ist monoton wachsend und Zu 1: Wir zeigen für n ≥ 2 1 1+ n−1 an−1 < an , also (1 + n−1 < 1 1+ n 2. (an ) ist beschränkt. 1 n−1 n−1 ) n n+1 n < n n n n+1 n n < · n−1 n n−1 n n2 n < (n − 1)(n + 1) n−1 n n2 n < n2 − 1 n−1 n 2 n−1 n −1 > 2 n n n 1 1 1− 2 >1− n n ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ < (1 + n1 )n : n n−1 n−1 Die letzte Ungleichung folgt aus der Bernoullischen Ungleichung für b = − n12 . Zu 2: Wir zeigen an < 3 für alle n ∈ N. Hierzu berechnen wir an = 1 + Lehrsatz (Satz II.6.3): n 1 n X n 1 = (∗) 1+ n k nk 1 n n nach dem binomischen k=0 Für 1 ≤ k ≤ n gilt: n(n − 1) . . . (n − k + 1) 1 n n−1 n−k+1 1 1 1 n 1 = = · · · ... · ≤ = ≤ k−1 . k k k n k! n n n k! 1 · 2 · ... · k k! n 2 29 Zur Erinnerung: Für alle reellen Zahlen b ≥ −1 und alle n ∈ N gilt (1 + b)n ≥ 1 + nb 3 Wie erkennt man konvergente Folgen? (2. Teil) 113 Wenn wir dies in (∗) einsetzen und die geometrische Summenformel benutzten, erhalten wir 1 1+ n n ≤ 1+ n X k=1 1 2k−1 = 1+ n−1 X k=0 1 2 k n n−1 1 − 12 1 = 1+2− = 1+ <3 1 2 1− 2 Es gilt an < 3 für alle n. Da a1 = 2 ist, folgt wegen der Monotonie 2 ≤ an < 3 für alle n. (an ) ist monoton und beschränkt, also nach Satz 4 konvergent. Den Grenzwert der Folge (1 + n1 )n ist die nach L. Euler (1707–1783) benannte Eulersche Zahl e. 1728 wurde e von Euler zur Bezeichnung der Basis des natürlichen Logarithmus verwendet. Man kann zeigen, dass e keine rationale Zahl ist. Die ersten Stellen der Dezimalbruchdarstellung von e lauten e = 2.71828182845904 . . . Wir fassen unser derzeitiges Wissen in einem Schema zusammen: ja - beschränkt? @ @ nein @ R divergent @ 3 ja - monoton? konvergent @ @ nein @ R @ ??? Wie erkennt man konvergente Folgen? (2. Teil) Wir wollen weitere Methoden und Hilfsmittel kennenlernen, um Folgen erfolgreich auf Konvergenz untersuchen zu können. Zunächst beschäftigen wir uns mit Nullfolgen, die wir bereits in einem früheren Abschnitt kennengelernt haben. Aus Gründen der Übersichtlichkeit werden wir statt lim . . . häufig die n→∞ kürzere Version lim . . . verwenden. Satz 3.1 Sei (an ) eine beliebige Folge, a ∈ R. Dann gilt 1) an → a 2) an → 0 3) an → a ⇐⇒ =⇒ =⇒ an − a → 0 a · an → 0 |an | → |a| Beweisidee: 1) folgt unmittelbar aus der Definition der Konvergenz. ε > 0 existiert wegen an → 0 ein 2) Sei a 6= 0 (sonst fertig). Wir geben uns ein beliebiges ε > 0 vor. Zu |a| ε n0 ∈ N mit |an | < |a| ⇐⇒ |a · an | = |a · an − 0| < ε für alle n ≥ n0 . 3) folgt direkt aus der Konvergenz und aus ||an | − |a|| ≤ |an − a|. (Zur Betragsrechnung siehe Satz II.1.5) Frage : Was ist mit ⇐“ in den Teilen 2) und 3) von Satz 3.1? ” 114 5 ANALYSIS Satz 3.2 (Einschließungssatz): Es seien (an ), (bn ), (cn ) Folgen mit an ≤ bn ≤ cn für alle n ∈ N. Die Folgen (an ) und (cn ) seien konvergent mit gleichem Grenzwert lim an = lim cn = a. Dann gilt auch lim bn = a. Beweis: Wegen lim an = lim cn = a gibt es zu jedem ε > 0 Zahlen n1 , n2 , so dass |an − a| < ε für alle n ≥ n1 und |cn − a| < ε für alle n ≥ n2 gilt. Sei n ≥ n0 := max{n1 , n2 }. Dann ist für bn ≥ a |bn − a| = bn − a ≤ cn − a ≤ |cn − a| < ε und für bn < a |bn − a| = a − bn ≤ a − an ≤ |an − a| < ε. Beispiel : Sei bn := n1 · sin(n). Da | sin(x)| ≤ 1 für jedes x ∈ R gilt, können wir an := wählen. Diese Folgen konvergieren gegen Null, also auch (bn ). −1 n und cn := 1 n Das letzte Beispiel ist ein Spezialfall von folgendem allgemeineren Sachverhalt: Satz 3.3 Sei (an ) eine Nullfolge und (bn ) beschränkt. Dann ist auch (an · bn ) eine Nullfolge. Beweis: Sei k > 0 eine Schranke von (bn ) mit −k ≤ bn ≤ k. Zu kε > 0 (ε > 0 beliebig) gibt es ein n0 ∈ N mit |an | < kε für alle n ≥ n0 . =⇒ |an · bn | = |an | · |bn | < kε · k = ε. Beispiel : Die Folge (cn ) mit cn := nn!n ist eine Nullfolge: cn = (Nullfolge) und |bn | ≤ 1 (beschränkt). 1 n · 2 n · ... · n n = an · bn mit an = 1 n Wenn sich Folgen durch Addition oder Multiplikation aus einfacheren Folgen zusammensetzen, kann man häufig Aussagen über Konvergenz oder Divergenz machen: Satz 3.4 (Rechenregeln für konvergente Folgen; Grenzwertsätze): Es gelte (an ) → a und (bn ) → b, mit a, b ∈ R. Dann folgt: 1) (an + bn ) → a + b 2) (an · bn ) → a · b 3) an bn → ab , falls bn 6= 0 für alle n und b 6= 0. 4) a ≤ b, falls an ≤ bn für alle n. Beweis zu 1): Sei ε > 0 gegeben. Wegen (an ) → a und (bn ) → b gibt es ein n1 mit |an − a| < 2ε für alle n ≥ n1 und ein n2 mit |bn − b| < 2ε für alle n ≥ n2 . Es folgt für alle n ≥ max{n1 , n2 }: |an + bn − (a + b)| ≤ |an − a| + |bn − b| < 2ε + 2ε = ε. Zu 2): (an − a) und (bn − b) sind Nullfolgen (Satz 3.1), (bn ) ist beschränkt (Satz 2.3). Damit sind auch ((an − a)bn ) und ((bn − b)a) Nullfolgen (Satz 3.3). Nach 1) ist dann an bn − ab = (an − a)bn + (bn − b)a ebenfalls eine Nullfolge und die Behauptung an bn → ab folgt erneut aus Satz 3.1. |b| Zu 3): Aus Satz 3.1 folgt |bn | → |b|, ferner ist (siehe auch Satz II.1.5) |b − bn | ≥ |b| − |bn |. Zu ε:= 2 >0 |b| |b| 1 2 1 existiert n0 ∈ N mit |bn | > |b| − ε = |b| − 2 = 2 ⇐⇒ |bn | < |b| . Wir untersuchen die Folge bn : 1 1 2 − 1 = b − bn = · |b − bn | < · |b − bn | → 0 bn b bn b |bn ||b| |b|2 Die Folge 1 bn konvergiert gegen 1b , wir erhalten die Behauptung mit Hilfe von 2): an 1 1 = an · →a· bn bn b 3 Wie erkennt man konvergente Folgen? (2. Teil) 115 zu 4): Dieser Beweis ist einfach und wird eventuell als Übung behandelt. Mit der Schreibweise lim an = a sehen die Grenzwertsätze so aus: 1) 2) 3) 4) lim (an + bn ) = lim an + lim bn lim (an · bn ) = lim an · lim bn an lim abnn = lim lim bn , falls bn 6= 0 für alle n und lim bn 6= 0. lim an ≤ lim bn , falls an ≤ bn für alle n. In 4) kann übrigens ≤ nicht durch < ersetzt werden! Es lassen sich weitere Regeln angeben, die (bn ) → ∞ oder (bn ) → −∞ behandeln, zum Beispiel ∞, falls a > 0 5) Gilt an → a für a ∈ R, a 6= 0 und bn → ∞ , so folgt lim (an bn ) = −∞, falls a < 0 6) Gilt an → a für a ∈ R und bn → ∞ oder bn → −∞, so folgt lim abnn = 0. Beispiele : 1) Gesucht ist lim 3n2n−1 2 +n−2 . Anwendung von Regel 3) hilft zunächst nicht weiter, da Zähler und Nenner gegen ∞ streben. Klammert man in Zähler und Nenner n aus (höchste gemeinsam vorhandene Potenz von n), so erhält man n(2 − n1 ) 2 − n1 2n − 1 = = 3n2 + n − 2 n(3n + 1 − n2 ) 3n + 1 − 2 n Anwendung der Regeln 1), 2), 5) und 6) ergibt den Grenzwert 0. 2) lim 2n3 +n−4 −3n2 +1 = lim 3) lim 2n3 +n−4 3n3 −5 = lim n2 n2 · 1 2n+ n − 4 n2 1 −3+ 2 n 1 − 43 n2 n 3− 53 n 2+ = 23 . = −∞ (Regeln 1), 2), 5)) (Regeln 1), 2), 3)) Allgemein gilt lim n→∞ αk nk nk−1 + αk−1 + . . . + α1 n + α0 l l−1 βl n + βl−1 n + . . . + β0 = 0 falls k < l αk βl falls k = l +∞ oder − ∞ falls k > l, wobei das Vorzeichen von ∞ mit dem von αβkl übereinstimmt30 . Ein eigentlicher Grenzwert existiert genau dann, wenn der höchste Grad des Zählerpolynoms nicht größer als der des Nennerpolynoms ist. Frage : Sei an → a und bn → b. Was weiß man über Folgen (cn ) und (dn ), falls der Zusammenhang an = bn + cn + dn besteht? Der nächste Satz hat direkt nichts mit Folgen zu tun. Er gehört zur Abteilung nützliche Ungleichungen“ ” und ist auch für sich alleine betrachtet interessant. 30 unter der stillschweigenden Voraussetzung αk 6= 0 6= βl 116 5 Satz 3.5 ANALYSIS (Geometrisches Mittel ≤ Arithmetisches Mittel) √ Für positive reelle Zahlen a, b gilt ab ≤ a+b 2 Beweis: √ ab ≤ Beispiel : 8 = √ a+b (a + b)2 ⇐⇒ ab ≤ ⇐⇒ 4ab ≤ a2 + 2ab + b2 ⇐⇒ 0 ≤ (a − b)2 2 4 4 · 16 < 4+16 2 = 10. Frage : Wann gilt in Satz 3.5 die Gleichheit? Wir wollen unser Wissen auf die rekursiv definierte Folge an+1 := 1 2 an + 2 an mit a1 := 2 anwenden: 1. Durch Induktion ist klar, dass an > 0 für alle Folgenglieder gilt. q √ 2. Nach Satz 3.5 ist 2 = ak a2k ≤ 21 ak + a2k = ak+1 . Unabhängig von a1 gilt somit für alle natürlichen Zahlen n ≥ 2 √ an ≥ 2 =⇒ a2n ≥ 2 =⇒ an ≥ a2n , also an+1 = 12 an + a2n ≤ 12 (an + an ) = an 3. Da die Folge beschränkt (0 < an ≤ max{a1 , a2 }) und monoton fallend ist (zumindest ab dem zweiten Folgenglied), ist sie nach Satz 2.4 konvergent. Den Grenzwert g können wir mit Hilfe der Grenzwertsätze ausrechnen, denn die Folgen (an+1 ) und (an ) haben natürlich den gleichen Grenzwert: √ g = 12 g + g2 =⇒ g = 2. Es gilt allgemein, dass jede Folge (an ), definiert durch ein beliebiges a1 > 0 und an+1 := 12 an + aan √ gegen a konvergiert. Mit Hilfe dieser Folge kann man Wurzeln näherungsweise berechnen. Liegt der Startwert a1 in der Nähe der gesuchten Wurzel, klappt das Verfahren schnell und gut. √ Beispiel : Beginnt man zur Bestimmumg von 2 mit a1 = 1.5, so stimmt a3 auf drei und a4 sogar auf acht Stellen hinter dem Dezimalpunkt mit dem wahren Wert überein. Auch in dem einführenden Beispiel im Kapitel 0 hatten wir einen Grenzwert vermutet, jetzt können wir unsere Vermutung belegen. Da die Folge der Einwohnerzahlen beschränkt und monoton wachsend ist, muss ein Grenzwert existieren, den wir mit Hilfe der Grenzwertsätze wie angegeben bestimmen können. Unsere Rechnung ist allerdings nur bei Vorliegen eines Grenzwertes sinnvoll. 4 Teilfolgen und der Satz von Bolzano–Weierstraß Auch ohne eine strenge mathematische Definition hat man wahrscheinlich eine vermutlich richtige Vorstellung von Teilfolgen. Spezielle Teilfolgen haben wir bereits unter der Bezeichnung Endstück kennengelernt. Trotzdem soll dieser Begriff mathematisch sauber“ eingeführt werden. ” Def 4.1 Sei (an )n∈N eine beliebige Folge. Ist (n1 , n2 , n3 , . . .) eine streng monoton wachsende Folge von natürlichen Zahlen, so heißt (an1 , an2 , . . .) eine Teilfolge von (an ). 4 Teilfolgen und der Satz von Bolzano–Weierstraß 117 Um eine Teilfolge zu erhalten, darf man beliebige Glieder einer Folge streichen. Es müssen aber stets unendlich viele Glieder übrig bleiben, ferner darf die Reihenfolge dieser Glieder nicht verändert werden. Beispiele : 1) (2n)n∈N ist eine Teilfolge der natürlichen Zahlen. 2) Welches sind alle Teilfolgen von (1, 2, 1, 1, 1, . . .)? In der Regel hat eine Folge unendlich viele Teilfolgen. Es gilt sogar Satz 4.1 Eine Folge mit paarweise verschiedenen Gliedern besitzt überabzählbar viele Teilfolgen. Beweis:31 OBdA sei N die Menge der Folgenglieder. Jede Teilfolge entspricht dann bijektiv einer unendlichen Teilmenge von N. Sei U die Menge dieser unendlichen Teilmengen. Wenn wir die Menge der endlichen nicht leeren Teilmengen von N mit E bezeichnen, gilt Pot N = U ∪ E ∪ {∅}. Beh. : E ist abzählbar. S Bew. : Es ist E = An mit An := {M ⊆ N | |M | = n}. Für jedes n ist eine surjektive Abbildung n∈N gn : Nn → n S Ai durch gn ((x1 , x2 , . . . , xn )) := {x1 , x2 , . . . , xn } definiert. Daher können wir An als Teil- i=1 menge des kartesischen Produktes Nn auffassen. Da Nn abzählbar ist (siehe hierzu das Kapitel II.3 über Abzählbarkeit), ist auch jede der Mengen An abzählbar. Für jede natürliche Zahl n gibt es also eine Bijektion fn : N → An . Als letzte Abbildung betrachten wir jetzt N×N → E f: (n, m) 7→ fm (n) Nach Konstruktion ist f surjektiv, also ist E abzählbar. Pot N ist nach Satz II.3.5 überabzählbar, also muss U nach dem soeben Bewiesenen ebenfalls überabzählbar sein. Jetzt wollen wir uns mit Eigenschaften von Teilfolgen beschäftigen. Satz 4.2 Sei (an ) eine konvergente Folge. Dann konvergiert auch jede Teilfolge (gegen den gleichen Grenzwert). Beweisidee: Es handelt sich um eine direkte Folgerung aus der Konvergenzdefinition. Die genaue Formulierung ist eine einfache Übungsaufgabe. Satz 4.3 a ist ein Häufungspunkt einer Folge (an ) a konvergiert. ⇐⇒ Es gibt eine Teilfolge von (an ), die gegen ⇒“: Es sind zwei Fälle möglich: ” 1. Fall: a tritt unendlich oft als Folgenglied auf. Dann ist bn := a die gesuchte Teilfolge. Beweis: 2. Fall: a tritt höchstens endlich oft als Folgenglied auf. Da in jeder Umgebung des Häufungspunktes a unendlich viele Folgenglieder liegen müssen, gibt es für jedes ε > 0 ein Folgenglied an1 6= a mit an1 ∈ Uε (a). Wir setzen b1 := an1 . Auch in Uε1 (a) mit ε1 := |a − an1 | gibt es von a verschiedene Folgenglieder: Sei b2 := an2 ∈ Uε1 (a) mit n2 > n1 . Dieses Verfahren setzen wir fort und erhalten so eine Teilfolge (bn ), die nach Konstruktion gegen a konvergiert. 31 Dieser Beweis für mathematische Feinschmecker wird in der Vorlesung nicht durchgeführt und ist nicht prüfungsrelevant. 118 5 ANALYSIS ⇐“: Weil in jeder ε–Umgebung von a fast alle Glieder einer Teilfolge liegen, ist natürlich auch die ” Häufungspunkt–Bedingung (für die Gesamtfolge) erfüllt. Dass jede Teilfolge einer beschränkten Folge ebenfalls beschränkt und jede Teilfolge einer monotonen Folge ebenfalls monoton ist, ist unmittelbar einsichtig. Nicht auf der Hand liegend ist dagegen die Aussage des nächsten Satzes, zu dessen Beweis wir noch einen neuen Begriff benötigen. Def. 4.2 Sei (an )n∈N eine beliebige Folge. Ein Folgenglied ak heißt Hochpunkt [Tiefpunkt] von (an ) : ⇐⇒ ak > an [ak < an ] ∀n > k. Beispiele : Jedes Folgenglied der Folge ( n1 )n∈N ist Hochpunkt; konstante Folgen besitzen keine Hoch– und auch keine Tiefpunkte. Ob die Folge an := sin(n) Hoch– oder Tiefpunkte besitzt, ist auf den ersten Blick nicht feststellbar. Satz 4.4 Jede Folge besitzt eine monotone Teilfolge. Beweis: Es sind zwei Fälle möglich: Jede Folge besitzt entweder unendlich viele oder nur endlich viele Hochpunkte. 1. Fall: Es gibt unendlich viele Hochpunkte. Dann bildet die Folge dieser Hochpunkte eine (streng) monoton fallende Teilfolge. 2. Fall: Es gibt nur endlich viele Hochpunkte an1 , an2 , . . . , ank . Sei k := max{n1 , . . . , nk }; falls die Folge überhaupt keinen Hochpunkt besitzt, setzen wir k := 0. Dann ist b1 := ak+1 kein Hochpunkt, also gibt es eine natürliche Zahl k 0 > k + 1 mit ak0 ≥ ak+1 . Auch b2 := ak0 ist kein Hochpunkt, denn es gibt ein k 00 > k 0 mit ak00 ≥ ak0 . Wir setzen b3 := ak00 , usw.. Die so konstruierte Folge (bn )n∈N ist eine monoton wachsende Teilfolge. Der Beweis des letzten Satzes ist ein reiner Existenzbeweis. So wissen wir jetzt, dass beispielsweise die beschränkte Folge (sin(n)) eine monotone Teilfolge besitzen muss, explizit angeben können wir sie aber nicht! Eine wichtige Konsequenz aus Satz 4.4 ist der nächste Satz, der nach dem Vater der Epsilontik“ Karl ” Weierstraß (1815–1897) und nach Bernhard Bolzano (1781–1848) benannt wurde. Satz 4.5 (Satz von Bolzano – Weierstraß) Jede beschränkte reelle Folge besitzt mindestens einen Häufungspunkt. Beweis: Nach Satz 4.4 besitzt jede Folge eine monotone Teilfolge, die wegen der Beschränktheit der Ausgangsfolge ebenfalls beschränkt sein muss. Nach Satz 2.4 ist jede monotone und beschränkte reelle Folge konvergent. Nach Satz 4.3 ist der Grenzwert (dieser Teilfolge) Häufungspunkt der Ausgangsfolge, was zu zeigen war. Der Satz von Bolzano – Weierstraß kann auch ganz anders bewiesen werden: Alternativer Beweis: Sei (an ) eine beschränkte Folge mit unterer Schranke u1 und oberer Schranke o1 ; 1 alle Folgenglieder liegen also im Intervall [u1 , o1 ].32 Sei t := u1 +o 2 . In mindestens einem Intervall [u1 , t] oder [t, o1 ] müssen unendlich viele Folgenglieder liegen, sei oBdA [u1 , t] dieses Intervall. Wir definieren u2 := u1 und o2 := t und führen die gleichen Überlegungen wie oben für das Intervall [u2 , o2 ] durch. Wir erhalten auf diese Weise eine Folge von Intervallen [un , on ] mit den Eigenschaften: 32 Wir behandeln hier nur den interessanten Fall u1 < o1 . (Warum ist u1 = o1 uninteressant?) 5 Das Cauchysche Konvergenzprinzip 119 1) Jedes Intervall enthält unendlich viele Folgenglieder. 2) (un ) ist eine monoton wachsende, (on ) eine monoton fallende Folge. 3) Wegen u1 ≤ un < on ≤ o1 sind die Folgen (un ) und (on ) beschränkt. Nach den bekannten Sätzen sind die Folgen (un ) und (on ) konvergent, es sei un → u und on → o. 1 (o1 − u1 ), die auf Grund der Wir betrachten jetzt die Folge dn := on − un = 21 (on−1 − un−1 ) = 2n−1 Grenzwertsätze ebenfalls konvergent sein muss. Wie man entweder sofort sieht oder aus den Übungen weiß, gilt dn → 0. Dies ist nur möglich, wenn die Grenzwerte der u– und der o–Folge übereinstimmen, es gilt also u = o =: h. In einem letzten Schritt zeigen wir jetzt, dass dieser gemeinsame Grenzwert h der Schrankenfolgen“ ein ” gesuchter Häufungspunkt der Ausgangsfolge (an ) ist. Sei hierzu ε > 0 beliebig gegeben. Nach Definition des Grenzwertes gibt es n1 , n2 ∈ N : un1 , on2 ∈ Uε (h). Für n0 := max{n1 , n2 } gilt dann [un0 , on0 ] ⊂ Uε (h). Da in diesem Intervall unendlich viele Folgenglieder von (an ) liegen, ist h ein Häufungspunkt von (an ). Frage : Wie hätte man u2 und o2 definieren müssen, wenn man zu Beginn des alternativen Beweises angenommen hätte, dass unendlich viele Folgenglieder im Intervall [t, o1 ] stecken? Manchmal wird der Satz von Bolzano – Weierstraß auch folgendermaßen formuliert: Satz 4.5’ Jede beschränkte reelle Folge enthält eine konvergente Teilfolge. Beweis: Satz 4.5 und Satz 4.3 5 Das Cauchysche Konvergenzprinzip Leider ist nicht jede beschränkte Folge monoton, so dass unser Schema vom Ende des zweiten Abschnitts nicht immer zu einer Entscheidung bezüglich Konvergenz führt. Beispiel : Sei an := n P k=1 (−1)k+1 k1 . Diese Folge ist beschränkt, denn es gilt 1 2 ≤ an ≤ 1, aber nicht monoton. Ist sie konvergent? Wir werden jetzt ein von der Monotonie unabhängiges Kriterium kennenlernen, das für reelle Folgen stets entscheidet, ob Konvergenz vorliegt oder nicht. Es ist nach Augustin Louis Cauchy (1789 – 1857) benannt. Def. 5.1 Eine Folge (an )n∈N heißt Cauchyfolge : ⇐⇒ ∀ε ∈ R+ ∃n0 ∈ N : |an − am | < ε ∀n, m ∈ N, n, m ≥ n0 Man vergleiche diese Definition mit der Definition der Konvergenz (Def. 1.1)! Satz 5.1 Jede konvergente Folge ist eine Cauchyfolge. Beweis: Sei a der Grenzwert der zu untersuchenden Folge (an ), sei ε > 0 beliebig gegeben. Dann gibt es auch zu 2ε > 0 ein n0 ∈ N mit |an − a| < 2ε für alle n ≥ n0 . Für n, m ≥ n0 gilt dann |an − am | ≤ |an − a| + |a − am | < ε ε + = ε. 2 2 120 5 ANALYSIS Also ist jede konvergente Folge auch eine Cauchyfolge. Für Konvergenzuntersuchungen interessanter ist die umgekehrte Richtung, die für reelle Folgen gilt. Satz 5.2 (Cauchysches Konvergenzkriterium) Eine reelle Folge konvergiert genau dann, wenn sie eine Cauchyfolge ist. Beweis: Die einfach zu beweisende Richtung =⇒ “, die für beliebige Folgen gilt, haben wir bereits mit ” Satz 5.1 erledigt. ⇐= “: Wir zeigen zuerst, dass jede Cauchyfolge beschränkt sein muss. ” Zu ε = 1 gibt es ein n1 ∈ N mit |an − am | < 1 für alle n, m ≥ n1 , also insbesondere |an | = |an − an1 + an1 | ≤ |an − an1 | + |an1 | < 1 + |an1 | für alle n ≥ n1 . Mit s := max{|ai |, 1 + |an1 | | i < n1 } gilt dann −s ≤ an ≤ s für alle Folgenglieder, damit ist jede Cauchyfolge beschränkt. Als nächstes benutzen wir den Satz von Bolzano – Weierstraß in der Version von Satz 4.5’, sei (ank )k∈N eine konvergente Teilfolge mit Grenzwert a. Beh. : a ist Grenzwert der Cauchyfolge (an ). Bew. : Sei ε > 0 beliebig gegeben. Da (an ) eine Cauchyfolge ist, gibt es zu 2ε > 0 ein n0 ∈ N mit |an − am | < 2ε für alle n, m ≥ n0 . Zu diesem n0 existiert ein n2 ∈ N mit |an2 − a| < 2ε und n2 > n0 . (Dies folgt direkt aus der Konvergenz der Teilfolge.) Für jedes n > n0 gilt nun |an − a| ≤ |an − an2 | + |an2 − a| < ε ε + =ε 2 2 Somit ist an → a nachgewiesen. Das Cauchysche Konvergenzkriterium ist notwendig und hinreichend, da es stets zu einer Entscheidung führt. Man kann dieses Kriterium anwenden, auch wenn man keine Ahnung hat, welchen konkreten Wert der vermutete Grenzwert besitzt. Leider liefert das Kriterium nicht diesen konkreten Wert und erfordert häufig umfangreiche und komplizierte Rechnungen. Wie verschiedene andere Sätze auch, gilt das Cauchysche Konvergenzprinzip nicht im Bereich der rationalen Zahlen, da die Vollständigkeit der reellen Zahlen eine wichtige Rolle spielt. Innerhalb Q gibt es Cauchyfolgen, die keinen rationalen Grenzwert besitzen, Beispiele hierfür sind bereits bei früherer Gelegenheit (wo ?) gegeben worden. Wir wollen jetzt mit Hilfe des Cauchyschen Konvergenzkriteriums überprüfen, ob die zu Beginn dieses n P Kapitels erwähnte Folge an = (−1)k+1 k1 konvergent ist. Zu zeigen ist: k=1 ∀ε ∈ R+ ∃n0 ∈ N : |an − am | < ε ∀n, m ∈ N, n, m ≥ n0 6 Drei Beispiele 121 Wir gehen oBdA von m > n aus und setzen m = n + l. Dann gilt an+l − an = n+l X k+1 1 (−1) k=1 k − n X k+1 1 (−1) k=1 k = n+l X (−1)k+1 k=n+1 1 k 1 1 1 + (−1)n+3 + · · · + (−1)n+l+1 n+1 n+2 n+l 1 1 1 = (−1)n = (−1)n · A − + − · · · + (−1)l+1 n+1 n+2 n+l = (−1)n+2 Der Ausdruck A kann auf zwei Arten berechnet werden: 1 1 1 1 A = − + − n+1 n+2 n+3 n+4 + · · · 1 1 1 A = n+1 − n+2 − n+3 − ··· > 0 ≤ 1 n+1 1 Damit ist |an+l − an | = |A| ≤ n+1 . Zu einem beliebig vorgegebenen ε > 0 genügt jedes n0 > 1ε der 1 Cauchyschen Konvergenzbedingung: Für alle n ≥ n0 und m = n + l ≥ n0 ist |am − an | ≤ n+1 < n10 < ε erfüllt. Diese Folge ist somit als konvergent nachgewiesen. Um den exakten Grenzwert zu bestimmen, ist allern P dings weiteres mathematisches Wissen nötig. Wir merken uns ohne Beweis: (−1)k+1 k1 → ln 2. k=1 6 Drei Beispiele I. Wir wollen uns ein wenig mit (Zinses)zinsrechnung beschäftigen. Wenn ein gewisses Kapital K mit p Prozent verzinst wird, erhält man bei jährlicher Verzinsung am Ende des ersten Jahres Z1 = Zinsen. Mit x := p 100 K ·p 100 besitzt man nach einem Jahr ein Kapital K1 = K + Z1 = K(1 + x) . Beispiel : 1000 Euro ergeben bei 10 Prozent Zinsen nach einem Jahr K1 = 1000 1 + 1 10 = 1100 Euro. Frage : Wie groß ist K1 bei halbjährlicher Verzinsung, wenn der Zinssatz pro Jahr p Prozent beträgt? Antwort : Nach einem halben Jahr erfolgt eine Zinszahlung von Z 1 = K · x2 , dieser Betrag wird am Ende 2 des Jahres erneut verzinst: x x x x 2 K1 = K + Z 1 + Z1 = K + K · + K + K · · = ... = K 1 + 2 2 2 2 2 Beispiel: Im Gegensatz zur jährlichen Verzinsung erhalten wir bei ansonsten gleichen Zahlen wie im 1 2 ersten Beispiel aus 1000 Euro K1 = 1000 1 + 20 = 1102.50 Euro. Wir werden in der Vorlesung monatliche, tägliche und ständige Verzinsung behandeln. (Frage : Sprengt ständige Verzinsung die Bank?) Um die Ergebnisse gemeinsam erarbeiten zu können, werden sie im Skript nicht vorweggenommen. 122 5 ANALYSIS II. Eine aktuelle Frage : Wie wirken sich Investitionen auf die Volkswirtschaft aus?33 Ein Unternehmen hat den Vorteil von Investitionen erkannt und steckt K Euro (beispielsweise zur Erneuerung von Maschinen) in die Firma, d.h., K Euro wandern in die Geldtaschen von Maschinenbauern, Transporteuren, Installateuren, usw.. Durch die Investition hat sich das Volkseinkommen zunächst um K Euro erhöht. Unter der Annahme, dass alle produzierenden und konsumierenden Mitglieder einer Volkswirtschaft einen festen Bruchteil q ∈ ]0, 1[ ihres Einkommens für Verbrauchsgüter benutzen, werden jetzt von den Empfängern der K Euro ihrerseits q · K Euro zusätzlich ausgegeben. Die Empfänger dieses Betrages erhöhen ihre Ausgaben ebenfalls, und zwar um um q 2 · K Euro, usw.. Nachdem der n–te Empfänger zusätzlich q n ·K Euro in die (Volks)wirtschaft gesteckt hat, sind auf Grund der ursprünglichen Investition von K Euro insgesamt n K + q · K + ... + q · K = K · n X qν = K · ν=0 1 − q n+1 1−q Euro bewegt worden, um diesen Betrag hat sich das Volkseinkommen erhöht. Fragen : Was haben Zinseszins und das Volkseinkommen mit Folgen zu tun? III. Wir wollen Folgen untersuchen, deren Verhalten nicht nur von einem Startwert a1 , sondern auch von einem festen Parameter α abhängen. Wir betrachten die Folge an+1 := α · an · (1 − an ) mit α, a1 ∈ R fest vorgegeben und untersuchen zuerst einige Spezialfälle: 1) Für a1 = 0 (bei beliebigem α) oder für α = 0 (bei beliebigem a1 ) handelt es sich um die konstante Nullfolge (zumindest ab a2 ). 2) Frage : Was passiert bei a1 = 1? 3) Für α = −1 erhalten wir mit dem Startwert a1 = 2 die konstante Folge 2,2,2,. . . . 4) Frage : Was passiert bei α = −1, wenn wir mit a1 = −1 oder a1 = 3 beginnen? Wir werden uns jetzt auf α ∈ ]0, 4[ und a1 ∈ ]0, 1[ beschränken. Beh. 1: Für α ∈ ]0, 4[ und a1 ∈ ]0, 1[ ist stets 0 < an < 1. Bew. : Vollständige Induktion (Kurzform). Für n = 1 gilt 0 < a1 < 1 nach Voraussetzung. n 7→ n + 1: Sei 0 < an < 1 für ein n ∈ N. Dann ist an = 21 + x mit |x| < 12 , es folgt 0 < 1 − an < =⇒ 0 < an (1 − an ) = 12 + x 12 − x = 14 − x2 ≤ 14 =⇒ 0 < an+1 = α an (1 − an ) ≤ α4 < 1 1 2 − x. Bei einem Startwert zwischen 0 und 1 liegt für α ∈ ]0, 4[ eine beschränkte Folge vor, die nach Bolzano– Weierstraß mindestens einen Häufungspunkt haben muss. Beh. 2: Für α ∈ ]0, 1] und a1 ∈ ]0, 1[ ist (an ) eine Nullfolge. αan (1−an ) = α(1 − an ) < 1. Da nach Beh. 1 an , an+1 > 0, ist (an ) monoton Bew. : Wir berechnen an+1 an = an fallend, also nach Satz 2.4 konvergent. Für den Grenzwert g muss nach den Grenzwertsätzen gelten 33 Weitere Angaben zu diesem Beispiel findet man in dem Lehrbuch der Analysis I von H. Heuser. 6 Drei Beispiele 123 g = α · g · (1 − g). Außer für g = 0 ist diese Gleichung für g = 1 − α1 ≤ 0 erfüllt. Da aber alle Folgenglieder positiv sind, kann der Grenzwert nicht negativ sein. Somit kommt als Grenzwert nur 0 in Frage. Für α > 1 ist das Verhalten der Folge (an ) nicht so einfach zu 9 bestimmen, beispielsweise ist die Folge für α = 45 und a1 = 10 wegen a1 > a2 < a3 (Rechnung!) nicht monoton. Bei der Kurve in der Zeichnung handelt es sich um den Graph der Funktion f : [0, 1] → [0, 1], f (x) := α · x · (1 − x) mit α = 2.5. Wegen a1 > a2 = f (a1 ) < a3 = f (a2 ) ist die Folge (an ) auch für dieses α nicht monoton. Aus der Zeichnung kann man auch die Gültigkeit der nächsten Behauptung ablesen: .... ..... ..... ..... . . . . ..... ..... ..... ..... ..... . . . .... ..... ..... ..... ..... . . . . ....................................... ...... .. ... ....... ..... .... ..... ..... ..... ... ......... .... .... . .... . ... ....... . .... .. . . . . . . . . ... ............................................. ... . . .. ... . ..... . . . . ... ... .. . .. ... . . . . ... . ... . .. ... . . . . . ... .. ...... . .. . . . . ... .. ....... . .. .. . . . . ....... . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ................ . . ..... . .. . . ..... . . . . .. ......... .. .. ... . . .. .... ... ... ... ..... .. ......... .. ... . . . . . .. ...... .. ... . . . . . ... ......... .. . . . . . .. .... .. .. .. a2 0 a3 Beh. 3: ∀ α ∈ ]1, 4[ ∃ a1 ∈ ]0, 1[ : a1 1 (an ) ist konstant. Bew. : Durch einfache Rechnung erhält man die Behauptung für a1 = 1 − α1 . Beh. 4: Sei α = 2. Dann gilt für jedes a1 ∈ ]0, 1[ Bew. : Sei a1 = 1 2 an → 12 . + x mit |x| < 12 . Durch vollständige Induktion kann man an+1 = 1 1 n − (2x)2 2 2 ∀n ∈ N n zeigen.34 Aus |2x| < 1 folgt dann lim (2x)2 = 0, mit den Grenzwertsätzen erhalten wir die Behauptung n→∞ an → 12 . Mit anderen Methoden kann man sogar für jedes α ∈ [1, 3[ die Konvergenz der an –Folge gegen 1 − α1 für jedes a1 ∈ ]0, 1[ beweisen. Ist α > 3, gilt dies nicht mehr, wie man an den nächsten Bildern erkennen kann. Verhalten der an –Folge für α = 3.5 und a1 = 0.7: ..... ..... ..... ..... . . . . . ... ..... ............................................................................... .................................................................................................. ....... .. ................................... ... ... .. .... .... .... .... .. . .. . . . . . . . . . . . . .... .... .... .... ................................. .... .... ..... .... .... ... ... ... ... ................ .... .... .... ... ... .... ... ... ... ...................... ... ... ... ... ... . .. ....... .. .... .. .. ... . .. . . . . . . .... .... ... .... ................................. ... ... .... ... ... ... ... ... ... ... ... ... ....... .... .. .. ... .. ... ... .. ... .. . .. ....................................................... ... .... . . .... .. .. .. ... ....... .. . . . .. .. .............................................................................. ..... . . .... .. ... .... ......... ... ........................................................................................ . . ... .... .... ... ... .... . . .. . . . . . ... ..... .... ... ... ..... . . .. . . . . . ... . ... . . . .. . ... . . . . .... . .. . ... . . . . . ... . .. ... . . . . . . . ... ... . .. . . . . . . .. ... .... ......... .... ... ... ....... ... ... ... ....... ... ... .......... ... ... . ..... ... . 0 a1 1 ..... ..... ..... ..... . . . ..... .............................................................................................. ..... .. . . ............................................................................................... .... .... .... .... . . . . . . . . . . . . . .... ...... .. ... .... .. ... .. .... .... .... .... .... ...... ... ... ... .... ....... .... .. ... ... ... ..... .... . . . . .. . . . . . ... ..... .... ... . .. .. .. . . . . . . . ... ... .... ... . .. .. . .. . . . . . ... ... ... .. .... ... ... ... ... .... ........ .... .. ... ... .......... . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ........... ..... . . ..... .. . .. . . . ..... ... . . . .. ........ .. . . .. ....... . ............. ... ... ...... ... . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .......... . . . ..... . . .. . . .. ...... . . . ... .. . . .. . . .. .. ... . . . ... . . . . .. . . . . .. ... . . . ... .. .. .. .. .... ... ..... ..... .. .. .. .. ... ... .... . . . .. ... . .. . . . . . . . . .. .. .. .. .... ..... ... ..... ... .. .. .. .. ... ..... ... .. .. .. .. ... ....... ... .. .. .. .. .... ......... ... .. .. .. .. .......... ... .. .. .. .. ..... . .. .. .. .. 0 an+2 an an+3 an+1 1 Im linken Bild wurden die Folgenglieder a2 , . . . , a12 berechnet, im rechten analog für 80 ≤ n ≤ 120 die Folgenglieder an , an+1 , an+2 , an+3 . Die aus der Zeichnung zu vermutende Existenz von vier Häufungspunkten lässt sich mathematisch exakt beweisen. 34 Dies wird entweder in den Übungen oder in der Vorlesung bewiesen. 124 5 ANALYSIS Man kann die Folge an+1 = α · an · (1 − an ) als Modell eines Insektenbiotops auffassen, wobei an die Population zum Zeitpunkt n bedeutet und α ein Umweltparameter ist. Es zeigt sich, dass in allen Biotopen mit α zwischen 1 und 3 eine stabile Insektenbevölkerung zu erwarten ist. Ist der Parameter zu klein, stirbt die Population aus. Ist er zu groß, kann die Insektenzahl von Jahr zu Jahr schwanken. Es kann sogar passieren, daß keine verlässliche Vorhersage mehr möglich ist. Diese Abhängigkeit von α soll in dem letzten Bild verdeutlicht werden. Hier wird das Verhalten der Folge für alle α ∈ [1, 4] dargestellt. Sogenannter Feigenbaum“: Für verschiedene α ” werden die Folgenglieder an mit 100 < n < 200 gezeichnet. Jeder Startwert a1 ∈ ]0, 1[ liefert ein ähnliches Bild, wenn ab einem hinreichend großen n1 genügend viele Folgenglieder gezeichnet werden. 7 Reihen In vorherigen Abschnitten haben wir reelle Folgen von spezieller Gestalt kennengelernt, die wir jetzt näher untersuchen wollen. Aus jeder gegebenen Folge a1 , a2 , a3 , . . . lässt sich eine neue Folge s1 , s2 , s3 , . . . bilden, indem man jeweils die ersten Glieder der Folge (ai ) addiert: s1 = a1 , s2 = a1 + a2 , s3 = a1 + a2 + a3 , s4 = a1 + a2 + a3 + a4 , ... Beispiel : Zur Folge (Zi ) der Zinsen im i–ten Zeitabschnitt gehört die Folge (Si ) der gesamten Zinseini P nahmen nach i Zeiteinheiten, es ist Si = Zi . ν=1 Def 7.1 Sei (an )n∈N eine beliebige Folge. Dann heißt (sn )n∈N mit sn := n P ai (unendliche) Reihe . i=1 Beispiele : 1) Sei an := 1 für alle n ∈ N. Die zugehörige Reihe ∞ P ak ist nichts anderes als die Folge der k=1 natürlichen Zahlen 1, 2, 3, . . .. 2) Sei an := n für alle n ∈ N. Die zugehörige Reihe sn := n P i=1 ∞ P ai ist die Folge 1, 1 + 2, 1 + 2 + 3, . . . bzw. es gilt i=1 i= n(n+1) . 2 Eine Reihe (sn )n∈N , die aus der Folge (an )n∈N entstanden ist, bezeichnet man meistens mit dem Symbol ∞ P ai . Die Folgenglieder a1 , a2 , . . . (Summanden der Reihe) werden auch als Glieder der Reihe bezeichnet. i=1 sn = n P i=1 ai heißt n–te Partialsumme der Reihe. Jede Reihe kann somit als Folge ihrer Partialsummen 7 Reihen 125 ∞ P ai wird also keineswegs eine unendliche Summe“ dargestellt, es handelt ” sich vielmehr um eine Bezeichnung für die Reihe (sn )n∈N . aufgefasst werden. Durch i=1 Die Glieder ai einer Reihe können natürlich auch mit dem Index 0 oder einem anderen Index beginnen, ferner kann statt i jeder andere Buchstabe – beispielsweise k – gewählt werden. Wie jede Folge kann eine Reihe konvergent oder divergent sein. Konvergenz bei Reihen können wir uns folgendermaßen merken: Def 7.2 Eine Reihe ∞ P ai heißt konvergent, wenn die Folge (sn )n∈N der Partialsummen konvergiert, i=1 d.h., wenn (sn ) → s für ein s ∈ R gilt. Hierfür schreibt man dann ∞ X ai = s i=1 Eine Reihe, die nicht konvergiert, heißt divergent. Beispiele : Die Reihen ∞ P i=1 ∞ P 1 und i=1 − 12 i ∞ P i (Beispiele 1)und 2) von oben) sind divergent. Die Konvergenz von i=1 wird in Kürze bewiesen. Bitte beachten: Das Zeichen steht ∞ P ∞ P ai wird in zwei unterschiedlichen Bedeutungen verwendet: Einerseits i=1 ai für eine Reihe (sn )n∈N , andererseits bezeichnet i=1 falls dieser existiert. Wenn verschiedene Reihen wir dies durch ∞ P ai = i=1 Gliedern) wird durch ∞ P ∞ P ai und i=1 ∞ P ai den Grenzwert s der Reihe (sn )n∈N — i=1 ∞ P bi den gleichen Grenzwert besitzen, werden i=1 bi ausdrücken, die Gleichheit zweier Reihen (also Übereinstimmung in allen i=1 ∞ P ∞ P i=1 i=1 ai ≡ bi dargestellt. Ein einfaches notwendiges Kriterium für Konvergenz von Reihen liefert der folgende Satz. Zur übersichtlicheren Schreibweise P für Reihen vereinbaren wir: Wenn eine Aussage nicht vom ersten Index abhängt, schreiben wir kurz ai . Satz 7.1 P ai konvergent ⇒ (an ) Nullfolge Beweis: Für jedes n > 1 gilt an = sn − sn−1 . Aus der vorausgesetzten Konvergenz der Folge der Partialsummen (sn → s) und den Grenzwertsätzen für Folgen erhalten wir lim an = lim (sn − sn−1 ) = lim sn − lim sn−1 = s − s = 0 n→∞ n→∞ n→∞ n→∞ Als nächstes sollen einige wichtige Reihen vorgestellt und untersucht werden. Def 7.3 Die Reihe ∞ P k=1 1 k heißt harmonische Reihe. 126 5 Die Glieder der harmonischen Reihe sind a1 = 1, a2 = 12 , a3 = 31 , . . . an = n P 1 s1 = 1, s2 = 1 + 12 , . . . , sn = 1 + 12 + 13 + . . . + n1 = k , . . .. 1 n , . . ., ANALYSIS ihre Partialsummen k=1 Satz 7.2 Die harmonische Reihe ist divergent. Beweis: a1 = 1, Wir fassen die Glieder a1 , a2 , . . . wie folgt zusammen: a2 = 12 , a5 + a6 + a7 + a8 = a3 + a4 = 1 5 + 1 6 + 1 7 1 3 + + 1 8 1 4 > 1 8 > 1 4 + + 1 8 1 4 = 12 , 1 1 4 1 8 + 8 = 8 = 2, 2n−1 + 1, . . . , 2n ak + Allgemein gilt für die Glieder ak mit k = dieser 2n−1 Glieder: 2n X ak > k=2n−1 +1 a9 + . . . + a16 > 8 · = 1 k ≥ 1 2n , 1 16 = 12 . und daher folgt für die Summe n 2 X k=2n−1 +1 1 1 1 = 2n−1 · n = . 2n 2 2 Für die 2n –te Partialsumme s2n erhalten wir damit s2n = a1 + a2 + (a3 + a4 ) + (a5 + . . . + a8 ) + . . . + (a2n−1 +1 + . . . + a2n ) > 1 + Aus 1 + n 2 1 1 n + ... + = 1 + 2 |2 {z 2} n–mal → ∞ folgt die Divergenz der Partialsummen, also ist die harmonische Reihe divergent.35 Die am Ende desPAbschnittes über Cauchyfolgen als Beispiel untersuchte sogenannte alternierende harmonische Reihe (−1)i+1 1i ist im Gegensatz zur harmonischen Reihe konvergent. Eine überraschende Konsequenz aus der Divergenz der harmonischen P Reihe wird sich in den P Übungen ergeben. Zunächst halten wir fest: Es gibt eine konvergente Reihe ai , deren Betragsreihe |ai | divergent ist. Die nächste Reihe beginnt mit dem Index i = 0: Def 7.4 Sei q ∈ R gegeben. Dann heißt die Reihe ∞ P q i geometrische Reihe. i=0 Die geometrische Reihe ist uns ansatzweise bereits im vorherigen Kapitel begegnet. Sie ist eine der wichtigsten Reihen der Analysis, bereits die alten Griechen haben sich unbewusst mit ihr auseinandergesetzt, wie das Paradoxum vom Wettlauf zwischen Achill und einer Schildkröte zeigt (mehr dazu in der Vorlesung). Es sei versichert: Grundwissen über diese Reihe ist unabdingbar zum Bestehen späterer Prüfungen! Satz 7.3 Die geometrische Reihe divergiert für |q| ≥ 1 und konvergiert für |q| < 1, es gilt ∞ X i=0 Beweis: qi = 1 1−q für Für |q| < 1 folgt die Behauptung aus sn = n P i=0 |q| < 1. qi = 1−q n+1 1−q (siehe auch Satz I.5.2) mit Hilfe der Grenzwertsätze wegen |q|n+1 → 0. Für |q| ≥ 1 ist q i keine Nullfolge, also liegt nach Satz 7.1 Divergenz vor. 35 Die harmonische Reihe strebt sehr langsam gegen ∞. Es ist beispielsweise 10000 P i=1 1 i < 10. 7 Reihen Beispiele : 127 ∞ P i=0 ( 21 )i = 1 1− 12 = 2, ∞ P i=0 (− 12 )i = 1 1+ 12 ∞ P = 23 , i=0 ( 94 )i = 1 1− 49 = 95 , ∞ P i=0 Im Gegensatz P zur harmonischen Reihe halten wir fest: Es gibt eine konvergente Reihe tragsreihe |ai |, ebenfalls konvergiert. Def. 7.5 Eine Reihe P ai heißt absolut konvergent : ⇐⇒ P ( 32 )i = ∞ P ai , deren Be- |ai | ist konvergent. Beispiel : Die geometrische Reihe ist für |q| < 1 absolut konvergent. Nicht jede konvergente Reihe ist absolut konvergent, aber die Umkehrung stimmt immer: Satz 7.4 P P ai absolut konvergent ⇒ ai konvergent Beweis: Nach Satz II.1.6 gilt für alle n, m ∈ N mit n < m m m m X X X a ≤ |a | = |a | i i i i=n+1 i=n+1 i=n+1 P Sei ε > 0 beliebig. Da |ai | nach Voraussetzung konvergiert, gilt für ein geeignetes n0 ∈ N nach dem Cauchykriterium (siehe Satz 5.2) n m X X |ai | − |ai | < ε ∀n, m ≥ n0 i=1 i=1 Insgesamt folgt (sei oBdA n < m) n m m n m m X X X X X X ai − ai = ai ≤ |ai | = |ai | − |ai | < ε i=1 i=1 i=n+1 i=n+1 i=1 i=1 Frage : Hätten wir in den Summen ebenso mit i = 0 argumentieren können? Satz 7.5 Die Reihe ∞ P i=1 1 i2 ist konvergent. Beweis: Wir benutzen den Satz über monotone und beschränkte Folgen, wir haben also zu zeigen, dass n P 1 die Partialsummen sn = eine monotone und beschränkte Folge bilden. i2 i=1 Beh. 1 : (sn )n∈N ist monoton wachsend. Beh. 2 : (sn )n∈N ist beschränkt. sn = Bew : Klar, da alle Summanden Bew : Für jedes i > 2 ist 1 i2 < 1 i(i−1) = 1 i2 1 i−1 positiv sind. − 1i . Damit gilt n n X X 1 1 1 1 < 1 + − = 1+1− <2. i2 i−1 i n i=1 i=2 Die Folge (sn ) ist nach unten durch 0 und nach oben durch 2 beschränkt. Insgesamt folgt, dass die Reihe ∞ P 1 konvergiert. Den exakten Grenzwert können wir mit den uns zur Verfügung stehenden Mitteln i2 i=1 allerdings nicht bestimmen.36 36 Der Grenzwert ist ∞ P i=1 1 i2 = π2 . 6 128 5 ANALYSIS Wir beenden diesen Abschnitt mit einem Beispiel aus der Geometrie. Ausgangspunkt ist ein gleichseitiges Dreieck der Seitenlänge s. Wir konstruieren eine Schneeflocke“ nach folgender Iterationsvorschrift: ” 1) Drittel die vorhandenen Seiten 2) Errichte auf den mittleren Abschnitten gleichseitige Dreiecke mit der Spitze nach außen 3) Fahre fort bei 1) Ausgangsdreieck und die ersten zwei Iterationen: .... ... ... .. ..... ... ... . . ... . ... ... ... ... ... ... . ... . . . ... .. . ... . ... ... . ... . . . ... ... ... . . . ... . .. ... . . ... ... . ... . . ... . ... ... . ... . . . ... .. . ... . ... ... . . ... . . ... ... . ... . . .. . . ........................................................................................................................................... .... ... ... .. ..... ... ... . . ... . ... ... ... ... ... ... . ... . . . ............................................... ................................................. .. ... ... ... ... ... ... ... . . ... ... ... ... ... ... ... .. ... . . ... .. ... .. ... ... ... ... ... ... . ... . . ... . ... ... . . ... . . . .. .................................................. ................................................ . ... . .. ... . . ... .. . . ... ... ... ... ... ... .... ... ... . ..... . .... ... ... .. ..... ................. ................... ... . ... ... .. ..... . . ... ........ ... ...... . . . ... . .. ... ... . . . . .................. .................... ................... ................... . ... ... ... .. . ..... ... . . ... ... .. .................... .................. ... ... ... . . . . ... .. . ... ... ... .................. .................... ... ... ... .. ... ..... . ... . . . ... . .................... ................... ..................... .................... ... ..... ... ... ... ... ... .. ... ... ...... ... .. .... . ... .. .. ... ................. .................... ... ..... ... ... ... Frage : Wie groß werden Umfang und Flächeninhalt nach n Iterationen, wie steht es mit Konvergenz? Zum Umfang : Der Umfang des Ausgangsdreiecks ist U0 = 3s. Nach Vorschrift kommt bei jedem Schritt zu jeder Seite ein Drittel ihre Länge hinzu, also gilt U1 = 3 · 34 s und allgemein n 4 4 Un = · Un−1 = · U0 3 3 n Wegen 43 → ∞ folgt, dass der Umfang beliebig groß wird. √ √ Zur Fläche : Der Flächeninhalt des Ausgangsdreiecks ist F0 = 12 · s · 23 s = 43 s2 . Bei der i–ten Iteration i kommt zu jeder existierenden Randstrecke ein neues gleichseitiges Dreiecke der Seitenlänge 13 s = 3si i und vom Flächeninhalt Di = 91 F0 hinzu. Jedes dieser Dreiecke macht aus einer alten Begrenzungsstrecke vier neue. Wir zählen die bei jeder Iteration hinzukommenden Dreiecke: Iteration 1. 2. 3. .. . Anzahl neue Dreiecke 3 4·3 4 · (4 · 3) .. . n. 4 · (4n−2 · 3) = 4n−1 · 3 Es folgt für die Gesamtfläche Fn nach n Schritten Fn = F0 + n X i=1 4i−1 · 3 · Di = F0 + 3 n X i=1 i 1 i−1 4 · · F0 = F0 · 9 n−1 1X 1+ 3 i=0 4 9 i ! 8 Einige Konvergenzkriterien für Reihen Aus ∞ P i=0 4 i 9 = 9 5 folgt Fn → F0 1 + 1 3 · 9 5 129 = √ 2 3 2 5 s . Diese sogenannte von Koch – Schneeflocke besitzt eine endliche Fläche mit einer unendlich langen Umrandung. Man kann außerdem durch elementargeometrische Überlegungen zeigen, dass sie vollständig in √ 3 einem regelmäßigen Sechseck der Seitenlänge 3 s liegt. Frage : Wieviel Prozent der Fläche dieses Sechsecks wird von der Schneeflocke eingenommen? 8 Einige Konvergenzkriterien für Reihen Wir wollen einige Kriterien kennenlernen, mit denen man häufig die Konvergenz bzw. DivergenzPvon Reihen feststellen kann. Aus Gründen der Übersichtlichkeit bleiben wir bei der kurzen Schreibweise ai . Selbstverständlich können die bekannten Konvergenzkriterien für Folgen ebenfalls für Reihen benutzt werden. Direkt aus den Grenzwertsätzen folgt beispielsweise P P Satz 8.1 PEs seien ai und bi konvergente Reihen; esPsei c ∈ R. Dann sind P P P P P auch die Reihen cai und (ai + bi ) konvergent, es gilt cai = c ai und (ai + bi ) = ai + bi . Der folgende Satz wurde bereits im letzten Abschnitt vorgestellt und bewiesen, aus Gründen der Vollständigkeit geben wir ihn noch einmal mit etwas anderen Worten an: Satz 8.2 Konvergiert die Reihe P ai , so gilt lim ai = 0. i→∞ Wie bereits erwähnt, handelt es sich um ein notwendiges Kriterium für die Konvergenz einer Reihe: Die Folge der Glieder einer konvergenten Reihe muss eine Nullfolge sein. Umgekehrt ist diese Bedingung aber keineswegs hinreichend für die Konvergenz, wie das Beispiel der harmonischen Reihe gezeigt hat. Satz 8.3 (Majorantenkriterium) P P Es sei bi eine konvergente Reihe mit bP ai eine Reihe mit |ai | ≤ bi für i ≥ 0 für alle i ∈ N. Ist dann alle i ∈ N, so konvergiert auch die Reihe ai . P P Beweis: |ai | ist monoton wachsend und durch den Grenzwert von bi nach oben beschränkt, also P konvergent. Damit ist ai nach Definition 7.5 absolut konvergent, aus Satz 7.4 folgt die Behauptung. Die Reihe P bi heißt konvergente Majorante von P ai . Der Satz bleibt richtig, wenn die Voraussetzung |ai | ≤ bi nur für fast alle i ∈ N gefordert wird. 37 Mit Hilfe des letzten Satzes kann man manchmal auch die Divergenz von Reihen nachweisen: Korollar (Minorantenkriterium) P P Es sei ci eine divergente ReihePmit ci ≥ 0 für alle i ∈ N. Ist dann ai eine Reihe mit ai ≥ ci für fast alle i ∈ N, so ist auch die Reihe ai divergent. 37 Zur Erinnerung: Fast alle bedeutet, dass nur endlich viele Ausnahmen zugelassen sind. 130 5 Beweis: Sonst wäre P ai eine konvergente Majorante zur divergenten Reihe Als Beispiele werden wir die Reihen P 2 n, P sin(i) i2 , P 3 5k P ANALYSIS ai , ein Widerspruch. auf Konvergenz oder Divergenz untersuchen. Häufig kann Konvergenz oder Divergenz einer Reihe mit dem sogenannten Quotientenkriterium nachgewiesen werden. Hierbei wird die zu untersuchende Reihe mit der geometrischen Reihe verglichen. Satz 8.4 (Quotientenkriterium) P Gegeben sei die Reihe ai mit ai 6= 0 für alle i ∈ N. a) Die Reihe konvergiert, falls es ein i0 ∈ N und ein q ∈ R gibt, so dass gilt ai+1 ai ≤ q < 1 für alle i ≥ i0 . b) Die Reihe divergiert, falls es ein i0 ∈ N gibt, so dass gilt ai+1 ai ≥ 1 für alle i ≥ i0 . Beweis: Zu a) Wir setzen M = |ai0 |. Aus | ai+1 ai | ≤ q folgt |ai0 +1 | ≤ |ai0 | q = M q, |ai0 +2 | ≤ |ai0 +1 | q ≤ M q 2 , |ai0 +3 | ≤ |ai0 +2 | q ≤ M q 3 , usw. Insgesamt giltP |ai0 +j | ≤ M q j für jedes j ∈ N. Jetzt kommt die geometrische Reihe P P in das Spiel: Die Reihe j j |ai0 +j |, d.h., die Reihe P M q = M q ist wegen |q| < 1 eine konvergente P Majorante der Reihe |ai0P | ist konvergent. Da sich diese Reihe von |a | nur um endlich viele Glieder unterscheidet, ist +j iP auch |ai | und damit nach dem Majorantenkriterium ai konvergent. Zu b) Aus | ai+1 ai | ≥ 1 folgt |ai+1 | ≥ |ai | (für alle i ≥ i0 ). Also gilt 0 < |ai0 | ≤ |ai0 +1 | ≤ |ai0 +2 | ≤ · · · , P d.h., die ai bilden keine Nullfolge. Damit ist ai nach Satz 8.2 nicht konvergent. Beispiele : 1) ∞ P k=0 3k k! ist konvergent: 3k+1 ak+1 (k+1)! 1 3 ak = 3k = 3 · k + 1 ≤ 4 < 1 ∀k ≥ 3 = k0 k! 2) Die Reihe ∞ P k=0 k5 2k ist konvergent: Für alle k ∈ N gilt 5 (k + 1)5 · 2k 1 k + 1 5 1 ak+1 (k+1) k+1 2 = · bk ak = k5 = 2k+1 · k 5 = 2 · 2 k k 2 Da die Folge bk gegen 1 konvergiert (Grenzwertsätze (!)), findet man zu jedem q ∈ ]0.5 , 1[ ein k0 mit den geforderten Eigenschaften. Wie wir gerade gesehen haben, kann man das Quotientenkriterium manchmal auch so anwenden: 8 Einige Konvergenzkriterien für Reihen Falls für eine Reihe P 131 ai gilt ai+1 < 1, lim i→∞ ai so konvergiert die Reihe, ai+1 > 1, lim i→∞ ai Frage : Konvergiert oder divergiert die Reihe so divergiert die Reihe. P 2k k7 ? ai+1 Leider führt das Quotientenkriterium nicht immer zum Ziel (lim ai = 1 ⇒ ??? ). Obwohl für die sind, ist diese Reihe divergent. (Es gibt kein q mit den harmonische Reihe alle Quotienten | an+1 an | < 1 P 1 verlangten Eigenschaften); auch für die Reihe werden wir vergeblich nach einem q suchen, trotz der i2 bekannten Konvergenz! Eng verwandt mit dem Quotientenkiterium ist das Wurzelkriterium, das wir hier ohne Beweis angeben: Satz 8.5 (Wurzelkriterium) P a) Die Reihe ai konvergiert, falls es ein i0 ∈ N und ein q ∈ R gibt, so dass gilt p i |ai | ≤ q < 1 für alle i ≥ i0 . b) Die Reihe divergiert, falls es ein i0 ≥ 0 gibt, so dass gilt p i |ai | ≥ 1 für alle i ≥ i0 . Aus dem Wurzelkriterium lassen sich analoge Folgerungen wie aus dem Quotientenkriterium ziehen. Das Wurzelkriterium ist besser“ als das Quotientenkriterium: Jeder erfolgreiche“ Konvergenznachweis mit ” ” Hilfe des Quotientenkriteriums hätte auch mit dem Wurzelkriterium durchgeführt werden können, die umgekehrte Richtung gilt nicht: Beispiel : ∞ P k=1 2+(−1)k 2k−1 ist nach dem Wurzelkriterium wegen r k 2 + (−1)k 1 = · k−1 2 2 q k 2(2 + (−1)k ) ≤ 1√ 1 k 6 → < 1 2 2 konvergent; mit dem Quotientenkriterium hätten wir keine Entscheidung treffen könnnen. Satz 8.6 (Leibnizsches Kriterium, G.W. Leibniz (1646–1716) ) P Eine Reihe (−1)i ai ist konvergent, wenn (ai ) eine monotone Nullfolge ist. Beweis: Sei oBdA ai ≥ 0 für alle i ∈ N0 (ausnahmsweise fangen wir mit a0 und s0 an). Wir betrachten zunächst nur jede zweite Partialsumme s1 = a0 − a1 , s3 , s5 , . . ., allgemein: s2n+1 = (a0 − a1 ) + (a2 − a3 ) + (a4 − a5 ) + . . . + (a2n − a2n+1 ). 132 5 ANALYSIS Wegen (ai − ai+1 ) ≥ 0 ist die Folge s1 , s3 , s5 , . . . monoton wachsend. Sie ist auch beschränkt; um dies einzusehen, klammern wir die Summe s2n+1 anders: s2n+1 = a0 − (a1 − a2 ) − (a3 − a4 ) − . . . − (a2n−1 − a2n ) − a2n+1 ≤ a0 . Also ist s1 , s3 , s5 , . . . konvergent mit einem Grenzwert s. Wir müssen jetzt nur noch zeigen, dass die Folge der Partialsummen s0 , s2 , s4 , . . . gegen denselben Grenzwert s strebt: Es gilt s2n+2 = s2n+1 + a2n+2 . Mit Hilfe der Grenzwertsätze erhalten wir lim s2n+2 = lim s2n+1 + lim a2n+2 = s + 0 = s. n→∞ Beispiele : n→∞ n→∞ P P (−1)i+1 1i und (−1)i 1i sind konvergent. Reihen mit ständigem Vorzeichenwechsel heißen alternierende Reihen. Die Monotonie in den Voraussetzungen von Satz 8.6 darf nicht vernachlässigt werden, es gibt Reihen, die bis auf die Monotonie alle Voraussetzungen des Leibnizschen Kriteriums erfüllen, aber nicht konvergent sind. Satz 8.7 Sei x ∈ R. Dann gilt ∞ P k=1 xk k konvergent ⇐⇒ x ∈ [−1, 1[. Beweis: Mit Hilfe des Quotientenkriteriums an+1 xn+1 · n n = an (n + 1) · xn = n + 1 · |x| → |x| folgt die Konvergenz für x ∈] − 1, 1[ und die Divergenz für |x| > 1. Für x = −1 folgt die Konvergenz aus dem Leibnizkriterium, für x = 1 liegt die divergente harmonische Reihe vor. P Reihen der Gestalt ai xi heißen Potenzreihen, leider können wir aus Zeitgründen nicht näher auf sie eingehen. Die wichtigste Potenzreihe soll allerdings nicht unerwähnt bleiben: Satz 8.8 Die Exponentialreihe ∞ P k=0 xk k! konvergiert für jede reelle Zahl x. Beweis: Aus dem Quotientenkriterium folgt an+1 xn+1 · n! 1 = an (n + 1)! · xn = n + 1 · |x| → 0 Wir geben ohne Beweis den Grenzwert der Exponentialreihe an: ∞ X xk k=0 Damit haben die Folge 1 + 1 n n k! = ex und die Reihe ∞ P k=0 ∀x ∈ R 1 k! den gleichen Grenzwert, es gilt allgemeiner ∞ X xk x n 1+ → ex = , n k! k=0 9 Grenzwerte von Funktionen 133 wobei die Exponentialreihe wesentlich schneller konvergiert als die entsprechende Folge. Frage : Gibt es einen Zusammenhang zwischen Exponentialreihe und e–Funktion? Reihen, deren Konvergenz aus dem Quotienten– oder Wurzelkriterium folgt, sind stets absolut konvergent. Konvergente Reihen, die nicht absolut konvergent sind (sogenannte bedingt konvergente Reihen), besitzen folgende erstaunliche Eigenschaft: Satz 8.9 (Riemannscher Umordnungssatz, B. Riemann (1826–1866) ) Sei a eine beliebige reelle Zahl. Dann gibt es zu jeder bedingt konvergenten Reihe eine Umordnung, die a als Grenzwert besitzt. Einen (konstruktiven) Beweis findet man in dem lesenswerten Lehrbuch der Analysis I von H. Heuser. Für absolut konvergente Reihen gilt nahezu das Gegenteil: Egal, wie sehr man die Folgenglieder solcher Reihen durcheinanderschüttelt“, stets erhält man den gleichen Grenzwert! ” 9 Grenzwerte von Funktionen Den Begriff der Funktion oder Abbildung haben wir bereits im ersten Semester kennengelernt. Ab jetzt wollen wir reelle Funktionen f : D → R mit Definitionsbereich D = D(f ) ⊆ R näher untersuchen. Da D(f ) häufig ein Intervall ist, soll dieser Begriff zunächst offiziell“ eingeführt werden. ” Def. 9.1 Es seien a, b ∈ R. Die Mengen [a, b] := {x ∈ R | a ≤ x ≤ b}, [a, b[ := {x ∈ R | a ≤ x < b}, ]a, b[ := {x ∈ R | a < x < b}, ]a, b] := {x ∈ R | a < x ≤ b} heißen endliche Intervalle; [a, b] heißt abgeschlossenes Intervall, ]a, b[ heißt offenes Intervall, [a, b[ und ]a, b] heißen halboffene Intervalle. Lässt man für a oder b auch −∞ oder ∞ zu, erhält man unendliche Intervalle, so ist beispielsweise ] − ∞, b] = {x ∈ R | x ≤ b}. Frage : Wie kann man R als Intervall schreiben? Zeichnerisch werden wir den Graph einer reellen Funktion (siehe Def. I.4.3, Seite 14) wie üblich in einem rechtwinkligen Koordinatensystem mit x–Achse und y–Achse darstellen. Beispiel : In der folgenden Skizze ist der Graph zweier Funktionen f, g : ] − 3, 5] → R aufgemalt, die Bedeutung der schwarzen und weißen Kringel wird in der Vorlesung geklärt. . ...... .. ...... .... ... .. ........ ..................................... ...... ............ ....... .. ..... .. ..... .......... ..... ... ..... .... . ......... . ... ..... .... .... .. ........ ... . . . . . . . . . . . . .. . . .. ..... ...... ....... . .. . .... .. . . . . . . . . . . ... ....... . ... ...... . .. . . . . . . . . . . . . . . . .. ...... ... ... ..... . . . . . .... . . ... . . . ...... .. ..... . . . . . . . . ... . . . . .. ........ . . .. .. .... .......................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... ....... .. . .... .. .. ......... .............. . . . . . . . . . . . . . . . . . . ............................................. . .. .... ... ... ... ... c g ...... ....... ....... ..... .. ...... ...... y c s −3 c f s s 5 x 134 5 ANALYSIS Nicht immer lassen sich Funktionen so einfach skizzieren. Frage : Wie sieht der Graph der Dirichletschen Funktion, benannt nach P.–G. Dirichlet, 1805–1859 , f : R → R mit f (x) := 1 für rationales x und f (x) = 0 für x 6∈ Q aus? Bisher haben wir uns um Grenzwerte von reellen Folgen und Reihen gekümmert, d.h., wir haben Grenzwerte der Art limn→∞ an betrachtet. Jetzt wollen wir den Grenzwertbegriff auf Funktionen erweitern. Def. 9.2 Eine reelle Funktion f : D → R hat an an der Stelle x0 ∈ R den Grenzwert a ∈ R, geschrieben lim f (x) = a oder f (x) → a für x → x0 , : ⇐⇒ x→x0 (1) Es gibt eine Folge (xn ) → x0 mit xn ∈ D\{x0 } (2) Für jede Folge aus (1) gilt f (xn ) → a Beispiel : Die Funktion f aus der Zeichnung hat an jeder Stelle x0 ∈ [−3, 5] einen Grenzwert, während g an genau einer Stelle des abgeschlossenen Intervalls [−3, 5] keinen Grenzwert besitzt (wo?). Damit eine Funktion an einer Stelle x0 einen Grenzwert besitzen kann, muss in jeder ε–Umgebung von x0 mindestens ein von x0 verschiedenes Element des Definitionsbereichs der Funktion liegen; man sagt auch mathematisch vornehmer: x0 muss ein Häufungspunkt von D sein. (Bitte nicht mit Häufungspunkt einer Folge verwechseln!) Keine Rolle spielt, ob die Funktion in x0 definiert ist und welchen Wert sie dort gegebenenfalls besitzt. Beispiele : 1) Die konstante Funktion f : R → R, die jede reelle Zahl auf 1 abbildet, hat an jeder Stelle x0 den Grenzwert 1: Wegen f (xn ) = 1 ∀xn ∈ R folgt für jede Folge xn → x0 auch f (xn ) = 1 → 1. 2) Sei f : R → R mit f (x) = x2 , also D(f ) = R. f hat an der Stelle x0 = 2 den Grenzwert 4; denn es gilt für jede Folge (xn ) mit xn ∈ D(f ), xn 6= 2 und lim xn = 2: n→∞ lim f (xn ) = lim x2n = lim xn · lim xn = 2 · 2 = 4, also lim f (x) = 4 . n→∞ n→∞ n→∞ n→∞ x→2 An der Stelle x0 hat f den Grenzwert x20 ; denn es gilt für jede Folge (xn ) mit xn ∈ D(f ), xn 6= x0 und lim xn = x0 n→∞ lim f (xn ) = lim x2n = lim xn · lim xn = x20 , also lim f (x) = x20 . n→∞ n→∞ n→∞ n→∞ x→x0 Zufälligerweise gilt auch f (x0 ) = x20 , an jeder Stelle stimmen lim f (x) und f (x0 ) überein. Dies ist nicht x→x0 immer so, wie die nächsten Beispiele zeigen. 3) Sei f : [0, ∞[→ R mit f (x) = 0 1 für x = 0 für x > 0 Frage : Hat f an der Stelle x0 = 0 einen Grenzwert? Antwort : Sei (xn ) eine beliebige Nullfolge mit xn > 0. Es folgt f (xn ) → 1, da (wegen xn 6= 0) stets f (xn ) = 1 gilt. Also hat f an der Stelle x0 = 0 den Grenzwert 1, obwohl lim f (x) = 1 6= f (0) gilt. x→0 9 Grenzwerte von Funktionen 135 4) Sei f : R → R mit f (x) = 1 für x > 0 0 für x = 0 −1 für x < 0 Frage : Hat f an der Stelle x0 = 0 einen Grenzwert? Antwort : Wir betrachten die Folge (xn ) mit xn = (−1)n n . Es gilt xn ∈ D(f ), xn 6= 0 und lim xn = 0. n→∞ Für die zugehörige Folge (f (xn )) der Funktionswerte gilt f (xn ) = −1, falls 1, falls n ungerade n gerade Damit existiert lim f (xn ) nicht, f hat an der Stelle x0 = 0 keinen Grenzwert, obwohl f (x0 ) definiert ist. n→∞ 5) Sei f : R \ {0} → R mit f (x) = x1 . Wir untersuchen, ob f an einer Stelle x0 einen Grenzwert hat. 1. Fall: x0 6= 0. Es sei (xn ) eine Folge mit xn ∈ D(f ) (d.h. xn 6= 0), xn 6= x0 und lim xn = x0 . Dann gilt n→∞ nach alten Sätzen: 1 1 1 lim f (xn ) = lim = , also lim f (x) = . n→∞ n→∞ xn x→x0 x0 x0 n 2. Fall: x0 = 0. Es sei xn := (−1) n . Da diese Folge gegen 0 konvergiert, aber die Folge (f (xn )) nicht konvergiert (warum nicht?), hat die Funktion f (x) = x1 an der Stelle x0 = 0 keinen Grenzwert. 6) Keine Funktion f : Z → R hat an irgendeiner Stelle einen Grenzwert (warum ?). Man kann Definition 9.2 auf uneigentliche Konvergenz/Divergenz ausdehnen, hierzu weitere Beispiele : 7) Sei f : ]0, 1[→ R gegeben durch f (x) := x1 . Dann gilt für x → 0 : 8) Sei f : R\{1} → R gegeben durch f (x) := x+1 x−1 . f (x) → ∞. Dann gilt für x → ∞ : f (x) → 1. Frage : Was ist mit lim f (x)? x→1 Mit den folgenden Funktionen werden wir uns eventuell in den Übungen beschäftigen: 1) Wie verhält sich f : R \ {0} → R, f (x) = x1 an x0 = 0? 2) Sei f : R\{0} → R gegeben durch f (x) := sin x1 . Existiert der Grenzwert lim f (x)? x→0 3) Sei f : R → R mit f (x) = 1 für x ∈ Q . An welchen Stellen hat f einen Grenzwert? x für x 6∈ Q Noch einmal zur Erinnerung: Für die Existenz eines Grenzwertes einer Funktion ist es völlig unerheblich, ob die betroffene Stelle zum Definitionsbereich der Funktion gehört oder nicht. Dies wird im nächsten Abschnitt über Stetigkeit anders sein. 136 10 5 ANALYSIS Stetigkeit: Definition und Beispiele Wie bereits angedeutet, werden wir uns jetzt nur noch mit Grenzwerten von reellen Funktionen an Stellen des Definitionsbereiches beschäftigen. Def 10.1: Es sei f : D → R eine reelle Funktion, x0 ∈ D(f ). f heißt stetig an der Stelle x0 : ⇐⇒ Für jede Folge (xn ) mit xn ∈ D(f ) und lim xn = x0 gilt lim f (xn ) = f (x0 ). n→∞ n→∞ f heißt stetig auf X (für X ⊆ D(f )), falls f an jeder Stelle x0 ∈ X stetig ist. Statt stetig an der Stelle x0 sagt man auch kürzer stetig in x0 . Ist eine Funktion f in x0 ∈ D(f ) nicht stetig, nennt man f unstetig an der Stelle x0 und x0 eine Unstetigkeitsstelle von f . Dies bedeutet, dass es mindestens eine Folge (xn ) mit xn ∈ D(f ) und xn → x0 gibt, für die die zugehörige Folge der Funktionswerte (f (xn )) entweder überhaupt nicht oder gegen einen Wert verschieden von f (x0 ) konvergiert. In der Schule haben Sie eventuell gelernt, dass eine reelle Funktion genau dann stetig ist, wenn man ihren Graph ohne Unterbrechung zeichnen kann. Dies mag für alle Fälle, die dort behandelt werden, zutreffen, mathematisch exakt ist es aber nicht! Wir werden später Beispiele kennenlernen, die diese Problematik deutlich machen. Wir vergleichen die Definitionen 9.2 (Grenzwert einer Funktion) und 10.1 (Stetigkeit) und stellen fest: Im Gegensatz zum Grenzwert – ist Stetigkeit oder Unstetigkeit ausschließlich an Stellen des Definitionsbereichs möglich – müssen bei Untersuchungen zur Stetigkeit auch Folgen (xn ) → x0 mit Folgengliedern xn = x0 berücksichtigt werden. Diese Unterschiede führen zu folgendem merkwürdigen Verhalten: Beispiel : Jede Funktion f : Z → R ist überall stetig (denn nur konstante Folgen erfüllen die Voraussetzung xn → x0 ), hat aber an keiner Stelle einen Grenzwert (da es keine Folge (xn ) → x0 mit xn 6= x0 gibt). Zum Glück werden wir uns im Folgenden nicht weiter mit solchen patologischen Fällen auseinandersetzen. Keine Probleme gibt es bei Funktionen f : R → R: Hier merken wir uns: f : R → R ist an der Stelle x0 stetig ⇐⇒ lim f (x) = f (x0 ) . x→x0 Beispiele : 1) Die konstante Funktion f : R → R, d.h. f (x) = c für alle x ∈ R, ist für jedes x0 ∈ R stetig; denn für jede Folge (xn ) mit lim xn = x0 gilt: n→∞ lim f (x) = lim f (xn ) = lim c = f (x0 ) . x→x0 n→∞ n→∞ 2) Die identische Abbildung f : R → R, f (x) := x ist stetig auf R, da für jede Folge (xn ) mit xn → x0 gilt: lim f (x) = lim x = x0 = f (x0 ) . x→x0 x→x0 Die nächsten Beispiele sind bereits im 9. Abschnitt behandelt worden: 10 Stetigkeit: Definition und Beispiele 137 3) Die Funktion f (x) = x2 ist auf ganz R stetig. 4) Die Funktion f : [0, ∞[→ R mit f (x) = 5) Da die Funktion f (x) = sin stetig noch unstetig. 1 x 1 für x > 0 ist an der Stelle x0 = 0 unstetig. 0 für x = 0 an der Stelle x0 = 0 nicht definiert ist, ist sie an dieser Stelle weder ( Frage : Ist die Funktion g : R → R, g(x) := sin 1 x für x 6= 0 0 für x = 0 an der Stelle x0 = 0 stetig? 1 für x ∈ Q hat nur an der Stelle x0 = 1 einen Grenzwert. x für x 6∈ Q An dieser Stelle ist sie auch stetig, da lim f (x) und f (1) übereinstimmen. 6) Die Funktion f : R → R mit f (x) = x→1 Wir stellen fest: Es gibt auf ganz R definierte Funktionen, die nur in genau einem Punkt stetig sind. Frage : Gibt es reelle Funktionen, die an genau zwei (3, 4, . . . n, abzählbar vielen) Stellen stetig sind? Sind f und g reelle Funktionen mit den Definitionsbereichen D(f ) und D(g), so versteht man unter f + g die Funktion mit Definitionsbereich D(f ) ∩ D(g), definiert durch (f + g)(x) := f (x) + g(x) Analog definiert man f − g, f · g, fg mit D( fg ) = D(f ) ∩ {x ∈ D(g) | g(x) 6= 0}. Im folgenden Satz möge x0 jeweils im notwendigen Definitionsbereich liegen. Satz 10.1 f und g seien stetig an der Stelle x0 . Dann gilt: (a) f + g, f − g, f · g sind stetig an der Stelle x0 . (b) f g ist stetig an der Stelle x0 , falls g(x0 ) 6= 0 gilt. Beweis: Es sei (xn ) eine Folge mit xn ∈ D(f ) ∩ D(g) und xn → x0 . Wegen der Stetigkeit von f und g folgt lim f (x) = f (x0 ) und lim g(x) = g(x0 ). Aus den Rechenregeln für Grenzwerte erhalten wir x→x0 x→x0 lim (f + g)(x) = lim (f (x) + g(x)) = lim f (x) + lim g(x) = f (x0 ) + g(x0 ) = (f + g)(x0 ) . x→x0 x→x0 x→x0 x→x0 Also ist f + g an der Stelle x0 stetig. Analog zeigt man die übrigen Behauptungen des Satzes (Beweis als Übungsaufgabe empfohlen). Def 10.2 a) Ein Polynom p vom Grad n ist eine Funktion p : R → R mit p(x) = a0 + a1 x + a2 x2 + . . . + an xn mit a1 , . . . , an ∈ R und an 6= 0. b) Eine Funktion r heißt rationale Funktion : ⇐⇒ r(x) := p(x) q(x) mit Polynomen p und q. Der Definitionsbereich einer rationalen Funktion r ist in der Regel D(r) = {x ∈ R | q(x) 6= 0}. Als eine unmittelbare Folgerung aus Satz 10.1 und den ersten Beispielen erhält man: 138 5 ANALYSIS Satz 10.2 a) Polynome sind auf R stetig. b) Rationale Funktionen sind auf ihrem Definitionsbereich stetig. Beispiel : f : R\{1} → R, gegeben durch f (x) := x+1 x−1 , ist im ganzen Definitionsbereich stetig. Will man untersuchen, ob f an einer Stelle x0 stetig ist, muss man nicht den gesamten Definitionsbereich D(f ) im Auge haben. Wichtig ist nur, wie sich f in einem beliebig kleinen offenen Intervall I mit x0 ∈ I verhält. Man sagt daher auch, dass Stetigkeit eine lokale Eigenschaft einer Funktion ist. Mit anderen Worten: Ob f in x0 stetig ist, hängt nicht von f insgesamt, sondern nur vom Verhalten von f in der unmittelbaren Nähe von x0 ab. Stetigkeit in einem Punkt kann man daher auch folgendermaßen ausdrücken: Satz 10.3 Eine Funktion f : D → R ist in x0 ∈ D stetig ⇐⇒ ∀ε>0 ∃δ > 0 ∀x ∈ D mit |x − x0 | < δ gilt |f (x) − f (x0 )| < ε Hierzu wird die folgende Skizze in der Vorlesung beschriftet: .... ... .. ... ... .... ... ... ... . . . . .................................................................................................................................... . .... ..... .... . ... .... .. ..... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .......... .. . . . . ... .... .. . ... ...... . .. .... .. ...... .. . .................................................................................................................................................... . ....... .. .. .. ... ............................. .. .. .. ... .. .. .. ... .. .. .. ... .. .. .. ... .. .. .. ... .. .. .. ... .. . . . . ................................................................................................................................................................................................................................................................ .. .. .... .. .... .... Beweis: ⇐“: Zu zeigen ist: x → x0 ⇒ f (x) → f (x0 ): ” Gegeben sei eine beliebige Folge (xn ) → x0 und ein beliebiges ε > 0. Nach Voraussetzung existiert ein δ > 0, so dass für alle x ∈ D mit |x − x0 | < δ gilt: |f (x) − f (x0 )| < ε. Zu diesem δ wiederum gibt es wegen der Konvergenz von (xn ) ein n0 ∈ N mit |xn − x0 | < δ für alle n ≥ n0 . ⇒ |f (xn ) − f (x0 )| < ε ∀ n ≥ n0 Also konvergiert f (xn ) gegen f (x0 ). ⇒“: Zu zeigen ist: ∀ε > 0 . . ., vorausgesetzt ist die Stetigkeit von f in x0 . ” Wir gehen indirekt vor und nehmen an, die Behauptung ist falsch. Das bedeutet: ∃ε > 0 ∀δ > 0 ∃x ∈ D mit |x − x0 | < δ, aber |f (x) − f (x0 )| ≥ ε Mit anderen Worten: Es gibt mindestens eine Folge xn → x0 (denn: ∀δ > 0 ∃x ∈ D mit |x − x0 | < δ), deren Bildfolge f (xn ) nicht gegen f (x0 ) konvergiert (denn: ∃ε > 0 . . . |f (x) − f (x0 )| ≥ ε). Dies ist ein Widerspruch zur Voraussetzung der Stetigkeit in x0 , damit ist der Satz bewiesen. Mit Hilfe von Satz 10.3 können wir Stetigkeit an einer Stelle x0 auf eine zweite Art nachweisen. Wir wollen dies an einigen Beispielen üben. 10 Stetigkeit: Definition und Beispiele 139 Beispiele : 1) Jede konstante reelle Funktion f ist in jedem x0 ∈ R stetig: Wegen |f (x) − f (x0 )| = 0 < ε für jedes ε > 0 genügt jedes δ > 0 der Bedingung von Satz 10.3. 2) f (x) = 2x ist ebenfalls überall stetig: Für jedes ε > 0 und x0 ∈ R gilt |f (x) − f (x0 )| = 2|x − x0 | < ε ⇐⇒ |x − x0 | < ε =: δ 2 Das gesuchte δ hängt in diesem Beispiel von ε, nicht aber von x0 ab. 3) f (x) = x2 ist in x0 = 0 stetig: Sei ε > 0 beliebig gegeben. Wegen |f (x) − f (0)| = |x2 | < ε ⇐⇒ |x| < √ ε √ ε die Stetigkeitsbedingung, denn für alle x ∈ D(f ) mit |x−0| < δ = ε ist |f (x)−f (0)| < ε. √ √ ε Für den Nachweis der Stetigkeit in x = 3 reicht δ = ε nicht aus. Für jedes 0 < ε < 1 und x = 3 + 0 2 pε √ √ √ ist zwar |x − 3| = ε, aber |f (x) − f (3)| = 3 · ε + 4ε > 3 · ε > ε. Trotzdem 2 < √ ist f auch in x0 = 3 stetig. Zum Nachweis benötigt man ein besseres“ δ, beispielsweise δ = min{1, 9 + ε − 3}. Wir ” verzichten auf die explizite Durchführung und merken uns nur, dass im Allgemeinen das gesuchte δ von ε und der zu untersuchenden Stelle x0 abhängt. erfüllt δ := √ 4) f (x) = 0 für x < 0 und f (x) = 1 für x ≥ 0 ist an der Stelle x0 = 0 nicht stetig: Zu ε = 21 gibt es wegen |f (x) − f (0)| = |0 − 1| = 1 > ε für alle x < 0 garantiert kein δ mit der geforderten Eigenschaft. Wir merken uns: Stetigkeit in x bedeutet, dass man zu jeder Umgebung V um f (x) immer eine Umgebung U um x findet mit f (U ) ⊂ V . Unstetigkeit in x bedeutet demnach: Es gibt eine Umgebung V um f (x), zu der keine Umgebung U um x mit f (U ) ⊂ V existiert. In vielen Büchern wird Stetigkeit mit Hilfe von Satz 10.3 definiert und unsere Definition 10.1 als dazu äquivalente Aussage bewiesen. Wir beenden diesen Paragraphen mit zwei Problemen, deren Lösungen nicht unmittelbar einsichtig sind. 1) Sei f : R → R gegeben durch 0 für f (x) := 1 für q x 6∈ Q und für x = 0 x = pq ∈ Q\{0} mit p ∈ Z, q ∈ N teilerfremd Frage : An welchen Stellen ist f stetig? Antwort : f ist unstetig für x0 ∈ Q\{0}, denn in jeder δ – Umgebung von x0 liegen irrationale Zahlen mit f (x) = 0. Somit ist die ε − δ – Bedingung für kein ε mit 0 < ε < f (x0 ) erfüllt. Hingegen ist f stetig für x0 6∈ Q und für x0 = 0: Zu jedem ε > 0 existiert ein n0 ∈ N mit 0 < n10 < ε. Da es nur endlich viele x ∈ [x0 − 1, x0 + 1] gibt mit f (x) ≥ n10 , existiert α := min{|x − x0 | | f (x) ≥ n10 } > 0. Wir können dieses α als δ im Sinne von Satz 10.3 benutzen: Zu jedem ε > 0 haben wir ein δ(= α) > 0 gefunden, so dass für alle x mit |x − x0 | < δ gilt: |f (x) − f (x0 )| < ε. 2) In der Anschauungsebene R2 sei das Dreieck ABC mit A = (−1, 0), B = (1, 0) und C = (0, 1) und ein fester Punkt P = (p1 , p2 ) ∈ R2 mit p2 6= 0 gegeben. Wir definieren eine Funktion lP : R → R folgendermaßen: 140 5 ANALYSIS Bestimme zu x ∈ R die Gerade durch P und X = (x, 0). Der Funktionswert lP (x) ist dann die Länge des Teils dieser Geraden innerhalb des Dreiecks ABC. Frage : Hängt es von dem gewählten Punkt P ab, ob lP stetig oder unstetig ist? 11 Einfache Eigenschaften stetiger Funktionen In diesem Abschnitt sollen einige interessante Eigenschaften stetiger Funktionen angegeben werden. Satz 11.1 Sei f : D → R in x0 ∈ D stetig mit f (x0 ) > 0. Dann gibt es eine Umgebung U (x0 ) mit f (x) > 0 ∀x ∈ D ∩ U . Beweis: Auf Grund der Stetigkeit von f in x0 gibt es nach Satz 10.3 zu jedem ε > 0 ein δ > 0 mit |f (x) − f (x0 )| < ε also auch zu ε = f (x0 ) 2 ∀ x ∈ D mit |x − x0 | < δ, > 0. Für das zugehörige δ zeigen wir Beh : U (x0 ) = ]x0 − δ, x0 + δ[ ist die gesuchte Umgebung. (d.h. ∀x ∈ U (x0 ) ⇒ f (x) > 0) Bew : Sonst gibt es ein x ∈ U (x0 ) mit f (x) ≤ 0. Für dieses x folgt f (x0 ) 1 = ε > |f (x) − f (x0 )| = f (x0 ) − f (x) > f (x0 ) > 0 =⇒ > 1, Widerspruch. 2 2 Unmathematisch ausgedrückt besagt der Satz: Wenn eine stetige Funktion an einer Stelle positiv ist, dann auch direkt daneben“. ” Eine analoge Aussage ist auch für f (x0 ) < 0 möglich. In diesem Fall gilt: ∃U (x0 ) mit f (x) < 0 ∀x ∈ D∩U . Die Voraussetzung stetig in x0 ist notwendig, wie uns das einfache Beispiel der in x0 = 0 unstetigen −1 für x ≤ 0 zeigt. Funktion f (x) = 1 für x > 0 Frage : Kann man einen ähnlichen Satz für f (x0 ) = 0 formulieren? Ein (auch in der Schule) häufig gestelltes Problem beschäftigt sich mit der Existenz und dem Auffinden von Nullstellen von Funktionen. Für eine auf einem Intervall [a, b] mit a < b stetige Funktion kennt man folgende Aussage über die Existenz von Nullstellen: Satz 11.2 (Nullstellensatz von Bolzano) Sei f : [a, b] → R stetig mit f (a) < 0 < f (b) (oder umgekehrt). Dann besitzt f mindestens eine Nullstelle in ]a, b[, d.h., ∃x0 ∈ ]a, b[ mit f (x0 ) = 0. Beweis: Wir argumentieren wie im alternativen Beweis des Satzes von Bolzano–Weierstraß, indem 1 wir u1 = a, o1 = b und t := u1 +o setzen. Im Fall f (t) = 0 haben wir die gesuchte Nullstelle x0 = t 2 gefunden, für f (t) < 0 setzen wir u2 = t und o2 = o1 , für f (t) > 0 sei u2 = u1 und o2 = t. Auf diese Weise erhalten wir eine monoton wachsende Folge (un ) und eine monoton fallende Folge (on ) mit gleichem Grenzwert x0 . Wegen der vorausgesetzten Stetigkeit folgt f (un ) → f (x0 ), f (on ) → f (x0 ) mit 11 Einfache Eigenschaften stetiger Funktionen 141 f (un ) < 0, f (on ) > 0 ∀n ∈ N. Nach Satz 11.1 muss f (x0 ) = 0 und damit x0 ∈ ]a, b[ sein: f (x0 ) > 0 steht im Widerspruch zu f (un ) → f (x0 ), denn es gibt eine Umgebung von x0 , in der alle Funktionswerte positiv sind, f (x0 ) < 0 geht nicht wegen f (on ) → f (x0 ). Wie beim Satz von Bolzano–Weierstraß kann man einen völlig anderen Beweis führen: Alternativer Beweis: Sei A := {x ∈ [a, b] | f (x) ≤ 0}. Wegen a ∈ A ist A 6= ∅, ferner ist A auf Grund der Definition beschränkt. Da wir uns im Bereich der reellen Zahlen bewegen, muss die Menge A ein Supremum besitzen, sei x0 = sup A mit x0 ∈ [a, b]. Beh : x0 ist der gesuchte Punkt mit f (x0 ) = 0. Bew : Sei (xn ) eine Folge mit xn ∈ A und xn → x0 . Wegen der Stetigkeit gilt f (xn ) → f (x0 ) mit f (x0 ) ≤ 0. Wir schließen den Fall f (x0 ) < 0 aus: Sonst gibt es (erneut wegen Satz 11.1) ein δ > 0 mit f x0 + 2δ < 0, ein Widerspruch zu x0 = sup A. Der Nullstellensatzes gilt nicht, falls die Voraussetzungen (abgeschlossenes Intervall, Stetigkeit) nicht beide erfüllt sind: 1) Eine stetige Funktion f : D → R mit f (a) < 0, f (b) > 0 für a, b ∈ D muss keine Nullstelle haben, wenn D kein Intervall ist, ein Gegenbeispiel ist f : R\{0} → R mit f (x) := +1 für x > 0 und f (x) := −1 für x < 0. 2) Verzichtet man auf die Voraussetzung der Stetigkeit, gibt es ebenfalls Gegenbeispiele (welche?). Eine unmittelbare Folgerung aus dem Nullstellensatz ist der sogenannte allgemeine Fixpunktsatz Satz 11.3 Sei f : [a, b] → [a, b] eine stetige Funktion =⇒ ∃ x0 ∈ [a, b] : f (x0 ) = x0 Beweis: Wir können von a < f (a) und f (b) < b ausgehen – andernfalls hätten wir ja bereits einen Fixpunkt gefunden. An Stelle von f betrachten wir die Funktion [a, b] → R g: x 7→ f (x) − x g ist nach Satz 10.1 stetig mit g(a) > 0 und g(b) < 0, wir können auf g den Nullstellensatz anwenden und erhalten x0 ∈ [a, b] mit g(x0 ) = f (x0 ) − x0 = 0 ⇐⇒ f (x0 ) = x0 . Fragen : Gilt der Satz auch für nichtstetige Funktionen? Gilt der Satz für stetige Funktionen, wenn der Definitionsbereich kein Intervall ist? Mit den letzten Sätzen haben wir Aussagen über ein Element des Bildbereiches gemacht. Auch diese Aussage lässt sich verallgemeinern: Satz 11.4 (Zwischenwertsatz) Sei f : [a, b] → R eine stetige Funktion. Dann nimmt f jeden Wert zwischen f (a) und f (b) an. Beweis: Sei oBdA f (a) < f (b), zu zeigen ist ∀y ∈ [f (a), f (b)] ∃ x ∈ [a, b] : f (x) = y 142 5 Sei y ∈ [f (a), f (b)]. Für die ebenfalls stetige Funktion g : ANALYSIS [a, b] → R folgt aus dem Nullstelx 7→ f (x) − y lensatz ∃x ∈ [a, b] : 0 = g(x) = f (x) − y ⇐⇒ f (x) = y Auch dieser Satz wird falsch, wenn man auf eine der Voraussetzungen verzichtet. Dies heißt natürlich nicht, dass unstetige Funktionen sich nie bijektiv auf Intervallen verhalten können: [0, 1] [0, 1] → x für x ∈ Q Beispiel : Sei f : 7→ x 1 − x für x 6∈ Q Jeder Wert zwischen f (0) = 0 und f (1) = 1 kommt genau einmal als Funktionswert vor, obwohl f nur an einer Stelle (welcher?) stetig ist: Für y ∈ [0, 1] ∩ Q gilt f (y) = y, für y ∈ [0, 1] ∩ (R\Q) gilt f (1 − y) = 1 − (1 − y) = y. In den Übungen werden wir überlegen, ob es auch überall unstetige Funktionen g : [0, 1] → R geben kann, die trotzdem der Aussage des Zwischenwertsatzes genügen. Laut Zwischenwertsatz wird für stetige Funktionen, die auf einem Intervall [a, b] definiert sind, jeder Wert zwischen f (a) und f (b) als Bild angenommen. Es gilt sogar Satz 11.5 (Prinzip vom Maximum und Minimum) Sei f : [a, b] → R stetig. Dann ist f ([a, b]) beschränkt und es existieren min f ([a, b]) und max f ([a, b]). Beweis: 1) Wir zeigen f ([a, b]) ist nach oben beschränkt. Angenommen, die Behauptung in 1) ist falsch. Dann existiert eine Folge (xn ) mit xn ∈ [a, b] und f (xn ) ≥ n ∀n ∈ N (∗) Da (xn ) beschränkt ist, existiert nach dem Satz von Bolzano–Weierstraß eine konvergente Teilfolge (x0n ) mit Grenzwert x. Wegen der Abgeschlossenheit von [a, b] muss auch x ∈ [a, b] gelten (sonst keine Konvergenz [a, b] 3 xn → x). ⇒ f (x) ∈ R ⇒ ∃n0 ∈ N : f (x) ≤ n0 Damit kann f (x) wegen (∗) kein Grenzwert der Folge (f (xn )) sein, was im Widerspruch zur Stetigkeit der Funktion f steht. f ([a, b]) ist demnach beschränkt und es existiert s = sup f ([a, b]). 2) Wir zeigen s ∈ f ([a, b]), also s = max f ([a, b]): Es sei (yn ) eine Folge aus f ([a, b]) mit yn → s. Die beschränkte Folge (xn ) der Urbilder von yn besitzt nach Bolzano–Weierstraß eine konvergente Teilfolge (x0n ) mit Grenzwert v ∈ [a, b]. Wegen der Stetigkeit von f und wegen der Eindeutigkeit des Grenzwertes müssen f (v) und s übereinstimmen, dies ist äquivalent zur Behauptung s = max f ([a, b]). 3) Die Existenz von min f ([a, b]) zeigt man analog. Das stetige Bild eines abgeschlossenen Intervalls ist nach Satz 11.5 wieder abgeschlossenes Intervall. ein R+ → R zeigt. Für (halb)offene Intervalle ist der Satz falsch, wie uns die Funktion f : x 7→ x1 12 Über Abbildungen f : Rn → Rm 143 Abgeschlossene (endliche) Intervalle sind ein Spezialfall von sogenannten kompakten Mengen38 . Aus Zeitgründen können wir nicht auf interessante Zusammenhänge zwischen Kompaktheit und Stetigkeit eingehen, für Interessenten sei auch an dieser Stelle auf das bereits mehrfach erwähnte Buch von Heuser hingewiesen. Wir beenden dieses Kapitel mit Satz 11.6 (Umkehrsatz für streng monotone Funktionen) Sei I ⊂ R ein Intervall und f : I → R streng monoton wachsend. Dann existiert auf der Bildmenge f (I) die Umkehrfunktion f −1 : f (I) → R, die außerdem stetig und streng monoton wachsend ist. Wir werden diesen Satz nicht beweisen. In der Vorlesung soll nur die folgende Skizze so beschriftet werden, dass man in ihr den Umkehrsatz erkennen kann. s s c s c s s s Es ist nicht vorausgesetzt, dass f stetig ist. Falls f stetig ist, ist auch f (I) ein Intervall. Der Satz gilt analog für streng monoton fallende Funktionen. 12 Über Abbildungen f : Rn → Rm Es werden elementare Eigenschaften höherdimensionaler reeller Funktionen angegeben. Der Gestalt von Graphen reeller Funktionen sind enge Grenzen gesetzt, beispielsweise kann kein Kreis als Bild vorkommen, da keinem x ∈ R zwei Funktionswerte zugeordnet sein dürfen. Für einen Kreis mit Mittelpunkt (0, 0) und Radius r benötigt man zwei Funktionen fi : [−r, r] → R 38 x 7→ (−1)i √ mit i = 1, 2 r2 − x2 Eine Teilmenge K ⊂ R ist kompakt, wenn sie beschränkt ist und für jede konvergente Folge (xn ) mit xn ∈ K auch ihr Grenzwert in K liegt. 144 5 ANALYSIS Bei komplizierteren Kurven wie bei der nebenstehenden Rosette ist eine Angabe von geeigneten Funktionen nahezu unmöglich. Mit einer kleinen Begriffserweiterung bekommen wir diese Dinge recht einfach in den Griff. Def 12.1 Seien fi : [a, b] → R für i = 1, 2 beliebige Funktionen. Dann heißt f: [a, b] → R2 t 7→ (f1 (t), f2 (t)) Parameterdarstellung (einer ebenen Kurve). Manchmal wird die Funktion f : R → R2 selbst ebene Kurve genannt. Jede reelle Funktion f ist der Spezialfall einer ebenen Kurve mit f1 = id und f2 = f . Man kann Definition 12.1 auf räumliche Parameterkurven f : R → R3 übertragen, für t ∈ R ist f (t) := (f1 (t), f2 (t), f3 (t)). Beispiele : 1) Für r ∈ R+ ist ( f: [0, 2π[ → t R2 7→ (r cos t, r sin t) die Darstellung eines Kreises mit Mittelpunkt (0, 0) und Radius r > 0. Der Kreis beginnt“ im Punkt ”π f (0) = (r · cos 0, r · sin 0) = (r, 0) und wandert“ entgegen dem Uhrzeigersinn über f 2 = (0, r), f (π) = ” (−r, 0), f 32 π = (0, −r) wieder nach (r, 0) zurück. 2) Die Rosette von oben stammt von der Funktion f: [0, 2π[ → R2 t 7→ (sin (12t) · cos t, sin(12t) · sin t) 3) f : R → R3 , f (t) = (t, 2t, 3t) ist die Gerade des Anschauungsraumes durch (0, 0, 0) und (1, 2, 3). 4) Frage : Was ist das Bild von f : R → R3 , f (t) = (sin t, cos t, t)? Wir wollen eine Hilfskonstruktion zum Zeichnen von ebenen Parameterkurven f (t) angeben. 12 Über Abbildungen f : Rn → Rm 145 1) Zeichne links den Graphen von f1 (t) und unten den von f2 (t) unter Beachtung der Pfeilrichtungen 66 2) Konstruiere“ die Parameterkurve aus f1 (t) ” und f2 (t). - (Zeichnung wird in der Vorlesung an Hand eines Beispiels ergänzt) ? An den Beispielen f : [0, 1] → R mit f1 (t) = 2, f2 (t) = t und g (t) = (t2 , t2 ) für t ∈ [0, 1] erkennen wir, dass man ohne weitere Informationen aus der Gestalt einer Parameterkurve nicht auf die beteiligten Funktionen fi (t) schließen kann. Eine Parameterkurve kann sogar stetig aussehen“, obwohl beide ” Funktionen fi an einigen Stellen nicht stetig sind. Jetzt beschäftigen wir uns mit Funktion f : D → Rm mit D ⊆ R2 und m = 1 oder 3. R2 → R die reelle Zahl f ((x, y)) mit (x, y) ∈ R2 als Höhe“ Wenn wir bei Abbildungen f : ” (x, y) 7→ f (x, y) des Funktionsgebirges“ an der Stelle (x, y) auffassen, bekommen wir eine Vorstellung des zugehörigen ” Graphen. Aus Gründen der Übersichtlichkeit schreibt man für f ((x, y)) häufig f (x, y). R [−4, 4] × [−4, 4] → ( xy(x2 −y 2 ) Beispiele : 1) f : (linkes Bild) − x2 +y2 für (x, y) 6= (0, 0) (x, y) 7→ 0 für (x, y) = (0, 0) 2) f : [1.5, 22] × [1.5, 22] → R 5 (x, y) 7 → 5 sin x3 cos y2 + cos x 4 + y 5 (rechtes Bild) 146 5 ANALYSIS 3) Wie sieht der Graph der Funktion f : R2 → R, f (x, y) := x2 + y 2 aus? Schönere“ und vor allem allgemeinere Bilder liefern Funktionen f : R2 → R3 , wenn man ähnlich wie bei ” den Parameterkurven den Bildbereich als Teilmenge des R3 zeichnet. In der Vorlesung werden wir uns mit der Funktion R3 [0, 2π] × [− π2 , π2 ] → f: (t, u) 7→ (cos t cos u, sin t cos u, sin u) beschäftigen, die ein Rechteck der Ebene auf die Oberfläche der Einheitskugel (Radius r = 1 und Mittelpunkt M = (0, 0, 0)) in R3 abbildet. Frage : (Wie) kann man eine Funktion f : R2 → R als Abbildung g : R2 → R3 auffassen? Beispiele : Bilder von zwei weiteren Parameterflächen 13 Die Ableitung einer Abbildung Viele Dinge des täglichen Lebens lassen sich durch Funktionen veranschaulichen; man denke etwa an Luftdruckwerte, festgestellt an einem bestimmten Ort zu unterschiedlichen Zeitpunkten oder an verschiedenen Orten zu einem gegebenen Zeitpunkt. Messen wir jederzeit bzw. überall und berücksichtigen wir, dass der Luftdruck nicht springt“, handelt es sich um Beispiele für stetige Funktionen. Zur Wet” tervorhersage (wann oder wo droht ein Orkan?) sind exaktes Wissen über das Verhalten der Werte bei minimalen Veränderungen der Variablen Zeit oder Ort erforderlich (wie schnell fällt der Luftdruck?). Diese und ähnliche Sachverhalte wollen wir mathematisch präzise erfassen. Die Behandlung solcher (und vieler anderer) Fragen erfolgt mit Hilfe der sogenannten Differenzialrechnung, die auf I. Newton (1643– 1727) und G. W. Leibniz (1646–1716) zurückgeht. Als Beispiel wollen wir noch einmal die Dreiecksfunktion“ lP mit P = (p1 , p2 ) ∈ R2 , p2 6= 0 von Ende ” des Kapitels 10 untersuchen. Man bestimmt lP (x) für eine reelle Zahl x auf folgende Weise: 13 Die Ableitung einer Abbildung 147 • Zeichne das Dreieck mit den Eckpunkten A = (−1, 0), B = (1, 0), C = (0, 1) • Zeichne die Gerade g durch P und X = (x, 0) • Bestimme die Länge l des Teils von g, der innerhalb des Dreiecks verläuft • Dann ist lP (x) = l Für P = (1, 1) erhalten wir so die Funktion39 R →R p −2 · 1 + (1 − x)2 x(2−x) p lP : 1−x x 7→ · 1 + (1 − x)2 2−x 0 für x ≤ −1 für für −1 < x ≤ 1 1<x lP ist stetig. Wenn wir den Graphen sorgfältig zeichnen, stellen wir an den Stellen −1 und 1 Knicke“ ” im Verlauf der Kurve fest. Offensichtlich stimmen hier die Grenzwerte der Steigungen der Sekanten von ” links“ und von rechts“ nicht überein. ” Ab jetzt betrachten wir Funktionen f : I → R, wobei I ⊆ R ein beliebiges Intervall ist, x0 ∈ I sei fest gewählt. Zu jedem x ∈ I mit x 6= x0 bilden wir den Differenzenquotienten f (x) − f (x0 ) x − x0 Veranschaulichen können wir uns den Differenzenquotienten als Steigungsmaß ( Verhältnis der Änderung ” von f zur Änderung von x“) der Sekante s durch die Punkte (x0 , f (x0 )) und (x, f (x)). f ... .. ... ... ... . . ... ... ... ... . . . ... ..... ..... ..... . . . . ..... ..... ..... ..... ..... . . . . . . ...... ...... ...... ....... ....... . . . . . . .. ........ ......... ......... .......... ............ . . . . . . . . . . . . . ..... .......................... s s f (x) s | f (x0 ) S {z x − x0 x0 f (x) − f (x0 ) } x Weiter hinten in der grundlegenden Definition 1 werden wir den Grenzwert lim x→x0 f (x) − f (x0 ) x − x0 betrachten. Falls dieser Grenzwert existiert, d.h., falls es ein a ∈ R mit lim x→x0 f (x)−f (x0 ) x−x0 = a gibt, werden wir a als Ableitung von f an der Stelle x0 bezeichnen. Veranschaulichen können wir uns a als das Steigungsmaß der Geraden t, an die sich die Sekante s annähert, wenn man x gegen x0 streben lässt. 39 Weitere Einzelheiten, wie man zu den konkreten Zahlen kommt, werden in der Vorlesung geklärt 148 5 ANALYSIS ... ... ... .. . . ... ... ... ... . . .. ... ..... ..... ..... . . . . ..... ..... ..... ..... ..... . . . . ...... ...... ...... ....... ...... . . . . . . ........ ........ ........ ......... .......... . . . . . . . . . . ..... ............. ............... ................... s1 s sqq 2 q q q q s q q q q t f s (x0 , f (x0 )) q t qq x0 x1 x2 q s2 s1 Man nennt t die Tangente an f im Punkt (x0 , f (x0 )). Ihr Steigungsmaß a = lim man mit f 0 (x0 ), x→x0 f (x)−f (x0 ) x−x0 bezeichnet also f 0 (x0 ) := lim x→x0 f (x) − f (x0 ) , x − x0 falls dieser Grenzwert existiert. Def 13.1 a) Eine Funktion f : I → R heißt differenzierbar an der Stelle x0 ∈ I : ⇐⇒ Es existiert lim x→x0 f (x) − f (x0 ) x − x0 Wir bezeichnen diesen Grenzwert mit f 0 (x0 ) und nennen ihn Ableitung von f an der Stelle x0 . b) f heißt differenzierbar auf X ⊂ I : ⇐⇒ f ist an jeder Stelle x0 ∈ X differenzierbar. c) Sei f differenzierbar auf X. Dann heißt die Funktion X → R 0 Ableitung von f. f : x 7→ f 0 (x) Um Differenzierbarkeit nachzuweisen, muss man überprüfen, ob der Grenzwert lim x→x0 f (x)−f (x0 ) x−x0 existiert. Hierzu wählt man sich eine beliebige Folge (xn ) mit xn ∈ I, xn 6= x0 , xn → x0 und untersucht (x0 ) lim f (xxnn)−f . −x0 n→∞ Beispiele : 1) Es sei f : R → R eine konstante Funktion, d.h. f (x) = c für alle x ∈ R. Dann ist f für alle x0 ∈ R differenzierbar, und es gilt f 0 (x0 ) = 0. Denn: Ist (xn ) eine beliebige Folge mit xn → x0 , xn 6= x0 , so folgt f (xn ) − f (x0 ) c−c = lim = 0. n→∞ n→∞ xn − x0 xn − x0 lim 2) Die Funktion f (x) = x ist auf ganz R differenzierbar, und es gilt für alle x0 ∈ R f 0 (x0 ) = 1. Denn: Ist (xn ) eine beliebige Folge mit xn → x0 , xn 6= x0 , so folgt f (xn ) − f (x0 ) xn − x0 = lim = 1. n→∞ n→∞ xn − x0 xn − x0 lim 13 Die Ableitung einer Abbildung 149 3) Die Funktion f (x) = x2 ist auf ganz R differenzierbar, für alle x0 ∈ R gilt f 0 (x0 ) = 2x0 . x2 − x20 (xn + x0 )(xn − x0 ) f (xn ) − f (x0 ) = lim n = lim = lim (xn + x0 ) = 2x0 . n→∞ xn − x0 n→∞ n→∞ n→∞ xn − x0 xn − x0 lim 4) Die Betragsfunktion f : R → R, gegeben durch f (x) = |x|, ist an der Stelle x0 = 0 nicht differenzierbar: Für die Folge xn = n1 gilt 1 −0 f (xn ) − f (x0 ) lim = lim n1 = 1, n→∞ n→∞ xn − x0 n −0 andererseits gilt für die Folge xn = − n1 1 −0 f (xn ) − f (x0 ) = lim n1 = −1; n→∞ − − 0 n→∞ xn − x0 n lim Damit existiert lim x→0 5) f (x) := x2 0 f (x)−f (0) x−0 nicht. x∈Q ist an der Stelle x0 = 0 differenzierbar, denn es ist x 6∈ Q ) ( x2 n für xn ∈ Q f (xn ) − f (x0 ) xn = xn =0 lim = lim 0 n→∞ n→∞ xn − x0 = 0 für x ∈ / Q n xn für für 6) Frage : Ist f (x) := x 0 für für x∈Q an der Stelle x0 = 0 differenzierbar? x 6∈ Q Zwischen den Begriffen stetig und differenzierbar besteht folgender Zusammenhang: Satz 13.1 Ist f : I → R differenzierbar, so ist f auch stetig. Beweis: Es sei x0 ∈ I. Zu zeigen ist für jede Folge (xn ) mit xn ∈ I und xn → x0 die Konvergenz f (xn ) → f (x0 ). Es genügt, dies für Folgen (xn ) mit xn 6= x0 für alle n ∈ N zu zeigen. Die Behauptung f (xn ) → f (x0 ) ist gleichbedeutend mit f (xn ) − f (x0 ) → 0. Wegen der Differenzierbarkeitsvoraussetzung von f in x0 folgt f (xn ) − f (x0 ) lim (f (xn ) − f (x0 )) = lim · (xn − x0 ) n→∞ n→∞ xn − x0 = lim n→∞ f (xn ) − f (x0 ) · lim (xn − x0 ) n→∞ xn − x0 = f 0 (x0 ) · 0 = 0 Bemerkung : Die Umkehrung dieses Satzes ist falsch: Aus der Stetigkeit folgt i.A. nicht die Differenzierbarkeit, ein Gegenbeispiel haben wir mit der Betragsfunktion bereits kennengelernt. Frage : Ist die Funktion f aus Beispiel 5 an einer Stelle x0 6= 0 differenzierbar? Wenn die Ableitung f 0 einer differenzierbaren Funktion f ebenfalls differenzierbar ist, kann man eine Funktion (f 0 )0 = f 00 bilden. Auf diese Weise kommt man zu höheren Ableitungen, , d.h., f 00 ist die Ableitung von f 0 , f 000 ist die Ableitung von f 00 usw.; allgemein definiert man f (n+1) := (f (n) )0 . 150 5 ANALYSIS Die Funktion f selber bezeichnet man auch als 0–te Ableitung, d.h. f (0) = f . Beispiel : f (x) = x2 , f 0 (x) = 2x, f 00 (x) = 2, f 000 (x) = f (4) (x) = 0. Nicht immer ist die Ableitung einer Funktion selbst differenzierbar. −x2 x2 Beispiel : Wir untersuchen die auf ganz R definierte Funktion f (x) := Für die Ableitung f0 : R → R gilt f 0 (x) := −2x 2x für für für für x≤0 . x>0 x≤0 . x>0 Diese Funktion ist an der Stelle x0 = 0 nicht differenzierbar, denn es ist f 0 (x) = 2|x|. Setzt man x = x0 + h, bedeutet x → x0 dasselbe wie h → 0. Es folgt f 0 (x0 ) = lim h→0 f (x0 + h) − f (x0 ) h Andere Schreibweisen von f 0 (x0 ) sind 14 bzw. kürzer df dy dx (x0 ), dx (x0 ), f 0 (x) = lim h→0 f (x + h) − f (x) . h Df (x0 ) oder y 0 (x0 ). Einige Ableitungsregeln Bereits für eine einfache Funktion wie f (x) = x3 ist es mühsam, die Ableitung an einer Stelle x0 nur mit Hilfe der Definition auszurechnen. Daher benötigen wir Regeln, die uns das Ableiten einfacher machen. Wenn nichts anderes gesagt wird, gehen wir immer von reellen Funktionen aus, die auf ganz R definiert sind. Satz 14.1 Es seien f und g an der Stelle x0 differenzierbar. Dann sind die Funktionen f + g und f · g in x0 differenzierbar; sofern g(x0 ) 6= 0 gilt, ist auch fg in x0 differenzierbar. Es gelten die Regeln: a) (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ) (Summenregel) b) (f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ) 0 0 0 f 0 )−f (x0 )·g (x0 ) (x0 ) = f (x0 )·g(x(g(x 2 g 0 )) (Produktregel) c) (Quotientenregel) Beweis: a) Es sei (xn ) eine Folge mit xn → x0 , xn 6= x0 . Dann ist (f + g)(xn ) − (f + g)(x0 ) xn − x0 = f (xn ) + g(xn ) − f (x0 ) − g(x0 ) xn − x0 = f (xn ) − f (x0 ) g(xn ) − g(x0 ) + → f 0 (x0 ) + g 0 (x0 ). xn − x0 xn − x0 b) Wir benutzen die gleichen Voraussetzungen wie in a). Ferner ist nach Satz 13.1 g in x0 auch stetig, also gilt g(xn ) → g(x0 ). Es folgt (f · g)(xn ) − (f · g)(x0 ) xn − x0 = f (xn ) · g(xn ) − f (x0 ) · g(x0 ) xn − x0 = f (xn ) − f (x0 ) g(xn ) − g(x0 ) · g(xn ) + f (x0 ) · xn − x0 xn − x0 → f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ). 14 Einige Ableitungsregeln 151 c) Wir formen den zu untersuchenden Quotienten um: ( fg )(xn ) − ( fg )(x0 ) xn − x0 = = → 1 f (xn ) · g(x0 ) − f (x0 ) · g(xn ) · g(xn )g(x0 ) xn − x0 1 g(xn ) − g(x0 ) f (xn ) − f (x0 ) · g(x0 ) − f (x0 ) · · g(xn )g(x0 ) xn − x0 xn − x0 1 0 0 · f (x ) · g(x ) − f (x ) · g (x ) 0 0 0 0 g 2 (x0 ) Satz 14.2 Es sei n ∈ N0 ; f : R → R sei definiert durch f (x) = xn . Dann ist f auf ganz R differenzierbar, und es gilt f 0 (x) = n · xn−1 . Beweis (durch vollständige Induktion): Für n = 0 und n = 1 wurde die Behauptung im letzten Kapitel direkt aus der Definition nachgewiesen. n 7→ n + 1: Für ein festes n sei die Behauptung richtig, d.h. (xn )0 = nxn−1 . Wir zeigen mit Hilfe der Produktregel, dass die Behauptung dann auch für n + 1 gilt: (xn+1 )0 = (xn · x)0 = (xn )0 · x + xn · 1 = nxn−1 · x + xn = nxn + xn = (n + 1)xn . Als eine weitere Konsequenz aus Satz 14.1 erhalten wir unmittelbar: Korollar a) Polynome p(x) = n P ak xk sind auf ganz R differenzierbar, es ist p0 (x) = b) Rationale Funktionen r(x) = differenzierbar: kak xk−1 . k=1 k=0 p(x) q(x) n P sind an allen Stellen ihres Definitionsbereiches (also für q(x) 6= 0) r0 (x) = p0 (x)q(x) − p(x)q 0 (x) q 2 (x) Beispiele : 1) f (x) = 5x4 − 3x2 + 11: Wenn wir f 0 (x) durch y 0 usw. abkürzen, erhalten wir y 0 = 20x3 − 6x, y 00 = 60x2 − 6, 2) Es soll g(x) = 4x3 +1 x+1 y 000 = 120x, y (4) = 120 und y (n) = 0 für alle n ≥ 5. differenziert werden. Nach der Quotientenregel erhält man: g 0 (x) = 12x2 (x + 1) − (4x3 + 1) 8x3 + 12x2 − 1 = . (x + 1)2 (x + 1)2 Ein Spezialfall rationaler Funktionen sind Funktionen der Gestalt f (x) = zeigt 1 xn = x−n mit n ∈ N. Man Korollar Sei z ∈ Z und f (x) = xz . Dann ist f 0 (x) = z · xz−1 . Beweis: Es ist nur noch der Fall z < 0, also −z = n ∈ N zu untersuchen. Es ist f (x) = xz = x−n = Mit der Quotientenregel gilt f 0 (x) = 0 − 1 · n · xn−1 = −n · xn−1−2n = −n · x−n−1 = z · xz−1 (xn )2 1 xn . 152 5 ANALYSIS Ohne Beweis40 geben wir die nächsten Regeln an: Satz 14.3 (Kettenregel) Es seien f : X → R und g : Y → R Funktionen mit f (X) ⊆ Y . Die Funktion f sei differenzierbar in x0 ∈ X, und g sei differenzierbar in y0 = f (x0 ). Dann ist die zusammengesetzte Funktion g ◦ f differenzierbar in x0 : (g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ). Beispiele : 3) h : R → R sei definiert durch h(x) = (3x3 − 5x + 2)7 . Es gilt h(x) = g(f (x)) für die Funktionen f : R → R und g : R → R, die durch f (x) = 3x3 − 5x + 2 und g(y) = y 7 gegeben sind. Die Anwendung der Kettenregel ergibt h0 (x) = (g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x) = 7 · (3x3 − 5x + 2)6 · (9x2 − 5). 4) Es sei h(x) = 4x3 +1 x+1 13 0 h (x) = 13 . Nach der Kettenregel erhält man: 4x3 + 1 x+1 12 3 0 3 12 4x + 1 4x + 1 8x3 + 12x2 − 1 · = 13 · . x+1 x+1 (x + 1)2 Auf Grund des Umkehrsatzes (Satz 11.6) existiert für eine streng monotone Funktion f eine Umkehrfunktion. Wenn f zusätzlich differenzierbar ist mit f 0 (x) 6= 0, kann man auch die Umkehrfunktion ableiten: Satz 14.4 (Umkehrregel) Es sei I ⊆ R ein Intervall, f : I → R streng monoton und in x0 ∈ I differenzierbar mit f 0 (x0 ) 6= 0. Dann 1 ist f −1 differenzierbar in y0 = f (x0 ), es gilt (f −1 )0 (y0 ) = f 0 (x . 0) Beispiel : 5) Es sei f : [0, ∞[→ R definiert durch y = f (x) = x2 . f ist stetig und streng monoton 1 √ wachsend. Die Umkehrfunktion f −1 : [0, ∞[→ [0, ∞[ ist die Wurzelfunktion x = g(y) = y = y 2 . Nach der Umkehrregel gilt für die Ableitung von f −1 an der Stelle y: g 0 (y) = 1 Schreiben wir x statt y und x 2 statt √ 1 f 0 (x) = 1 1 = √ . 2x 2 y 1 1 x, erhalten wir (x 2 )0 = 12 x− 2 . Allgemein folgt aus der Umkehrregel für r ∈ R und x > 0 sogar: f (x) = xr ⇒ f 0 (x) = r · xr−1 , wobei noch zu klären wäre, was xr für eine beliebige reelle Zahl r überhaupt bedeutet. Wir benutzen die Umkehrregel, um die Ableitung von ln x zu bestimmen. Hierbei setzen wir voraus, dass die ln–Funktion die Umkehrabbildung von ex ist und dass für die e–Funktion gilt (ex )0 = ex . 40 Beweise der Ketten– und der Umkehrregel findet man beispielsweise in: H. Junek, Analysis, Teubner Verlag 1998. 14 Einige Ableitungsregeln 153 Satz 14.5 Sei x > 0. Dann gilt (ln x)0 = 1 x . Beweis: Wir schreiben y = f (x) = ln x und erhalten zusammen mit ey = eln x = x y 0 = (ln x)0 = Beispiele : 6) y = √ 3 2x2 + 1 = 2x2 + 1 1 3 ⇒ y0 = 1 1 1 0 = y = . y e x (e ) 1 3 − 2 2x2 + 1 3 · 4x = √ 3 3 4x (2x2 +1)2 x 7) y = 2x ⇒ y 0 = ln 2 · 2x ; denn es ist y = 2x = eln(2 ) = ex·ln 2 = (f ◦ g)(x) mit f (x) = ex und g(x) = x · ln 2. Die Kettenregel ergibt y 0 = ex ln 2 · ln 2 = ln 2 · 2x . 0 8) y = xx ⇒ y 0 = (xx )0 = ex ln x = ex ln x · (x ln x)0 = xx · x · x1 + 1 · ln x = xx · (1 + ln x) 9) Die Ableitungen von Sinus und Cosinus sollten zum mathematischen Allgemeingut gehören: (sin x)0 = cos x, (cos x)0 = − sin x. √ 10) y = esin x ist vom Typ y = f (g(h(x))) mit h(x) = Anwendung der Kettenregel führt zum Ergebnis √ x, g(x) = sin x und f (x) = ex . Mehrfache √ √ √ √ 1 y 0 = f 0 (sin x) · g 0 ( x) · h0 (x) = esin x · cos x · √ . 2 x Wir haben bereits gesehen, dass die Ableitung einer differenzierbaren Funktion nicht selbst differenzierbar sein muss. Es gibt sogar differenzierbare Funktionen mit unstetigen Ableitungen: 2 x sin x1 für x 6= 0 Beispiel : 11) Die Funktion f (x) := ist nach den Ableitungsregeln für x 6= 0 0 für x = 0 differenzierbar, die Ableitung ist in diesem Fall f 0 (x) = 2x sin x1 − cos x1 . Für x = 0 kann man die Differenzierbarkeit mit Hilfe der Definition und Satz 3.3 nachweisen, es ist x2 sin x1 − 0 1 lim = lim x sin = 0 x→0 x→0 x−0 x Damit ist f 0 auf ganz R definiert. Dass diese Funktion in x0 = 0 nicht stetig ist, möge man selbst 1 → 0.) nachprüfen. (Hinweis: Man untersuche die Folge nπ Zum Kuriositätenkabinett der Differenzialrechnung gehören ferner Funktionen, die auf ganz R stetig, ∞ P aber an keiner einzigen Stelle differenzierbar sind, beispielsweise f (x) := bi cos(ni πx), wobei b und n i=0 die Bedingungen 0 < b < 1, n ∈ N, n ungerade, und nb > 1 erfüllen müssen. Zum Abschluss wollen wir die Differenzialrechnung zur Bestimmung von Grenzwerten der Art lim x→x0 f (x) g(x) benutzen, wenn Zähler und Nenner beide gegen 0 bzw. beide gegen ∞ streben (für x → x0 ). Der folgende Satz liefert uns hierfür eine schlagkräftige Methode. Man fasst Sätze dieser Art unter dem Namen Regeln 154 5 ANALYSIS von de l’Hospital zusammen, benannt nach Guillaume Francois Antoine Marquis de l’Hospital, (1661– 1704). Wir verzichten auf Beweise und gehen nur auf den Fall 00 “ ein, andere Fälle bearbeitet man ” analog. Satz 14.6 Es sei I ein Intervall und x0 ∈ I. Die Funktionen f und g seien für alle x ∈ I differenzierbar, es gelte g 0 (x) 6= 0 für alle x ∈ I, x 6= x0 , und ferner sei lim f (x) = lim g(x) = 0. Dann gilt x→x0 lim x→x0 x→x0 f (x) f 0 (x) = lim 0 , g(x) x→x0 g (x) falls der rechte Grenzwert existiert bzw. gleich +∞ oder −∞ ist. ex −1 x→0 3x soll berechnet werden. Für x → 0 streben sowohl Zähler als auch Nenner gegen Beispiele : 12) lim 0, d.h., die Berechnung des Grenzwertes ist nicht ohne weiteres möglich. Anwendung von Satz 14.6 ergibt ex 1 ex − 1 = lim = . x→0 3 x→0 3x 3 lim ex + e−x − 2 ex − e−x ex + e−x 1 = lim = lim = . 2 x→0 x→0 x→0 2x 4x 4 2 13) lim Dieses Beispiel zeigt, dass manchmal erst mehrfache Anwendung der Regel von de l’Hospital zum Erfolg führt. 1 1 14) lim (1 + x) x = lim e x ln(1+x) x→0 x→0 ex stetig = lim 1 ex→0 x ln(1+x) = e1 = e, wobei der Grenzwert lim 1 x→0 x ln(1 + x) nach der Regel von de l’Hospital bestimmt wurde (wie?). Bemerkung : Ein entsprechender Satz gilt für x → ∞ an Stelle von x → x0 und für den Fall Beispiel : 15) Es soll lim (x · ln x) berechnet werden. Es gilt x · ln x = x→0 lim (x · ln x) = lim x→0 x→0 ln x 1 x 1 x x→0 − 12 x = lim ln x 1 x ∞ ”∞ “. , also = lim (−x) = 0. x→0 Mit den Regeln von de l’Hospital kann man zeigen, dass jede Exponentialfunktion ax mit a > 1 für x → ∞ schneller wächst als jedes Polynom beliebigen Grades. 15 Weitere Eigenschaften differenzierbarer Funktionen Im letzten Abschnitt aus der Analysis wollen wir uns mit der geometrischen Bedeutung von Ableitungen beschäftigen und zum Schluss den Mittelwertsatz der Differentialrechnung kennenlernen. Wenn nichts anderes gesagt wird, ist f : [a, b] → R eine (beliebig oft) differenzierbare Funktion. Wir werden nicht alle Beweise exakt durchführen und verweisen stattdessen auf die gängigen Lehrbücher. 15 Weitere Eigenschaften differenzierbarer Funktionen 155 Wir wissen: Ist f konstant, so ist die Ableitung f 0 überall gleich Null. Als Umkehrung gilt: Satz 15.1 Sei f 0 (x) = 0 für alle x ∈ [a, b]. Dann ist f auf dem Intervall [a, b] eine konstante Funktion. Mit anderen Worten: Eine differenzierbare Funktion, die nirgends steigt oder fällt, muss konstant sein. Satz 15.2 Gilt f 0 (x) > 0 für alle x ∈ [a, b], so ist f auf [a, b] streng monoton wachsend; gilt f 0 (x) < 0 für alle x ∈ [a, b], so ist f auf [a, b] streng monoton fallend. Sowohl Satz 15.1 als auch Satz 15.2 sind auf Grund der geometrischen Interpretation von f 0 (x) als Steigung von f im Punkt (x, f (x)) einleuchtend, wir verzichten auf formale Beweise. Def 15.1 Die Funktion f hat an der Stelle x0 ∈ ]a, b[ ein lokales Maximum : ⇐⇒ ∃ δ > 0 : f (x0 ) ≥ f (x) für alle x ∈ [x0 − δ, x0 + δ]. Analog definiert man lokales Minimum. Hat f in x0 ein lokales Maximum oder ein lokales Minimum, so nennen wir x0 ein lokales Extremum von f (oder auch Extremstelle von f ). Satz 15.3 Wenn eine differenzierbare Funktion f : [a, b] → R an der Stelle x0 ∈ ]a, b[ eine Extremstelle hat, so gilt f 0 (x0 ) = 0. Beweis: OBdA habe f in x0 ein lokales Maximum. Es gibt ein δ > 0, so dass f (x) ≤ f (x0 ) für alle x ∈ [x0 − δ, x0 + δ] ist. Es folgt (da f in x0 differenzierbar ist): f 0 (x0 ) = lim f (x0 + n1 ) − f (x0 ) n→∞ 1 n f (x0 − n1 ) − f (x0 ) . n→∞ − n1 = lim Ist n hinreichend groß, so gilt x0 + n1 ∈ [x0 −δ, x0 +δ] und x0 − n1 ∈ [x0 −δ, x0 +δ] und somit f (x0 + n1 ) ≤ f (x0 ) und f (x0 − n1 ) ≤ f (x0 ). Es folgt f (x0 + n1 ) − f (x0 ) 1 n ≤0 und f (x0 − n1 ) − f (x0 ) ≥ 0. − n1 ≤0 und lim Also gilt auch lim f (x0 + n1 ) − f (x0 ) n→∞ 1 n n→∞ f (x0 − n1 ) − f (x0 ) 1 n ≥ 0. Insgesamt folgt f 0 (x0 ) = 0. Die Bedingung f 0 (x0 ) = 0 ist notwendig, aber nicht hinreichend für das Vorliegen eines Extremums an der Stelle x0 : Für die Funktion f (x) = x3 gilt f 0 (x) = 3x2 , also f 0 (0) = 0. An der Stelle x0 = 0 hat f aber keine Extremstelle. Es sei x0 eine Nullstelle der ersten Ableitung f 0 von f . Um zu entscheiden, ob ein Minimum, ein Maximum oder überhaupt kein Extremum vorliegt, kann man die folgenden Sätze heranziehen. 156 5 ANALYSIS Satz 15.4 Die Funktion f sei in [a, b] zweimal differenzierbar, an der Stelle x0 ∈ ]a, b[ gelte f 0 (x0 ) = 0. a) Ist f 00 (x0 ) < 0, so hat f an der Stelle x0 ein lokales Maximum. b) Ist f 00 (x0 ) > 0, so hat f an der Stelle x0 ein lokales Minimum. Beweis: Wir zeigen nur a), der Beweis von b) verläuft analog. Es gelte f 0 (x0 ) = 0 und f 00 (x0 ) < 0: 0 > f 00 (x0 ) = lim x→x0 f 0 (x) f 0 (x) − f 0 (x0 ) = lim . x→x0 x − x0 x − x0 0 f (x) Es folgt die Existenz eines δ > 0 mit x−x < 0 für alle x ∈ [x0 − δ, x0 + δ], x 6= x0 (andernfalls wäre der 0 Grenzwert nicht kleiner als Null). Hieraus folgt f 0 (x) > 0 für x ∈]x0 − δ, x0 [ x0 − δ s und f 0 (x) < 0 x0 s s für x ∈]x0 , x0 + δ[. x0 + δ x–Achse Frage : Wie verläuft der Graph von f 0 in der Skizze? Man sagt, dass f 0 an der Stelle x0 einen Vorzeichenwechsel von + nach − hat. Aus Satz 15.2 folgt: f ist im Intervall [x0 − δ, x0 ] streng monoton wachsend und im Intervall [x0 , x0 + δ] streng monoton fallend. f hat an x0 ein lokales Maximum. Ist f 0 (x0 ) = f 00 (x0 ) = 0, so gibt Satz 15.4 keine Auskunft darüber, ob ein Minimum, Maximum oder keine Extremstelle vorliegt. Hier kann manchmal der folgende Satz weiterhelfen, den wir ohne Beweis angeben. Satz 15.5 Die Funktion f sei in ]a, b[ n–mal differenzierbar (n ≥ 2). An der Stelle x0 ∈ ]a, b[ gelte f 0 (x0 ) = f 00 (x0 ) = . . . = f (n−1) (x0 ) = 0 und f (n) (x0 ) 6= 0. Ist n eine gerade Zahl und gilt f (n) (x0 ) < 0 [f (n) (x0 ) > 0], so hat f an x0 ein lokales Maximum [lokales Minimum]. Ist n ungerade, liegt an der Stelle x0 kein Extremum vor. Satz 15.4 ist der Spezialfall n = 2 von Satz 15.5. Beispiel : f (x) = 41 x3 − x2 . Es ist f 0 (x) = 43 x2 − 2x = x( 34 x − 2) mit den Nullstellen x0 = 0 und x1 = 83 , ferner ist f 00 (x) = 32 x − 2. Wegen f 00 (0) = −2 und f 00 ( 83 ) = 2 liegt an der Stelle x0 = 0 ein Maximum und an der Stelle x1 = 83 ein Minimum vor. Def 15.2 Ist f : D → R eine Funktion, so hat f an der Stelle x0 ein absolutes Maximum, falls f (x) ≤ f (x0 ) für alle x ∈ D gilt. Analog definiert man absolutes Minimum. Ist D = [a, b] ein abgeschlossenes Intervall und soll das absolute Maximum oder Minimum von f auf D gefunden werden, muss man sich auch um die Randpunkte a und b kümmern, in denen die Sätze für die Ableitungen nicht gelten müssen. Beispiel : D = [−1, 5], f (x) = 41 x3 − x2 (wie oben). Absolute Maxima bzw. Minima könnten an den 25 Stellen −1, 0, 83 und 5 vorliegen. Es gilt f (−1) = − 54 , f (0) = 0, f ( 83 ) = − 64 27 , f (5) = 4 . Am Randpunkt 8 b = 5 liegt ein absolutes Maximum vor, während das absolute Minimum bei 3 angenommen wird. 15 Weitere Eigenschaften differenzierbarer Funktionen 157 Def 15.3 Eine Funktion f heißt streng konvex auf dem Intervall I, falls für alle x1 , x2 , x ∈ I mit x1 < x < x2 gilt f (x2 ) − f (x1 ) f (x) < (x − x1 ) + f (x1 ). x2 − x1 Geometrisch bedeutet dies, dass der Graph von f zwischen x1 und x2 unterhalb der Verbindungsgeraden g der Punkte (x1 , f (x1 )) und (x2 , f (x2 )) verläuft. (Man beachte, dass der rechts stehende Ausdruck in der Definition diese Gerade g beschreibt.) f (x2 ) f (x1 ) s ... .... ..... .... ..... ... ................... .... .... . .... s.. g ........... ..... ....... ....... ........ ............ .............................. x1 f x2 Bildlich gesprochen hängt“ eine streng konvexe Funktion nach unten durch“. ” ” Analog definiert man konvex bzw. streng konkav bzw. konkav; man braucht hierzu in der obigen Definition das Zeichen < nur in ≤ bzw. > bzw. ≥ abzuändern. Ohne Beweis geben wir den folgenden Satz an, der den Zusammenhang von streng konvex bzw. streng konkav mit der zweiten Ableitung f 00 herstellt: Satz 15.6 a) Gilt f 00 (x) > 0 für alle x ∈ I = ]a, b[, so ist f auf I streng konvex. b) Gilt f 00 (x) < 0 für alle x ∈ I = ]a, b[, so ist f auf I streng konkav. Def 15.4 Eine Nullstelle x0 der zweiten Ableitung von f heißt ein Wendepunkt von f , falls f 00 in x0 einen Vorzeichenwechsel hat, d.h., wenn für ein δ > 0 entweder f 00 (x) > 0 für x ∈]x0 − δ, x0 [ und f 00 (x) < 0 für x ∈]x0 , x0 + δ[ f 00 (x) < 0 für x ∈]x0 − δ, x0 [ und f 00 (x) > 0 für x ∈]x0 , x0 + δ[. oder gilt. In einem Wendepunkt stößt ein Bereich, in dem die Funktion streng konvex ist, mit einem Bereich, in dem die Funktion streng konkav ist, zusammen. Oder anders gesagt: An einem Wendepunkt geht die Funktion von konvexer zu konkaver Krümmung über (oder umgekehrt). Damit haben wir alle Hilfsmittel zusammen, um die in der Schule beliebten(?) Kurvendiskussionen erfolgreich durchführen zu können! Differenzierbarkeit ist eine lokale Eigenschaft (Steigung der Tangente in einem Punkt). Im Mittelwertsatz (a) und lokaler Änderung in x0 ∈ ]a, b[ wird eine Verbindung zwischen globaler Änderungsrate f (b)−f b−a hergestellt. Satz 15.7 (Mittelwertsatz der Differenzialrechnung) Sei f : [a, b] → R differenzierbar. Dann gibt es mindestens ein x0 ∈ ]a, b[ mit f 0 (x0 ) = f (b) − f (a) . b−a 158 5 ANALYSIS sg s f (b) − f (a) s | {z } b−a a x0 b Frage : Wie muss der Graph von f in obige Skizze eingefügt werden, damit der Mittelwertsatz dargestellt wird? (a) Der Mittelwertsatz ist anschaulich einleuchtend: f (b)−f gibt die Steigung der Geraden g durch die b−a Punkte (a, f (a)) und (b, f (b)) an. Er besagt, dass es (mindestens) eine Stelle x0 ∈ ]a, b[ gibt, für die die Tangente im Punkt (x0 , f (x0 )) parallel zu g verläuft. Wir werden zuerst einen Spezialfall beweisen, benannt nach Michel Rolle (1652–1719): Satz 15.8 (Satz von Rolle) Sei f : [a, b] → R differenzierbar mit f (a) = f (b). Dann gibt es mindestens ein x0 ∈ ]a, b[ mit f 0 (x0 ) = 0. Beweis: Da die Behauptung für den Fall einer konstanten Funktion gilt, gehen wir oBdA von einer nicht konstanten Funktion aus. Nach dem Prinzip vom Maximum/Minimum (Satz 14.8, anwendbar wg. Satz 13.1) existieren min f ([a, b]) und max f ([a, b]); seien x1 , x2 ∈ [a, b] mit f (x1 ) = min f ([a, b]) und f (x2 ) = max f ([a, b]). Da f nicht konstant ist, gilt f (x1 ) < f (x2 ) und deshalb ist {x1 , x2 } = 6 {a, b}. Für x0 ∈ {x1 , x2 }\{a, b} sind die Voraussetzungen von Satz 15.3 erfüllt und wir erhalten f 0 (x0 ) = 0. Beweis des Mittelwertsatzes: Mit Hilfe der gegebenen Funktion f definieren wir die ebenfalls differenzierbare Abbildung g(x) := (f (b) − f (a))x − (b − a)f (x). Wegen g(a) = f (b)a − bf (a) = g(b) sind für g die Voraussetzungen des Satzes von Rolle erfüllt: Es gibt ein x0 ∈ ]a, b[ mit g 0 (x0 ) = 0. Mit Hilfe der Differenziationsregeln erhalten wir andererseits g 0 (x) = (f (b) − f (a)) · 1 − (b − a) · f 0 (x) Mit g 0 (x0 ) = 0 folgt hieraus die Behauptung f 0 (x0 ) = ∀x ∈ [a, b] f (b)−f (a) . b−a Wir wollen die Analysis mit einer nützlichen Anwendung beenden: Das Newton–Verfahren dient zur näherungsweisen Berechnung von Nullstellen einer Funktion f . Es zeichnet sich dadurch aus, dass es sehr gut konvergiert und daher meist schon nach wenigen Iterationsschritten gute Näherungswerte liefert. Sorgfältig muss man allerdings auf das Erfülltsein folgender Bedingungen achten: Sei f : [a, b] → R eine mindestens zweimal differenzierbare Funktion mit (1) f 0 (x) 6= 0 für alle x ∈ [a, b] (2) f 00 überall stetig und es gilt entweder f 00 (x) ≥ 0 oder f 00 (x) ≤ 0 für alle x ∈ [a, b] (3) f (a) · f (b) < 0. (1) sorgt dafür, dass f streng monoton (steigend oder fallend) ist. Wegen (2) ist f auf [a, b] konvex oder konkav. Bedingung (3) sichert die Existenz mindestens einer Nullstelle c ∈ ]a, b[. 15 Weitere Eigenschaften differenzierbarer Funktionen 159 Sind (1) bis (3) erfüllt, kann man die (eindeutig bestimmte) Nullstelle c näherungsweise durch xn+1 = xn − f (xn ) f 0 (xn ) bestimmen, wenn der Startwert x0 auf der richtigen Seite“ von c gewählt wird, genauer: ” (4) In den Fällen (4.1) f (a) < 0, f (b) > 0, f 00 (x) ≤ 0 und (4.2) f (a) > 0, f (b) < 0, f 00 (x) ≥ 0, wähle man x0 ∈ [a, c]; also etwa x0 = a. In den übrigen Fällen (4.3) f (a) < 0, f (b) > 0, f 00 (x) ≥ 0 und (4.4) f (a) > 0, f (b) < 0, f 00 (x) ≤ 0, wähle man x0 ∈ [c, b], also etwa x0 = b. Beispiel : Wir suchen eine Nullstelle der Funktion f (x) = x2 + 2x − 5. Wir überprüfen (1) bis (4): Wegen (1) f 0 (x) = 2x + 2 6= 0 für alle x ∈ [0, 3] (2) f 00 (x) = 2 ist auf ganz [0, 3] stetig, es gilt f 00 (x) ≥ 0 für alle x ∈ [0, 3] (3) f (0) · f (3) < 0 (4) f (0) < 0, f (3) > 0, f 00 (x) ≥ 0 Daher wählen wir als Startwert x0 = 3 und erhalten nacheinander x1 = 3 − f (3) f 0 (3) = 1.75, x2 = 1.465909, x3 = 1.449544, x5 = 1.449490 = x6 usw. 160 6 6 GEOMETRIE Geometrie 0 Vorbemerkungen Als Antwort auf die Frage : Wovon handelt Geometrie? werden häufig Begriffe wie Punkt, Gerade, Kreis, Winkel, Fläche, Volumen, Länge, Lot fällen, Spiegelungen, Kongruenzen, Strahlensätze, . . . genannt. Wir wollen mit den einfachsten Begriffen beginnen und werden unsere Untersuchungen zunächst auf Punkte und Geraden beschränken. Frage : Was ist ein Punkt? Was ist eine Gerade? Bereits Euklid (circa 300 v. Chr.) hat sich mit diesen Fragen beschäftigt und unter anderem festgestellt: Ein Punkt ist etwas, was keine Teile hat. Eine Gerade ist eine Linie, die gleich liegt mit den Punkten auf ihr selbst. Eine Linie hat breitenlose Länge, die Enden einer Linie sind Punkte. Diese Angaben machen den Sachverhalt kaum klarer! Daher wollen wir nicht länger über diese Fragen nachdenken41 und legen fest Punkte sind Elemente einer beliebigen Menge P = {A, B, P, Q, X, . . .}. Geraden sind Elemente einer weiteren, zunächst ebenfalls beliebigen Menge G = {a, b, g, h, . . .}. Die Frage, ob ein Punkt auf einer Geraden liegt oder nicht, wird durch eine Relation auf P × G festgelegt. Weil wir uns nicht zu weit von unserer gewohnten Anschauung entfernen wollen, gehen wir im Folgenden nicht möglichst allgemein vor (wie Mathematiker es lieben) sondern fassen jede Gerade im Sinne von Euklid als eine Menge von Punkten auf, d.h., G soll ab jetzt eine Teilmenge der Potenzmenge von P sein. Damit ist sofort die weitere Frage, wann ein Punkt auf einer Geraden liegt, beantwortet: Def 0.1 Sei P eine Menge von Punkten und G ⊂ Pot P eine Menge von Geraden. A ∈ P liegt auf g ∈ G : ⇐⇒ A ∈ g. Liegt auf“ ist daher nur eine andere Bezeichnungsweise für ist Element von“, wir werden in diesem ” ” Sinn bekannte Schreibweisen wie A ∈ g oder B 6∈ h benutzen. Beispiele : 1) Zahlenstrahl : P = R, G = {R}. Jeder Punkt (=jede reelle Zahl) liegt auf der Geraden R (=Zahlenstrahl). 2) Anschauungsebene : P = R2 , G = {gm,b , gk | m, b, k ∈ R}. Hier gilt beispielsweise (1, 0) ∈ g1 ∩ g1,−1 oder (5, 3) 6∈ g1,2 . Mit der Anschauungsebene haben wir uns bereits ausführlich im zweiten Semester beschäftigt. 3) P := {A, B, C, D, E, F, G, H}, G := {{A, B}, {A, D}, {A, E}, {B, C}, {B, F }, {C, D}, {C, G}, {D, H}, {E, F }, {E, H}, {F, G}, {G, H}}. Es steht eindeutig fest, ob ein Punkt auf einer Geraden liegt oder nicht. Wir können die Punkte als Ecken eines Würfels deuten, wobei die Kanten des Würfels den Geraden entsprechen. Man beachte aber, dass unsere Geraden (= Elemente von G) jeweils nur aus zwei (Eck)punkten bestehen! 4) P := {A, B, C, D}, G bestehe aus allen zweielementigen Teilmengen von P. Anschaulich handelt es sich um die Eckpunkte eines Tetraeders. 41 sonst landet man bei Überlegungen wie: Ein Punkt ist ein Winkel, dem die Schenkel ausgerissen wurden; ein Winkel ist eine geknickte Gerade; eine Gerade ist ein aufgeblasener Kreis; ein Kreis ist ein aufgeblasener Punkt; ... ;-) 1 Affine Ebenen: Definition und einfache Beispiele sD As sC s B 161 Cs sD @ @ s s H E s s F G A s @ @ @s B Links Würfel aus Beispiel 3), rechts Skizze zu Beispiel 4). Bei endlichen Punkt– und Geradenmengen wie in den letzten beiden Beispielen kann die Inzidenz von Punkten und Geraden (welcher Punkt liegt auf welcher Geraden?) auch durch eine Inzidenztafel angegeben werden. Frage : Wieviele Möglichkeiten gibt es, in der folgenden Tabelle die fehlenden Punkte so einzutragen, dass die vollständige Inzidenztafel dem obigen Beispiel 3) entspricht? A B g1 g2 g3 g4 g5 g6 g7 g8 g9 g10 g11 g12 × × × × × × × × × × × × × × × × × × × × × × × × Wir werden in der Vorlesung an einem Beispiel aus dem täglichen Leben“ die unterschiedlichen Darstel” lungsmöglichkeiten (graphisch, durch Mengen, als Inzidenztafel) noch einmal vergleichen. Def 0.2 Man nennt Punkte P1 , . . . , Pn kollinear oder in kollinearer Lage : ⇐⇒ ∃g ∈ G : Pi ∈ g ∀i ∈ {1, . . . , n} Geraden g1 , . . . , gn kopunktal oder in kopunktaler Lage : ⇐⇒ ∃P ∈ P : P ∈ gi ∀i ∈ {1, . . . , n} Im Fall der Anschauungsebene sind (0, 0), (1, 0), (0, 1) nicht kollinear, zwei verschiedene Geraden liegen in ihr genau dann kopunktal, wenn sie nicht parallel sind. Im Würfelbeispiel 3) sind A, G nicht kollinear, da es keine Gerade in G gibt, die A und G enthält. Im Beispiel 4) liegen {A, D} und {B, C} nicht kopunktal, auch wenn sich diese Geraden“ in unserer Zeichnung zu schneiden scheinen. ” 1 Affine Ebenen: Definition und einfache Beispiele Eines der Ziele dieser Vorlesung ist es, die uns bereits bekannte Anschauungsebene durch möglichst wenige charakterisierende Eigenschaften (Axiome) eindeutig festzulegen; nach dem Motto: Wenn ein Gebilde aus Punkten und Geraden diese und jene Eigenschaft erfüllt, dann muss es sich um die Anschauungsebene handeln. 162 6 GEOMETRIE Wie in der Anschauungsebene wollen wir daher ab jetzt verschiedene Geraden genau dann parallel nennen, wenn sie keinen Punkt gemeinsam haben, ferner soll stets jede Gerade zu sich selbst parallel sein.42 Diese Terminologie bedeutet beispielsweise für den Würfel aus dem vorherigen Abschnitt im Gegensatz zu unserer Anschauung {A, G} k {C, E}. Parallelität kommt auch in der nächsten grundlegenden Definition vor: Def 1.1 Sei P eine Menge von Punkten und G ⊂ Pot P eine Menge von Geraden. (P, G) heißt affine Ebene : ⇐⇒ (AE 1) ∀ P, Q ∈ P, P 6= Q, ∃1 g ∈ G : P, Q ∈ g. (Zwei verschiedene Punkte legen genau eine Gerade fest) (AE 2) ∀ P ∈ P ∀g ∈ G ∃1 h ∈ G : P ∈ h und g k h. (Sogenanntes Euklidisches Parallelenaxiom) (AE 3) P enthält mindestens drei nichtkollineare Punkte. Beispiele : 1) Der Zahlenstrahl ist keine affine Ebene; denn Axiom (AE 3) ist nicht erfüllt: Es gibt für alle Punkte eine gemeinsame Gerade. 2) Die Anschauungsebene ist eine affine Ebene. Obwohl dies anschaulich klar ist, werden wir es weiter unten beweisen. 3) Der Würfel mit den 8 Ecken als Punktmenge und den 12 Kanten (Eckenpaare) als Geradenmenge ist keine affine Ebene (warum nicht?) 4) Sei (P, G) mit P := {A, B, C, D} und G die Menge aller zweielementigen Teilmengen von P (Tetraeder). (P, G) ist eine affine Ebene, was man durch Überprüfung der drei Axiome beweist. 5) Frage : Bildet der Anschauungsraum R3 eine affine Ebene? Bevor wir 2) beweisen, zeigen wir noch Satz 1.1 Sei (P, G) eine affine Ebene. Dann ist k eine Äquivalenzrelation auf G. Beweis: Wir überprüfen reflexiv, symmetrisch, transitiv: (r): Für alle Geraden g gilt g = g, also auch g k g. (s): g k h ⇒ g = h oder g ∩ h = ∅ ⇒ h = g oder h ∩ g = ∅ ⇒ h k g. (t): Sei g k h, h k l. Wäre g ∦ l ⇒ ∃S ∈ g ∩ l mit g 6= l ⇒ durch S gibt es verschiedene parallele Geraden zu h, ein Widerspruch zu (AE 2). Satz 1.2 Die Anschauungsebene ist eine affine Ebene. Beweis: Wir überprüfen die Axiome (AE 1) –(AE 3): (AE 1): Seien P = (p1 , p2 ), Q = (q1 , q2 ) ∈ P = R2 verschiedene Punkte. 1. Fall p1 = q1 =: k: Wegen P, Q ∈ gk existiert eine Verbindungsgerade. Sie ist auch eindeutig bestimmt: Für l 6= k gilt P 6∈ gl . Es kann auch keine gemeinsame Gerade vom Typ gm,b geben, denn P, Q ∈ gm,b ⇒ p2 = mp1 + b = mq1 + b = q2 , ein Widerspruch zur Voraussetzung P 6= Q. 42 Wir erinnern uns an die Def IV.10.2: : ⇐⇒ g = h oder g ∩ h = ∅. Geraden g und h der Anschauungsebene heißen parallel, geschrieben g k h, 1 Affine Ebenen: Definition und einfache Beispiele 163 2. Fall p1 6= q1 : Es kann keine Gerade vom Typ gk geben, auf der beide Punkte liegen. Wir untersuchen, für welche m, b wir P, Q ∈ gm,b erhalten: p1 1 m p2 P, Q ∈ gm,b ⇐⇒ = q1 1 b q2 Wir erinnern uns an das Lösbarkeitskriterium aus der linearen Algebra (Satz IV.12.4): Für A ∈ M (m × n) ist Ax = b eindeutig lösbar ⇐⇒ rg A = rg (A, b) = n Weil dies in unserem Fall (n = 2) erfüllt ist, gibt es genau eine Gerade gm,b durch die Punkte P und Q. (AE 2): Sei P = (p1 , p2 ) ∈ P. Für g = gk ist gp1 die einzige Gerade durch P parallel zu gk . Für g = gm,b erhalten wir durch Rechnung P ∈ gm,p2 −mp1 k gm,b .43 (AE 3): Wurde schon erledigt (wo?) Wenn keine Verwechslung möglich ist, werden wir die in affinen Ebenen eindeutig bestimmte Gerade durch verschiedene Punkte A und B kurz AB schreiben. An Stelle von g ∩ h = {X} notieren wir ohne Klammern kürzer g ∩ h = X. Mit (A, g) sei ab jetzt die gemäß (AE 2) eindeutig bestimmte Gerade durch A gemeint, die parallel zu g verläuft. Wir haben bereits sehr unterschiedliche affine Ebenen kennengelernt. Noch kleinere“ affine Ebenen als ” in Beispiel 4) (bestehend aus vier Punkten und sechs Geraden) kann es nicht geben: In jeder affinen Ebene (P, G) muss es wegen (AE 3) und (AE 1) mindestens drei verschiedene Punkte A, B, C und drei verschiedene Geraden AB, AC, BC geben. Frage : Ist (P = {A, B, C}, G = {AB, AC, BC}) eine affine Ebene? Antwort : Nein, denn (AE 2) ist nicht erfüllt – es fehlen die Geraden (A, BC), (B, AC), (C, AB). Diese zuletzt genannten Geraden sind paarweise nicht parallel, denn wegen Satz 1.1 hätte Parallelität die Kollinearität von A, B, C zur Folge: BC k (A, BC) k (B, AC) k AC ⇒ BC k AC ⇒ BC = AC Sei D := (B, AC) ∩ (C, AB), E := (A, BC) ∩ (B, AC), F := (A, BC) ∩ (C, AB). Frage : Können die Punkte D, E, F zusammenfallen? Antwort : Warum nicht? Wie wir in Beispiel 4) gesehen haben, liegt im Fall D = E = F eine affine Ebene vor; jetzt wissen wir, dass es sich um den kleinstmöglichen Fall handelt, dem sogenannten Minimalmodell einer affinen Ebene. Das Minimalmodell einer affinen Ebene besteht aus 4 Punkten und 6 Geraden. So wie in der Anschauungsebene die reellen Zahlen zur Punktmenge gehören – es ist P = R2 = R × R – können wir den Punkten des Minimalmodells die Zahlenmenge Z2 × Z2 = {(0, 0), (0, 1), (1, 0), (1, 1)} zuordnen. Auch bei den Geraden geht es so ähnlich zu wie in der Anschauungsebene, wir müssen nur jeweils modulo 2 rechnen. Beispiel : Die Punkte (0, 1) und (1, 0) liegen auf der Geraden g1,1 = {(x , x +2 1) | x ∈ Z2 } Unter Verwendung der Modulo 2 – Rechnung haben wir eine algebraische Darstellung des Minimalmodells gefunden: P = (Z2 )2 und G = {gm,b , gk | m, b, k ∈ Z2 }. 43 Einzelheiten zur Parallelität von Geraden in der Anschauungsebene sind bereits früher behandelt worden. 164 6 GEOMETRIE Es gibt keine affine Ebene mit genau 5,6,7 oder 8 Punkten. Die zweitkleinste affine Ebene besteht aus 9 Punkten und 12 Geraden: @ @ @ @ @s @ s @s @ @ @ @ @ @s @s @ s @ @ @ @ @ @ @ s @s @s @ @ @ @ @ @ @ @ Frage : Kann man die Punkte dieses Modells auch in der Form P = (Z3 )2 schreiben? Wie sieht die dazugehörige Geradenmenge aus? Auf Grund der Axiome (AE 1) und (AE 3) ist schnell klar, dass in jeder affinen Ebene jeder Punkt auf mindestens zwei Geraden liegen muss44 . Jetzt beweisen wir die Umkehrung“: ” Satz 1.3 Sei (P, G) eine beliebige affine Ebene. Dann gilt |g| ≥ 2 ∀g ∈ G. Beweis: Wir müssen zeigen, dass es in keiner affinen Ebene Geraden mit weniger als zwei Punkte geben kann. Wir führen den Beweis indirekt und nehmen das Gegenteil an. 1. Fall: Angenommen, es gibt eine Gerade g ohne Punkte, also g = ∅. Wegen (AE 3) und (AE 1) existieren Punkte A, B, C mit AB 6= AC. Da AB ∩ g = ∅ = AC ∩ g, haben wir verschiedene Geraden AB und AC durch A gefunden, die beide parallel zu g liegen. Dies ist wegen (AE 2) aber nicht möglich. 2. Fall: Angenommen, es gibt eine Gerade g = {P }. Nach (AE 3) gibt es weitere Punkte A, B mit A 6∈ BP . Sei h := (A, BP ). Wegen P 6∈ h (sonst folgt aus AP = h k BP die kollineare Lage von A, B, P ) ist g ∩ h = ∅. Erneut haben wir mit g und BP verschiedene Geraden durch P gefunden, die parallel zu h liegen, Widerspruch zu (AE 2). 2 P t g B t A t h Sphärenmodell und Moultonebene Weitere Beispiele für affine Ebenen finden wir auf Kugeloberflächen im Anschauungsraum R3 . Hierzu betrachten wir die Oberfläche der Einheitskugel S := {(x, y, z) | x2 + y 2 + z 2 = 1}, wobei der Punkt N = (0, 0, 1) (N wie Nordpol) eine besondere Rolle spielen wird. ... ........ ....... ... ... .. ............... ................... ........ ........... . . . . . . . ...... . ..... . . . ..... . . . . ..... ..... .. ..... ..... . ... . .. .. ... . . . ... .. ... . . ... .. . . ... .. ........ ........ ........ ........ . . . . . . .. . . . ......... ......................... . ................... ... . ...... . . . . ........ .... . .... . . . . ....... ... .... .... . . . . . ...... .... .... ........... .... .... .. ... . ... ...... .... .... .... .. ......... .. .... .... ........ .... .... . .. . . . .................... .... .... . . . . . . . . . ........... . .... .............................................. ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ......................... .. ........................ .. ...... ........ ... .. ................ ........................... . ... ... .. ... ... .. ... ... . ... . . . ..... ... ..... ..... ..... ...... .. ...... ....... ....... ........ ................ ... ........................ ........ .... ... . N r r r r r r Schneiden wir im Anschauungsraum Kugeln mit Ebenen, so ist das Ergebnis stets ein Kreis, sofern die Schnittmenge mindestens zwei Punkte enthält. Sei im Folgenden E eine Ebene, die S im Nordpol N und in mindestens einem weiteren Punkt schneidet. Zur besseren Übersicht sei S 0 := S\{N }. r 44 Man kann sogar zeigen, dass jeder Punkt auf mindestens drei Geraden liegt. 2 Sphärenmodell und Moultonebene 165 Satz 2.1 (P, G) mit P = S 0 , G = {S 0 ∩ E | N ∈ E ∧ |S ∩ E| > 1} ist eine affine Ebene. Punkte dieser affinen Ebene sind alle Punkte auf der Sphäre außer N , Geraden dieser affinen Ebene sind alle Kreise auf der Sphäre durch N , aber ohne diesen Punkt. In der folgenden Beweisskizze nutzen wir einige einfache Eigenschaften des Anschauungsraumes R3 aus, die wir im zweiten Semester kennengelernt haben. Ferner wollen wir den Begriff Raumgerade für die normale“ Gerade durch zwei Punkte des R3 ” verwenden. Beweisskizze: (AE 1): Seien A, B verschiedene Punkte auf S 0 . Weil N nicht auf der Raumgeraden von A und B liegt, da keine Raumgerade die Kugeloberfläche mehr als zweimal trifft, legen die drei Punkte N, A und B genau eine Ebene E des R3 fest. Nach Definition von G ist die gesuchte (affine) Gerade durch A und B der Schnitt von S 0 mit dieser Ebene E. (AE 2): Sei P ∈ P, g ∈ G. Nach Definition ist g ∪ {N } ein Kreis auf S. In der eindeutig festgelegten Ebene E des Anschauungsraumes, in der g ∪ {N } liegt, gibt es genau eine Tangente t an diesen Kreis durch N . Die Raumgerade t hat mit S nur den Punkt N gemeinsam. Weil P auf S liegt, ist P 6∈ t, also legen P und t im R3 genau eine Ebene E0 fest. h := E0 ∩ S 0 ist die durch E0 auf S 0 bestimmte (affine) Gerade. Wegen h ∩ g = ∅ ist h die zu g gesuchte Parallele durch P. (AE 3): (1, 0, 0), (0, 1, 0), (0, −1, 0) ∈ P liegen nicht zusammen mit N in einer Ebene und erfüllen daher das Axiom. ........ ... ............ ....... ... ....... .. . . ....... ....... ... ....... .. . . ....... ....... ... ....... . ....... . ....... . . . ....... ....... .. . . ....... . . . ......................... . ....... . . . ... . . . . ....... .... .... . . . . . . . . . . . . . . .......... .... . . ... . . . . ... . . . ... ........ . .... . . ... . . . . . ... . .. .. . . ... . . . . . ... . .. ... . ... ... ... ... ... ... .. .. .. ... .. .. .. ... . . . . . . . . . . ... ... ... ... .. ... ... ... .. .. .. ... ..... .. ... ... . . . . . . ... . . .. ... ... ... ... ... ... ..... ... ..... ........ ... ... ....... ..... .. . . . . . . . . . . ...... ....... . . ................................ ....... ... ....... ... ....... ... ....... ... ....... . . ....... ... ....... ....... ... ....... .. ....... .... .......... rN t g E Für das nächste Beispiel kehren wir zur Anschauungsebene zurück. Wir übernehmen die Punkte und alle Geraden vom Typ gk und gm,b mit m ≤ 0. An Stelle der Geraden mit positiver Steigung m > 0 führen wir sogenannte Knickgeraden“ ein: ” mx für x ≤ 0 Für m > 0 sei g̃m,b := {(x, m ∗ x + b) | x ∈ R} mit m ∗ x := 2mx für x > 0 6 g̃1,1 Eine Knickgerade: Beim Überqueren der y–Achse von links nach rechts wird die positive Steigung verdoppelt. - Übung : Skizziere die Geraden g1 , g0,1 , g̃2,0 , g̃1,−1 . Im Folgenden sei G0 := {gk , gm,b | k, m, b ∈ R, m ≤ 0} ∪ {g̃m,b | m, b ∈ R, m > 0}; wir haben im Vergleich zur Anschauungsebene die Geraden mit positiver Steigung durch entsprechende Knickgeraden ersetzt. Satz 2.2 (P, G0 ) mit P = R2 ist eine affine Ebene, die sogenannte Moultonebene. Beweis: (AE 1): Der Nachweis der eindeutigen Verbindungsgeraden zweier Punkte unterscheidet sich nur im Fall P = (p1 , p2 ), Q = (q1 , q2 ) mit p1 < 0 < q1 , p2 < q2 von der Konstruktion der Geraden in der Anschauungsebene (gegebenenfalls knicke man an der y–Achse). 166 6 GEOMETRIE In diesem Fall muss die gesuchte vom Typ Gerade g̃m,b sein mit mp1 + b = p2 und 2mq1 + b = q2 , p1 1 m p2 anders geschrieben = . Dieses lineare Gleichungssystem ist eindeutig lösbar 2q1 1 b q2 (warum?), daher ist die gesuchte Gerade eindeutig bestimmt. Mit der Cramerschen Regel oder durch andersartige Rechnung folgt m = p2 −q2 p1 −2q1 , b= p1 q2 −2p2 q1 p1 −2q1 . (AE 2): Sei P = (p1 , p2 ), g ∈ G0 , gesucht ist (P, g). 1. Fall 2. Fall g = gk g = gm,b ⇒ ⇒ (P, g) = gp1 (P, g) = gm,p2 −mp1 3. Fall g = g̃m,b ⇒ (P, g) = g̃m,c mit m ∗ p1 + c = p2 , also c = p2 − mp1 p2 − 2mp1 für für p1 < 0 p1 ≥ 0 (AE 3): Die Punkte (0, 0), (0, 1), (1, 0) liegen nicht kollinear. Der Beweis von (AE 1) kann übrigens auch ganz anders mit Hilfsmittel aus der Analysis (Stichworte: streng monotone, stetige Funktionen) durchgeführt werden. Ferner kann die Moultonebene verallgemeinert werden, indem man nicht nur an der y–Achse, sondern zusätzlich an der x–Achse knickt. 3 Isomorphie und Kollineationen Den Begriff der Isomorphie haben wir bereits im Zusammenhang mit Gruppoiden und linearen Abbildungen kennengelernt. Für Mathematiker sind isomorphe Gruppen nicht wirklich verschieden. Wir erinnern uns ferner, dass ein Isomorphismus eine strukturerhaltende bijektive Abbildung ist. Wir wollen in diesem Abschnitt die Frage untersuchen, wie stark sich Anschauungsebene, Sphärenmodell und Moultonebene voneinander unterscheiden. Frage : Was bedeutet strukturerhaltend für affine Ebenen? Die einzige Struktur, die wir bisher bei affinen Ebenen kennengelernt haben, ist die Inzidenz von Punkt und Gerade, d.h., ob Punkte auf einer Geraden liegen oder nicht. Wir wollen daher eine Bijektion zwischen den Punktmengen zweier affiner Ebenen als Isomorphismus bezeichnen, wenn bei Anwendung der Abbildung stets kollineare Lage von Punkten erhalten bleibt. Def 3.1 Affine Ebenen (P, G), (P0 , G0 ) heißen isomorph, geschrieben (P, G) ' (P0 , G0 ), wenn eine Bijektion ϕ : P → P0 existiert mit ϕ(g) := {ϕ(P ) | P ∈ g} ∈ G0 für alle g ∈ G. Eine bijektive Abbildung mit dieser Eigenschaft wird aus naheliegenden Gründen auch Kollineation genannt. Wenn zwischen affinen Ebenen eine Kollineation existiert, sind die Ebenen isomorph, zu isomorphen Ebenen gehört immer (mindestens) eine Kollineation. Etwas unpräzise kann man sagen, dass jede Kollineation Geraden bijektiv auf Geraden abbildet. Wie bisher nennt man eine bijektive, strukturerhaltende Abbildung einer affinen Ebene auf sich einen Automorphismus. Bei den folgenden Beispielen für Kollineationen beschränken wir uns auf die Anschauungsebene: Beispiele : 1) Kollineationen haben wir bereits in der linearen Algebra im zweiten Semester kennengelernt, als wir lineare Abbildungen untersucht haben: Jede Spiegelung an einer Geraden durch (0, 0) und jede Drehung um (0, 0) ist eine solche Kollineation. 2) Translationen (Verschiebungen) in der Anschauungsebene sind mit Ausnahme der Identität keine lineare Abbildungen (warum nicht?), aber Kollineationen. 3 Isomorphie und Kollineationen 3) α : 167 R2 → R2 ist bijektiv, aber keine Kollineation; denn α(g1,0 ) 6∈ G. (x, y) 7→ (x, y 3 ) Jede Kollineationen ist bijektiv und besitzt deshalb eine Umkehrabbildung. Mit Hilfe von Satz 1.3 kann man leicht beweisen, dass mit ϕ auch ϕ−1 eine Kollineation ist: Satz 3.1 Wenn ϕ eine Kollineation von einer affinen Ebene (P, G) auf eine affine Ebene (P0 , G0 ) ist, ist ϕ−1 eine Kollineation von (P0 , G0 ) auf (P, G). Beweis: Zu zeigen ist ϕ−1 (g 0 ) ∈ G für alle Geraden g 0 . Da auf jeder Geraden mindestens zwei Punkte liegen, ist g 0 = A0 B 0 mit geeigneten Punkten A0 , B 0 ∈ P0 . Wegen der Bijektivität von ϕ gibt es verschiedene Punkte A = ϕ−1 (A0 ) und B = ϕ−1 (B 0 ), die ihrerseits die Gerade AB in G festlegen. Wegen ϕ(AB) = ϕ(A)ϕ(B) = A0 B 0 = g 0 ist ϕ−1 (g 0 ) = ϕ−1 (ϕ(AB)) = AB = g. Leicht einzusehen ist folgende, eventuell als Übungsaufgabe zu beweisende Eigenschaft von Kollineationen: Satz 3.2 Kollineationen erhalten Parallelität. Wie verhält es sich nun mit der Anschauungsebene, der Moultonebene und dem Sphärenmodell in Bezug auf Isomorphie? Satz 3.3 Sphärenmodell und Anschauungsebene sind isomorphe affine Ebenen. Beweis: Der Beweis gliedert sich in drei Teile, von denen wir nur die ersten beiden explizit durchführen werden: 1) Konstruktion einer Abbildung τ : S 0 → E := {(x, y, 0) | x, y ∈ R} 2) Nachweis der Bijektivität von τ 3) Nachweis der Strukturerhaltung von τ Zu 1): Für jeden Punkt X = (u, v, w) ∈ S 0 mit u2 + v 2 + w2 = 1 und w 6= 1 schneidet die Raumgerade N X = {N + λ(X − N ) | λ ∈ R} = {(λu, λv, 1 + λ(w − 1)) | λ ∈ R} die Ebene E in genau einem Punkt 1 P = τ (X) = (p1 , p2 , 0). Gesucht ist also λ ∈ R mit 1 + λ(w − 1) = 0 ⇐⇒ λ = 1−w u v ⇒ τ (X) = τ ((u, v, w)) = P = , ,0 1−w 1−w Zu 2): τ ist injektiv: Seien X = (u, v, w), X 0 = (u0 , v 0 , w0 ) ∈ S 0 Punkte mit τ (X) = τ (X 0 ), also u 1−w ⇒ = u0 v 1−w0 , 1−w v0 1−w0 = 1 − w02 = u02 + v 02 = u 1−w 2 (1 − w0 )2 + (1−w)(1+w) (1 (1−w)2 ⇐⇒ (1 − w0 )(1 + w0 ) = ⇐⇒ (1 + w0 )(1 − w) = (1 + w)(1 − w0 ) 2 (1 − w0 )2 = ⇐⇒ 1 + w0 = v 1−w − w0 )2 ⇐⇒ u2 +v 2 (1 (1−w)2 1−w2 (1 (1−w)2 − w0 )2 − w0 ) 1+w 1−w (1 w0 − w = w − w0 − w0 )2 = ⇐⇒ X = X0 τ ist surjektiv: Gesucht ist zu P = (x, y, 0) ∈ E ein Punkt X ∈ S 0 mit τ (X) = P , d.h., wir suchen den Schnittpunkt der Raumgeraden N P = {N + λ(P − N ) | λ ∈ R} = {(λx, λy, 1 − λ) | λ ∈ R} mit S 0 : (λx)2 + (λy)2 + (1 − λ)2 = 1, λ 6= 0 ⇐⇒ λ2 (x2 + y 2 + 1) = 2λ ⇒ λ= x2 2 + y2 + 1 168 ⇒ 6 X= 2 2 2x , 2y , x +y −1 x2 +y 2 +1 x2 +y 2 +1 x2 +y 2 +1 GEOMETRIE ist das gesuchte Urbild. N s ............................... .................................................................. .. ......... . .. .. ....... ............ .... .. .... ............ ............. ..... ...... ...... .. .... . . . . . . . . . .... .. ..... ..... .... .... ... . . . . . . ..... ... . . . . . . ... ..... .. .... .. . . . . . . . . . . . . ..... . . .... .... .... .... . . . . . ... . ... . .. .... .... . . . ... . . . ... .... ... .. .... .. ... . . . .. ... .... . . .. . . . . . . ... ..... ...... . . . . . . . . . ... . . . . . ........ ........ . ....... . ... ... .... .... . . . . . ... . . . . . . . . . . . . . . . . . . . . . . . . .......... ... ...... .... . ........... ............ ... ... . . . . . . . . . . . . . . ..... . . . . ....... ... . . . ..... ... . . . . .... . . . . . . . . . . . . . . . . . ... ..... . .... . . .... . ....... ....... . ... . . . . . . . . . . . . . . . . . . . .... ..... .... .. .. ... ... ... ..... ... ..... .. ... ..... .... .... ..... ...... .. ..... ... ..... ..... ..... ..... ...... ....... ..... .. ............ ...... .... ..... ...... .. ................................... .... ........ .... . . . . . . . . . . . . . . . . . . . . ... ... ..... ........ ..... .......... ... .... .... ..... ...... ........ ..... ... ..... ..... ..... ........ .......... ..... .. .............. .... ..... ........... ..... ..... ............................ .... ............... ..... . . . . .... . ..... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...... ..... ... ... ..... ..... ... .... .... ..... ..... ... ..... ..... ..... ..... .. ..... ..... ..... ........................................................................................................................................................................................................................................................................................................... .... .... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ... .... .... ..... ..... ..... ..... .... .... . . . . . . . . ..... ..... ..... ..... .... .... ....................................................................................................................................................................................................................................................................................................................................................................................................... sX s s s h g s Ps E Zu 3): Sei ρ : E → R2 die Bijektion (x, y, 0) 7→ (x, y). Als Verkettung von Bijektionen ist auch α := ρ ◦ τ : S 0 → R2 bijektiv. Durch teilweise umfangreiche Rechnung kann man zeigen, dass α eine Kollineation ist. Wir machen uns dies nur anschaulich klar: Zu jeder Geraden g des Sphärenmodells (= Kreis auf S durch N ohne N ) existiert genau eine Ebene E0 ⊂ R3 mit g ⊂ E0 . E0 ∩ E ist eine eindeutig bestimmte Raumgerade h, ρ(h) ist eine Gerade der Anschauungsebene. Insgesamt wird so jede Gerade des Sphärenmodells auf eine Gerade der Anschauungsebene abgebildet. Frage (als Übungsaufgabe): Wie sieht das Urbild von g1 unter α aus? Die Abbildung τ : S 0 → E aus Satz 3.3, die auch in anderen Zusammenhängen von Bedeutung ist, heißt stereographische Projektion. Satz 3.4 Moultonebene und Anschauungsebene sind nicht isomorph. Beweisidee: Wir nutzen Satz 3.2 aus: Parallele Geraden werden unter Kollineationen auf parallele Geraden überführt. Seien in der Moultonebene die Punkte A1 = (0, 1), A2 = ( 12 , 1), B1 = (−1, 0), B2 = (0, 0), C1 = (0, −1), C2 = (1, −1) gegeben. Die eindeutig festgelegten Geraden a = A1 A2 = g0,1 , b = B1 B2 = g0,0 , c = C1 C2 = g0,−1 sind parallel, ebenso gilt A1 B1 = g̃1,1 k g̃1,0 = A2 B2 , B1 C1 = g−1,−1 k g−1,0 = B2 C2 . Wie aus der Zeichnung zu entnehmen bzw. leicht zu berechnen ist, gilt aber A1 C1 = g0 ∦ g−4,3 = A2 C2 . 6 t Ct C C C @t @t C @ @ C @ @C t @ @ Ct @ @ C C - Wären Moulton– und Anschauungsebene isomorph, müsste eine Kollineation ϕ existieren, die diese Konfiguration unter Erhaltung der vorliegenden Parallelitäten in die Anschauungsebene überführt. Dies ist aber nicht möglich, da in der Anschauungsebene wegen Satz 3.2 aus der spezifischen Lage der beteiligten Geraden stets ϕ(A1 )ϕ(C1 ) k ϕ(A2 )ϕ(C2 ) folgt und daher kein Bildpunkt zu g0 ∩ g−4,3 existieren kann. 4 4 Schließungssätze 169 Schließungssätze Wir haben im letzten Satz die Nichtisomorphie zweier affiner Ebenen begründet, indem wir aus der Voraussetzung über die parallele Lage gewisser Geraden die notwendige Parallelität weiterer Geraden in der Anschauungsebene gefolgert haben. Jetzt wollen wir uns ausführlich mit Aussagen dieser Art beschäftigen. Aus historischen Gründen werden sie als Sätze“ bezeichnet, obwohl der Name Satz eigentlich nicht angebracht ist, denn sie gelten im Ge” gensatz zur Anschauungsebene nicht in jeder affinen Ebene. Wir werden sie als Definitionen für beliebige affine Ebenen (P, G) formulieren. Def 4.1 (Großer Satz von Pappus, ≈ 320 n. Chr.) Seien g, h verschiedene Geraden, seien Pi ∈ g\h, Qi ∈ h\g für i = 1, 2, 3 Punkte mit P1 Q2 k P2 Q1 , P2 Q3 k P3 Q2 . Dann folgt P1 Q3 k P3 Q1 . P2 P3 r ... ................................ ........................................ ............................... .... ................................ ............ .... . . ... ................................ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .......... . ... .. ... ... ..... ... ... ..... .... ... ... ..... ..... .... ... ..... .... .... ..... ... ........ ..... . ... . . . . . ...... ... .... . ... .... ......... . . . . . . .... .... . . ... . ... .. . . . . ... ........ . . . ... ... .... ..... ... . . ...... .... . . . . . . . . .... .... ... .. .... .. . . . . . . . . . ... .... ..... .... .. ... .. .... ... ..... . . . . ... ........ . . ... ... ... . ... ... ..... .... ... ........ ... . ........... ........ .. . . . . . ..................................... ................................................................................................................................................................... r P1 r r Q3 r Q2 r Q1 g g. h ... ..... ...... ..... ...... ..... . . ...... . . . ......... ....... ..... ... ..... ....... ..... .... . .... .......... ..... ... .... . ...... ..... . . .... .... . ...... ... . ..... ...... ... ... .. ..... ...... . ... .. . . . ... ... ...... ... ... ... . . . . . ... ...... .... ... ........... ... ... ... .. .... . . . ... .. . . ... ........ . . . ..... .. ... . ...... ... . ... . . ... . . ... . ...... ... ... .. . . ... . . . ... . ...... .. .... ... . . . . ... . ...... ... ... . ... . . . . . . . . ...... .. ... ..... .. .... . . . . . ... ... ... ............................................................................................. .. ... ........ . . . . ...... ... ... ...... . . ...... ...... ..................................................................................................................................... . . . . ...... ... .... ..... ..... P1 Q1 r r r h r Q2 r Q3 oder P2 r P3 Wir werden den großen Satz von Pappus mit (P) abkürzen. Wenn (P) in einer affinen Ebene gültig ist, spricht man von einer pappusschen affinen Ebene. Setzt man in Definition 4.1 zusätzlich die Parallelität der sogenannten Trägergeraden g und h voraus, liegt der kleine Satz von Pappus (p) vor. Wir notieren als einfache Erkenntnis Satz 4.1 Sei (P, G) eine beliebige affine Ebene. Dann gilt (P) ⇒ (p). Beweis: (p) ist ein Spezialfall von (P). Beispiele : 1) In der Anschauungsebene gelten (P) und (p). P1 2) In der Moultonebene gelten (P) und (p) nicht, denn für P1 = (−1, 1), P2 = (0, 1), P3 = ( 12 , 1) ∈ g = g0,1 und Q1 = (1, 0), Q2 = (0, 0), Q3 = (−1, 0) ∈ h = g0,0 gelten zwar (P1 Q2 = g−1,0 ) k (P2 Q1 = g−1,1 ) und (P2 Q3 = g̃1,1 ) k (P3 Q2 = g̃1,0 ), aber (P1 Q3 = g−1 ) ∦ (P3 Q1 = g−2,2 ). Def 4.2 r ... ... P2......... r ... ... P3.......... r . .......................................................................................................................................................................................................................... . .. . ..... . . ..... ..... ......... ... . ..... ..... . . ... .. . . .... ......... ..... ... ... .. . ..... . . . . . . . . ..... .. ..... ... ...... ..... ..... ... ... ..... ..... .... .. .. ......... ..... ........ . . . ..... ......... ... ..... ... ............. .. ..... . . . . ..... . . ..... .. ..... ... . . . . . . . . . ..... . ..... ... . . . . . . . . . . . . . .. ..... .... ..... .. .. ..... ..... ..... ... ... ..... . ..... .... ........ ..... .... ..... .. ......... ...... ..... .. . . . . . . . . . . ................................................................................................................................................................................................................... . . .... .... . . . . . . ..... ..... r r r Q3 Q2 Q1 g h (Großer Satz von Desargues, 1593 – 1662, (D)) Seien a, b, c paarweise verschiedene kopunktale Geraden mit S ∈ a ∩ b ∩ c, seien Ai ∈ a, Bi ∈ b, Ci ∈ c für i = 1, 2 von S verschiedene Punkte mit A1 B1 k A2 B2 , B1 C1 k B2 C2 . Dann folgt A1 C1 k A2 C2 . Gilt (D) in einer affinen Ebene, spricht man von einer desarguesschen affinen Ebene. Die Anschauungsebene ist so eine desarguessche Ebene. Ersetzt man in Definition 4.2 die Voraussetzung a, b, c kopunktal durch a, b, c parallel, liegt der sogenannte kleine Satz von Desargues vor, abgekürzt durch (d). 170 6 a . ......... .......... .......... ......... . . . . . . . . . .. ............. .......... ... .......... ......... ..... .......... ..... .. ......... . ..... . . . . . . . . . . .. ... ..... .. .......... ............ ..... ......... ..... . . . . . . . . . . . . . . ..... ..... ... ....... . . . . . . ..... . . . . . . . ..... ......... .. ... . .... ..... ........ .................. ........................................................................................................................................................................................................................ ......... . ... . ........ . ..... ... . . ......... . . ... ..... ......... . . . . . . . . . . . ......... .... ..... ......... .... ..... ......... ... ........ ..... . ............... ..... ......... ..... . ......... . . . . . ......... ... ..... . ......... ......... ......... ............. ......... ......... ......... ......... ......... ........ A2 r A1 A1 S r C1 r r B1 B2 C1 b r C2 A2 r r ....................................................................................................................................... .. .. ...... ...... ..... ... ..... ... ..... .. ..... .. ..... .... ..... .... . . . . . . . . ... ... ... ... ..... ..... .. .. ..... ..... .............................................................................................................................................. ... ... .. .. . . ... ... ... ... ... ... .. .. .. .. .. .. . . . . ... .. ... .. .. ... .. ... .. .. ...... ...... . . . . ................................................................................................................................ r r GEOMETRIE c C2 r r r r B1 B2 a c b Wie bereits im letzten Kapitel gesehen, gilt (d) nicht in der Moultonebene. Anders als bei dem kleinen und großen Satz von Pappus ist (d) auf Grund der geänderten Voraussetzungen kein Spezialfall von (D). Trotzdem gilt Satz 4.2 Sei (P, G) eine beliebige affine Ebene. Dann gilt (D) ⇒ (d). Beweisskizze: Angenommen, in einer desarguesschen affinen Ebene gilt (d) nicht, d.h., es existieren Geraden a k b k c und Punkte A1 , A2 ∈ a, B1 , B2 ∈ b, C1 , C2 ∈ c mit A1 B1 k A2 B2 und B1 C1 k B2 C2 , aber A1 C1 ∦ A2 C2 . Wie man leicht sieht, sind unter dieser Annahme alle beteiligten Punkte A1 , . . . , C2 paarweise verschieden und es muss gelten A1 C1 ∦ B1 C1 . Sei C20 := B2 C2 ∩ (A2 , A1 C1 ). A02 a0 .. ........ ........ ........ ........... . . . . . . . .. ........ ... ........ ..... ........ .. ........ ... ........ . . . . . . . . . . . ... ........ ...................................................................................................................................................................................................................................................... .. .. .. ........ ... .. ... ... ........ ..... .... ... .... ........ ... ... ... ... ........ . ........ ... ... . ... . . . . . . . . . . . . .. ... .. .. ........ .... ... ... ... ........ . . . . . . . . . . . . . . . . ... ............................................................................................................................................................................................................................................................... ............ . . . . ... . . . . . ..... ..... ............ ... .. ..... . ............ . . ..... ..... ... ... ............ . . ..... ............ ..... .. ... ..... ............ ....... . ..................................................................................................................................................................................................................................................... ............ . . . ..... .... ............ ..... .. ............ ............ ...... ... .................. .............. ............ ............ ............ . A1 r Sr B1r r r A2 B2r r C1 Cr 2 C20 r a b c c0 Durch einfache, teilweise aber Zeit kostende Überlegungen erkennt man: C20 6∈ b, C20 6∈ c, C20 6= C1 . Damit existiert eindeutig die Gerade c0 = C1 C20 . Da man c0 k b leicht widerlegen kann, gibt es den Schnittpunkt S := b ∩ c0 . Als nächstes zeigt man S 6= C1 , A1 , B1 , B2 , C20 . Insbesondere folgt die Existenz der Geraden a0 = SA1 . a0 ist verschieden von b und c0 (leicht einzusehen) und es gilt a0 ∦ A2 B2 (sonst gibt es einen Widerspruch), also existiert A02 := a0 ∩ A2 B2 . Nachdem man überlegt hat, dass A02 6= S gelten muss, kann man (D) auf die Geraden a0 , b, c0 und auf die Punkte S, A1 , A02 , B1 , B2 , C1 , C20 anwenden und erhält A1 C1 k A02 C20 . Wegen A1 C1 k (A2 , A1 C1 ) = A2 C20 liegen A2 , A02 , C20 kollinear. Zuletzt macht man sich A2 6= A02 klar. Wegen B2 ∈ A2 A02 folgt die kollineare Lage von A2 , B2 , C2 . Dieser Widerspruch ist nicht mehr zu retten, die Ungültigkeit von (d) ist widerlegt. Es gibt weitere Verbindungen zwischen den Schließungssätzen: Satz 4.3 Sei (P, G) eine beliebige affine Ebene. Dann gilt (d) ⇒ (p). 4 Schließungssätze 171 Beweis: Die Voraussetzungen von (p) seien wie in der Skizze erfüllt, oBdA sei P2 Q3 ∦ P2 Q1 . Wir setzen a := (P1 , P3 Q2 ), b := (P3 , P2 Q1 ) und S := a ∩ b. S ................r.... ..... . ..... ..... ... .... ...... ... .. ..... . . ... . . ... ...... ... ... ...... . . . . ... .. .... . ... . . . ... .... . . . . ... ... ... . . . . ... . .. .... . ... . . . ... .... . . . . . ... ... ... . . . ... . . . .... ... . . . . ... ... . . . . . . . ...................................................................................................................................................................................................................................... . ... .. .... . .... .. . . . . . . . ... ... .... . .... . . . . . . . . . .. .... ... .. ..... ... .. .... ...... ..... ..... ... ......... ... ...... ....... ... ...... ... ... . .......... ...... . . . . ... . . .... . . .. ... .. ... ..... ... ...... ... ..... ... ...... .... ... .......... ... ... ...... . ........ . . . . . .. ... .. . ... ...... ...... ... ... ...... ...... ..... .... ... .... ..... ..... ... . . . . . . . . . . . ... . ... .... .... . . . . . . . . . . ... ... ...... .. ....... .. . . ................................................................................................................................................................................................................................. a b P1r P2 r P r 3 g h r r r Q3 Q2 Q1 Wir wenden (d) zweimal an: a k P2 Q3 k P3 Q2 , P1 Q2 k b, (h = Q2 Q3 ) k (g = P2 P3 ) ⇒ P1 Q3 k SP2 b k P2 Q1 k P1 Q2 , a k P3 Q2 , (g = P1 P2 ) k (h = Q2 Q1 ) ⇒ P3 Q1 k SP2 und erhalten aus der Transitivität der Parallelität die Behauptung P1 Q3 k P3 Q1 . Def 4.3 (Großer und kleiner Scherensatz, (S) bzw. (s)) Seien g, h ∈ G im Fall (S) beliebig bzw. parallel (für (s)). Für P1 , P3 , Q1 , Q3 ∈ g\h, P2 , P4 , Q2 , Q4 ∈ h\g gelte Pi Pi+1 k Qi Qi+1 für i = 1, 2, 3. Dann folgt P1 P4 k Q1 Q4 . Q3 r Q1 g ............................ ........................................... ................................ ..... .. ................................ ..... ... .......................................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... . ........................... ..... ....... ... ................................ ... ....... ..... ..... .. ......................................... ... ..... ... ..... .. ... .. ..... ..... .... ..... ... ..... ... ...... .. ..... . . . . . . . . . . . . . . . . . .. . ... ... ..... ..... ..... ... ... . ... ..... ..... ... ......... ..... ... ... ..... ... ... . ..... .. .. ..... ... ... ............... .. .. ........... . . . . . ... . . . . . . . . ..... ... ...... ..... ... ... .... ..... ..... ...... ... ... ... ... ... ..... .. ..... ... .. .. ..... ..... ..... ... ..... ..... .. .. . ... ......... . . . . . . . . . . . . ... . . .. ... ....... ... ... .. ...... .. .. .................................................................................................................................................................................................................................................................................................... P3 r r P1 r r r r r P2 P4 Q2 Q4 h Satz 4.4 Sei (P, G) eine beliebige affine Ebene. Dann gilt (D) ⇐⇒ (S). Beweisskizze: ⇒“: Pi , Qi ∈ P, g, h ∈ G mögen die Voraussetzungen von (S) erfüllen, zu zeigen ist ” P1 P4 k Q1 Q4 . 1. Fall g ∩ h = S: Q3 r ..... ............. .............. .................... ............. ............... . . . . . . . . . . . . ..... ..... .. ............. ..... ... ............. ...... ... ............. ...... ..... ............. ..... ..................... . . . . . . . . . . . . . . . . . . . . ..... . .... ..... ..... ............. ... ..... ........... ..... ... ...... .................... ..... ... ...... ............. ........ ..... ... ..... ............. .............. . . . . . . . . . . . . . . . . . . . . . . . . . ....... ..... . .. .... .. ............. ............. ........... ...... ... ... ............. ... ................... ..... ...... ......... ... ............. ..... ...... ... ............. ... ............. .... ..... ..... ..... ............. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ... ....................................................................................................................................................................................................................................................................................................................................... ......... ... ... ... ......... ......... ... ... ... ......... ... ... . . ... ......... . . . .. ......... ... ..... ... ......... ......... ... ... .... ......... ... ......... ......... ... . ............ . ......... .. ......... ... ......... ... ......... ... ......... ... ......... . . ......... .. ......... ... ......... ... ......... ......... ..... .......... ......... ......... ...... P3 r P1 r S r r P4 r P2 Q1 r r r Q4 Q2 r P r Q h g 172 6 GEOMETRIE Weil die Behauptung für P1 P4 k P2 P3 und Q1 Q4 k Q2 Q3 direkt folgt, können wir oBdA von P1 P4 ∦ P2 P3 ausgehen (notfalls vertausche man die Buchstaben Pi und Qi ), es sei P := P1 P4 ∩ P2 P3 . Wegen P 6= S und SP ∦ Q2 Q3 (indirekter Nachweis) existiert Q := SP ∩ Q2 Q3 . SP = g oder SP = h ist nur möglich, falls einige der beteiligten Punkte zusammenfallen, in diesen Fällen folgt die Gültigkeit von (S) unmittelbar. Ist SP 6= g, h, können wir (D) zweimal auf die Trägergeraden g, h, SP anwenden: P1 P2 k Q1 Q2 , P2 P k Q2 Q ⇒ P1 P k Q1 Q P3 P4 k Q3 Q4 , P3 P k Q3 Q und ⇒ P4 P k Q4 Q Weil die Punkte P, P1 , P4 kollinear liegen, gilt P1 P = P4 P , wir erhalten Q1 Q k (P1 P = P4 P ) k Q4 Q ⇒ P1 P4 k Q1 Q4 2. Fall g k h: Der Beweis verläuft ähnlich zum ersten Fall. Statt P S benutzt man die Gerade (P, g) und an Stelle von (D) wird mit (d) argumentiert, was wegen Satz 4.2 erlaubt ist. ⇐“: S, Ai , Bi , Ci ∈ P, a, b, c ∈ G mögen die Voraussetzungen von (D) erfüllen45 , zu zeigen ist ” B1 C1 k B2 C2 . Bei den folgenden Überlegungen gehen wir davon aus, dass A1 , . . . , C2 paarweise verschieden sind und Ai , Bi , Ci nicht kollinear liegen (sonst folgt (D) trivialerweise). Angenommen, B1 C1 ∦ B2 C2 , d.h., es existiert P := B1 C1 ∩ B2 C2 . 1. Fall P 6∈ a: Es seien g := B2 C2 und h := B1 C1 . . ..... c C2 ...................... r . ........... ...... .. ....... ..... ..... .............. ..... ....... ..... ... . . . . ......... ....... . ... .... ........ ....... ... ..... ........ ....... ... ...... ....................... ..... . . . . . . . . . . . . . . . . . . ... .... . .... ...... ... ................. ... .............. ..... ....... ......... .. ..... ....... ...... .......... ....... ... ........ ..... ...... . ....... . . .. . . . . . . . . ....... ... .. ...... .... . . . . . . . ....... . . . . . . . ... . ..... ..... . .... . . . . . . . . . . . . . .................................................................................................................................................................................................................................................................................................. . . . . . . .. ... ... ...... . .... . . . . . . . . . ..... .. ....... ....... . . . . . . ..... ........ ... ... . .... ..... ......................... . . . . . . . . . . . . . . . . . . . . . ... ....... ..... ..... ......... ......... ......... ....... ... .... ..... ....... ........ ..... .................. ..... . . . . . . . . . . . . . . . . . . . . . ...... . ... ..... .. ... .. ..... ........ ...... ........ ..... ... ... ... ................... ...................... . . . . . . . . . . . . . . . . .. . ..... .. ... ...................................................................................................................................................................................................................................................................................................................................... b B2 r C1 r r S B1 P r Q r r r h g a R r r r r A1 A2 A3 A4 Wir erhalten weitere Punkte: A3 := a ∩ (P, c), es ist A3 6∈ g, h; A4 := a ∩ (P, A1 C1 ) mit A4 6∈ g, h; Q := h ∩ (A3 , b) mit Q 6∈ a und R := g ∩ A3 Q, R 6∈ a. Wir wenden (S) mit den Trägergeraden h, a und g, a zweimal an : C1 S k P A3 , C1 A1 k P A4 , B1 S k QA3 ⇒ B1 A1 k QA4 C2 S k P A3 , C2 A2 k P A4 , B2 S k RA3 ⇒ B2 A2 k RA4 ⇒ RA4 = QA4 , weitere Überlegungen führen zu R = Q und P 6= R (beachte P 6∈ (A3 , b) 3 R) ⇒ B2 C2 = P R = P Q = B1 C1 , Widerspruch! 2. Fall P ∈ a: Es seien C3 := c ∩ (P, A1 C1 ) und B3 := b ∩ (P, A1 B1 ). 45 Wir setzen A1 B1 k A2 B2 und A1 C1 k A2 C2 voraus. 4 Schließungssätze 173 c . ...... ...... C3...................... r .. ...... ........ ...... .. ..... ..... . . . . . ... ..... ... ..... . ...... ... ........ ...... ... ........ ..... . . . ......... ... . . ... ........ . . . . . . . . . . . . . . . ... .... ...... .... ... ................ .... ..... ......... . ...... .. ...... ..... .......... ...... ... ..... ........ ..... . . ..... . . . .. . . . . . . . . . . . ..... ........ ... . .... . . . . . . . . . . . . . ... . .... ......... ........ ... ... ...... ........ ..... ... ...... ... ........ ..... .. .............. ......... ... ..... ..... ..... ................................. .. . . . . . . . . . . . ..... ... ............ ............ ... .. ..... .......... ..... . ..... ........ . .......... ..... .... ... ...... ................ ..... .... .......... ..... ... ... .......... ...... ... ... ... ..... .. .. .......... ..................... . . . . . . . . . . . . . . .......... .... .. . ... .. ... ..... ....... ....... .. ............... ....................................................................................................................................................................................................................................................... C2 B3 r r B2 C1 r r B1 r r S b r r A1 P a Wir erinnern uns an unsere Annahme B1 C1 ∦ B2 C2 . B3 C3 kann also nicht zu beiden Geraden parallel sein. Sowohl B2 C2 ∦ B3 C3 als auch B1 C1 ∦ B3 C3 führt bei geeigneter Vorgehensweise zu Widersprüchen. daher muss B1 C1 k B2 C2 sein.46 Korollar Sei (P, G) eine beliebige affine Ebene. Dann gilt (d) ⇒ (s). Beweis: Genau dies wurde zweiten Fall der Beweisrichtung ⇒“ bewiesen. ” Satz 4.5 Sei (P, G) eine beliebige affine Ebene. Dann gilt (P) ⇒ (S). Beweisskizze: Pi , Qi ∈ P, g, h ∈ G mögen die Voraussetzungen von (S) erfüllen, zu zeigen ist P1 P4 k Q1 Q4 . Sei R := g ∩ (Q2 , P3 P4 ) und S := h ∩ (P1 , P3 P4 ). P1 P3 r R r Q1 r r Q3 r ........................................................................................................................................................................................................................................................................................ . .. ... ..... .. ..... ... ... .... ... ... ..... .... ..... .... ... ... ... ... ..... ... ..... ... .. ..... ..... ... ... ... ... ... ..... .. ..... . . . .. .... . . . . . . ... . . . . ... ... . ... ........ .. ... ..... ... ... ... ... ...... .. ..... . ... .. . . . . . . . . . ... ...... ... ... . . ... . .. . . . . . . . . . . ... ... . ... ... ... ... . . . . . .. . . . . . . . . ... .. ... ... ... . . .. .......... ..... . . . . . ... .. ..... ... ... ... .. ....... . . . . . . ... ... ... .. ...... ... .......... . .. . . . . .. . ....................................................................................................................................................................................................................................................................................... r P2 r S r r r P4 Q2 Q4 g h Wegen S ∈ h\g, R ∈ g\h können wir (P) dreimal mit den Trägergeraden g und h anwenden: P1 P2 k Q1 Q2 , P1 S k RQ2 ⇒ RP2 k Q1 S P3 P2 k Q3 Q2 , P3 P4 k RQ2 ⇒ RP2 k P4 Q3 P1 S k Q3 Q4 , Q1 S k Q3 P4 ⇒ P1 P4 k Q1 Q4 Korollar Sei (P, G) eine beliebige affine Ebene. Dann gilt (p) ⇒ (s). Satz 4.6 Sei (P, G) eine beliebige affine Ebene. Dann gilt (P) ⇒ (D). Beweis: Satz 4.5, Satz 4.4 Alle Schließungssätze gelten in der Anschauungsebene, wir werden dies aber nicht beweisen. Im krassen Gegensatz hierzu verhält sich die Moultonebene: Zu jedem Satz findet man Punkte und Geraden, die zwar den Voraussetzungen, nicht aber der Folgerung genügen. 46 Weitere Einzelheiten zu diesem Beweis findet man in R. Lingenberg, Grundlagen der Geometrie 174 6 GEOMETRIE Es gibt ferner affine Ebenen, in denen (D), aber nicht (P) gilt; ebenso findet man Ebenen mit (d), in denen (D) nicht erfüllt ist. Die Schließungssätze können daher zu einer Klassifizierung der affinen Ebenen benutzt werden. Es sind immer noch nicht alle Beziehungen zwischen den Schließungssätzen bekannt, offen ist beispielsweise die Frage : Gilt (p) ⇒ (d)? Wir fassen unser Wissen zusammen: (P) ⇒ (D) ⇐⇒ (S) ⇒ (d) ⇒ (p) ⇒ (s) und schließen das Kapitel mit einer praktischen Anwendung von (D) in der Anschauungsebene: ..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... g ..................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................... h Pr Seien g, h ∈ G und P ∈ P wie in der Skizze gegeben. Man konstruiere die Gerade durch P , die im Fall g k h zu g und h parallel ist oder andernfalls durch den Schnittpunkt von g und h verläuft. Die Lösung dieses Problems werden wir in den Übungen ermitteln. 5 Dilatationen Wir wollen uns mit Abbildungen innerhalb einer affinen Ebene (P, G) beschäftigen. Wenn wir von Verschiebungen, Streckungen oder Drehungen reden, sind zunächst die (hoffentlich) aus dem Schulunterricht bekannten Abbildungen der Anschauungsebene gemeint, erst später werden wir diese Begriffe exakt definieren. {P, Q} ∈ P2 bedeutet ab sofort, dass die Punkte P, Q ∈ P verschieden sind. Def 5.1 Eine Abbildung δ : P → P heißt Dilatation : ⇐⇒ δ(Q) ∈ (δ(P ), P Q) ∀{P, Q} ∈ P2 . Dilatationen bilden Geraden auf (Teilmengen von) Geraden ab, es kann passieren, dass alle Punkte das gleiche Bild besitzen. In diesem Fall, der uns nicht weiter interessieren wird, liegt eine sogenannte ausgeartete Dilatation vor. Wir werden später beweisen, dass nicht ausgeartete Dilatationen jede Gerade auf eine dazu parallele Gerade abbilden. Beispiele : 1) Die Identität ist eine Dilatation, sie kommt in jeder affinen Ebene vor. 2) In der Anschauungsebene ist jede Verschiebung und jede Streckung wegen δ(g) k g Dilatation. ∀g ∈ G eine 3) Drehungen in der Anschauungsebene sind nur in Ausnahmefällen Dilatationen, nämlich wenn der Drehwinkel ein Vielfaches von π ist. Frage/Übung : Welche Abbildungen im Minimalmodell sind Dilatationen? Im Folgenden wollen wir Dilatationen genauer kennenlernen. Wieviel muss eigentlich von einer Dilatation bekannt sein, damit sie eindeutig bestimmt ist? 5 Dilatationen 175 Satz 5.1 Seien α, β Dilatationen, {P, Q} ∈ P2 mit α(P ) = β(P ) =: P 0 , α(Q) = β(Q) =: Q0 ⇒ α = β. Beweis: Zu zeigen ist α(R) = β(R) für alle Punkte R. Wir unterscheiden zwei Fälle: 1. Fall R 6∈ P Q: Nach Definition der Dilatation ist α(R) ∈ (α(P ), P R) = (β(P ), P R) 3 β(R) und analog α(R) ∈ (α(Q), QR) = (β(Q), QR) 3 β(R). Wegen P R ∦ QR ist auch (α(P ), P R) ∦ (α(Q, QR). ⇒ | (α(P ), P R) ∩ (α(Q), QR) | = 1 ⇒ α(R) = β(R) 2. Fall R ∈ P Q: Auf Grund des dritten Axioms (AE 3) gibt es einen Punkt S 6∈ P Q. Für diesen Punkt S gilt, wie im ersten Fall bewiesen, α(S) = β(S). Weil R 6∈ P S, wenden wir noch einmal den ersten Fall auf P, S, R an und erhalten die Behauptung α(R) = β(R). Korollar Jede Dilatation mit zwei Fixpunkten ist die Identität. Beweis: α(P ) = P = id(P ), α(Q) = Q = id(Q) ⇒ α = id Leider kann man Satz 5.1 nicht auf Kollineationen übertragen, beispielsweise besitzt jede Geradenspiegelung in der Anschauungsebene unendlich viele Fixpunkte, ist aber verschieden von der Identität. Wir wollen den Zusammenhang zwischen Kollineationen und Dilatationen klären: Satz 5.2 Jede nicht ausgeartete Dilatation ist eine Kollineation. Beweis: Nach Definition bilden Dilatationen Geraden auf Teilmengen von Geraden ab, es fehlt noch der Nachweis der Bijektivität. Im Folgenden sei δ eine nicht ausgeartete Dilatation. Wir zeigen 1. δ ist injektiv: Angenommen, für verschiedene A, B ∈ P sei δ(A) = δ(B) =: P . Wir vergleichen δ mit der ausgearteten Dilatation δP , die jeden Punkt X auf P abbildet. Weil beide Dilatationen auf A und B übereinstimmen, gilt nach Satz 5.1 δ = δP . Dies ist ein Widerspruch, also muss δ injektiv sein. ..... . ..... ...... ..... ........... ......... . . . . . . . . ...... ........ ..... ...... ...... ..... ...... ..... ...... ..... . . . . . ..... .... . . . . ..... . .... . . ..... . . . .. ................................................................................................................................ . ..... . . . . ..... .... . . . . . ... ... r 2. δ ist surjektiv: Wir suchen zu einem beliebigen Punkt T ein Urbild. Da δ nicht ausgeartet ist, gibt es {P, Q} ∈ P2 mit P 0 = δ(P ) 6= δ(Q) =: Q0 . Falls T ∈ {P 0 , Q0 }, ist nichts mehr zu zeigen. Falls T 6∈ {P 0 , Q0 }, untersuchen wir zuerst die Möglichkeit T 6∈ P 0 Q0 (Fall 2.1): T0 P Q r r Q0 P0 ..... ..... .. .... ...... ............................................................................................................. ..... .... . . . ..... . . ..... ...... ..... ...... ..... ...... ..... ...... ..... ........... . .. ......... ...... ......... ..... ...... . ...... r Es folgt T P 0 ∦ T Q0 ⇒ (P, T P 0 ) ∦ (Q, T Q0 ), diese Geraden haben genau einen Schnittpunkt T0 , der nach Definition der Dilatation das gesuchte Urbild von T ist. r r T Für T ∈ P 0 Q0 (Fall 2.2) wählen wir einen beliebigen Punkt S 6∈ P 0 Q0 . Wie gerade gezeigt ∃S0 ∈ P mit δ(S0 ) = S; jetzt wenden wir Fall 2.1 auf T ∈ 6 P 0 S an. Bezüglich der Verkettung als Verknüpfung bilden die nicht ausgearteten Dilatationen einer affinen Ebene eine Untergruppe aller Kollineationen; wir werden hierauf nicht näher eingehen. Weil ab jetzt ausschließlich nicht ausgeartete Dilatationen untersucht werden, vereinbaren wir zur Vereinfachung der Schreibarbeit, dass ab jetzt mit Dilatation stets eine nicht ausgeartete Dilatation gemeint ist. Def 5.2 Sei α eine Kollineation. g ∈ G heißt Fixgerade : ⇐⇒ ∀P ∈ g : α(P ) ∈ g Die folgenden Beispiele beziehen sich auf die Anschauungsebene: 1) τ : (x, y) 7→ (x + 1, y + 1) ist eine Dilatation mit Fixgerade g1,0 : τ (g1,0 ) = {τ ((x, x)) | x ∈ R} = {((x + 1, x + 1)) | x ∈ R} = g1,0 . Gibt es bei dieser Abbildung τ weitere Fixgeraden? 176 6 GEOMETRIE 2) (x, y) 7→ (−x, −y) ist eine Dilatation, jede Gerade durch (0, 0) ist eine Fixgerade. 3) (x, y) 7→ (y, −x) ist eine Kollineation, aber keine Dilatation. Es gibt keine Fixgerade, obwohl jede Gerade g einen Punkt besitzt, der wieder auf g abgebildet wird. (Warum? Einzelheiten eventuell in den Übungen.) Im Fall von Dilatationen besitzen Fixgeraden weitere interessante Eigenschaften. Satz 5.3 Sei δ eine Dilatation, seien g, h ∈ G. Dann gilt a) g ist Fixgerade ⇐⇒ ∃P ∈ g mit δ(P ) ∈ g b) g, h sind Fixgeraden mit g ∦ h ⇒ g ∩ h Fixpunkt Beweis: a) ⇒“ ist klar, ⇐“: Sei P ∈ g mit δ(P ) ∈ g. Für jeden Punkt Q ∈ g gilt dann δ(Q) ∈ ” ” (δ(P ), P Q) = g ⇒ g ist Fixgerade. b) Sei P der eindeutig bestimmte Schnittpunkt von g und h. Weil g und h Fixgeraden sind, folgt δ(P ) ∈ g ∩ h ⇒ P = δ(P ). Bei Dilatationen δ = 6 id liegen alle Fixgeraden im Büschel, d.h., entweder sie sind alle parallel oder sie haben genau einen Punkt gemeinsam (denn mehr als ein Schnittpunkt hat die Identität zur Folge). Wieviele Fixpunkte kann eine Dilatation haben? Weil jede Dilatation mit mehr als einem Fixpunkt die Identität ist, gibt es nur drei Möglichkeiten: Kein Fixpunkt, ein Fixpunkt oder jeder Punkt ist Fixpunkt. Def 5.3 Eine Dilatation τ heißt Translation : ⇐⇒ τ = id oder τ besitzt keinen Fixpunkt. Die Menge aller Translationen schreiben wir T , bezüglich der Verkettung bilden alle Translationen eine Untergruppe der Dilatationen. Beispiele : 1) In der Anschauungsebene ist jede Abbildung (x, y) 7→ (x+a, y +b) eine Translation (näheres eventuell in den Übungen). 2) In der Minimalebene mit den vier Punkten A, B, C, D ist A 7→ B 7→ A, C 7→ D 7→ C eine Translation. Satz 5.4 Für τ ∈ T \{id} bildet die Menge aller Fixgeraden ein Parallelbüschel. Beweis: Eventuell Übungsaufgabe. Wir haben gesehen, dass bei einer beliebigen Dilatation zwei Paare Punkt – Bildpunkt ausreichen, um die Abbildung eindeutig festzulegen. Bei Translationen geht es noch einfacher: Satz 5.5 Seien τ1 , τ2 Translationen mit τ1 (P ) = τ2 (P ) für ein P ∈ P. Dann gilt τ1 = τ2 . Beweis: Sei τ1 (P ) = τ2 (P ) = P 0 6= P (sonst liegt ein Fixpunkt vor und nach Definition 5.3 gilt τ1 = id = τ2 ). Sei R 6∈ P P 0 . Nach den letzten beiden Sätzen ist τi (R) ∈ (R, P P 0 ). Für i = 1, 2 gilt damit τi (R) ∈ (R, P P 0 ) ∩ (P 0 , P R) ⇒ τ1 (R) = τ2 (R), nach Satz 5.1 stimmen die Abbildungen überein. Zu P, Q ∈ P kann es in einer affinen Ebene höchstens eine Translation geben, die P auf Q abbildet. In der Anschauungsebene gibt es auch immer so eine Abbildung, zu P = (p1 , p2 ), Q = (q1 , q2 ) wähle man τ ((x, y)) := (x + (q1 − p1 ), y + (q2 − p2 )). Dies trifft jedoch nicht auf jede affine Ebene zu: Behauptung : In der Moultonebene existiert keine Translation, die P := (−1, 0) auf Q := (0, 0) abbildet. 5 Dilatationen 177 Beweis :47 Angenommen, τ ist eine Translation mit τ (P ) = Q. Damit ist P Q = g0,0 und jede zu ihr parallele Gerade eine Fixgerade. Wir bestimmen τ (R) für R = (0, 1): 1 τ (R) = (R, P Q) ∩ (Q, P R) = , 1 =: R0 2 Wie finden wir das Bild von S = (0, −1) unter τ ? Es muss gelten τ (S) ∈ (S, P Q) = g0,−1 , τ (S) ∈ ((Q, P S) = g−1,0 , τ (S) ∈ (R0 , RS) = g 1 2 Es gibt aber keinen gemeinsamen Schnittpunkt dieser drei Geraden! Def 5.4 Eine affine Ebene heißt Translationsebene : ⇐⇒ ∀{P, Q} ∈ P2 ∃τ ∈ T : τ (P ) = Q Minimalmodell und Anschauungsebene sind Translationsebenen, die Moultonebene ist keine Translationsebene. Ohne Beweis geben wir den folgenden Satz an, der eine Verbindung zu den Schließungssätzen herstellt: Satz 5.6 Eine affine Ebene ist genau dann eine Translationsebene, wenn in ihr der kleine Satz von Desargues (d) gilt. Als nächstes beschäftigen wir uns mit den Dilatationen mit Fixpunkt. Def 5.5 Eine Dilatation σ heißt Streckung : ⇐⇒ σ besitzt mindestens einen Fixpunkt. Eine Streckung hat entweder genau einen Fixpunkt, der auch Zentrum genannt wird, oder es liegt die identische Abbildung vor. Beispiele : 1) In der Anschauungsebene ist jede Abbildung (x, y) 7→ (ax, ay) für a 6= 0 eine Streckung; denn (0, 0) ist Fixpunkt, σ ist bijektiv und wegen σ(gk ) = gak k gk , σ(gm,b ) = gm,ab k gm,b liegt eine Dilatation vor. 2) In der Anschauungsebene ist die Abbildung (x, y) 7→ (2x, 3y) keine Streckung; σ(g1,0 ) = g 3 ,0 ∦ g1,0 . 2 3) In der affinen Ebene mit 9 Punkten und 12 Geraden gibt es zu jedem Punkt genau eine Streckung, die genau diesen Punkt fest lässt. Im Gegensatz zu den Translationen bilden die Streckungen keine Untergruppe der Dilatationen. Um dies einzusehen, betrachten wir in der Anschauungsebene folgende Abbildungen: 1) σ((x, y)) = (−x, −y) ist eine Streckung. 2) τ ((x, y)) = (x − 1, y) ist eine Translation und keine Streckung. 3) (τ −1 στ )((x, y)) = τ −1 (σ((x−1, y)) = τ −1 ((1−x, −y)) = (1−x+1, −y) = (2−x, −y) ist eine Streckung, denn (1, 0) ist einziger Fixpunkt. Dies kann man elementar ausrechnen oder elegant durch Widerspruch beweisen: Angenommen, es gibt keinen Fixpunkt. Dann ist τ −1 στ = α eine Translation. Translationen bilden eine Gruppe, also ist auch σ = τ ατ −1 eine Translation, Widerspruch. Würden die Streckungen bezüglich der Verkettung eine Untergruppe bilden, müsste auch σ ◦ (τ −1 στ ) eine Streckung sein, aber στ −1 στ hat wegen (στ −1 στ )((x, y)) = (x − 2, y) keinen Fixpunkt. Während es in der Anschauungsebene zu Punkten A, B stets genau eine Translation τ mit τ (A) = B gibt, verhält es sich mit Streckungen etwas anders. 47 Siehe hierzu auch die Skizze auf Seite 158. 178 6 GEOMETRIE Beispiel : σ1 : (x, y) 7→ (2 − x, −y) und σ2 : (x, y) 7→ (3x + 2, 3y) sind verschiedene Streckungen, die beide (0, 0) auf (2, 0) abbilden. Def 5.6 Eine affine Ebene heißt Streckungsebene : ⇐⇒ ∀Z, P, Q ∈ P kollinear, Z 6= P, Q ∃ Streckung σ mit σ(Z) = Z und σ(P ) = Q. Wegen Satz 5.1 ist diese Streckung eindeutig bestimmt. Ein Beispiel für eine Streckungsebene ist die Anschauungsebene. Die Moultonebene ist keine Streckungsebene. Wir wollen in der Anschauungsebene alle Streckungen mit Zentrum (Fixpunkt) Z = O = (0, 0) angeben: Sei X = (x, y) ∈ R2 beliebig. Weil Streckungen spezielle Dilatationen sind, muss gelten σ(X) ∈ (σ(O), OX) = OX, d.h. σ(X) = (αx, αy) mit α ∈ R Für jede reelle Zahl α ist σ(x, y) 7→ (αx, αy) eine Streckung mit Fixpunkt O (für α = 0 liegt eine ausgeartete Dilatation vor). Wir wollen verallgemeinern und suchen als Beispiel die Streckung mit Fixpunkt Z = (0, 1), die P = (1, 2) auf Q = (−2, −1) abbildet. Weil diese Punkte kollinear liegen, muss es genau eine solche Streckung geben. Wir gehen schrittweise vor: 1) Es gibt eine Translation τ mit τ (Z) = O, nämlich τ ((x, y)) := (x, y − 1). Für diese Abbildung gilt τ (P ) = (1, 1) und τ (Q) = (−2, −2). 2) Es gibt eine Streckung σ mit σ(O) = O und σ((1, 1)) = (−2, −2), nämlich σ((x, y)) := (−2x, −2y). 3) Es gibt eine Translation, die O auf Z abbildet, nämlich τ −1 aus 1), also τ −1 ((x, y)) = (x, y + 1). 4) Für τ −1 ◦σ ◦τ gilt τ −1 στ (Z) = τ −1 σ(O) = τ −1 (O) = Z und τ −1 στ (P ) = τ −1 (σ(τ (P ))) = τ −1 (τ (Q)) = Q, allgemein ist τ −1 στ ((x, y)) = τ −1 σ((x, y − 1)) = τ −1 ((−2x, −2y + 2)) = (−2x, −2y + 3). Als Übungsaufgabe versuche man, die analoge Abbildung für beliebige kollineare Punkte Z, P, Q anzugeben! Wie bei Translationsebenen gibt es auch für Streckungsebenen einen charakteristischen Schließungssatz: Satz 5.7 Eine affine Ebene ist genau dann eine Streckungsebene, wenn in ihr der große Satz von Desargues (D) gilt. 6 Normale euklidische Ebenen Bisher haben wir uns ausschließlich mit inzidenzgeometrischen Aspekten beschäftigt und beispielsweise untersucht, ob Punkte kollinear liegen oder ob Geraden parallel sind. Mit Hilfe von Schließungssätzen oder der Existenz von Dilatationen konnten wir affine Ebenen klassifizieren. In diesem Abschnitt werden wir zusätzliche Axiome kennenlernen, durch die sich die Anschauungsebene eindeutig von allen anderen affinen Ebenen unterscheidet. Beschränken wir uns hierzu für einen Augenblick auf die Anschauungsebene und erinnern uns an die Schulzeit. Fragen : Was ist eine Strecke und wie stellt man fest, ob zwei Strecken gleich lang sind oder nicht? 6 Normale euklidische Ebenen 179 Nachdem wir diese Fragen in der Vorlesung beantwortet haben, stellen wir fest, dass Strecken in der Anschauungsebene eindeutig durch zwei Randpunkte festgelegt sind. Der Vergleich zweier Strecken bedeutet die Überprüfung, ob diese Strecken in einer Relation (gleich lang?) zueinander stehen. Wie man leicht sieht, handelt es sich hierbei um eine Äquivalenzrelation. Kehren wir zu beliebigen affinen Ebenen (P, G) zurück. Wir wollen jedes Punktepaar {A, B} ∈ P2 als Strecke bezeichnen. Auf der Menge aller Punktepaare P2 sei eine zunächst beliebige Äquivalenzrelation ≡ gegeben. Falls {A, B} ≡ {C, D} für {A, B}, {C, D} ∈ P2 erfüllt ist (gesprochen: {A, B} ist kongruent zu {C, D}), wollen wir diese Strecken gleich lang nennen. Beispiele : 1) In der Anschauungsebene messen wir die Länge der Strecke zwischen Punkten A = (a1 , a2 ) p und B = (b1 , b2 ) durch (b1 − a1 )2 + (b2 − a2 )2 . Genau dann, wenn diese Werte für verschiedene Strecken übereinstimmen, sind sie gleich lang. 2) Wir stellen uns das Minimalmodell einer affinen Ebene als regelmäßiges Tetraeder vor. Weil alle Kanten gleich lang sind, setzen wir {A, B} ≡ {C, D} ∀ {A, B}, {C, D} ∈ P2 . Es ist wahrscheinlich aufgefallen, dass bei uns Strecken {A, B} nur aus zwei Punkten bestehen und nicht, wie in der Schule üblich, aus allen Punkten dazwischen“. Der einzige Grund für diese Vorgehensweise ” ist, dass die Streckendefinition als Punktepaar problemlos auf jeder affinen Ebene möglich ist. (Wie soll liegt zwischen“ in beliebigen affinen Ebenen erklärt sein?) ” Ab jetzt sei (P, G, ≡) eine affine Ebene mit einer Äquivalenzrelation ≡ auf P2 . Wir führen mit Hilfe dieser Relation weitere Begriffe ein: Def 6.1 Sei (P, G, ≡) eine affine Ebene, sei {A, B} ∈ P2 . Dann heißt a) mA,B := {X ∈ P | {A, X} ≡ {X, B}} Mittelsenkrechte von {A, B}. b) kA (B) := {X ∈ P | {A, X} ≡ {A, B}} Kreis mit Mittelpunkt A durch B. Beispiele : 1) In der Anschauungsebene mit der üblichen Längenmessung ist m(0,0)(2,0) = g1 : p p X = (x, y) ∈ m(0,0)(2,0) ⇐⇒ x2 + y 2 = (x − 2)2 + y 2 ⇐⇒ 0 = −4x + 4 ⇐⇒ (x, y) = (1, y), also m(0,0)(2,0) = {(1, y) | y ∈ R} = g1 . k(0,0) ((2, 0)) = {(x, y) | x2 + y 2 = 4}, die entsprechende Rechnung wird in den Übungen durchgeführt. Mittelsenkrechte und Kreise aus Definition 6.1 sind genau die Gebilde, die uns aus der Schule unter diesen Namen bekannt sind! 2) Definiert man in der Minimalebene {A, B} ≡ {C, D} für alle {A, B}, {C, D} ∈ P2 , so ist mA,B = {C, D} und kA (B) = {B, C, D}. Def 6.2 Sei (P, G) eine affine Ebene, seien A1 , . . . , A4 ∈ P paarweise verschieden. (A1 , A2 , A3 , A4 ) heißt Parallelogramm : ⇐⇒ A1 A2 k A3 A4 ∦ A2 A3 k A1 A4 Zum mathematischen Allgemeinwissen gehört, dass in der Anschauungsebene gegenüberliegende Seiten eines Parallelogramms als Strecken aufgefasst die gleiche Länge besitzen. Dies ist nicht in jeder affinen Ebene so, ein Gegenbeispiel liefert einmal mehr die Moultonebene mit dem Parallelogramm (−2, 0), (0, 0), (1, 1), (0, 1) bei gleicher Längendefinition wie in der Anschauungsebene. Eine andere Binsenweisheit der Anschauungsebene besagt, dass jeder Kreis jede Gerade, die durch den Kreismittelpunkt verläuft, in genau zwei Punkten schneidet. Auch dies gilt nicht in jeder affinen Ebene, diesmal finden wir ein Gegenbeispiel im Minimalmodell, hier ist kA (B) ∩ AB = {B}. 180 6 GEOMETRIE Offensichtlich können wir diese beiden Eigenschaften benutzen, um die Anschauungsebene von anderen affinen Ebenen zu unterscheiden. Def 6.3 Eine affine Ebene (P, G, ≡) 1) genügt dem Kreisschnittaxiom (KS) : ⇐⇒ |kA (B) ∩ AB| = 2 ∀{A, B} ∈ P2 2) genügt dem Parallelogrammaxiom (PG) : ⇐⇒ {A, B} ≡ {C, D} für alle Parallelogramme (A, B, C, D). 3) heißt normale euklidische Ebene : ⇐⇒ es gelten (KS) und (PG). Wie bereits in den Beispielen gesehen, ist die Anschauungsebene im Gegensatz zur Moultonebene und zum Minimalmodell eine normale euklidische Ebene. Leider gibt es normale euklidische Ebenen, die sich wesentlich von der Anschauungsebene unterscheiden. Um die Anschauungsebene eindeutig von allen anderen Ebenen abzuheben, sind weitere Axiome notwendig. Def 6.4 In einer affinen Ebene (P, G, ≡) heißt a) g ∈ G Tangente an den Kreis k : ⇐⇒ |g ∩ k| = 1. b) P ∈ P innerer Punkt eines Kreises k : ⇐⇒ P liegt auf keiner Tangente an k. c) k o := {X ∈ P | X innerer Punkt von k} Inneres von k. d) k ∪ k o abgeschlossene Kreisscheibe. Weil diese Begriffe in der Anschauungsebene genau unseren Vorstellungen entsprechen, verzichten wir auf explizite Beispiele. Def 6.5 Eine affine Ebene (P, G, ≡) 1) genügt dem euklidischen Axiom (E) : ⇐⇒ trifft diesen Kreis. Jede Gerade durch einen inneren Punkt eines Kreises 2) genügt dem Vollständigkeitsaxiom (V) : ⇐⇒ Sind k1 , k2 abgeschlossene Kreisscheiben mit gleichem Mittelpunkt M und gilt k1 $ k2 , so existiert eine weitere abgeschlossene Kreisscheibe k3 mit Mittelpunkt M und k1 $ k3 $ k2 . 3) heißt vollständige euklidische Ebene : ⇐⇒ es gelten (E) und (V). Wer ein gutes Gedächtnis hat, erinnert sich an ein ähnliches Vollständigkeitsaxiom, das wir im ersten Semester zur Charakterisierung der reellen Zahlen kennengelernt haben. Mit dem folgenden Satz, den wir nicht beweisen werden, haben wir ein Ziel dieser Vorlesung, nämlich die Anschauungsebene eindeutig durch Axiome festzulegen, erreicht: Satz 6.1 Jede vollständige euklidische Ebene ist isomorph zur Anschauungsebene. Normale euklidische Ebenen heißen übrigens nur dann isomorph, wenn eine bijektive Abbildung existiert, die kollineare Punkte auf kollineare Punkte und außerdem gleichlange Strecken auf gleichlange Strecken abbildet. Weitere Eigenschaften solcher Isomorphismen sind im folgenden Satz zusammengefasst: Satz 6.2 Sei ϕ ein Isomorphismus zwischen affinen Ebenen (P, G, ≡) und (P0 , G0 , ≡0 ). Dann gilt für alle {A, B} ∈ P2 a) ϕ(mA,B ) = mϕ(A)ϕ(B) 7 Bewegungen Teil 1: Punktspiegelungen 181 b) ϕ(kA (B)) = kϕ(A) (ϕ(B)) Beweis: a) ϕ(mA,B ) = {ϕ(X) | {A, X} ≡ {B, X}} = {ϕ(X) | {ϕ(A), ϕ(X)} ≡0 {ϕ(B), ϕ(X)}} = mϕ(A)ϕ(B) b) ϕ(kA (B)) = {ϕ(X) | {A, X} ≡ {A, B}} = {ϕ(X) | {ϕ(A), ϕ(X)} ≡0 {ϕ(A), ϕ(B)}} = kϕ(A) (ϕ(B)) Isomorphismen bilden Mittelsenkrechte auf Mittelsenkrechte, Kreise auf Kreise und Parallelogramme auf Parallelogramme ab. (Frage : Warum gilt das Letztere?) 7 Bewegungen Teil 1: Punktspiegelungen Mit den Dilatationen haben wir Kollineationen kennengelernt, die Geraden auf parallele Geraden abbilden. Jetzt wollen wir uns mit Abbildungen beschäftigen, die distanztreu“ sind. Hierzu benötigen wir ” eine Äquivalenzrelation ≡ auf der Menge der Punktepaare. Um allzu exotische Fälle von vorneherein auszuschließen, gehen wir von einer normalen euklidische Ebene aus. An einigen Stellen werden wir außerdem voraussetzen, dass die Geradenmenge G mit der Menge der Mittelsenkrechten übereinstimmt. Dies ist in der Anschauungsebene selbstverständlich und wir werden uns nicht mit der Frage befassen, ob es überhaupt Ebenen geben kann, in denen es anders ist. Alle folgenden Aussagen gelten in solchen gutartigen“ normalen euklidischen Ebenen. Um dies deutlich zu machen, benutzen wir die allgemeine ” Notation ≡ für gleich lang“. Wem dies zu unheimlich ist, der möge sich unter (P, G, ≡) lediglich die ” Anschauungsebene vorstellen! Def 7.1 Eine Kollineation ϕ heißt Bewegung : ⇐⇒ {A, B} ≡ {ϕ(A), ϕ(B)} ∀{A, B} ∈ P2 Bewegungen sind distanztreue Abbildungen, bezüglich der Verkettung bilden sie eine Untergruppe der Kollineationsgruppe. Frage : Wer kennt Beispiele für Bewegungen? Wir wollen eine spezielle Bewegung, die etwas mit Kreisen und dem Kreisschnittaxiom zu tun hat, kennenlernen und genauer untersuchen. ............................. ........... ....... ....... ...... ...... ..... ..... ..... . . . . .... .... ... . .. ... . ... .. . ... .... ... ... ... ... . ........................................................................................................................................................... ... ... ... .. . ... ... ... ... ... .. ... .. ... . . . ..... ..... ..... ..... ...... ...... ....... ....... ........... ............................. Xr M r rY Sei M ∈ P fest gewählt. Für jeden Punkt X 6= M trifft die Gerade M X den Kreis kM (X) außer in X in genau einem weiteren Punkt Y , der vom Kreismittelpunkt M die gleiche Entfernung hat wie X; denn nach dem Kreisschnittaxiom ist {X, M } ≡ {Y, M }. Def 7.2 Sei (P, G, ≡) eine normale euklidische Ebene. Für jeden Punkt M heißt die Abbildung P → P ϕM : M für X = M X 7→ Y für X 6= M mit Y ∈ M X\{X}, {M, X} ≡ {M, Y } Punktspiegelung an M. 182 6 GEOMETRIE Wenn klar ist, an welchem Punkt gespiegelt wird, werden wir an Stelle von ϕM manchmal kürzer ϕ schreiben. Jede Streckung mit Zentrum M und Streckungsfaktor −1 ist eine Punktspiegelung. Wir wollen Eigenschaften von beliebigen Punktspiegelungen (in beliebigen normalen euklidischen Ebenen) zusammenstellen. Beh. 1 : Jede Punktspiegelung hat genau einen Fixpunkt. Bew. : Folgt direkt aus der Definition: ϕM (M ) = M, ϕM (X) 6= X für X 6= M . Bei den nächsten Behauptungen verwenden wir statt ϕM die kürzere Schreibweise ϕ. Beh. 2 : Jede Punktspiegelung ist surjektiv. Bew. : Sei Y ∈ P beliebig. Für Y = M ist M das Urbild, für Y 6= M folgt aus dem Kreisschnittaxiom kM (Y ) ∩ M Y = {Y, X} ∈ P2 mit {Y, M } ≡ {X, M }. X ist das gesuchte Urbild: ϕ(X) = Y . Beh. 3 : Jede Punktspiegelung ist injektiv. Bew. : Zu zeigen ist ϕ(X1 ) 6= ϕ(X2 ) für alle {X1 , X2 } ∈ P2 . Wir untersuchen verschiedene Fälle: 1. Fall M ∈ {X1 , X2 }, sei oBdA M = X1 ⇒ ϕ(X1 ) = M 6= ϕ(X2 ). 2. Fall M 6∈ {X1 , X2 }. Für M 6∈ X1 X2 folgt ϕ(X1 ) ∈ M X1 63 ϕ(X2 ). Für M ∈ X1 X2 unterscheiden wir weitere Fälle: a) {M, X1 } 6≡ {M, X2 }. Weil nach Definition {M, Xi } ≡ {M, ϕ(Xi )} für i = 1, 2 gilt, ist {M, ϕ(X1 )} 6≡ {M, ϕ(X2 )} und damit ϕ(X1 ) 6= ϕ(X2 ). b) {M, X1 } ≡ {M, X2 } ⇒ X1 ∈ kM (X2 ) und X2 ∈ kM (X1 ) ⇒ ϕ(X1 ) = X2 6= X1 = ϕ(X2 ). Beh. 4 : Jede Punktspiegelung ist selbstinvers (involutorisch). Bew. : Es ist ϕ2 (M ) = M . Für ϕ(X) = Y mit Y ∈ M X\{X}, {X, M } ≡ {Y, M } folgt ϕ2 (X) = ϕ(Y ) mit ϕ(Y ) ∈ (M Y = M X)\{Y }, {Y, M } ≡ {ϕ(Y ), M } ⇒ ϕ(Y ) = X ⇒ ϕ2 = id. Beh. 5 : Jede Punktspiegelung ist eine Streckung. Bew. : Sei ϕ eine Punktspiegelung an M . Weil wir bereits wissen, dass ϕ bijektiv ist und genau einen Fixpunkt besitzt, bleibt nur“ noch zu zeigen, dass jede Gerade g unter ϕ auf eine zu g parallele Gerade ” abgebildet wird. Für Geraden g mit M ∈ g ist natürlich ϕ(g) = g, der andere Fall M 6∈ g bereitet leider etwas Mühe. Es sei h := (M, g), U ∈ h\{M } und V = ϕ(U ), damit ist {U, M } ≡ {V, M }. Wegen mU,V = {X ∈ P | {U, X} ≡ {V, X}} gilt M ∈ h ∩ mU,V und U ∈ h\ mU,V . Aus h k g folgt mU,V ∦ g. Sei A := g ∩ mU,V , also {A, U } ≡ {A, V }. ... ... . ......................................................................................................................................................... ... . ..... ... ... ... ... ... ... .. ........................................................................................................................................................... ... ... ... ... ... ... ... .. r Vr A rM rU g h mU,V Weil A, U, V nicht kollinear sind, legt der eindeutig bestimmte Punkt B := (V, AU ) ∩ (U, AV ) das Parallelogramm (U, A, V, B) fest mit {B, V } ≡ {A, U } ≡ {A, V } ≡ {B, U }48 ⇒ B ∈ mU,V . Aus {A, U } ≡ {B, U } und {A, V } ≡ {B, V } folgt außerdem U, V ∈ mA,B = h.49 Damit ist M ∈ h = mA,B und wir erhalten {M, A} ≡ {M, B} und hieraus ϕ(A) = B. 48 49 Hier geht das Axiom (PG) ein. Hier benutzen wir die Gleichheit von Geraden und Mittelsenkrechten. 7 Bewegungen Teil 1: Punktspiegelungen 183 Zu zeigen ist ϕ(g) = (B, g) =: l, d.h., für jeden beliebigen Punkt X ∈ g\{A} ist ϕ(X) ∈ l nachzuweisen. ... ... . .......................................................................................................................................................................................................................... ................... . . ..... . . . .... .... ... ... ......... ...... . . . . . . . ...... . ...... ...... ... .. .. ...... ...... .... .... ..... ........... ........... . . . . . .......... . ... . .. ...... ... ...... .... ... ...... ... ........... ........... ... ... ...... ...... ..... ...... ... ... ...... ........... .. ...... . . . ...... . . . . . . . . . . . ... .. ...... ... ........ ... ...... ........................................................................................................................................................................................................................................ ... ...... ... .. ..... . ...... . . ... ...... . . . . ...... . . . . . . . ... . . ...... ... ...... ... ...... ..... ...... ... . ... ...... . . . . . . . .. . ...... ... ... ...... ...... .. ...... ..... ... ..... ............ ...... .. .. .. ...... ...... ... ... ... ...... ...... ... . .. ...... .................. ...................................................................................................................................................................................................................... ... ... ... ... ... ... ... .. rA Es sei X 0 := h ∩ (B, M X). B, X 0 , A liegen nicht kollinear, daher gibt es genau ein X 00 ∈ P, so dass (B, X 0 , A, X 00 ) ein Parallelogramm ist, d.h., es gilt {A, X 00 } ≡ {B, X 0 } und {A, X 0 } ≡ {B, X 00 }. Wegen h = mA,B ist ferner {X 0 , A} ≡ {X 0 , B} ⇒ X 00 ∈ h. X 00r Vr r M rX rU rX 0 r g h l B mU,V Nach Definition von X 0 ist M X k BX 0 , ferner ist BX 0 k AX 00 . Damit erhalten wir ein weiteres Parallelogramm (X, M, X 00 , A) (beachte (M X 00 = h) k (g = AX)) mit {X, M } ≡ {A, X 00 }. rA Da XM ∦ h existiert Y := l ∩ XM mit Y 6= B X 0M ) BX 0 Wegen (BY = l) k (h = und (Y M = XM ) k 0 ist auch (B, X , M, Y ) ein Parallelogramm mit {B, X 0 } ≡ {M, Y } Insgesamt folgt für die kollinearen Punkte X, M, Y Y = ϕ(X) ∈ l, was zu zeigen war. rX .................................................................................................................................................................................................................. . . ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... . . . . . . . . . . . . ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... . . . . . . . . . . ...... ...... ....................................................................................................................................................................................................................... .. ..... ...... ...... ...... . . . ...... . . .... ...... . . . . . . . . . . . . ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... . . . . . . . . . . ... ... ...... ...... ...... ...... ................................................................................................................................................................................................................ X 00r M r r rX 0 r Y g h l B Beh. 6 : Sei {A, B} ∈ P2 , M 6∈ AB. Für jede Punktspiegelung ϕ an M ist (A, B, ϕ(A), ϕ(B)) ein Parallelogramm. Bew. : Wegen M 6∈ AB ist AB ∦ Bϕ(A). Aus Behauptung 5 folgt AB k ϕ(A)ϕ(B) Aus den Behauptungen 4 und 5 folgt Aϕ(B) k ϕ(A)ϕ2 (B) = ϕ(A)B. A .........r..................................................................... ............. ...... .. ............. ...... ... ............. ...... ............ .. ...... ...... ... ........... ... ...... ............. ... ... ............................. . . ... . . . . . . ... ............ .......... ... ... ............. ...... .......................... . ... ...... ............. . . ... ...... ............. ...... ............. ... ............. . . . . . .. ............. ............. ........... ... .................... ..... r ϕ(B) r B r M r ϕ(A) Beh. 7 : Jede Punktspiegelung ϕ an M ist eine Bewegung. Bew. : Wir haben bereits nachgewiesen, dass ϕM = ϕ eine Kollineation ist, zu zeigen bleibt die Distanztreue, d.h. {A, B} ≡ {ϕ(A), ϕ(B)} ∀ {A, B} ∈ P2 Für M 6∈ AB folgt dies aus der letzten Behauptung und dem Parallelogrammaxiom, denn (A, B, ϕ(A), ϕ(B)) ist ein Parallelogramm. Für M ∈ AB wählen wir U 6∈ AB. Mit V := (A, BU ) ∩ (U, AB) ist (A, B, U, V ) ein Parallelogramm, es folgt {A, B} ≡ {U, V }. Weil M 6∈ U V ist {U, V } ≡ {ϕ(U ), ϕ(V )}. Weil ϕ eine Kollineation ist, ist auch (ϕ(A), ϕ(B), ϕ(U ), ϕ(V )) ein Parallelogramm, also gilt {ϕ(A), ϕ(B)} ≡ {ϕ(U ), ϕ(V )}, womit alles gezeigt ist. V..r........................................................U .....r ... ... ... ... ... ... .. .. . . ... ... ... ... ... ... .. .. . . ... ... ... ... .. .. .. .. . . . . ................................................................................................................................................................................... r r r A B M 184 6 GEOMETRIE Mit den Behauptungen 1 – 7 haben wir folgenden Satz bewiesen: Satz 7.1 In normalen euklidischen Ebenen sind Punktspiegelungen a) involutorische Streckungen mit einzigem Fixpunkt M b) Bewegungen Aus unserer Erfahrung mit der Anschauungsebene verbinden wir mit dem Namen Mittelsenkrechte Vorstellungen von senkrecht stehen“ und Mitte“. Diese Begriffe sind bisher nicht vorgekommen, für uns ” ” bestehen Mittelsenkrechte nur aus allen Punkten, die den gleichen Abstand zu zwei gegebenen Punkten besitzen. Einen ersten Schritt in Richtung Anschauung unternehmen wir mit dem nächsten Satz, der in der Anschauungsebene offensichtlich gültig ist. Für beliebige normale euklidische Ebenen müssen wir ihn beweisen. Satz 7.2 Für alle Punktepaare {A, B} einer normalen euklidischen Ebene gilt mA,B ∦ AB. Beweis: Wegen A 6∈ mA,B ist mA,B 6= AB. Sei C := ϕB (A). Wegen A 6∈ mA,C und B ∈ mA,C ist mA,C ∦ AB. Wir zeigen indirekt mA,B k mA,C und damit die Behauptung AB ∦ mA,B : Angenommen, mA,C ∩ mA,B = {D}. Für kollineare Punkte A, C, D, also D ∈ (AC = AB), gilt die Behauptung AB ∦ mA,B . Für nicht kollineare Punkte A, C, D bilden diese Punkte zusammen mit E := ϕB (D) das Parallelogramm (A, D, C, E). ⇒ {A, E} ≡ {C, D} ≡ {A, D} ≡ {B, D} ≡ {B, E} (Begründung für ≡ von links nach rechts: Parallelogramm; D ∈ mA,C ; D ∈ mA,B ; Definition von ϕB ) ⇒ E ∈ mA,B ⇒ mA,B = mA,C , Widerspruch. Wir notieren einige interessante Konsequenzen aus diesem Satz: Korollar 1 Zu je zwei Punkten A, B gibt es genau eine Punktspiegelung ϕ mit ϕ(A) = B Beweis: Für A = B ist ϕ = ϕA , für A 6= B ist ϕ = ϕM mit M = AB ∩ mA,B . Auf Grund des Korollars können wir jetzt die Mitte einer Strecke definieren: Def 7.3 Sei {A, B} ∈ P2 . M ∈ P heißt Mitte der Strecke {A, B} : ⇐⇒ ϕM (A) = B Korollar 2 Sei (A, B, C, D) ein Parallelogramm, dann ist AC ∩ BD Mitte von {A, C} und {B, D}. Beweis: Sei E die Mitte von {A, C}, dann ist (A, B, C, ϕE (B)) ein Parallelogramm, das mit dem Parallelogramm (A, B, C, D) übereinstimmen muss, also D = ϕE (B) ⇒ E ist auch Mitte von {B, D}. Korollar 3 Jede Kollineation α ist mittentreu: Die Mitte von {A, B} wird auf die Mitte von {α(A), α(B)} abgebildet. Beweis: Sei (A, U, B, V ) ein Parallelogramm mit Mitte M = AB ∩ U V . Jede Kollineation bildet Parallelogramme auf Parallelogramme ab, also ist (α(A), α(U ), α(B), α(V )) ein Parallelogramm mit Mitte α(A)α(B) ∩ α(U )α(V ) = α(M ). Mit dem nächsten Satz stellen wir einen wichtigen Zusammenhang zwischen Punktspiegelungen und Translationen her. 7 Bewegungen Teil 1: Punktspiegelungen 185 Satz 7.3 Seien ϕA und ϕB Punktspiegelungen in einer normalen euklidischen Ebene. Dann ist a) ϕA ◦ ϕB eine Translation. Im Fall A = B ist ϕA ◦ ϕB die identische Abbildung, im Fall A 6= B liegt eine Translation in Richtung AB vor. b) jede Translation die Verkettung zweier Punktspiegelungen. Beweis: a) Die Behauptung gilt für A = B, weil jede Punktspiegelung selbstinvers ist (Beh. 4 von Satz 7.1). Für A 6= B ist ϕA ◦ ϕB eine Dilatation (Begründung: Punktspiegelungen sind Streckungen, Streckungen sind Dilatationen, Dilatationen bilden eine Gruppe). Beh. : ϕA ◦ ϕB hat keinen Fixpunkt. Bew. : Angenommen, (ϕA ◦ ϕB )(X) = X. Aus ϕ2A = id folgt ϕB (X) = ϕ2A (ϕB (X)) = ϕA ((ϕA ϕB )(X)) = ϕA (X) Aus Korollar 1 folgt ϕB = ϕA und daraus der Widerspruch A = B. Weil Dilatationen ohne Fixpunkt Translationen sind, ist ϕA ◦ ϕB als Translation nachgewiesen. Wegen (ϕA ϕB )(B) = ϕA (B) ∈ AB ist AB die gesuchte Translationsrichtung. b) Sei τ eine Translation, sei X ∈ P beliebig. Für τ = id ist τ = ϕX ◦ ϕX , für τ 6= id ist {X, τ (X)} ∈ P2 . Nach Korollar 1 existiert eine Punktspiegelung ϕM mit ϕM (X) = τ (X). Beh. : τ = ϕM ◦ ϕX Bew. : Wie in a) bewiesen, ist ϕM ◦ ϕX eine Translation. Wegen (ϕM ◦ ϕX )(X) = τ (X) stimmen diese Translationen nach Satz 5.5 überein. Damit haben wir gezeigt, dass Translationen ebenfalls Bewegungen sind, und dass man in normalen euklidischen Ebenen zu zwei Punkten A, B immer eine Translation findet, die A in B überführt: Korollar Translationen sind Bewegungen. Jede normale euklidische Ebene ist eine Translationsebene. Verkettet man zwei Punktspiegelungen, erhält man eine Translation. Was passiert, wenn drei Punktspiegelungen hintereinander ausgeführt werden? Satz 7.4 Seien A, B, C ∈ P beliebig. a) ϕA ◦ ϕB ◦ ϕC ist eine Punktspiegelung b) ϕA ◦ ϕB ◦ ϕC = ϕC ◦ ϕB ◦ ϕA c) Liegen A, B, C nicht kollinear, ist (A, B, C, D) ein Parallelogramm mit ϕA ◦ ϕB ◦ ϕC = ϕD . Beweis: a) Wir vergleichen die Punkte C und ϕA ϕB (C). Im Fall C = ϕA ϕB (C) folgt ϕA = ϕB . Damit ist A = B ⇒ ϕA ϕB ϕC = ϕC . Im Fall C 6= ϕA ϕB (C) sei D die Mitte von {C, ϕA ϕB (C)}, also ϕD (C) = ϕA ϕB (C). Wegen C = ϕC (C) folgt ϕA ϕB (C) = ϕD (C) = ϕD ϕC (C). Nach Satz 7.3 sind ϕA ϕB und ϕD ϕC Translationen, die nach Satz 5.5 übereinstimmen: ϕA ϕB = ϕD ϕC ⇐⇒ ϕA ϕB ϕ−1 C = ϕD ⇐⇒ ϕA ϕB ϕC = ϕD −1 −1 b) Weil jede Punktspiegelung selbstinvers ist, folgt ϕA ϕB ϕC = (ϕA ϕB ϕC )−1 = ϕ−1 C ϕB ϕA = ϕ C ϕB ϕ A . 186 6 GEOMETRIE c) A, B, C nicht kollinear ⇒ A 6= B ⇒ ϕA ϕB Translation in Richtung AB. Wegen ϕA ϕB = ϕD ϕC ist auch ϕD ϕC eine Translation in gleicher Richtung, es folgt AB k CD. Analog folgt aus ϕB ϕC = ϕA ϕD die Parallelität von BC und AD. C ..r..............................................................r ..............................................................r Frage : Welcher der in der Zeichnung nicht benannten Punkte ist D mit ϕD = ϕA ◦ϕB ◦ϕC ? Welche Bedeutung haben die beiden anderen Punkte? ... ... .. ... ... ... ... ... ... ..... ... ... ... ... ... ... ... ... ... . . . . . . ... ... . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . . . . . ... .. ... ... ... .... . . ....................................................................... . ... ... ... . . . ... ... ... ... ... . . ... ... ... ... ... ... ... ... ... ..... ... ... ..... A r r B r 8 Orthogonalität Nachdem wir im vorherigen Paragraphen den Begriff Mitte geklärt haben, wenden wir uns jetzt der zweiten Worthälfte von Mittelsenkrechte zu. Wir befinden uns weiterhin in normalen euklidischen Ebenen. Def 8.1 Eine Gerade g heißt orthogonal oder senkrecht zu einer Geraden h, geschrieben g ⊥ h, : ⇐⇒ h = mA,B mit geeigneten Punkten A, B ∈ g. Man beachte, dass wir zur Definition von orthogonal keine Winkel benutzt haben! Beispiel : In der Anschauungsebene ist g0 ⊥ g0,1 ; denn wegen A = (0, 0) und B = (0, 2) ∈ g0 gilt mA,B = g0,1 . Frage : Gilt auch g0,1 ⊥ g0 ? Die Antwort auf die letzte Frage lässt sich verallgemeinern: Satz 8.1 Seien g und h Geraden einer normalen euklidischen Ebene. Dann gilt g ⊥ h ⇐⇒ h ⊥ g. Beweis: Es ist nur ⇒“ zu zeigen: Gesucht sind X, Y ∈ h mit g = mX,Y . ” Aus der Voraussetzung g ⊥ h folgt die Existenz zweier Punkte A, B ∈ g mit h = mA,B . Nach Satz 7.2 ist mA,B ∦ (AB = g), sei M = g ∩ h. Auf jeder Geraden liegen mindestens zwei Punkte, sei C ∈ h ein weiterer Punkt. Wir nutzen verschiedene Eigenschaften der Punktspiegelung ϕM und die Distanztreue der Relation ≡ aus: {A, ϕM (C)} = {ϕM (B), ϕM (C)} ≡ {B, C} ≡ {A, C} ≡ {ϕM (A), ϕM (C)} = {B, ϕM (C)} A und B liegen auf mC,ϕM (C) , dies bedeutet (AB = g) = mC,ϕM (C) . Wegen C, ϕM (C) ∈ h sind X = C und Y = ϕM (C) die gesuchten Punkte! Wir haben soeben bewiesen, dass die Relation ⊥ symmetrisch auf der Menge der Geraden ist. Ob sie auch reflexiv und transitiv ist, werden wir eventuell in den Übungen untersuchen. Auf Grund von Satz 6.2 wissen wir, dass jede Bewegung (dort Isomorphismus genannt) Mittelsenkrechte auf Mittelsenkrechte, Kreise auf Kreise und Parallelogramme auf Parallelogramme abbildet. Jetzt lernen wir eine weitere Eigenschaft dieser gutartigen“ Abbildungen kennen: ” Satz 8.2 Bewegungen erhalten Orthogonalität. 8 Orthogonalität 187 Beweis: Sei α eine Bewegung und sei g ⊥ h. Nach Definition ist h = mA,B mit geeigneten Punkten A, B ∈ g. Es folgt α(A), α(B) ∈ α(g), ferner ist nach Satz 6.2 mα(A),α(B) = α(mA,B ) = α(h), womit die Behauptung α(g) ⊥ α(h) bewiesen ist. Wir vergleichen k und ⊥; bekanntlich ist g ⊥ h ⇒ g ∦ h (warum?). Satz 8.3 Seien g, h, h0 ∈ G, g ⊥ h. Dann gilt h k h0 ⇐⇒ g ⊥ h0 . Beweis: ⇒“: Sei M = g ∩ h, aus h0 k h ∦ g folgt g ∩ h0 = M 0 . Weil für M = M 0 wegen h = h0 nichts ” mehr zu zeigen ist, können wir von M 6= M 0 ausgehen. Jede normale euklidische Ebene ist eine Translationsebene (Korollar zu Satz 7.3). Also gibt es eine Translation τ mit τ (M ) = M 0 . Weil τ gleichzeitig eine Bewegung ist, folgt aus Satz 8.2 τ (g) ⊥ τ (h). Hierbei ist τ (g) = τ (M M 0 ) = g und τ (h) = (τ (M ), h) = h0 , was zu zeigen war. ⇐“: Zu zeigen ist g ⊥ h, g ⊥ h0 ⇒ h k h0 . Erneut sei M = g ∩ h. Wir setzen k := (M, h0 ). Wegen k k h0 ” folgt aus der vorher bewiesenen Richtung ⇒“ g ⊥ k. Zu zeigen ist somit k = h. ” Sei A ∈ g\{M }. Wir bilden ϕM (A) ∈ g und stellen fest: Wegen g ⊥ h ist h = mA,ϕ(A) , wegen g ⊥ k ist k = mA,ϕ(A) , also gilt h = k. Alle zu einer Geraden orthogonale Geraden liegen demnach in einem Parallelbüschel. Etwas allgemeiner gilt sogar Korollar Seien g, g 0 , h, h0 ∈ G, g ⊥ h, g k g 0 . Dann ist h k h0 ⇐⇒ g 0 ⊥ h0 . Den einfachen kurzen Beweis möge man als Übung selbst erledigen. Jetzt können wir uns mit einigen elementaren geometrischen Begriffen beschäftigen, die in der Schule aus der Anschauungsebene bekannt sein sollten. Satz 8.4 (Fällen von Loten) In jeder normalen euklidischen Ebene kann zu jeder Geraden durch jeden Punkt das Lot gefällt werden: ∀g ∈ G, ∀P ∈ P ∃1 l ∈ G : P ∈ l ∧ l ⊥ g Beweis: Zu A, B ∈ g, A 6= B, existiert stets die Mittelsenkrechte mA,B ⊥ g, die Gerade l := (P, mA,B ) ist wegen Satz 8.3 das gesuchte Lot. Frage : Wie konstruiert man Lote in der Anschauungsebene? Das Lot l durch A zu einer Geraden g schreiben wir auch l = (A ⊥ g). Im Folgenden werden drei nicht kollineare Punkte A, B, C als Dreieck ABC bezeichnet. Satz 8.5 (Umkreis eines Dreiecks) In jedem Dreieck ABC schneiden sich die Mittelsenkrechten mA,B , mA,C , mB,C in einem Punkt M . M ist der Mittelpunkt des Umkreises k von ABC, d.h., k = kM (A) = kM (B) = kM (C). Beweis: Aus AB ⊥ mA,B , AC ⊥ mA,C und AB ∦ AC folgt aus dem letzten Korollar die Existenz von M := mA,B ∩ mA,C . ⇒ {B, M } ≡ {A, M } ≡ {C, M } ⇒ M ∈ mB,C und A, B, C ∈ kM (A) ∩ kM (B) ∩ kM (C). 188 6 GEOMETRIE Def 8.2 In jedem Dreieck ABC heißt das Lot hA := (A ⊥ BC) die Höhe auf BC durch A. Analog sind hB = (B ⊥ AC) und hC = (C ⊥ AB) die anderen Höhen des Dreiecks ABC. Satz 8.6 (Höhenschnittpunkt eines Dreiecks) In jedem Dreieck ABC schneiden sich die Höhen hA , hB , hC in einem Punkt H. Beweis: Wir ergänzen ABC zu Parallelogrammen (A, B, C, B 0 ), (C, A, B, A0 ), (B, C, A, C 0 ) und erhalten {A, B 0 } {A0 , C} {A, C 0 }, ≡ {B, C} ≡ ≡ {A, B} ≡ {B 0 , C}. {B, C 0 } ≡ {A, C} ≡ 0 B 0..r..............................................................C r..............................................................A r ... . ..... ... ... ... ... ... ... ... ..... ... ... ... ... ... . . ... . . ... .. .. ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . ... . . ... ... ... .... .. ... ... .... ....................................................................... ... ... . ... . .. ... ... ... ... ... ... ... ... . ... . ... ... ... ... ... ..... ... ... ..... {A0 , B}, A r Damit ist A ∈ mB 0 ,C 0 , B ∈ mA0 ,C 0 , C ∈ mA0 ,B 0 . Wegen hA ⊥ BC und BC k B 0 C 0 ist hA ⊥ B 0 C 0 ⇒ hA = mB 0 ,C 0 . rB r Weil analog hB = mA0 ,C 0 und hC = mA0 ,B 0 gilt, folgt die Behauptung aus Satz 8.5. C0 Satz 8.7 In einem Dreieck ABC sei M die Mitte von {A, B} und M 0 die Mitte von {A, C}. Dann ist M M 0 k BC. Beweis: Es ist A = ϕM (B), C = ϕM 0 (A), wegen B 6= C ist M 6= M 0 . Nach Satz 7.3 ist ϕM 0 ◦ ϕM eine Translation τ in Richtung M M 0 . Wegen τ (B) = ϕM 0 (ϕM (B)) = ϕM 0 (A) = C ist BC = Bτ (B) k M M 0 . Def 8.3 Sei M die Mitte von {A, B}. Dann heißt kM (A) = kM (B) Thaleskreis über AB, geschrieben k(A, B). Aus der Schulzeit erinnert man sich vielleicht noch, dass der Thaleskreis etwas mit rechten Winkeln zu tun hat. Wir haben in dieser Vorlesung zwar bisher keine Winkel eingeführt, wissen aber, was senkrecht bedeutet. Satz 8.8 Sei X 6= A, B ∈ P. Dann gilt X ∈ k(A, B) ⇐⇒ AX ⊥ BX Beweis: Für X 6= A sei U die Mitte von {A, X}. Wenn wir die Mitte von {A, B} mit M bezeichnen, ist nach Definition des Thaleskreis k(A, B) = kM (A). Damit ist X ∈ k(A, B) ⇐⇒ {A, M } ≡ {X, M } ⇐⇒ U M = mA,X ⇒“: Weil ABX ein Dreieck mit Mitten M und U ist, folgt aus ” Satz 8.7 U M k BX. Aus Satz 8.3 folgt dann AX ⊥ BX. ⇐“: Sei AX ⊥ BX. Erneut ergibt Satz 8.7 ” AX ⊥ U M , d.h. U M = mA,X . X r ........................................ ....... ............ ...... ... ........... ...... ...... ..... ..... . ..... . . . ...... .. . .... ...... .... ... ... ...... ... .... ... . ...... ... .. ............. . . . ...... ... .. .... ......... ...... . . ...... ...... .... ..... ...... ...... ..... ...... ...... .. ........ .................................................................................................................................................................. ... .. ... ... ... .. ... .. . . ... . ... ... ... ... ..... .... ..... .... . . . ...... . . ... ....... ....... ........... .............................. r r U A r M r B U M k BX, zusammen mit Satz 8.3 erhalten wir diesmal 9 9 Bewegungen Teil 2: Spiegelungen und Drehungen 189 Bewegungen Teil 2: Spiegelungen und Drehungen Im vorletzten Paragraphen hatten wir uns das erste Mal mit Bewegungen beschäftigt, dort standen Punktspiegelungen im Zentrum unseres Interesses. Jetzt wollen wir auf ähnliche Weise Geradenspiegelungen untersuchen. Wir werden feststellen, dass diese Abbildungen die elementaren Bausteine sind, aus denen alle Bewegungen zusammengesetzt sind. Def 9.1 Sei g ∈ G, P ∈ P und h = (P ⊥ g). Der Schnittpunkt FP := g ∩ h heißt Lotfußpunkt. Mit Hilfe von Punktspiegelungen an Lotfußpunkten werden wir Geradenspiegelungen definieren: Def 9.2 Sei g ∈ G. Die Abbildung g̃ : P → P X 7→ ϕFX (X) heißt Geradenspiegelung an g Geradenspiegelungen ordnen jedem Punkt X das Bild unter der Punktspiegelung an dem jeweiligen Lotfußpunkt zu. Man beachte, dass g̃ nichts mit den Knickgeraden der Moultonebene zu tun hat! rP r FP r g̃(Q) r FQ ........................................................................................................................................................................................................................................................... r g̃(P ) g rQ Im folgenden Satz werden die wichtigsten Eigenschaften von Geradenspiegelungen zusammengestellt. Satz 9.1 Für jede Geradenspiegelung g̃ gilt (1) g̃ ist bijektiv und involutorisch (2) g̃ ist eine Bewegung und damit distanztreu (3) g = mP,g̃(P ) ∀P ∈ P\g (4) g = mA,B ⇐⇒ g̃(A) = B (5) Die Menge aller Fixpunkte ist g, also Fix g̃ := {X ∈ P | g̃(X) = X} = g (6) Die Menge aller Fixgeraden ist {g} ∪ {h ∈ G | h ⊥ g} Beweis: Wir zeigen nur die Distanztreue {A, B} ≡ {g̃(A), g̃(B)} für alle {A, B} ∈ P2 , alle anderen Behauptungen sind mehr oder weniger direkt einsichtig. Hierzu untersuchen wir zwei Fälle: 1. Fall: {A, B}∩g 6= ∅: Liegen beide Punkte auf g, ist wegen {A, B} = {g̃(A), g̃(B)} nichts mehr zu zeigen. Sei oBdA A ∈ g und B 6∈ g. Weil A ∈ mB,g̃(B) folgt auch in diesem Fall sofort {A, B} ≡ {g̃(A), g̃(B)}. 2. Fall: {A, B} ∩ g = ∅: Falls AB ⊥ g, stimmen die Lotfußpunkte FA und FB überein, die Behauptung folgt aus Satz 7.1 über Punktspiegelungen (g̃ stimmt auf A und B mit einer Punktspiegelung überein). Interessant ist lediglich der andere Fall AB 6⊥ g. Wir benötigen die weiteren Punkte C := BFB ∩(FA , AB) und E := AFA ∩ (g̃(B), FA g̃(C)). 190 6 GEOMETRIE ... ... .. ... ... ... ............................................................................................................................................................................................................................................................................... ...... . .. ...... . . . . . . ...... ...... .. ...... ........... ....... .......... . .... .......... .... ...................... ...... ...... .. ...... ...... . . . . . ...... ........... . ...... ...... .. ...... ...... ...... .. ....... ...... ...... ...... .... ........... ...... ...... ...... ...... .. ...... ...... ...... ...... . . . . . . . ...... . . . . . ...... . .... .... ...... . . . . . . . . . . . . . . . . ...... ...... . .... .... . . . . . . ...... . . . . . . . . . ...... . ...... .... .... . . . . . . . . . . . . . . . ...... ...... . .... .... . . . . . . . . . . . . . . . . ................................................................................................................................................................................................................................................................. .. ... .. .... ... ... ... . Ar r r FA E r r r g̃(C) g̃(B) FB g r r B C Weil (A, B, C, FA ) und (FA , g̃(C), g̃(B), E) Parallelogramme sind, folgen {A, B} ≡ {FA , C} ≡ {FA , g̃(C)} ≡ {E, g̃(B)} (∗) {A, FA } ≡ {B, C} ≡ {g̃(B), g̃(C)} ≡ {E, FA } (∗∗) und (beachte BC ⊥ g) Es ist A 6= E, da sonst wegen (∗) {A, B} ≡ {A, g̃(B)} und A ∈ mB,g̃(B) = g folgt, ein Widerspruch zur Voraussetzung A 6∈ g. Damit ist wegen (∗∗) g̃(A) = E, sodass in (∗) die Behauptung {A, B} ≡ {g̃(A), g̃(B)} steht. Für jede Bewegung ϕ und Gerade g ist ϕ(g) ebenfalls eine Gerade. Der nächste Satz untersucht, in g (Geradenspiegelung an ϕ(g)) steht. welchem Verhältnis g̃ (Geradenspiegelung an g) zu ϕ(g) g = ϕ g̃ ϕ−1 ϕ(g) Satz 9.2 Sei ϕ eine Bewegung. Dann gilt für jede Gerade g Beweis: Für X ∈ P\g ist g = mX,g̃(X) , also ϕ(g) = ϕ(mX,g̃(X) ) = mϕ(X),ϕ(g̃(X)) . Dies bedeutet, dass die Geradenspiegelung an ϕ(g) den Punkt ϕ(X) auf ϕ(g̃(X)) abbildet: ⇐⇒ g ϕ(g)(ϕ(X)) = ϕ(g̃(X)) g ◦ ϕ (X) = (ϕ ◦ g̃) (X) ϕ(g) Für X ∈ g ist ϕ(X) ∈ ϕ(g) und g̃(X) = X, also ebenfalls ϕ(g̃(X)) = (ϕ ◦ g̃) (X). Insgesamt folgt g ◦ ϕ = ϕ ◦ g̃ ϕ(g) ⇐⇒ g ◦ ϕ (X) = ϕ(g)(ϕ(X)) g ϕ(g) = ϕ(X) = g = ϕ g̃ ϕ−1 ϕ(g) Mathematiker drücken diesen Sachverhalt gerne durch ein Diagramm aus: P g ϕ(g) - P 6 ϕ−1 ϕ ? P g̃ - P Weil es egal ist, auf welchem Weg man von oben links nach oben rechts gelangt, spricht man von einem kommutativen Diagramm. 9 Bewegungen Teil 2: Spiegelungen und Drehungen 191 In der Anschauungsebene sei τ die Translation (x, y) 7→ (x − 2, y). Was passiert mit dem ^ Wanderer unter der Abbildung τ (g 1,−1 )? Beispiel : ........ .... ... ... ... ... ... ... . ........ .... ... . ... ........... ... ............ ............ ..... ... .... ... . ... .... ... ... .... ... ... ... ......... ... . ..... ................................................................................................................................................................................................................................................................................................... .. ... .. .... ... ... . 1 d 1 Im Beweis des nächsten Satzes benötigen wir die aus der Anschauungsebene wohlbekannte Tatsache, dass zwei verschiedene Kreise nicht mehr als zwei Punkte gemeinsam haben. Satz 9.3 Jede Bewegung α mit mindestens zwei Fixpunkten ist entweder eine Geradenspiegelung oder die Identität. Beweis: α habe die Fixpunkte {A, B} ∈ P2 . Für X ∈ P\{A, B} ist {A, X} ≡ {α(A), α(X)} ≡ {A, α(X)} und {B, X} ≡ {B, α(X)}. Da für g = AB auch {A, X} ≡ {A, g̃(X)} und {B, X} ≡ {B, g̃(X)} gilt, folgt {X, α(X), g̃(X)} ∈ kA (X) ∩ kB (X). Wegen |kA (X) ∩ kB (X)| ≤ 2 sind zwei Fälle möglich: 1. Fall |kA (X) ∩ kB (X)| = |{X, α(X), g̃(X)}| = 1 ⇒ 2. Fall |kA (X) ∩ kB (X)| = 2, also {X, α(X), g̃(X)} = {X, Y } ∈ P2 . Wegen {A, X} ≡ {A, Y } und {B, X} ≡ {B, Y } folgt A, B ∈ mX,Y . Damit ist AB = g = mX,Y und X 6∈ g ⇒ g̃(X) 6= X ⇒ Y = g̃(X) und α(X) ∈ {X, g̃(X)} = kA (X) ∩ kB (X). α(X) = g̃(X) = X. ............................. ........... ....... ....... ...... ............................... ...... ....... ..... ............... ..... ..... . . . ...... . ..... . ..... ....... . ... .... . . . ... . .. ... . . . . ... ... ... ... . . . ... ... .. . .... ... ... ... ... ... .... .. . .. ... . ................................................................................................................................................................................................................ ... ... .. .. . ... ... . .. . . . . ... ... ... ... ... ... .. ... ... ... .. ... ... ... ..... ..... .... ... . . . . . . . ..... ....... ..... ..... ..... .............. ...... ...... ................................. ...... ....... ....... ........... .............................. X s s s A B g s Y Beh. : Für alle Punkte P gilt α(P ) = P (also α = id) oder für alle Punkte P gilt α(P ) = g̃(P ) (also α = g̃). Bew. : Angenommen, es gibt U, V ∈ P mit α(U ) = U 6= g̃(U ) und α(V ) = g̃(V ) 6= V . ⇒ {U, V } ≡ {α(U ), α(V )} = {U, g̃(V )} ⇒ U ∈ mV,g̃(V ) = g, ein Widerspruch zu U 6= g̃(U ). In Satz 7.3 wurde gezeigt, dass die Verkettung zweier Punktspiegelungen stets eine Translation ergibt. Bei zwei Geradenspiegelungen hängt das Ergebnis davon ab, ob die Geraden parallel sind oder nicht. Satz 9.4 Für {g, h} ∈ G2 gilt (1) Fix (g̃ ◦ h̃) = g ∩ h (Es gibt höchstens einen Fixpunkt) (2) g k h ⇒ g̃ ◦ h̃ ist eine Translation 6= id in senkrechter Richtung zu g. ⊆“: U ∈ Fix (g̃ ◦ h̃) ⇐⇒ U = (g̃ ◦ h̃)(U ) ⇐⇒ g̃(U ) = h̃(U ) ” Zu zeigen ist U ∈ g ∩ h, dies geschieht indirekt: Beweis: (1) (g̃ ist selbstinvers.) 192 6 GEOMETRIE U 6∈ g ⇒ U 6= g̃(U ) = h̃(U ) ⇒ g = mU,g̃(U ) = mU,h̃(U ) = h, aber nach Voraussetzung ist g 6= h. U 6∈ h widerlegt man völlig analog. ⊇“: U ∈ g ∩ h ⇒ (g̃ ◦ h̃)(U ) = g̃(U ) = U ⇒ U ∈ Fix (g̃ ◦ h̃) ” (2) Wegen g ∩ h = ∅ kann g̃ ◦ h̃ nach (1) keinen Fixpunkt haben. (∗) Wir zeigen (g̃ ◦ h̃)(l) k l ∀l ∈ G. (Dann ist g̃ ◦ h̃ eine Translation.) Für l ⊥ g (und damit l ⊥ h) ist l nach Satz 9.1 (6) eine Fixgerade unter g̃ und h̃, also gilt l = (g̃ ◦ h̃)(l). Für l 6⊥ g folgt l k (g̃ ◦ h̃)(l) indirekt: Sonst ∃1 A ∈ l ∩ (g̃ ◦ h̃)(l). Weil k := (A ⊥ g) eine Fixgerade unter g̃ und h̃ ist (siehe erneut Satz 9.1 (6)), folgt (g̃ ◦ h̃)(A) ∈ k ∩ (g̃ ◦ h̃)(l). Weil k ∦ (g̃ ◦ h̃)(l) (sonst (g̃ ◦ h̃)(l) = k ⊥ g ⇒ l ⊥ g) ist A Fixpunkt, ein Widerspruch zu (∗). g̃ ◦ h̃ ist eine Translation ohne Fixpunkt, die senkrechte Richtung folgt aus den Überlegungen zum Fall l ⊥ g von oben. Satz 9.5 Sei τ 6= id eine Translation in Richtung f , sei g ⊥ f . Dann gilt (1) ∃1 h ∈ G, h k g mit τ = h̃ ◦ g̃ (2) ∃1 k ∈ G, k k g mit τ = g̃ ◦ k̃ Beweis: (1): Nach alten Sätzen existiert A := g ∩ f . Für h := mA,τ (A) ist g k h und damit h̃ ◦ g̃ eine Translation in Richtung f mit (h̃ ◦ g̃)(A) = h̃(A) = τ (A). g = g̃ h̃ g̃ ⇐⇒ g̃ k̃ = h̃ g̃ = τ (2): Für k := g̃(h) ist nach Satz 9.2 k̃ = g̃(h) Frage : Wie findet man zu g k h die Gerade k mit g̃ h̃ k̃ = h̃? Für g ∦ h besitzt g̃ h̃ genau einen Fixpunkt und kann deshalb keine Translation sein. Def 9.3 Eine Bewegung heißt Drehung, wenn sie genau einen Fixpunkt besitzt oder die Identität ist. Die aus der Schule bekannten Drehungen sind Beispiele für Drehungen im Sinne dieser Definition, ferner handelt es sich bei den in beliebigen normalen euklidischen Ebenen untersuchten Punktspiegelungen um spezielle Drehungen. Der Fixpunkt einer Drehung 6= id heißt Drehzentrum. Analog zum letzten Satz gilt für Drehungen Satz 9.6 Sei δ 6= id eine Drehung mit Drehzentrum D, sei g ∈ G mit D ∈ g. Dann gilt (1) ∃1 h ∈ G, D ∈ h mit δ = h̃ ◦ g̃ (2) ∃1 k ∈ G, D ∈ k mit δ = g̃ ◦ k̃ Beweis zur Existenz der gesuchten Geraden (der Rest ist einfach) (1): Für A ∈ g\{D}, also A 6= δ(A), existiert die Mittelsenkrechte h := mA,δ(A) . Weil {A, D} ≡ {δ(A), δ(D)} = {δ(A), D} ist D ∈ h und h 6= g. Die Bewegung h̃ δ 6= id hat zwei Fixpunkte A und D: (h̃ δ)(A) = h̃(δ(A)) = A (denn h ist entsprechende Mittelsenkrechte) 9 Bewegungen Teil 2: Spiegelungen und Drehungen (h̃ δ)(D) = h̃(δ(D)) = h̃(D) = D 193 (warum?) Nach Satz 9.3 ist h̃ δ eine Geradenspiegelung, wegen AD = g muss gelten h̃ δ = g̃ ⇐⇒ δ = h̃ g̃. g = g̃ h̃ g̃ = g̃ δ ⇐⇒ g̃ k̃ = δ. (2) Für k := g̃(h) ist nach Satz 9.2 k̃ = g̃(h) Jede Translation und jede Drehung besteht aus je zwei Geradenspiegelungen. Wir sehen uns das noch einmal an einigen Beispielen in der Anschauungsebene an: 1) Frage : Wie findet man Geradenspiegelungen zu einer Translation τ , die durch ein Punktepaar A, B mit B = τ (A) gegeben ist? .. .. Antwort : Für A = B ist τ = g̃ g̃ = id mit beliebigem g ∈ G; für A 6= B wählen wir eine beliebige Gerade g ⊥ AB. Sei P := g ∩ AB. Mit Hilfe eines weiteren Punktes Q ∈ g ist τ (P ) = AB ∩ ((Q, AB) ∩ (B, AQ), P Q) (warum?). Für h := mP,τ (P ) und k := g̃(h) ist τ = h̃ g̃ = g̃ k̃. .. .. .. .. .................................................................................................................................................................. . .... ..... .... .... ..... ... .... ... ... .... ... .... ... ... .... ... . . ... . . ... ... ... .... .... ... ... ... ... ... ... ... .. . . . . . . . . ......................................................................................................................................................................................................... .. .. ... ... ... ... ... ... ... ... ... ... ... ... r r Q r r P r A g r τ (P ) B h 2) Frage : Wie findet man Geradenspiegelungen zu einer Translation τ , die durch τ : (x, y) 7→ (x + 2, y) gegeben ist? Antwort : Wir gehen wie in 1) vor. Weil τ eine Translation in Richtung g0,0 ist, wählen wir beispielsweise g = g0 . Wegen τ (g0 ∩g0,0 ) = (2, 0) ist h = g1 ⇒ (h̃ g̃)((x, y)) = g̃1 (g̃0 ((x, y))) = g̃1 ((−x, y)) = (x+2, y) = τ ((x, y)). Zusatzfrage : Für welche k ∈ G ist τ = g̃0 k̃? Antwort : k̃ = g̃(h) = g̃0 (g1 ) = g−1 . 3) Frage : Wie findet man Geradenspiegelungen zu einer Drehung δ mit Zentrum D = (0, 0), die durch δ(A) = (0, 1) für A = (1, 0) gegeben ist? Antwort : Man wähle beispielsweise die Gerade DA = g0,0 . Für h = mA,δ(A) = g1,0 ist δ = h̃ g̃ = gg g 1,0 g 0,0 , also δ((x, y)) = gg ((x, −y)) = (−y, x). 1,0 Man kommt auch mit anderen Geraden zum Ziel, beispielsweise setze g = g0 mit (0, 1) ∈ g0 . Wegen δ((0, 1)) = (−1, 0) ist δ = g] −1,0 ge0 ; denn m(0,1),(−1,0) = g−1,0 . g̃ h̃ ist für parallele Geraden eine Translation und sonst eine Drehung. Im nächsten sogenannten Dreispiegelungssatz wird untersucht, wie sich die zugehörigen Geradenspiegelungen im Fall dreier Geraden verhalten, die im Büschel liegen, für die also g k h k k oder g ∩ h ∩ k = P gilt. Satz 9.7 Seien g, h, k ∈ G. Dann gilt (1) g, h, k liegen im Büschel ⇒ g̃ h̃ k̃ ist eine Geradenspiegelung. (2) g̃ h̃ k̃ = ˜l ⇒ g, h, k, l liegen im Büschel. Beweis: (1) Wir unterscheiden die Fälle g k h und g ∦ h: 1. Fall g k h: Ist g = h, liegen g, h, k stets im Büschel und es ist g̃ h̃ k̃ = k̃. Ist g ∩ h = ∅, folgt aus Satz 9.3, dass g̃ h̃ eine Translation τ 6= id in senkrechter Richtung zu g ist. Aus der Voraussetzung im Büschel liegen folgt g k k, damit ist die Richtung von τ senkrecht zu k. Diese Konstellation wenden wir auf Satz 9.5 (1) an: ∃1 l ∈ G, l k k mit τ = ˜l k̃. Der Rest ist Kinderspiel: g̃ h̃ = τ = ˜l k̃ ⇒ g̃ h̃ k̃ = ˜l. 194 6 GEOMETRIE 2. Fall g ∩ h = D: Jetzt handelt es sich bei g̃ h̃ um eine Drehung δ, aus der Büschel–Voraussetzung folgt D ∈ k. Wir argumentierenanalog zum ersten Fall mit Satz 9.6 (1): Sei δ 6= id eine Drehung mit Zentrum D und D ∈ k. Dann gibt es genau eine Gerade l mit D ∈ l und δ = ˜l k̃ ⇒ g̃ h̃ k̃ = ˜l. (2) beweisen wir an dieser Stelle nicht und erhalten uns so die Möglichkeit einer Übungsaufgabe. Wir sind (fast) am Ende unserer Überlegungen über Bewegungen angelangt und wiederholen: Bewegungen sind längentreue Kollineationen, sie bilden bezüglich der Verkettung eine Gruppe. Jede Bewegung 6= id mit mehr als einem Fixpunkt ist eine Geradenspiegelung. Jede Bewegung mit genau einem Fixpunkt ist eine Drehung und deshalb als Verkettung zweier Geradenspiegelungen darstellbar. Was wissen wir über Bewegungen ohne Fixpunkt? Es können Translationen sein, die ebenfalls eine Verkettung zweier Geradenspiegelungen sind. Im nächsten Beispiel werden wir sehen, dass es aber auch Bewegungen ohne Fixpunkt gibt, die keine Translationen sind. Beispiel : Seien in der Anschauungsebene die Geraden g0 , g0,0 und g−1,1 gegeben. Um welche Abbildung handelt es sich bei ge0 g] g −1,1 g 0,0 ? ge0 g] g −1,1 g 0,0 : (x, y) 7→ (??, ??) ge0 und gg g 0,0 sind leicht zu durchschauen, es ist ge0 : (x, y) 7→ (−x, y) und g 0,0 : (x, y) 7→ (x, −y). Um g] −1,1 in den Griff zu bekommen, wenden wir die gleiche Idee wie bei der Darstellung von Streckungen an (siehe Ende von Paragraph 5). Statt sofort an g−1,1 zu spiegeln, verschieben wir diese Gerade erst in eine Ursprungsgerade, spiegeln an dieser und schieben zurück: −1 g] g] −1,1 = τ −1,0 τ mit τ ((x, y)) = (x − 1, y) und g] −1,0 ((x, y)) = (−y, −x) −1 g] τ g Insgesamt ist ge0 g] g −1,1 g 0,0 = ge0 τ −1,0 g 0,0 , nacheinander folgt (von rechts nach links abgebildet) (x, y) 7→ (x, −y) 7→ (x − 1, −y) 7→ (y, 1 − x) 7→ (y + 1, 1 − x) 7→ (−y − 1, 1 − x) Diese Bewegung hat keine Fixpunkte (warum nicht?), ist aber keine Translation; denn gk wird auf g0,1−k abgebildet. Mit diesem Beispiel einer sogenannten Gleitspiegelung oder Schubspiegelung haben wir die letzte uns bisher unbekannte Bewegungsart kennengelernt, eine Verkettung von drei Geradenspiegelungen, die nicht im Büschel liegen. Wir fassen unser Wissen über Bewegungen in normalen euklidischen Ebenen in einem Satz zusammen, den wir nicht beweisen werden. Satz 9.8 (1) Jede Bewegung besteht aus zwei oder drei Geradenspiegelungen. (2) Die Menge der zweifachen Geradenspiegelungen bildet (mit ◦) die Gruppe der eigentlichen Bewegungen, sie besteht aus Drehungen und Translationen. (3) Die Menge der dreifachen Geradenspiegelungen umfasst die uneigentlichen Bewegungen, sie besteht aus Geradenspiegelungen und Gleitspiegelungen. Bewegungen sind genau die Abbildungen, die in der Anschauungsebene Dreiecke in kongruente Dreiecke überführen, daher heißen sie auch Kongruenzabbildungen. 10 Winkel 195 Frage und Beispiel : In der Anschauungsebene ist α : (x, y) 7→ (y + 1, x + 1) eine Gleitspiegelung. Wo liegen α(Wanderer) und α2 (Wanderer)? Welche drei Geradenspiegelungen ergeben α? ........ .... ... ... ... ... ... . ........ .... .. .. .... ......................... ... ........ . ... . ....... ... ... .... .... .. ... ........ ...... .... ............................................................................................................................................................................................................................................................. .. .... ... ... ... 1 d 1 10 Winkel Wir bleiben in normalen euklidischen Ebenen (P, G, ≡) und wollen einen Winkelbegriff einführen. Zur Beruhigung sei versichert, dass alle Beispiele in diesem Abschnitt aus der Anschauungsebene stammen und es vollkommen ausreicht, wenn man die folgenden Ausführungen im R2 verstanden hat. Def 10.1 Jedes geordnete Paar (g, h) ∈ G×G heißt Winkel mit erstem Schenkel g und zweitem Schenkel h. Im Gegensatz zur Streckendefinition, bei der es nicht auf die Reihenfolge der beiden Punkte ankommt, ist hier die Reihenfolge der Geraden wichtig. (Beachte die unterschiedliche Schreibweise: Strecke als Menge von Punkten, Winkel als geordnetes Tupel). Man spricht deshalb auch von orientierten Winkeln. Für manche Zwecke kann es sinnvoller sein, nichtorientierte Winkel oder aber orientierte oder nichtorientierte Winkel zwischen Halbgeraden (Strahlen) zu untersuchen. Wir beschränken unsere Überlegungen im Folgenden auf Winkel im Sinn von Definition 10.1. Geraden können parallel sein oder nicht. Jedes Paar (g, h) mit g k h, wobei der Fall g = h nicht ausgeschlossen ist, heißt Nullwinkel. Im Fall g ∦ h heißt der Schnittpunkt g ∩ h Scheitel des Winkels (g, h). Wie bei den Strecken wollen wir Winkel lediglich vergleichen, es kommt uns nicht auf die konkrete Größe eines Winkels an. Def 10.2 a) Winkel (g, h) und (k, l), die keine Nullwinkel sind, heißen gleichgroß oder konform, geschrieben (g, h) ∧ (k, l) : ⇐⇒ Es gibt eine eigentliche Bewegung α mit α(g) = k und α(h) = l. b) Alle Nullwinkel sind konform. Nullwinkel können nicht zu anderen Winkeln konform sein. Wie man leicht sieht, ist ∧ eine Äquivalenzrelation auf der Menge der Winkel. Will man überprüfen, ob zwei Winkel (g, h) und (k, l) mit g ∦ h und k ∦ l konform sind, suche man eine eigentliche Bewegung α (Translation oder Drehung), die den Scheitel g ∩ h auf den Scheitel k ∩ l und g auf k abbildet (dies ist immer möglich). Gilt dann α(h) = l, sind die Winkel konform. Die Sonderbehandlung von Nullwinkeln ist leider notwendig, da es beispielsweise keine Bewegung gibt, die in der Anschauungsebene die gleichgroßen“ Nullwinkel (g0 , g1 ) und (g0 , g2 ) ineinander überführt. ” Trotzdem gibt es eine Möglichkeit, mit Hilfe eigentlicher Bewegungen Konformität auch bei Nullwinkel festzustellen. Hierzu nutzen wir die in Satz 9.8 gelernte Tatsache aus, dass jede eigentliche Bewegung aus zwei miteinander verketteten Geradenspiegelungen besteht. 196 6 GEOMETRIE ^ ^ ^ ^ g) ◦ (X, h) = (X, k) ◦ (X, l) Satz 10.1 (g, h) ∧ (k, l) ⇐⇒ ∃X ∈ P : (X, Beweisidee: Im Fall von Nullwinkel ist (g, h) ∧ (k, l) ⇐⇒ g k h und k k l. Für jeden Punkt X gilt demnach ^ ^ ^ ^ ^ ^ ^ ^ (g, h) ∧ (k, l) ⇐⇒ (X, g) = (X, h) und (X, k) = (X, l) ⇐⇒ (X, g) ◦ (X, h) = id = (X, k) ◦ (X, l). ^ ^ Im andern Fall g ∦ h ist (X, g) ∦ (X, h) und damit (X, g) ◦ (X, h) = δ1 eine Drehung. Man zeigt dann, dass die Winkel (g, h) und (k, l) genau dann konform sind, wenn die zugehörigen Drehungen δ1 und ^ ^ δ2 = (X, k) ◦ (X, k) übereinstimmen. Während uns Satz 10.1 im Folgenden hauptsächlich als Hilfsmittel bei Beweisen dienen wird, bilden die nächsten Aussagen wichtige Grundlagen für viele Anwendungen im Geometrieunterricht in der Schule. Satz 10.2 (Abtragbarkeit von Winkel) Sei (g, h) ein Winkel, sei k ∈ G und A ∈ P. Dann gibt es genau eine Gerade l mit A ∈ l und (g, h) ∧ (k, l). Beweisskizze: Für Nullwinkel folgt die Behauptung direkt aus dem Parallelitätsaxiom affiner Ebenen. Für andere Winkel (g, h) mit Scheitel S wähle man eine eigentliche Bewegung α, die g auf k abbildet. l := (A, α(h)) ist die gesuchte Gerade, dies zeigt man mit Hilfe der eigentlichen Bewegung τ ◦ α, wobei τ die Translation ist, die α(S) auf k ∩ l abbildet: (τ ◦ α)(g) = k, (τ ◦ α)(h) = τ (α(h)) = l. h ... ..... ..... ..... . . . . ..... ..... ..... ..... .... . . . . .... ..... ..... ..... ..... . . . . ..... ........................................................................................................... .... .... ..... r S −→ α ..... .. ..... ... ..... ..... .... ..... .. ..... .. ....... ...... ..... ..... ... ...... ..... ..... .... ......... ..... ..... .. ..... ..... .. ..... ....... ..... ...... ..... ... ....... ..... ... ....... ..... ..... ..... ... ..... ..... ..... ... ..... ..... .. ... ..... ... ..... ..... ... ..... ... ..... ..... ... ... ... ... ... α(S) g r rA k = α(g) Satz 10.3 l α(h) (Schenkelaustauschsatz) Seien g, h, k, l ∈ G, dann gilt (g, h) ∧ (k, l) ⇐⇒ (h, g) ∧ (l, k) ⇐⇒ (g, k) ∧ (h, l) ...... ..... ...... .... ...... ..... ...... .. ..... ................................................................................................................................................................................................ ...... ..... ...... ..... ...... ...... ..... .... ...... ...... ......... .. .......... ......... ................ ..... ........... ...... ................ ..... ..... ............................. ..... . . . . ....................... . . .... . . . . . . . . . . . . . . . . ...... .. ......... ...... ....................... ...... ................. ...... ................ ......... ...... ................ ...... .... . . . ...... . ..... Beweis: (Die Zeichnung wird in der Vorlesung beschriftet.) Sei X ∈ P beliebig, sei g 0 := (X, g) und analog h0 := (X, h), k 0 := (X, k), l0 := (X, l). Nach Satz 10.1 gilt (g, h) ∧ (k, l) ⇐⇒ ge0 he0 = ke0 le0 Jede Geradenspiegelung ist involutorisch: −1 −1 −1 −1 ⇐⇒ ge0 = ke0 le0 he0 = ge0 = (ke0 le0 he0 )−1 = he0 le0 ke0 = he0 le0 ke0 ⇒ h0 g 0 = l0 k 0 bzw. g 0 k 0 = h0 l0 Korollar In jedem Parallelogramm (A, B, C, D) sind gegenüberliegende Winkel konform. Beweis: Sei AB = g, CD = h, AD = k und BC = l. Weil alle Nullwinkel konform sind, gilt (g, h) ∧ (k, l) ∧ (h, g). Aus Satz 10.3 folgen (g, k) ∧ (h, l) und (k, h) ∧ (l, g). Außer den Nullwinkeln gibt es weitere besondere“ Winkel: ” 10 Winkel 197 Def 10.3 (g, h) ∈ G × G heißt rechter Winkel : ⇐⇒ g ⊥ h. Im folgenden Satz fassen wir einige Eigenschaften rechter Winkel zusammen: Satz 10.4 Sei (g, h) ein rechter Winkel a) (h, g) ist ebenfalls ein rechter Winkel b) (g, h) ∧ (h, g) c) Alle rechten Winkel sind konform. Beweisskizze: a) Definition 10.3 und Satz 8.1 (dort wurde die Symmetrie der ⊥ – Relation behandelt). g = g̃ h̃ g̃ ⇒ g̃ h̃ = h̃ g̃ ⇒ (g, h) ∧ (h, g). b) g ⊥ h ⇒ g̃(h) = h ⇒ h̃ = g̃(h) c) g ⊥ h ⇒ g ∦ h ⇒ g̃ h̃ ist eine Drehung mit Zentrum X = g ∩ h, aus b) folgt g̃ h̃ = h̃ g̃, damit ist g̃ h̃ eine selbstinverse Drehung, d.h., g̃ h̃ = ϕX (Punktspiegelung). k ⊥ l ⇒ k 0 ⊥ l0 für k 0 = (X, k) und l0 = (X, l) (folgt aus Satz 8.2) ⇒ ke0 le0 = ϕX ⇒ (g, h) ∧ (k, l). Bevor wir weitere mehr oder weniger bekannte Eigenschaften im Umfeld des Winkelbegriffs zusammentragen, geben wir eine Möglichkeit an, wie man in der Anschauungsebene Winkel messen“ kann: ” Sei (g, h) ein Winkel mit Scheitel S. Durch eine eigentliche Bewegung α kann man S auf (0, 0) und g auf g0,0 abbilden: Man verschiebt zuerst S auf (0, 0), dann dreht man g um (0, 0) auf g0,0 , die zusammengesetzte Abbildung ist α. (Wieviele solcher Abbildungen gibt es?) Je nachdem, auf welche der Ursprungsgeraden der zweite Schenkel h unter α abgebildet wird, kann man ein Maß für die Größe des Winkels angeben und so mit Winkelmaßen rechnen.50 Kehren wir zurück zum Zusammenhang zwischen Winkel und Geradenspiegelungen. Hierzu betrachten wir zwei Geraden g, h und vergleichen die Winkel (g, h), (g, g̃(h)), (g̃(h), g). g⊥h gkh .............................................................................................................................. h .............................................................................................................................. g .............................................................................................................................. g̃(h) .. ... ... ... ... ... ... ... ... .. .................................................................................................................................. .. ... ... ... ... ... ... ... .... . h = g̃(h) g ...... ....... ....... ....... ....... ....... ....... . . . . . . . ....... ....... ....... ....... ....... ....... ....... ....... ....... ....... ................................................................................................................................................. ....... ..... ....... ....... ....... ....... ....... ....... ....... ....... . ....... . . . . . .. ....... ....... ....... ....... ....... ....... h g g̃(h) Man markiere die oben genannten Winkel in den Zeichnungen. Was stellt man fest? Beh : (1) Für alle Geraden g, h gilt (g, h) ∧ (g̃(h), g). (2) (g, h) ∧ (g, g̃(h)) ⇐⇒ g k h oder g ⊥ h. Bew : (1) Für g k h ist auch g̃(h) k h und die Behauptung gilt. Für g ∦ h gibt es genau einen Punkt g = g̃ h̃ g̃ ⇐⇒ g̃ h̃ = g̃(h) g g̃ ⇒ Behauptung. X ∈ g ∩ h ∩ g̃(h). Nach Satz 9.2 ist g̃(h) ⇐“: Für g k h bereits in (1) gezeigt, für g ⊥ h ist g̃(h) = h. ” ⇒“: Nach Satz 10.1 sei X ∈ P mit g 0 = (X, g), h0 = (X, h) und g̃(h)0 = (X, g̃(h)), ” (2) 50 Für Insider: α(h) = gm,0 ⇒ m ist der Tangens des eingeschlossenen Winkels; α(h) = g0 ⇒ g ⊥ h. 198 6 GEOMETRIE ]0 ⇐⇒ he0 = g̃(h) ]0 ⇐⇒ h0 = g̃(h)0 ⇐⇒ h k g̃(h). also ge0 he0 = ge0 g̃(h) Ist h ∩ g̃(h) = ∅, folgt h ∩ g = ∅ ⇒ g k h. Ist h = g̃(h) ⇐⇒ h ∈ Fix g̃ ⇐⇒ h = g oder h ⊥ g. Für jede eigentliche Bewegung ϕ gilt auf Grund der Definition von konform (g, h) ∧ (ϕ(g), ϕ(h)). Daher sagt man auch, dass eigentliche Bewegungen gleichsinnig winkeltreu sind. Bei Geradenspiegelungen ändert sich die Reihenfolge der Schenkel, wir merken uns (ohne Beweis) Satz 10.5 Sei ψ eine uneigentliche Bewegung. Dann gilt für jeden Winkel (g, h) ∧ (ψ(h), ψ(g)), d.h., uneigentliche Bewegungen sind gegensinnig winkeltreu. Def 10.4 Sei (g, h) ∈ G × G. Eine Gerade a heißt Symmetrieachse oder Winkelhalbierende des Winkels (g, h) : ⇐⇒ ã(g) = h. Beispiele : .............................................................................................................................. h .............................................................................................................................. a .............................................................................................................................. g ... ... ... ... .. ... ... ... ... ... ... ... ... ... ... ... ... ... .. . . ................................................................................................................................. .... .... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... a1 ··· g=h ··· a1 a2 ... ...... ... ....... ....... ... ....... ....... . . . . . . . . . ....... ... ....... ....... ... ....... ....... ....... ....... .. ....... ....... ....... .... .............. . . . . . . ............................................................................................................................................... ... . ... ....... .... .............. ....... ....... .... ....... ....... ....... .. ....... ....... ....... . . . . .... . . ....... ..... ... ....... ....... ... ....... .... .. h a2 g Wie man an den Beispielen sieht, sind Winkelhalbierende nicht eindeutig festgelegt. Der nächste Satz liefert eine Begründung für die Bezeichnung Winkelhalbierende. Satz 10.6 Seien g, h, k ∈ G kopunktal. Dann gilt k Winkelhalbierende von (g, h) ⇐⇒ (g, k) ∧ (k, h) g Beweis: Wir benutzen einmal mehr Satz 9.2: (g, k) ∧ (k, h) ⇐⇒ g̃ k̃ = k̃ h̃ ⇐⇒ k̃ g̃ k̃ = k̃(g) = h̃. Nur der Vollständigkeit halber halten wir fest, dass es nicht in jeder normalen euklidischen Ebene zu jedem Winkel Winkelhalbierende gibt. In der Anschauungsebene geht es zum Glück vernünftig“ zu. ” Wenn A, B, C nicht gemeinsam auf einer Geraden liegen, also ein Dreieck bilden, gilt Satz 10.7 (Berührkreise) Sei ABC ein Dreieck in der Anschauungsebene. (1) Durch jeden Eckpunkt gehen zwei Winkelhalbierende des Dreiecks ABC. (2) Die beiden Winkelhalbierenden stehen in jedem Eckpunkt aufeinander senkrecht. (3) Es gibt genau vier Punkte, in denen sich je drei Winkelhalbierende schneiden. (4) Jeder der Punkte aus (3) ist Mittelpunkt eines Berührkreises an die Seiten des Dreiecks. Einen Beweis zu diesem Satz findet man in E. Schröder: Geometrie euklidischer Ebenen (Mathematische Grundlegung der Schulgeometrie), Paderborn 1985. Wir begnügen uns mit einer Zeichnung auf der folgenden Seite. Diese Zeichnung wird in der Vorlesung beschriftet und ergänzt, wie übrigens auch die weiteren Zeichnungen in diesem Paragraphen. 10 Winkel 199 Zeichnung zum Satz über Berührkreise und Winkelhalbierende: ..... ..... ..... ... ..... .. .... ... ... ... . ..... ... ...... ... ...... ... ...... ... ....... . . ..... .. .... ...... . ... ....... ...... ......... ...... .. ........ ...... ........... . ... . . ...... ... ...... ...... ... ...... . ..... ...... .. .... ....... . ... . . . . ... ... .. ... ... ..... .. ...... ... ... ..... ... .... ... ....... . . ... ... . . . .. . ... ... ... .. ... ... ... ... ... ... . ... ... .. ... .. .... ... ... ... .... . . .... .. . . . .. ... .. ... .... .... ............ .... . ... . ... .. ... . .... ... .... .... .... .... .... . .. .. ... .... .... .... .... .. ... . .... ... ... .... .... .. .. .... .... .... .... ... ... ... .. ... .. .... . .... .... .... .... ........ . ... .... .... .... .. . . .... . . . . . . . . . . . . . .... ....... .... .... .... .. .... .... . . . ... . . . . . . . . . . . . . . . . . . . . . . . . . .... .... .... .... .... .... . .... .. .. ... .... .... .... .... .. .... ... ... ... ... .. .. .. .... .... .... .... ... ....... .... .... ........ .... .... .... .... ... . ... ... ..... ... .... . ... ... ..... ... . ... .... ... ... ..... ... . ... ... . . .. .... . . . . . . .. . ... .. .... ... ... .... ... ... ... ... .... . .. .... . .. ..... . . . . ... . .... . . ... ... ... . .... ... ... .. ... .... .. ... ... . .... ... ... ... .... .... . .... ... ... ... .... . .... ... ... ............................................ ........ ... . ... ...... ...... . .... .................... ... . . . . ...... .... .... .... ... ............. ... ... ........... .... .... .......... .... .... ............ ... ... .... .. ....... .......... .. ...... .... .... . ...... ... . . . . . . . ... ....... . . ... .... ........ ...... . .... .. ... .... .... ........ ....... ... .... .... ........ .. ... .... .. .... .. .... .... ......... ... . ..... .... . . . . . . . . . . . . .. . ... .. .. ...... ... . ....... .... . .. ... .. .... .... . ........ ... ... ... .. ..... .... ... ... .... ...... .. ... .. ..... ........ .... ........ .... . ... .... .. ... ...... .. ... .......... . . . . . . . . . . . . . . . . . ... ...... .. . ... . .... .... . . ... ... ...... ...... ... ... .... .... .... ...... ... ...... .. ... ... ... ...... ...... ...... ... ........ .... ..... ... .. .. ............... ..... ...... .. .... .... ... .. .... ... . . . . . . . . . . . . . . ....... . . . . . . . .... ..... . .. ..... . .... ........ .. ...... .... ..... ... ..... ......... ... ..... .... .... .......... ........... ........ . ....... .... ... . ...... .. ... .... ........... ............ ............. .......... .......... .. .......... ........ ........................ ............. .. ............ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .................................. ....................... ...................................................................................................................................................................................... ....................................................................................................................................................................................................................................................................... . . . . . . . . . . . . . . . . . . . . . . . . . ............ .. .. . . .... .......... .... .... ... ... ........... ... ..... ... .... ......... .. ................ . .... ..... . .... ........ ... ... . ... .. ....... .. .... ........ ... . ... ....... .. .. ... ............ .... .... . ... . . ... . . . . . .... . . ... ........ ... ...... ... .... . ... ... ... .. ........... ... ........... . ... . . . .... . . . . . ... ...... . ...... ... ... .... . . . . . . . . . . . . . ..... ... .... . . ......... . .. . . . . . . . . . . . . . .... ..... .. . ....... .. .... . . .... . . . . . . . . . . . ..... ... . .. . .. ...... . . . . . . . ..... ... ... .. .... .. . . . . . . . .... .. ... ... . . .. . . . . . . . ...... . ... ...... ... ... ... ..... .... ... ...... ... .... ... ..... ... .. ...... . . . . . . .... . . ..... ... . . . ... . . . . ...... ... . . . . . . .. ..... ... . . . . . . ... . .... .. ... . . . . ...... ... .. ... .. .. . . ...... . .. .. ... ... . . . ...... . . . .. ... . . ...... . . . . .. . . . .. ....... . . . . . . ... . .. ... ... .. . . . . . . . . ... ... ... .. .. .. . . . . .. ... .. .. . . ... . . . . . .. .. ... . . . . . .. . . ... ... . . ... ... . . . ... . .. ......... ... ........ ... .. .. r r r r r r r Der nächste Satz beschäftigt sich mit Winkel an Kreisen in der Anschauungsebene. Satz 10.8 (Kreiswinkelsatz) Sei ABC ein Dreieck mit Umkreis k, seien a, c ∈ G mit a ∩ k = {A, X} und c ∩ k = {C, Y }. Dann gilt (a, c) ∧ (AB, BC) ⇐⇒ X =Y. ........ ........ .... ...... .... .............................. ... ............ ........ ................................... . . . . . . ........ ...... .... ... .... . . . . . . . . . . . . . . . .............. ... ... .... . . . . . . . . . . . . . . . .......... ... .... .................... ..... .... ..... ... ... .... ........ .... . ... . . . ... ... . ... . .. . . . ... .... . ... . .. ... . . . ... . .. ... ... .... ......... ... ... ... ....... ... . . . . . . . ... ......... ........ .. ............ . . . . . . . . . . . . . . . . ... . . ... .... .............. . . .. . . . . . ......... . . ... ... . . . . . . . . . . . ......... . ... . . . . . . ..... . . . . ......... ... . ......... ... .... ... ......... ... ... .... ......... ... . . ......... ... ......... .... ..... ..... ................ ..... ............ ..... ..... .. ................ ...... . ...... ... ....... ...... ......... ..... .............................................. r r r r .. ......... ....................................... ............ ............ ........ . . . . . . ...... .. ..... ...... ..... ... ...... ..... ..... .. ..... ..... ..... .... . ..... . . . . .... . . ... ... .. . . . ... . . . . ... .... . ... . . . . . ... ... . . .. . . . . . . ... . ... . . .. . . ... . . . .. .. ... . .... ......... ... .. . ... ....... . ... . . . . . . . ......... ....... ... .. ............ . . .... ........ . .. . . . . ......... .. ... ... . . . . . . . . . . . . .......... . .... ... . . . . . . . ... . ............. . . . . . ......... ... . ......... ... ... ... ......... .. ... ... ......... ... .... .. ......... ... .. .. ......... . . ....... . .. . ...................................................................................................................................................... ......... .. ......... .... ...... ....... ...... ... ...... ......... ............................................... r r r r Beweis: Sei M der Mittelpunkt von k, seien r, s, t, u die Lote von M auf a, c, AB, BC. Wir untersuchen 200 6 GEOMETRIE die Abbildung α := r̃ t̃ ũ s̃, es ist α(M ) = M und α(Y ) = X. Beh : X = Y ⇐⇒ α = id Bew : Es ist nur ⇒“ zu zeigen. Wegen der Fixpunkte M und X = Y ist α nach Satz 9.3 eine Gera” denspiegelung oder die Identität. Weil α aus vier Geradenspiegelungen besteht, handelt es sich um eine eigentliche Bewegung, damit bleibt nur die Identität übrig. r̃ t̃ ũ s̃ = id ⇐⇒ r̃ t̃ = s̃ ũ ⇐⇒ (r, t) ∧ (s, u) ⇐⇒ (r, s) ∧ (t, u) Nach Satz 10.4 sind alle rechten Winkel konform: (t, AB) ∧ (u, BC) (Schenkelaustauschsatz) ∧ (r, a) ∧ (s, c) Erneut der Schenkelaustauschsatz liefert (t, u) ∧ (AB, BC) und (r, s) ∧ (a, c). Damit gilt insgesamt X = Y ⇐⇒ α = id ⇐⇒ (a, c) ∧ (AB, BC). Liest man den Kreiswinkelsatz genau, stellt man fest, dass A = X oder C = Y nicht ausgeschlossen sind. Diese Spezialfälle bilden den Tangentenwinkelsatz. Wir erinnern uns: Eine Gerade t heißt Tangente an einen Kreis k, falls |t ∩ k| = 1 gilt. Korollar 1 Seien A, B, C Punkte auf einem Kreis k, die Tangente in A sei tA , die Tangente in C sei tC . Dann gilt (tA , AC) ∧ (AB, BC) ∧ (AC, tC ) ... . ... ... ... ... ... ... ..... ................................................................................................................................................... .. ......... ..... ....... ... ... ........ ...... ...... ... .... ..... ... ...... .. ..... ..... ... .. . . . . .... . . ... . ... ... . . . . ... ... ... ... . . . ... ... .. .. ... . . . ... .. .. ... . . . ... ... .. . .... ... . ... . . . ... ... ... ... . ... . ... ... .. .... . . . ... .. ... . ... ... . . .. ... . . ... .. ... . ... . . . ... . ... . .. . . . ... ... . ... ... ... .... ... ..... ... .. .. .. .. .. ............................................................................................................................................ .... .. ... ......... .... .... ...... ... ..... ... ...... ...... ... ... ........ ...... . . .. . ........... . . . . . ................................. r r r ... . ... ... ... ... ... ... .... ..... ..................................................... . ......... ....... ... ... ....... ...... .. .... ...... ..... . . . . . . . ..... ... .. ..... ..... ... .. .... . ... . . . . ... ... ... ... . . . ... ... .. .. . . . ... ... .. .. ... . . . ... ... .. . .... ... . ... . . . .. ... ... ... ... ... . ... . ... ... ... .. .... . . ... ... . . .. . . ... . . . ... . . ... ... ... .... ... ... ... ... ... ... ... ... .. ... .. ... ... ....... .. . . . . ... ... .. . ... ........ ... .. .. .. .. .. ............................................................................................................................................ . ... . . .. ....... . . . ..... .... .... ... ...... ....... ... ....... ......... ... ... ......... ...... .. .. ............................................... ..... r r r Beweis: Im Fall A = X ist a = tA und c = AC, im Fall C = Y ist c = tC und a = AC. Anders formuliert wird der Kreiswinkelsatz zum Peripheriewinkelsatz : Vier Punkte liegen genau dann auf einem Kreis, wenn die entsprechenden Winkel konform sind, formal Korollar 2 Seien A, B, C ∈ k, Z ∈ P\{A, C}. Dann gilt Z ∈ k ⇐⇒ (AZ, ZC) ∧ (AB, BC). Jetzt betrachten wir zusätzlich Winkel am Kreismittelpunkt. Es gilt (ohne Beweis): Korollar 3 (Mittenwinkelsatz) Seien A, B, C ∈ kM (A). Dann gilt (AB, BC) ∧ (AM, mA,C ) ∧ (mA,C , M C). ... . ... .. ... .. .... ........ ....... ..... ...................................................... . ......... ....... .. .. ... ....... ...... ... .... .... ...... ..... . . . . . . . ..... .. .. ... ..... ..... .. .... .... .... . ... . . . ... . . ... . . ... . . . . ... ... .. .. ... . . . . ... ... .. .. .. ... . . . . ... ....... .. .. ... .. . . . . . ......... ... .. . .. . . . . . . .... . .... ... . ... . . . . . . . . . . . . . ... . ... ...... .. ....... ... ... ............. ... .... . ........ . . . .. . . ... . . ... . . ... .. .. ....... .. .. ... . . . . . ...... ... . . . ... . . . . . . . ...... . ... .. ... ...... ..... . . ... . . ...... .. ...... ... .... ... .... ...... ... ... ... .. ...... .. .. .. ................................................................................................................................................... ... ...... ... ......... .... ........ ...... ... ..... ... ...... ...... ... ... ........ ....... . . . . .. . ........... . . . . .................................. r r r r ..................................... ........... ........ .. ........ ...... ... ........... ...... . . ..... . . . . ............ ...... ..... ............. .... . . ... . . . ... ...................... . .. .. ... ... ........ . ... .... . . .. ... .... ........ . . . . . ... ...... ..... . . .. ... .... . . . . ... . ...... . .... . ... . . . . . ... . . .... ... . ...... . ... ... ...... .. .............. ... .. ... ................ .. ... ... ..... ............ . .. . . ... . ... . ... . .. ... ............. ... ..... . ... ... . ........ . . ... .. . . . . . . . ... ... .. ....... ..... .. . . . . . ... ... ... ... .... ... .. ... .. ... . . ... ... .............. ... ... ... ......... . . . . . . . . ... .. .... .... .... ....................... ... .. .... . .. ..... ... ........ ........... ...... ....... ....... ..... ... ... ....... ........ ........ .... ........................ ..................... .................. .. ........... . r r r r 11 11 Eulergerade und Feuerbachkreis in der Anschauungsebene 201 Eulergerade und Feuerbachkreis in der Anschauungsebene Weil wir uns in diesem Paragraphen ausschließlich in der Anschauungsebene befinden, in der Punkte, Geraden und Kreise durch Koordinaten gegeben sind, können wir mit Koordinaten rechnen. Wir wiederholen einige bereits bekannte Tatsachen über Abbildungen: Satz 11.1 Seien X = (x, y), A = (a, b) ∈ R2 und α ∈ R∗ . 1) Für jede Translation τ existiert A ∈ R2 mit τ (X) = X + A. 2) Für jede Streckung σA mit Zentrum A und Streckungsfaktor α gilt σA (X) = (1 − α)A + αX. 3) Für jede Punktspiegelung ϕA um A gilt ϕA (X) = 2A − X. Beweis: 1) und 2) wurden bereits (teiweise in den Übungen) behandelt. zu 3): Bei der Punktspiegelung ϕA erhält man das Bild von X, indem man zu A den Vektor A − X addiert, d.h., ϕA (X) = 2A − X. Eine andere Beweismöglichkeit: Es ist ϕA = τ −1 ϕO τ mit τ (X) = X − A und ϕO (X) = −X, also ϕA (X) = (τ −1 ϕO τ )(X) = (τ −1 ϕO )(X − A) = τ −1 (A − X) = 2A − X. An speziellen Punkten in einem Dreieck ABC haben wir bisher den Höhenschnittpunkt H = hA ∩hB ∩hC und den Schnittpunkt der Mittelsenkrechten M als Mittelpunkt des Umkreises kennengelernt. Jetzt wollen wir uns mit weiteren ausgezeichneten Punkten und ihrer Lage zueinander beschäftigen. Wir bezeichnen die Mitten der Seiten {A, B}, {A, C} und {B, C} eines Dreiecks ABC mit Mc , Mb , Ma . Def. 11.1 Sei ABC ein Dreieck. Dann heißt S = 31 (A+B+C) Schwerpunkt, die Geraden AMa , BMb , CMc heißen Seitenhalbierende. Mit obiger Bezeichnung gilt Satz 11.2 S ∈ AMa Beweis: Wir nutzen aus, dass für Geraden der Anschauungsebene gilt AB = A + R(B − A). Ma = 21 (B + C) ⇒ S = 13 A + 13 (B + C) = 13 A + 23 Ma = A + 32 (Ma − A) ∈ AMa . Korollar S = AMa ∩ BMb ∩ CMc Satz 11.3 Sei ABC ein Dreieck mit Höhenschnittpunkt H, Mittelsenkrechtenschnittpunkt M und Schwerpunkt S. Dann gilt S ∈ HM für H 6= M oder S = H = M . Beweis: Für die Streckung σS (X) := 3S − 2X gilt σS (Ma ) = 3S − 2Ma = A + B + C − (B + C) = A und analog σS (Mb ) = B, σS (Mc ) = C. Beh 1 : Für alle Geraden g, h gilt g ⊥ h ⇒ g ⊥ σS (h) Bew : Als Streckung ist σS eine Dilatation mit h k σS (h), die Behauptung folgt aus Satz 8.3. Beh 2 : σS (M ) = H Bew : M ∈ (Ma ⊥ BC) ⇒ σS (M ) ∈ (σS (Ma ) ⊥ BC) (wegen Beh. 1) ⇒ σS (M ) ∈ (A ⊥ BC) = hA . Weil analog σS (M ) ∈ hB und hA ∩ hB = H, ist σS (M ) = H. Im Fall H 6= M liegen M, S, H kollinear; im Fall H = M ist H Fixpunkt von σS , also H = M = S. 202 6 Korollar Ist M 6= H, so liegt S zwischen M und H und es ist Verhältnis 2:1). S−H S−M GEOMETRIE = −2 (S teilt die Strecke H, M im Beweis: H = σS (M ) = 3S − 2M ⇐⇒ H − S = 2(S − M ). Def. 11.2 Für M 6= H heißt HM die Eulergerade des Dreiecks ABC. Die Seitenmitten Ma , Mb , Mc eines Dreiecks ABC bilden natürlich wieder ein Dreieck, und wie jedes Dreieck besitzt auch dieses Dreieck einen Umkreis. Def. 11.3 Der Umkreis des Seitenmittendreiecks Ma Mb Mc heißt Feuerbachkreis des Dreiecks ABC. Wir werden den Feuerbachkreis eines Dreiecks ABC mit fk abkürzen. In den nächsten zwei Sätzen zeigen wir, warum der Feuerbachkreis auch Neun–Punkte–Kreis genannt wird. Satz 11.4 In jedem Dreieck liegen die Punkte A0 := 21 (A + H), B 0 := 21 (B + H), C 0 := 12 (C + H) auf dem Feuerbachkreis. Beweis: Wir zeigen nur A0 ∈ fk : Für A0 = Mb ist nichts zu zeigen; für A0 6= Mb ist nach Satz 8.7 über die Mitten der Seiten eines Dreiecks, bezogen auf das Dreieck AHC, A0 Mb k hC . Wegen hC ⊥ AB und AB k Ma Mb folgt A0 Mb ⊥ Ma Mb , d.h., Mb liegt auf dem Thaleskreis k(A0 , Ma ). Völlig analog folgt auch Mc ∈ k(A0 , Ma ). Damit liegt A0 gemeinsam mit Ma , Mb , Mc auf dem Kreis fk . Satz 11.5 In jedem Dreieck liegen die Lotfußpunkte51 Ha = BC ∩ (A ⊥ BC), Hb = AC ∩ (B ⊥ AC) und Hc = AB ∩ (C ⊥ AB) auf dem Feuerbachkreis. Beweis: Wir zeigen nur Ha ∈ fk : Ha liegt auf dem Thaleskreis über AC mit Mittelpunkt Mb , d.h., CHa ⊥ Ha A oder Ha = C. Beh 1 : (BC, Ha Mb ) ∧ (AC, BC) Bew : Im Fall CHa ⊥ AHa liefert die Spiegelung ψ an der Geraden mC,Ha (eine uneigentliche Bewegung) wegen Satz 10.5 (BC, Ha Mb ) ∧ (ψ(Ha Mb ), ψ(BC)). Da Mb ∈ mC,Ha (beachte Ha ∈ kMb (C)) ist ψ(Ha ) = C und ψ(Mb ) = Mb . Weil ferner ψ(BC) = BC (beachte BC ⊥ mC,Ha ) folgt (BC, Ha Mb ) ∧ (CMb , BC) = (AC, BC). Im Fall Ha = C handelt es sich um rechte Winkel, die nach Satz 10.4 stets konform sind. Beh 2 : (AC, BC) ∧ (Ma Mc , Mc Mb ) Bew : Es handelt sich um gegenüberliegende Winkel in dem Parallelogramm (C, Mb , Mc , Ma ), die nach dem Korollar zu Satz 10.3 konform sind. Insgesamt gilt (BC, Ha Mb ) ∧ (Ma Mc , Mc Mb ), die Behauptung Ha ∈ fk folgt jetzt aus dem Tangenten– bzw. Peripheriewinkelsatz (Korollare zu Satz 10.8). 51 Zur Erinnerung: In Def 9.1 wurden Lotfußpunkte mit dieser Schreibweise eingeführt. 11 Eulergerade und Feuerbachkreis in der Anschauungsebene 203 Der Feuerbachkreis enthält die neun Punkte Ma , Mb , Mc , A0 , B 0 , C 0 , Ha , Hb , Hc . Zum Schluss stellen wir den Zusammenhang zwischen Eulergerade und Feuerbachkreis her: Satz 11.6 Der Mittelpunkt F des Feuerbachkreises liegt auf der Eulergeraden und ist die Mitte von {H, M }. Beweis: Die Dilatation σS aus Satz 11.3 bildet den Umkreis des Dreiecks Ma Mb Mc auf den Umkreis des Dreiecks ABC ab. Damit folgt σS (F ) = M = 3S − 2F = −2F + 3S = −2F + H + 2M (siehe Korollar zu Satz 11.3) ⇒ F = 21 (H + M ) F liegt zusammen mit H, S, M auf der Eulergeraden. In jedem Dreieck, in dem diese vier Punkte nicht zusammenfallen, gilt darüber hinaus Korollar M −H M −S = F −H S−F =3 Beweis: M − H = M − (3S − 2M ) = 3(M − S) F − H = 4F − H − 3F = 2H + 2M − H − 3F = H + 2M − 3F = 3S − 3F = 3(S − F ). C r .... .... ........... ..... .. ........ ...... .... ........... ...... .. .. ...... ... ... .. ...... . ...... ... .. ... ...... . .... .. ...... ...... ... ... .. ...... . ... .. ...... ... ...... ... .. . ...... ... ... .. ... ... .. . ................................................................. . . . . . ... . .. .......... .................. ......... . . . . . .. . ........ ... ...... . .. ..... . ....... . ...... . . . . .. . ... . . .. .. ...... ...... . . .. ........... ... ...... ...... ... .. . ..... . ........... ... . . ...... . . ..... . . . . . . . ... . ...... ..... ... . .. ...... ..... ... ... ........... ...... ..... . . ... ..... ... ...... .. ... . . ...... ..... . ... .... . ... . . . .. . ...... ..... ... ... . ...... .. .. .. ....... . ... ...... ... .. .. ..... ........ . .. .. .. ......... ... .. ................ .... . . .................. .. ........ . . . . .... .. ................ .... .... . . . ..... . . . . . . . . . . . . .. .... ... ....... .. . ..... ... . .. .... .. ........ ........ .. ...... ....... . ... ........ . ... .. ..... .. ...... .. ... .... ....... . .. .. ...... ...... ...... ..... ... .. ...... ...... ...... .. ......... ........ . ..... . ...... ...... . ...... . .. . . .. . . . . . . . . . . . ........ . ...... ... ...... . ...... ... ..... ... ............................................... .. . ...... ...... ... ...... . ......................... . . ...... .. ... . ....... ... . ... ..................... ...... . ...... . . . . .. . . . . . . . . . . ..... . . . . . . . . . . . ...... . ... .. ...... ............. . . . . . . ...... . . . ....... ... ... ... ... ... .. ...... ............................................... . ..... . ... .. . ...... . . . . . . . . . ...... . . ........................ ... ... ...... .. ...... . . . ... ... ... . . . . . . ...... . . ... ... . . . . ... ... ... .. ... ... ..... .. . . ...... .. .. . . . . . ... .... . . . . ... ... ... . ........ ...... . .. . . . . . . . . . . . . . . . . . . ...... ... ... ... ... ... . . .. . . . ...... . . . ...... . . . . . .. . . . . . .. ... .... . . . ... ... ..... ..... . . ...... ..... . ........ ... ... .. .. .. ... ... ... . ... . . ...... ..... . . ... ... ... . . ... .. ...... ... .. . . ... . . . ... ... ... . .. ... ... ......... . ...... . ...... .... . . . . . . . ... .. ...... ...... .. ... ... ... ... ... ... ... . ... .. ........ . ...... . . ... . .. ..... .. .... ... ... ... . . ...... . . . . . ... ... .... .. ......... . . ... ... ... ...... ...... .. ... ... . . . . ....... . . . . . . . ..... ... ... . . . . ... ... ... . .. ...... .. . . . . . ... .. ... ...... ..... ... . . . . . ... ... ... . .... ... ........... ... . . ..... . . . . . . . . . . ... .. .... ... ... ... ....... ...... ........ ..... .. . ....... . .. ... ............ . . ......... .. . ............................................................................................................................................................................................................................................................................................................................................................................................................................................... ..... ... ...... ..... . . . ...... . . .... ....... ....... ........ ........ ......... ......... ............ ............................................................ r r r r r r r r r r r A r r r r B Index Basis, 70 Basisergänzungssatz, 71 Bernoullische Ungleichung, 19 Berührkreis, 198 beschränkt, 24, 111, 118 Betrag, 22 Bewegung, 181 bijektiv, 14 Bild, 75 Bildbereich, 13 Bildelement, 13 binäre Verknüpfung, 13, 50 Binomialkoeffizient, 40 Binomischer Lehrsatz, 41 Bogenmaß, 46 Boolesche Summe, 5 Abbildung, 13, 133 abelsch, 51 abgeschlossene Kreisscheibe, 180 abgeschlossenes Intervall, 133 stetiges Bild, 142 Ableitung, 147 höhere, 149 Ableitungsregeln, 150 absolut konvergent, 127 Absolutbetrag, 22 absoluter Betrag von z, 44 absolutes Maximum/Minimum, 156 abzählbar, 27 Additionsregel für cos, 84 für sin, 84 Additionstheorem, 47 Äquivalenz, 8 Äquivalenzrelation, 11 Äquivalenzrelation Isomorphie, 61 affine Ebene, 162 Minimalmodell, 163 Sphärenmodell, 164 alternierende Folge, 26 alternierende harmonische Reihe, 126 alternierende Quersummenregel, 33 alternierende Reihe, 132 altes China, 106 angeordneter Körper, 22 Anordnungsaxiome, 22 Anschauungsebene, 160 antisymmetrisch, 10 Anzahl Primzahlen, 30 Argument von z, 47 Arithmetisches Mittel, 116 Assoziativgesetz, 5, 20 Assoziativgesetz bei Gruppoiden, 52 Assoziativgesetz der Matrizenmultiplikation, 83 Aufpunkt, 92 Aussage, 7 Austauschlemma, 72 Aut G, 62 Automorphismengruppe, 62 Automorphismus, 62, 75, 166 C, 43 Cantorsches Diagonalverfahren, 27 Cauchy–Schwarzsche Ungleichung, 96 Cauchyfolge, 119 Cauchysches Konvergenzkriterium, 120 cos, 47, 144 Ableitung, 153 Additionsregel, 84 Cramersche Regel, 102 Definitionsbereich, 13 Determinantenfunktion, 89 Determinantenmultiplikationssatz, 92 dicht, 29 Diedergruppe, 58 Differenzenquotient, 147 Differenzialrechnung, 146 differenzierbar, 148 differenzierbar und stetig Zusammenhang, 149 Differenzmenge, 5 Dilatation, 174 Dimension eines Vektorraums, 71 Dimensionsformel für lineare Abbildungen, 76 für Untervektorräume, 73 Dirichletfunktion, 134 Disjunktion, 8 distanztreu, 181 204 INDEX Distributivgesetz, 5, 20 divergent, 108 Division mit Rest, 31 Dn , 58 Dominoprinzip, 18 Dreh (), 57 Drehung, 77, 192 Drehung im R3 , 78 Drehzentrum, 192 Dreieck, 187 Dreiecksungleichung, 23, 45 Dreispiegelungssatz, 193 Durchschnitt, 5 e, 113 e – Funktion Ableitung, 152 eigentliche Bewegung, 194 Eindeutige Lösbarkeit in Gruppen, 54 eineindeutig, 16 Einheitskugel, 146, 164 Einheitsmatrix, 84 Einschließungssatz, 114 Einselement, 51 Elementare Zeilenumformungen, 88 Endomorphismus, 62, 75 Endstück einer Folge, 109 Entwicklungssatz für Determinanten, 90 ε-Umgebung, 108 erweiterte Matrix, 100 Erzeugendensystem einer Gruppe, 57 Erzeugendensystem eines Vektorraumes, 70 Euklidischer Algorithmus, 32 euklidischer Vektorraum, 95 euklidisches Axiom, 180 Eulergerade, 202 Exponentialreihe, 132 Extremstelle, 155 Fakultät, 15 fast alle, 108 Feigenbaum, 124 Feuerbachkreis, 202 Fixgerade, 175 Fixpunktsatz, 141 Folge, 26 freie Parameter, 104 freier Vektor, 66 Fußballbundesliga, 39 205 Funktion, 13, 133 diff’bar, Ableitung unstetig, 153 höherdimensional reell, 143 stetig, nirgends diff’bar, 153 g–adische Darstellung, 36 Gaußsche Summenformel, 18 Gaußsche Zahlenebene, 45 Gaußscher Algorithmus, 103 gegensinnig winkeltreu, 198 geometrische Bedeutung der Ableitung, 154 geometrische Reihe, 126 Geometrische Summenformel, 19 Geometrisches Mittel, 116 Gerade, 92, 160 Geradenspiegelung, 189 ggT, 31 Gleichheitsrelation, 10 gleichmächtig, 17 Gleichmächtigkeit, 2 gleichsinnig winkeltreu, 198 Gleitspiegelung, 194 Graph, 14, 133, 143 Grenzwert, 108, 148 Grenzwertsätze, 114, 129 größte untere Schranke, 24 Gruppe, 21, 53 zyklisch, 57 Gruppoid, 50 Häufungspunkt, 109, 117, 118 Häufungspunkt einer Menge, 134 Halbgruppe, 52 halboffenes Intervall, 133 harmonische Reihe, 125, 131 Hauptdiagonale einer Matrix, 84 Hochpunkt, 118 Höhe, 188 höhere Ableitung, 149 Höhenschnittpunkt, 188 Hom (V, W ), 74 Homomorphismus, 62, 74 imaginäre Achse, 46 imaginäre Einheit, 43 Imaginärteil von z, 44 Implikation, 8 Induktionsprinzip, 17 Infimum, 25 206 injektiv, 14 innerer Punkt, 180 Intervall, 133, 140 inverse Abbildung, 16 inverse Matrix, 85 inverses Element, 20, 21, 51 Inzidenztafel, 161 isomorph, 61 Isomorphie, 166 Isomorphismus, 44, 61, 75 Jägerzaunregel, 89 kanonische Basis, 71 kartesisches Produkt, 6, 38 Kern, 75 Kettenregel, 152 kgV, 31 Klasseneinteilung, 11 Kleinsche Vierergruppe, 62 kleinste obere Schranke, 24 Knickgerade, 165 Kochrezept, 32, 37 zur Rangbestimmung, 88 Körper, 20 kollinear, 97, 161 Kollineation, 166 kommutativ, 51 Kommutativgesetz, 5, 20 kompakt, 143 Komplement, 5 komplexe Zahlen, 43 konform, 195 kongruent, 179 konjugiert komplexe Zahl, 44 Konjunktion, 8 konkav, 157 konstante Folge, 26 konstante Funktion differenzierbar, 148 stetig, 136 konvergent, 108 konvergente Majorante, 129 konvex, 157 Koordinatenform, 94 kopunktal, 161 Kreis, 144, 179 Kreisschnittaxiom, 180 Kreiswinkelsatz, 199 INDEX Kreuzprodukt, 99 Krümmung, 157 Kürzungsregel, 21, 55 Kurvendiskussion, 157 leere Menge, 5 Leibnizkriterium, 131 lim, 108, 115, 136 linear abhängig, 69 linear unabhängig, 69 lineare Abbildung, 74, 81 lineare Hülle, 68 lineares Gleichungssystem homogen, 100 inhomogen, 100 Lösung mit inversen Matrizen, 86 mit Nebenbedingung, 106 spezielle Lösung, 101 Linearkombination, 68 linksinvers, 51 ln – Funktion Ableitung, 153 Lös (A, b), 101 lokales Maximum/Minimum, 155 Lot, 187 Lotfußpunkt, 189 Lotto, 40 Majorantenkriterium, 129 Matrix, 79 erweitert, 100 Hauptdiagonale, 84 invers, 85 invertierbar, 84 Rang, 86, 87 regulär, 84 Matrix einer Drehung, 81 Maximum, 24 Menge, 4 Mengenklammern, 4 Mengenoperation, 5 Mersennesche Primzahlen, 30 minimales Erzeugendensystem, 70 Minimum, 24 Minorantenkriterium, 129 Mitte einer Strecke, 184 Mittelpunkt, 179 Mittelsenkrechte, 179 Mittelwertsatz, 157 INDEX Mittenwinkelsatz, 200 Moivresche Formel, 49 monoton fallend, 111 monoton wachsend, 111 Moultonebene, 165 Multiplikation von Matrizen, 82 Multiplikationsregel, 38 natürliche Zahlen, 17 Nebenklasse, 93 Negation, 8 neutrales Element, 20, 51 Newton – Verfahren, 158 normale euklidische Ebene, 180 Nullfolge, 109, 113 Nullstellensatz, 140 Nullteiler, 84 Nullwinkel, 195 obere Schranke, 24 Objekt, 4 offenes Intervall, 133 Operation, 50 Ordnung einer Gruppe, 56 Ordnungsrelation, 11 orthogonal, 95, 186 orthogonale lineare Abbildung, 96 Ortsvektor, 66 parallel, 94, 98, 162 Parallelenaxiom, 162 Parallelogramm, 96, 179, 185 Parallelogrammaxiom, 180 Parallelotop, 98 Parameter, 122 Parameterdarstellung, 144 Parameterflächen, 146 Parameterform, 92 Partialsumme einer Reihe, 124 Partition, 11 Pascalsches Dreieck, 41 Peano–Axiome, 17 Peripheriewinkelsatz, 200 Permutation, 39 Polarkoordinatendarstellung, 47 Polynom, 137 Ableitung, 151 positiv definit, 95 Potenzmenge, 7 207 Potenzreihe, 132 Primfaktorzerlegung, 30 Primteiler, 30 Primzahl, 30 Primzahlordnung, 57 Prinzip vom Maximum und Minimum, 142 Produktregel, 150 Punkt, 160 Punktspiegelung, 181 Quadratwurzel näherungsweise Berechnung, 116 Quersummenregel, 33 Quotientenkriterium, 130 Quotientenregel, 150 (R2 , +), 64 Rang, 76 Rang einer Matrix, 86, 87 rationale Funktion, 137 Ableitung, 151 Realteil von z, 44 Rechenregeln für stetige Funktionen, 137 Rechte Hand – Regel, 99 rechter Winkel, 197 rechtsinvers, 51 reeller Vektorraum, 64 reflexiv, 10 Regel von Sarrus, 89, 91 Regel Zeile mal Spalte, 80, 82 Regeln von de l’Hospital, 154 Regeln von de Morgan, 5 Reihe, 124 absolut konvergent, 127 alternierend, 132 divergent, 125 geometrisch, 126 Grenzwertsätze, 129 harmonisch, 125 konvergent, 125 Partialsumme, 124 rekursiv definierte Folge, 26 Relation, 9 Richtungsvektor, 92 Riemannscher Umordnungssatz, 133 Rosette, 144 Satz von Bolzano – Weierstraß, 118 Satz von Desargues, 169 208 Satz von Pappus, 169 Satz von Rolle, 158 Schachbrettmuster, 91 Scheitel, 195 Schenkel, 195 Schenkelaustauschsatz, 196 Scherensatz, 171 Scherung, 81 Schneeflocke, 128 Schnittaxiom, 23 Schubspiegelung, 194 Schwerpunkt, 201 Seitenhalbierende, 201 selbstinvers, 51 senkrecht, 186 Sheffer–Strich, 9 sin, 47, 144 Ableitung, 153 Additionsregel, 84 Skalarmultiplikation, 64 Skalarprodukt, 95, 98 Sn , 58 Spaltenrang, 87 Spaltenvektor, 80 Spat, 98 Spatprodukt, 99 Spg (), 57 Sphäre, 164 Spiegelung, 78 Spiegelung im R3 , 78 Steigung, 94 stereographische Projektion, 168 stetig Definition, 136 ε − δ – Kriterium, 138 stetig und differenzierbar Zusammenhang, 149 Stetigkeit als lokale Eigenschaft, 138 Strecke, 179 Streckung, 177 Streckungsebene, 178 Streichungsmatrix, 90 streng konkav, 157 streng konvex, 157 strenge Monotonie, 111 strukturerhaltend, 44, 61 Summe von Untervektorraumen, 72 Summenregel, 150 INDEX Summenzeichen, 18 Supremum, 25 Supremumsprinzip, 25 surjektiv, 14 Symmetrieachse, 198 symmetrisch, 10 symmetrische Bilinearform, 95 symmetrische Differenz, 5 symmetrische Gruppe, 58 Tangente, 148, 180 Tangentenwinkelsatz, 200 Teilbarkeitsbeziehung, 29 Teilbarkeitsregeln, 32 Teiler, 29 Teilfolge, 116, 118 Teilmenge, 4 Tetraeder, 98, 160 Thaleskreis, 188 Tiefpunkt, 118 transitiv, 10 Translation, 176, 184 Translationen, 78 Translationsebene, 177 triviale Teiler, 30 überabzählbar, 27 Uε (a), 108 Umgebung, 139, 140 Umkehrabbildung, 16 Umkehrregel, 152 Umkreis, 187 unbeschränkt, 24 uneigentliche Bewegung, 194 uneigentliche Konvergenz, 110 unendlich dimensional, 71 unendliche Reihe, 124 unendliches Intervall, 133 unstetig, 136 untere Schranke, 24 Untergruppe, 59 Untergruppenverband, 60 Untervektorraum, 66 Durchschnitt, 68 Vereinigung, 68 Urbildmenge, 13 Urnenproblem, 39 V4 , 62 INDEX Vektorprodukt, 99 Vektorraum, 64 über einem Körper, 65 Venndiagramm, 5 Vereinigung, 5 Verkettung, 16 Verknüpfung, 50 Verknüpfungstafel, 50 Volkseinkommen, 122 vollständige euklidische Ebene, 180 Vollständigkeitsaxiom, 180 vollständige Induktion, 17 Vollständigkeitsaxiom, 23 Volumen eines Parallelotop, 98 Tetraeder, 98 von Koch – Schneeflocke, 129 Vorzeichenwechsel, 156 Wahrheitstafel, 8 Wendepunkt, 157 windschief, 98 Winkel, 195 Winkelhalbierende, 198 wohlbestimmt, 4 wohlunterschieden, 4 Würfel, 160 Wurzelfunktion Ableitung, 152 Wurzelkriterium, 131 Zahlenstrahl, 160 Zeilenrang, 87 Zeilenstufenform, 104 Zentrum, 177 Zinseszins, 121 Zn , 56 Zwischenwertsatz, 141 Zykelschreibweise, 59 zyklisch, 57 209