Skript zum MSG-Zirkel Klasse 9 Lucas Mann Vorwort Dies ist das Skript zum Kurs 9d (Schuljahr 2016/2017) der mathematischen Schülergesellschaft LeonardEuler. Hier füge ich fortlaufend alle im Kurs behandelten Themen und Inhalte ein, wobei ich mich dank nachträglichem Schreiben des Skripts sehr nah dan den tatsächlich im Kurs behandelten Stoff halten kann. Natürlich richtet sich das Skript zuallererst an die Teilnehmer des Kurses: es zeigt die große Menge an Dingen, die wir bereits im Kurs gelernt haben und es dient jederzeit als Nachschlagewerk, falls irgendetwas im Kurs nicht verstanden wurde oder falls man einmal gefehlt hat. Das Skript hilft aber auch mir, dem Kursleiter, den letzten Kurs zu reflektieren und den nächsten vorzubereiten. Zuallerletzt wird jeder Mathematikinteressierte in diesem Skript manche interessante Dinge lernen können. Ich wünsche euch nun viel Spaß beim Lesen und weiterhin viel Freude an der Mathematik! – Lucas Mann Letzte Aktualisierung des Skripts: 7. Juni 2017 Inhaltsverzeichnis 1 Messen von Größen 1.1 Mächtigkeit von Mengen . . . . . 1.2 Abzählbarkeit . . . . . . . . . . . . 1.3 Mächtigkeit unendlicher Mengen 1.4 Längen . . . . . . . . . . . . . . . . 1.5 Flächeninhalte und Volumen . . . 1.6 Ausblick: Maßtheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 6 7 10 10 2 Quadratische Reste 12 2.1 Definition und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Aufgaben zu quadratischen Resten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.3 Theoretische Eigenschaften quadratischer Reste . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3 Netzwerke 4 Analytische Geometrie 4.1 Rechnen mit Punkten . . 4.2 Geraden . . . . . . . . . . 4.3 Rechte Winkel . . . . . . . 4.4 Parallelität . . . . . . . . . 4.5 Skalarprodukt . . . . . . . 4.6 Parallelogrammgleichung 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 17 18 20 22 23 27 5 Volständige Induktion 29 5.1 Wiederholung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.2 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 6 Programmierung in Python 30 7 Mengen und Abbildungen 31 7.1 Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 7.2 Komposition von Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 7.3 Umkehrung von Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1 1 Messen von Größen In diesem Abschnitt beschäftigen wir uns mit verschiedenen Methoden, die „Größe“ von etwas anzugeben und widmen uns dabei ein paar grundlegenden Fragen der Mathematik mit teilweise erstaunlichen (und auch etwas verwirrenden) Antworten. Wir beginnen mit dem wohl naheliegendsten Begriff von „Größe“, nämlich der Mächtigkeit von Mengen. Anschließend werfen wir einen Blick auf Längen-, Flächen- und Volumenmessung, wobei wir feststellen werden, dass sich ähnliche Gesetze wir für Mächtigkeiten ergeben. 1.1 Mächtigkeit von Mengen Wir wollen uns als erstes der „Größe“ von Mengen widmen, was grob gesagt die Anzahl der Elemente einer Menge ist. Der Fachbegriff dafür ist die Mächtigkeit: Definition 1.1. Die Mächtigkeit einer Menge M beschreibt die Größe, also die Anzahl der Elemente von M . Wir schreiben |M | für die Mächtigkeit von M . Andere Notationen sind #M (vor allem in der Kombinatorik benutzt) und card(M ) (steht für „Kardinalität“, englisch „cardinality“). Im Falle von endlichen Mengen hat der Begriff der Mächtigkeit viel mit Kombinatorik zu tun – in diesem Falle ist das Bestimmen der Mächtigkeit einer Menge gleichbedeutend damit, ihre Elemente zu zählen; und das Zählen von Objekten ist eine der grundlegenden Aufgaben der Kombinatorik. Wenig überraschend wurden einige der folgenden Beispiele auch bereits im Abschnitt „Kombinatorik“ im vorigen Jahr behandelt. Beispiel 1.2. Die folgenden Beispiele geben ein erstes Gefühl für Mächtigkeiten: (a) Sei M = {0, 1, 2}. Dann ist |M | = 3, denn M enthält genau 3 Elemente. Für N = {a, b} gilt |N | = 2. (b) Sei M die Menge der Buchstaben des englischen Alphabets, also M = {A, B,C , . . . , Z }. Dann ist |M | = 26. (c) Für die Vereinigung1 M ∪ N der Mengen aus Beispiel (a) gilt |M ∪ N | = |{0, 1, 2, a, b}| = 5 = |M | + |N | . Die Mächtigkeit verhält sich bezüglich Vereinigung also so wie Addition. Gilt die Regel |M ∪ N | = |M |+ |N | allgemein, also für beliebige Mengen M und N ? (d) Sei M = {0, 1, 2} wie zuvor und sei diesmal N = {2, 3}. Dann ist M ∪ N = {0, 1, 2, 3} und hat somit die Mächtigkeit 4. Dies ist jedoch nicht gleich |M |+|N |, das heißt die im vorigen Beispiel vermutete Regel für |M ∪ N | gilt nicht allgemein. Das Problem ist, dass in diesem Fall die Mengen M und N das gemeinsames Element 2 enthalten, das heißt der Schnitt2 M ∩ N ist nichtleer. Bei der Formel |M | + |N | zählen wir jedoch die Elemente des Schnitts doppelt, daher erhalten wir das falsche Ergebnis. Um unsere Formel zu korrigieren, müssen wir also die doppelt gezählten Elemente wieder abziehen: |M ∪ N | = |M | + |N | − |M ∩ N | . Dies ist die bekannte Summenregel aus der Kombinatorik. Angewandt auf unser Beispiel ergibt sich |{0, 1, 2} ∪ {2, 3}| = |{0, 1, 2}| + |{2, 3}| − |{2}| = 3 + 2 − 1 = 4. (e) Eine weitere wichtige Konstruktion aus zwei Mengen M und N (neben Vereinigung und Schnitt) ist das kartesische Produkt M × N , welches alle Paare aus Elementen von M und N enthält. Für M = {0, 1, 2} und N = {a, b} ist zum Beispiel M × N = {0, 1, 2} × {a, b} = {(0, a), (1, a), (2, a), (0, b), (1, b), (2, b)}. 1 Zur Erinnerung: Die Vereinigung zweier Mengen M und N ist die Menge, die alle Elemente enthält, die in M oder N enthalten sind. 2 Zur Erinnerung: Der Schnitt zweier Mengen M und N ist die Menge, die genau diejenigen Elemente enthält, die sowohl in M als auch in N liegen. 2 Wir sehen insbesondere, dass |M × N | = 6. Allgemein sieht man leicht, dass |M × N | = |M | · |N | , denn um ein Paar aus M und N zu bilden gibt es genau |M | Möglichkeiten für das erste Element und |N | Möglichkeiten für das zweite Element. Dies ist die Produktregel aus der Kombinatorik. Neben den Konstruktionen aus den Beispielen gibt es noch eine weitere Konstruktion, die insbesondere bei dem Studium von Mächtigkeiten eine wichtige Rolle spielt: Definition 1.3. Die Potenzmenge einer Menge M ist die Menge P (M ), die genau alle Teilmengen3 M von M enthält, also P (M ) = {N | N ⊆ M }. Beispiel 1.4. Sei M = {1, 2, 3}. Dann ist die Potenzmenge von M gegeben durch © ª P (M ) = {}, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} Dabei ist {} die leere Menge, also diejenige Menge, die kein Element enthält. Wir sehen |P ({1, 2, 3})| = 8. Weitere Beispiele sind ¯© ª¯ |P ({1, 2})| = ¯ {}, {1}, {2}, {1, 2} ¯ = 4, ¯© ª¯ |P ({1})| = ¯ {}, {1} ¯ = 2, ¯© ª¯ |P ({})| = ¯ {} ¯ = 1. Die Beispiele motivieren den folgenden Satz: Satz 1.5. Für Mächtigkeit der Potenzmenge P (M ) einer Menge M gilt: |P (M )| = 2|M | . Beweis. Die Aufgabe ist es zu zählen, wie viele Teilmengen eine Menge M mit m = |M | Elementen hat. Dies tun wir folgendermaßen: Eine Teilmenge N ⊆ M ist eindeutig dadurch bestimmt, dass wir für jedes Element x ∈ M angeben, ob x in N liegen soll oder nicht. Für jedes dieser x gibt es also zwei Möglichkeiten. Da es m solcher x gibt, sind das insgesamt · . . . · 2} = 2m |2 · 2 {z m mal Möglichkeiten, wie zu beweisen war. Zusammenfassend haben wir also die folgenden Regeln für Mächtigkeiten. Satz 1.6. Für endliche Mengen M und N gilt: (i) |M ∪ N | = |M | + |N | − |M ∩ N |. (ii) |M × N | = |M | · |N |. (iii) |P (M )| = 2|M | . 1.2 Abzählbarkeit In diesem Abschnitt beschäftigen wir uns weiter mit Mächtigkeiten, jedoch nun mit der Mächtigkeit unendlicher Mengen. Es ist nicht so einfach, den Begriff „Mächtigkeit“ für solche Mengen sinnvoll zu definieren, denn wir können nicht einfach die Elemente zählen. Trotzdem hat es Sinn, verschiedene unendliche Mächtigkeiten zu betrachten anstatt einfach zu sagen alle unendlichen Mengen haben die gleiche Mächtigkeit, nämlich „unendlich“. Bevor wir zu einer exakten Definition von Mächtigkeit kommen, betrachten wir beispielhaft ein paar unendliche Mengen. 3 Zur Erinnerung: Eine Menge N heißt Teilmenge einer Menge M , geschrieben N ⊆ M , wenn jedes Element aus N auch in M enthalten ist. 3 Beispiel 1.7. Viele der folgenden (teilweise überraschenden) Beispiele haben wir bereits im Zusammenhang mit Zahlenmengen behandelt. Hier werden sie nochmal wiederholt und aus einem anderen Winkel betrachtet: (a) Die wohl einfachste unendliche Menge ist die Menge N = {0, 1, 2, 3, . . . } (1.1) der natürlichen Zahlen. Ihre Mächtigkeit werden wir im folgenden mit dem Symbol ℵ0 bezeichnen (dieses Symbol heißt „Aleph“ und ist der erste Buchstabe des hebräischen Alphabets). Also gilt |N| = ℵ0 . (b) Betrachte die Menge 2N = {0, 2, 4, 6, . . . } (1.2) der geraden natürlichen Zahlen. Welche Mächtigkeit hat diese Menge? Nun, einerseits ist 2N eine Teilmenge von N, kann also keine größere Mächtigkeit haben als N. Da in 2N außerdem die „Hälfte“ der Elemente (nämlich die ungeraden Zahlen) fehlen, ist leicht anzunehmen, dass |2N| = 12 |N|. Aber wenn man die beiden Darstellungen (1.1) und (1.2) vergleicht, so stellt man fest, dass N und 2N bis auf „Umbenennung“ der Elemente gleich sind – beides sind unendlich lange Listen von Elementen, die man nacheinander durchzählen kann. Daher ist es sinnvoll zu sagen, dass |2N| = |N| . (c) Wie sieht es mit Z = {. . . , −2, −1, 0, 1, 2, . . . } aus? Ähnlich wie zuvor könnte man zuerst denken, dass |Z| > |N|, etwa |Z| = 2 |N|, denn Z enthält N einmal in positive Richtung und einmal in negative Richtung. Andererseits kann man Z auch schreiben als Z = {0, 1, −1, 2, −2, 3, −3, . . . } und hier sieht man, dass Z wieder nichts anderes als N ist, bloß dass man die Elemente „umbenannt“ hat. Also gilt |Z| = |N| . (d) Was ist mit den rationalen Zahlen Q? Jede dieser Zahlen kann als Bruch ± ba mit a, b ∈ N geschrieben werden, das heißt Q ist so ähnlich wie die Menge N × N aller Paare von natürlichen Zahlen. Bevor wir |Q| untersuchen, schauen wir uns also erstmal |N × N| an. Wir können die Menge N×N in ein zweidimensionales Gitter schreiben, wobei der Eintrag in Spalte n und Zeile m dem Paar (n, m) ∈ N × N entspricht. Wir können dieses Gitter dann wie in Abbildung 1.1 durchlaufen und somit N × N schreiben als N × N = {(0, 0), (1, 0), (0, 1), (0, 2), (1, 1), (2, 0), (3, 0), . . . }. Wir sehen also mit der gleichen Begründung wie zuvor: |N × N| = |N| . Dies ist eine überraschende Feststellung. Wir erhalten damit auch sogleich eine Folgerung für |Q|: Einerseits gilt sicherlich |Q| ≥ |N|, denn N ist ein Teil von Q. Andererseits ist die Menge Q>0 der positiven rationalen Zahlen nicht größer als N × N und wegen |N × N| = |N| folgt |Q>0 | ≤ |N|. Ähnlich wie bei Z kann man leicht sehen, dass |Q| = |Q>0 |, also insgesamt |Q| = |N| . 4 0 1 2 3 4 5 0 • • • • • • 1 • • • • • • 2 • • • • • • 3 • • • • • • 4 • • • • • • 5 • • • • • • Abbildung 1.1: Abzählen von N × N. Dieses Ergebnis wirkt auf den ersten Blick sehr unglaubwürdig, da die rationalen Zahlen Q auf dem Zahlenstrahl dichtliegen, während die natürlichen Zahlen N in festen Abständen und daher nur „vereinzelt“ vorkommen. Dies zeigt, dass man beim Umgang mit unendlichen Mächtigkeiten sehr vorsichtig umgehen muss, vor allem dann, wenn man sich eine Menge bildlich (wie auf dem Zahlenstrahl) vorstellt! Tatsächlich ist es möglich, die natürlichen Zahlen so zu verschieben, dass auch sie dicht auf dem Zahlenstrahl liegen, indem wir sie gemäß der Abzählung von Q auf die Positionen der entsprechenden rationalen Zahlen schieben. (e) Die vergangenen Beispiele lassen vermuten, dass die Mächtigkeit aller unendlichen Mengen gleich |N|, also gleich ℵ0 ist. Kann man nicht jede Menge als unendlich lange Liste schreiben? Die Antwort darauf ist jedoch nein! Das einfachste Gegenbeispiel ist die Menge R aller reellen Zahlen (also aller Kommazahlen). Zum Beweis dieser Behauptung sei angenommen, dass es tatsächlich möglich ist, eine Abzählung R = {r 1 , r 2 , r 3 , . . . } zu finden, also die reellen Zahlen allesamt in irgendeine Reihenfolge zu bringen. Nehmen wir beispielsweise an, dass diese Liste wie folgt aussieht: r 1 = 0, 123456 . . . r 2 = 3, 141592 . . . r 3 = 2, 172818 . . . r 4 = 1, 415394 . . . r 5 = 6, 292881 . . . .. . Es genügt zu zeigen, dass diese Liste mindestens eine reelle Zahl nicht enthält. Dazu konstruieren wir eine neue reelle Zahl r wie folgt: Vor dem Komma hat r nur die Zahl 0 stehen. An der k-ten Stelle hinter dem Komma hat r eine Ziffer stehen, die sich von der Ziffer an der k-ten Stelle von r k unterscheidet (das sind die unterstrichenen Ziffern). In obiger Beispielliste heißt das also, dass r an der ersten Nachkommastelle keine 1, an der zweiten keine 4, an derdritten keine 2, an der vierten keine 3 und an der fünften keine 8 hat, usw. Diese reelle Zahl r ist nicht in der Liste enthalten. Wäre sie nämlich enthalten, so wäre sie gleich r k für irgendein k. Aber andererseits unterscheidet sich r von r k an der k-ten Nachkommastelle. Widerspruch!4 Daraus folgt also |R| > |N| . 4 Streng genommen muss man noch ein bisschen mit Perioden aufpassen, z.B. ist 0,09 = 0,1. Dies sei als kleine Übung dem Leser überlassen. 5 Die Beispiele zeigen, dass unendliche Mächtigkeiten ein wenig unintuitiv sind. Das ist kein Wunder, da die menschliche Intuition auf dem Verständnis endlicher Mengen basiert. Alles, was es im Universum gibt, ist eine endliche Menge; sogar die Menge aller Atome des gesamten Univsersums ist nur eine endliche Menge und damit viel kleiner als N! Wie in den Beispielen zu sehen, zeichnet sich die Mächtigkeit ℵ0 von N dadurch aus, dass man Mengen in eine Liste schreiben, also „abzählen“ kann. Daher definiert man: Definition 1.8. Eine Menge M heißt abzählbar, wenn sie die gleiche Mächtigkeit wie N hat (d.h. |M | = |N| = ℵ0 ). Anders ausgedrückt ist eine abzählbare Menge also eine Menge, die unendlich ist und deren Elemente man hinteinander in eine Liste schreiben (also nummerieren) kann. Eine Menge, deren Mächtigkeit größer als ℵ0 ist, heißt überabzählbar. Wir sehen also: Die Mengen N, Z, Q, 2N, Q>0 , usw. sind abzählbar; die Menge R ist dagegen überabzählbar. Man kann ohne allzugroße Schwierigkeiten zeigen, dass sogar jedes (noch so kleine) Intervall [a, b] := {x ∈ R | a ≤ x ≤ b}, für a, b ∈ R, bereits überabzählbar ist. 1.3 Mächtigkeit unendlicher Mengen Insgesamt haben wir bis jetzt die folgenden Mächtigkeiten identifiziert: 0, 1, 2, 3, 4, 5, . . . , |N| , |R| , In dieser Liste gibt es jedoch noch drei ungeklärte Lücken: 1. Gibt es eine Mächtigkeit zwischen 0, 1, 2, . . . und |N|? Mit anderen Worten: Gibt es eine Menge, die größer ist als jede endliche Menge, aber kleiner als N? 2. Gibt es eine Mächtigkeit zwischen |N| und |R|? 3. Gibt es eine Mächtigkeit größer als |R|? Gibt es also eine Menge, die noch größer ist als die Menge der reellen Zahlen? Um diese Fragen sinnvoll beantworten zu können, müssen wir zunächst den Begriff der Mächtigkeit präzisieren. Wir müssen also exakt definieren, was es heißt, dass zwei Mengen die gleiche Mächtigkeit haben. Definition 1.9. Zwei Mengen M und N heißen gleichmächtig, d.h. |M | = |N |, wenn M und N sich nur durch eine Umbenennung ihrer Elemente unterscheiden. Solch eine Umbenennung ist eine Vorschrift f , welche jedem Element m ∈ M ein Element n ∈ N zuordnet derart, dass jedes Element aus N genau einmal benutzt wird. Beispiel 1.10. Zum besseren Verständnis des Umbenennungsbegriffs seien hier ein paar Beispiele genannt: (a) Die Mengen {1, 2, 3} und {a, b, c} sind gleichmächtig. Eine Umbenennung ist zum Beispiel gegeben durch die Vorschrift f , welche 1 den Wert a, 2 den Wert b und 3 den Wert c zuordnet. Wir schreiben f (1) = a, f (2) = b und f (3) = c. (b) Die Mengen M = {1, 2} und N = {a, b, c} sind nicht gleichmächtig. Der Versuch einer Umbenennung wäre zum Beispiel f (1) = a und f (2) = b. Allerdings wird dann nicht jedes Element aus N genau einmal benutzt: c wird nicht benutzt. (c) Die Mengen M = {1, 2, 3} und N = {a, b} sind nicht gleichmächtig. Der Versuch einer Umbenennung wäre zum Beispiel f (1) = a, f (2) = b und f (3) = b. Dann wird jedoch nicht jedes Element aus N genau einmal benutzt: b wird nämlich zweimal benutzt. (d) Die Menge Z ist gleichmächtig zu N. Die Schreibweise Z = {0, 1, −1, 2, −2, 3, −3, . . . } gibt nämlich eine Umbenennung f von N nach Z an: f (0) = 0, f (1) = 1, f (2) = −1, f (3) = 2, f (4) = −2, f (5) = 3, f (6) = −3, . . . Genauso sieht man, dass das Darstellen einer Menge als unendliche Liste gleichbedeutend mit dem Angeben einer Umbenennung von N zu dieser Menge ist. 6 Wir kehren nun zu den obigen drei Lücken und den damit verbundenen Fragestellungen zurück: 1. Gibt es eine Mächtigkeit zwischen 0, 1, 2, . . . und |N|? Die Antwort lautet „nein“, denn: Sei M eine Menge, die größer ist als jede endliche Menge. Dann ist M unendlich groß. Wir müssen zeigen, dass daraus automatisch folgt, dass M mindestens so groß ist wie N. Dazu genügt es eine Teilmenge von M zu finden, die genauso groß wie N ist, also eine Teilmenge, die sich als unendliche Liste darstellen lässt. Wir konstruieren diese Teilmenge N wie folgt: Beginne bei einem beliebigen Element m 0 ∈ M . Nun nehme ein zweites Element m 1 ∈ M , dann ein drittes Element m 2 ∈ M usw. Da M unendlich ist, können wir damit immer weiter fortfahren; sonst wären irgendwann alle Elemente aus M verbraucht, also M endlich. Dann definieren wir einfach N = {m 0 , m 1 , m 2 , . . . } ⊆ M . Offensichtlich ist N abzählbar, also |N | = |N|. Damit folgt |M | ≥ |N|. 2. Gibt es eine Mächtigkeit zwischen |N| und |R|? Die Aussage, dass es keine solche Mächtigkeit gibt, wird als Kontinuumshypothese bezeichnet.5 Es wurde bewiesen, dass die Kontinuumshypothese weder beweisbar noch widerlegbar ist. Um zu verstehen, was das genau heißen mag, muss man sich etwas genauer mit mathematischer Logik beschäftigen. 3. Gibt es eine Mächtigkeit größer als |R|? Die Antwort lautet „ja“; ein Beispiel ist die Potenzmenge P (R) von R. Man kann allgemein zeigen, dass die Potenzmenge einer Menge immer eine größere Mächtigkeit hat als die Menge selbst, also |P (M )| > |M | für alle Mengen M . Insbesondere lässt sich z.B. mittels Binärdarstellungen zeigen, dass P (N) gleichmächtig zu R ist. 1.4 Längen Nachdem wir uns in den vorangegangenen Abschnitten ausführlich mit Mächtigkeiten beschäftigt hatten, werfen wir nun einen Blick auf eine andere Art der Größenmessung: Längen. Dazu betrachten wir Teilmengen von R als Punkte auf dem Zahlenstrahl und geben mit der Länge einer solchen Menge deren „Ausdehnung“ an. Der Grund für diesen neuen Größenbegriff ist einfach: Die meisten der folgenden Mengen haben die gleiche Mächtigkeit (nämlich die von R); trotzdem würde man zum Beispiel die Menge der Zahlen von 0 bis 1 als „kleiner“ ansehen als die gesamten reellen Zahlen R. Wo die Mächtigkeit uns keine Informationen mehr geben kann, hilft also die Länge (allerdings gibt es Längen nur für Teilmengen von R und nicht für beliebige Mengen!). Definition 1.11. Sei M eine Teilmenge von R. Dann bezeichnet `(M ) die Länge von M . `(M ) ist entweder eine nichtnegative reelle Zahl oder ∞. Diese „Definition“ von Längen ist eigentlich keine richtige Definition; vielmehr vertrauen wir auf ein intuitives Verständnis des Längenbegriffs und führen nur neue Notation ein. Der Grund dafür ist, dass Längen gar nicht so ohne weiteres definierbar sind; vielmehr werden Längen in der modernen Mathematik dadurch definiert, dass man eine Liste von Eigenschaften aufschreibt, die der Längenbegriff erfüllen muss. Um uns dieser Liste anzunähern, betrachten wir im Folgenden ein paar Beispiele. Dabei bezeichne [a, b] ⊆ R das Intervall von a nach b, also die Menge der Zahlen x ∈ R mit a ≤ x ≤ b. In Abbildung 1.2 sind die genannten Beispielmengen bildlich veranschaulicht. (a) `([0, 1]) = 1, denn [0, 1] ist der Strich von 0 bis 1 und der hat die Länge 1 (in der Mathematik gibt es gewöhnlich keine Längeneinheiten). (b) `([−3, −1]) = 2, denn [−3, −1] ist ein Strich der Länge 2. Allgemein sieht man leicht, dass für beliebige reelle Zahlen a und b mit a < b gilt: `([a, b]) = b − a. Denn b − a ist der Abstand der Zahlen a und b auf dem Zahlenstrahl. 5 Die Menge R wird häufig als Kontinuum bezeichnet, daher der Name. 7 (c) `([−1, 1] ∪ [2, 3]) = 3, denn diese Menge besteht aus einem Strich der Länge 2 und einem Strich der Länge 1; insgesamt ergibt sich also die Länge 2 + 1 = 3. (d) `([0, 2] ∪ [1, 3]) = 3, denn diese Menge ist ein Strich der Länge 3. Die Länge der Vereinigung von zwei Mengen ist also nicht immer die Summe der einzelnen Längen (wie im vorigen Beispiel). Wie bei den Mächtigkeiten muss man den Schnitt der beiden Mengen, hier [1, 2], gesondert betrachten. Die letzten beiden Beispiele und die Summenregel der Mächtigkeiten suggerieren die folgende Summenregel für Längen: Für zwei Mengen M , N ⊆ R gilt `(M ∪ N ) = `(M ) + `(N ) − `(M ∩ N ). Schauen wir uns nun ein paar „extremere“ Beispiele an: (e) `(R) = ∞, denn der gesamte Zahlenstrahl hat natürlich eine unendliche Länge. Das gleiche gilt für die Menge R>0 der positiven reellen Zahlen, also auch `(R>0 ) = ∞. Der Längenbegriff funktioniert bei unendlichen Mengen also nicht sehr gut (im Gegensatz zu Mächtigkeiten gibt es bei Längen auch keine verschiedenen Arten von unendlich). (f) `({0}) = 0, den ein einzelner Punkt hat keine Ausdehnung, also die Länge 0. Alternativ kann man es mit {0} = [0, 0] begründen und obige Formel für [a, b] anwenden. Wir wollen aber noch einen weiteren Weg der Begründung angeben, da dies später wichtig ist: Wir sehen dass für jede reelle Zahl a > 0 gilt: {0} ⊆ [−a, a]. Die Menge [−a, a] hat nach obiger Formel die Länge 2a. Nun verwenden wir die allgemeine Tatsache, dass für M ⊆ N gilt `(M ) ≤ `(N ), und folgern daraus `({0}) ≤ 2a für jedes a > 0. Dann muss aber offenbar `({0}) = 0 sein. (g) Wie sieht es mit einer endlichen Menge aus? Diese ist die endliche Vereinigung von Punkten; wenn wir also die Summenregel mehrmals anwenden und benutzen, dass jeder Punkt die Länge 0 hat, so erhalten wir: Jede endliche Menge hat die Länge 0. Zum Beispiel ist `({−1, 0, 21 , 23 , 1}) = 0. (h) Was passiert, wenn wir einen Punkt aus einer Menge entfernen? Da der Punkt die Länge 0 hat, wird sich die Länge der Menge nicht ändern. Zum Beispiel ist also `([−1, 1] \ {0}) = 2. Insbesondere sehen wir, dass es Mengen M , N ⊆ R gibt, sodass M eine echte Teilmenge von N ist, aber trotzdem M und N die gleiche Länge haben. 0 1 −3 (a) [0, 1] −2 0 −1 0 −1 (b) [−3, −1] 0 1 (e) R>0 1 2 3 0 (c) [−1, 1] ∪ [2, 3] 0 1 (f) {0} −1 0 1 (g) {−1, 0, 12 , 23 , 1} 1 2 3 (d) [0, 2] ∪ [1, 3] −1 0 1 (h) [−1, 1] \ {0} Abbildung 1.2: Darstellung der Mengen aus den Längenbeispielen. Wir haben nun einige allgemeine Eigenschaften von Längen gefunden: (i) Intervalle [a, b] haben die Länge b − a (für a < b). (ii) Es gilt die Summenregel `(M ∪ N ) = `(M ) + `(N ) − `(M ∩ N ). (iii) Für M ⊆ N gilt `(M ) ≤ `(N ). (iv) Endliche Mengen haben die Länge 0; wenn sich zwei Mengen um nur endlich viele Punkte unterscheiden, haben sie die gleiche Länge. Abschließend wollen wir uns dem letzten Punkt etwas genauer widmen und schauen, ob wir ihn noch ein wenig verallgemeinern können. Dass endliche Mengen die Länge 0 haben, liegt daran, dass sie nur aus „einzelnen Punkten“ bestehen und jeder dieser Punkte die Länge 0 hat. Was ist aber mit unendlichen Mengen, die nur aus einzelnen Punkten bestehen? Dazu betrachten wir die Menge N. Was ist `(N)? Es gibt zwei naheliegende Antworten: • `(N) = 0, da N nur aus einzelnen Punkten besteht. 8 • `(N) = ∞, da N nach rechts unendlich weit geht. Um der Frage auf die Spur zu kommen, konstruieren wir uns die folgende Menge M 1 : Um den Punkt 0 enthält M 1 ein Intervall der Länge 1 (also zum Beispiel [− 12 , 12 ]), um den Punkt 1 enthält M 1 ein Intervall der Länge 21 , um den Punkt 2 enthält M 1 ein Intervall der Länge 14 usw. Wir halbieren die Länge des Intervalls also in jedem Schritt. Siehe Abbildung 1.3 für eine Darstellung von M 1 . 0 1 2 3 4 Abbildung 1.3: Darstellung der Menge M 1 . Offensichtlich ist N in M 1 enthalten, also gilt `(N) ≤ `(M 1 ). Nun berechnen wir `(M 1 ): Das erste Intervall hat die Länge 1, das zweite die Länge 21 , das dritte die Länge 14 , usw., d.h. die Länge von M 1 ist `(M 1 ) = 1 + 1 1 1 1 + + + + · · · = 2. 2 4 8 16 Um zu sehen dass sich diese unendliche Summe tatsächlich beliebig nah an 2 annähert, kann man sich überlegen, dass jeder Summand den Abstand zu 2 halbiert. Man sagt die Summe „konvergiert“ gegen 2; für uns ist aber nur wichtig dass die Länge von M 1 eine endliche Zahl ist und zwar nicht größer als 2. Nun können wir den gleichen Trick wiederholen und dabei eine Menge M 2 konstruieren, nur dass wir diesmal mit einem Intervall der Länge 12 starten (dann eins der Länge 14 usw). Die so entstehende Menge M 2 enthält immer noch N, aber hat nur die halbe Länge wie M 1 , also die Länge 1. Wenn wir stattdessen mit einem Intervall der Länge 41 starten, so erhalten wir eine Menge M 3 der Länge 12 und so weiter. Da jede dieser Mengen die natürlichen Zahlen enthält folgt 1 1 1 `(N) ≤ 2, 1, , , , . . . 2 4 8 Da die Zahlen auf der rechten Seite beliebig klein werden, folgt `(N) = 0. Es stellt sich die Frage, warum wir für die Länge von N so eine umständliche Herleitung genommen haben; letztendlich verwendeten wir ja eine unendliche abzählbare Summe und wenn wir unendliche Summen erlauben, dann kann man auch gleich sagen, dass N aus unendlich vielen isolierten Punkten der Länge 0 besteht und somit `(N) = 0+0+0+· · · = 0. Dies ist in der Tat eine richtige Begründung für die Berechnung von `(N), allerdings erscheint es weniger „geschummelt“, wenn wir stattdessen die Länge von M 1 ausrechnen. Der obige Beweis für `(N) lässt sich verallgemeinern zu folgendem überraschenden Ergebnis: Satz 1.12. Für jede höchstens abzählbar unendliche Menge M ⊂ R gilt `(M ) = 0. Beweis. Der Beweis ist im Wesentlichen der gleiche wie für `(N) = 0: Schreibe M = {m 1 , m 2 , m 3 , . . . }. Wir konstruieren eine Menge M 1 folgendermaßen: M 1 hat um den Punkt m 1 ein Intervall der Länge 1, um den Punkt m 2 ein Intervall der Länge 21 , um den Punkt m 3 ein Intervall der Länge 14 . Die Länge von M 1 ist dann6 `(M 1 ) ≤ 1 + 1 1 1 1 + + + + · · · = 2. 2 4 8 16 Analog konstruiert man Mengen M 2 , M 3 , M 4 , . . . , indem man mit einem Intervall der Länge 21 , 14 , 81 , . . . beginnt. Dann ist `(M 2 ) ≤ 1, `(M 3 ) ≤ 21 , `(M 4 ) ≤ 14 usw., und da M in all diesen Mengen enthalten ist, folgt 1 1 1 `(M ) ≤ 2, 1, , , , . . . 2 4 8 Also muss `(M ) = 0 gelten, wie zu beweisen war. Eine Anwendung dieses Satzes ist die Aussage `(Q) = 0. Dieses Resultat ist ziemlich erstaunlich, da Q auf dem Zahlenstrahl dicht liegt! Es spiegelt wieder, wie viel mehr reelle Zahlen als rationale Zahlen es gibt. Wenn man eine Stecknadel zufällig auf den Zahlenstrahl fallen lässt, dann trifft sie mit Sicherheit eine irrationale Zahl. 6 Wir kriegen nur eine obere Abschätzung für `(M ), da sich die Intervalle eventuell überlappen. 1 9 1.5 Flächeninhalte und Volumen Wir werfen nun einen kurzen Blick auf die mit dem Längenbegriff verwandten Begriffe des Flächeninhalts und des Volumens. Im folgenden fassen wir R × R als die Menge der Punkte in der Ebene auf; das Paar (x, y) ∈ R × R entspricht dabei dem Punkt mit den Koordinaten x und y. Analog fassen wir R × R × R als die Menge der Punkte im Raum auf, wobei (x, y, z) ∈ R × R × R dem Punkt mit den Koordinaten x, y und z entspricht. Definition 1.13. Sei M ⊆ R × R eine Menge von Punkten der Ebene. Dann bezeichnet A(M ) den Flächeninhalt von M . Flächeninhalte sind sehr ähnlich zu Längen und erfüllen daher ähnliche Eigenschaften, insbesondere gilt die Summenregel A(M ∪ N ) = A(M ) + A(N ) − A(M ∩ N ). Aus Formelsammlungen ist bekannt, wie man den Flächeninhalt von vielen speziellen Mengen berechnet und wir wollen hier nicht darauf eingehen. Stattdessen betrachten wir einen interessanten Zusammenhang zum Längenbegriff und zur Produktregel von Mächtigkeiten. Dazu zunächst ein Beispiel. Beispiel 1.14. Betrachte die Menge M = [1, 4] × [1, 2]. Diese besteht aus allen Paaren (x, y) mit x ∈ [1, 4] und y ∈ [1, 2], das heißt M ist das in Abbildung 1.4 dargestellte Rechteck. Folglich gilt für den Flächeninhalt 2 1 1 2 3 4 Abbildung 1.4: Darstellung der Menge [1, 4] × [1, 2]. A(M ) = 3 · 1 = 3. Wir sehen also A([1, 4] × [1, 2]) = `([1, 4]) · `([1, 2]). Das Beispiel illustriert bereits die Produktregel. Allgemein gilt nämlich für zwei Mengen M , N ⊆ R: A(M × N ) = `(M ) · `(N ). Dies ist die Produktregel für Flächeninhalte und Längen. Definition 1.15. Sei M ⊆ R × R × R eine Menge von Punkten des Raumes. Dann bezeichnet V (M ) das Volumen von M . Auch das Volumen erfüllt die Summenregel und es erfüllt außerdem die Produktregel für Längen und Flächeninhalte. Wir gehen hier nicht weiter darauf ein. 1.6 Ausblick: Maßtheorie Die mathematische Theorie hinter dem Messen von Größen heißt Maßtheorie. Ein „Maß“ ist eine Vorschrift, die jeder Menge eines Systems von Mengen eine Größe in R≥0 oder ∞ zuordnet. Die oben besprochenen Längen-, Flächeninhalt- bzw. Volumenmessungen sind also Maße, die auf Teilmengen von R, von R×R bzw. R×R×R definiert sind. Die Mächtigkeit kann auch zu einem Maß umfunktioniert werden, indem allen unendlichen Mengen der Wert ∞ zugeordnet wird – natürlich geht dann bei unendlichen Mengen eine Menge Informationen über die Mächtigkeit verloren. Eine der überraschendsten Erkenntnisse im Bereich der Maßtheorie ist die Tatsache, dass es nicht möglich ist, einen sinnvollen Längen-, Flächen-, oder Volumenbegriff für alle Teilmengen von R, R × R oder R × R × R zu definieren. Am besten verdeutlicht dies das sogenannte Banach-Tarsky-Paradoxon. Banach und Tarsky haben gezeigt, dass folgendes möglich ist: Man kann eine Kugel in 24 Teilmengen zerlegen derart, dass man diese 24 Teile in zwei Gruppen von je 12 aufteilen kann, sodass diese 12 Teile jeweils zu einer 10 vollständigen Kugel zusammengesetzt werden können. Die so entstehenden zwei Kugeln haben dabei jeweils die gleiche Größe wie die Ausgangskugel. Dieses Resultat erscheint erstmal völlig unglaubwürdig. Natürlich ist diese Zerlegung in 24 Teile nicht mit realen Kugeln möglich; vielmehr basiert sie auf der Überabzählbarkeit der reellen Zahlen, einer Eigenschaft, die weit weniger intuitiv ist als sie auf den ersten Blick scheinen mag. Der Beweis von Banach und Tarsky verwendet nicht viel mehr als elementare Gruppentheorie. 11 2 Quadratische Reste In diesem Kapitel beschäftigen wir uns mit den aus den letzten beiden Jahren bereits bekannten Zahlenkongruenzen (auch Modulorechnung genannt). Dabei werden wir uns speziell mit sogenannten quadratischen Resten beschäftigen, welche ein sehr mächtiges Werkzeug im Umgang mit Quadratzahlen bilden. 2.1 Definition und Beispiele Wir beginnen mit der zentralen Definition dieses Kapitels. Definition 2.1. Sei m 6= 0 eine ganze Zahl. Ein Rest x mod m heißt quadratischer Rest, falls x der Rest einer Quadratzahl modulo m ist, das heißt falls es eine Quadratzahl y 2 mit x ≡ y 2 mod m gibt. Andernfalls heißt x mod m ein quadratischer Nichtrest 7 . Zum Verständnis der Definition betrachten wir ein paar Beispiele: Beispiel 2.2. (a) 1 ist ein quadratischer Rest modulo 5, denn 1 = 12 ist selbst schon eine Quadratzahl. (b) Was ist mit 2 modulo 7? Dies ist ebenfalls ein quadratischer Rest, denn 2 ≡ 9 = 32 mod 7. (c) Wie sieht es aber mit dem Rest 2 modulo 5 aus? Ist 2 mod 5 ein quadratischer Rest, d.h. gibt es eine ganze Zahl y mit y 2 ≡ 2 mod 5? Wir prüfen nach: 02 = 0 6≡ 2, 12 = 1 6≡ 2, 22 = 4 6≡ 2, 32 = 9 ≡ 4 6≡ 2, 42 = 16 ≡ 1 6≡ 2 mod 5. Weiter müssen wir nicht nachprüfen, denn man sieht leicht, dass sich die Folge der Reste der Quadratzahlen wiederholt: 52 ≡ 02 = 0, 62 ≡ 12 = 1, 72 ≡ 22 = 4, ... mod 5. Da der Rest 2 mod 5 bei den ersten 5 Quadratzahlen nicht vorgekommen ist, kommt 2 somit bei gar keiner Quadratzahl als Rest vor, das heißt 2 ist ein quadratischer Nichrest. (d) Was sind die quadratischen Reste modulo 7? Wir wissen aus obigem Beispiel bereits, dass 2 ein quadratischer Rest modulo 7 ist. Um die anderen quadratischen Reste zu ermitteln, betrachten wir analog zum vorigen Beispiel die ersten 7 Quadratzahlen modulo 7: 02 = 0, 11 = 1 22 = 4, 32 = 9 ≡ 2, 42 = 16 ≡ 2, 52 = 25 ≡ 4, 62 = 36 ≡ 1 mod 7. Mit der gleichen Begründung wie im vorigen Beispiel wissen wir, dass es keine weiteren quadratischen Reste modulo 7 gibt. Die quadratischen Reste modulo 7 sind also 0, 1, 2 und 4, während die quadratischen Nichtreste 3, 5 und 6 sind. Das letzte Beispiel gibt bereits ein Verfahren, wie man zu allgemeinem m die quadratischen Reste (und Nichtreste) bestimmen kann. Tabelle 2.1 zeigt die quadratischen Reste modulo 1 bis 9. m 1 2 3 4 5 6 7 8 9 Quadratische Reste modulo m 0 0, 1 0, 1 0, 1 0, 1, 4 0, 1, 3, 4 0, 1, 2, 4 0, 1, 4 0, 1, 4, 7 Quadratische Nichtreste modulo m 2 2, 3 2, 3 1, 5 3, 5, 6 2, 3, 5, 6, 7 2, 3, 5, 6, 8 Tabelle 2.1: Quadratische Reste für m = 1, 2, . . . , 9. Bemerkenswert ist vor allem der Fall m = 8. Hier gibt es nur 3 quadratische Reste und, interessanterweise, nur einen einzigen quadratischen Rest von ungeraden Zahlen. Mit anderen Worten: Jede ungerade Quadratzahl ist kongruent zu 1 modulo 8. Eine wichtige Anwendung von quadratischen Resten ist zu zeigen, dass bestimmte Zahlen keine Quadratzahlen sind. Dies wird durch folgende Beispiele veranschaulicht. 7 Die Bezeichnung „quadratischer Nichtrest“ macht eigentlich keinen Sinn: Weder ist ein solcher Rest quadratisch noch ist er kein Rest. Stattdessen sollte es „nichtquadratischer Rest“ heißen; allerdings hat sich „quadratischer Nichrest“ als Fachbegriff etabliert. 12 Beispiel 2.3. (a) Ist 9138215 eine Quadratzahl? Diese Zahl ist ungerade, daher hilft der Rest modulo 8 wahrscheinlich. In der Tat ist 9138215 ≡ 7 mod 8 und da 7 kein quadratischer Rest modulo 8 ist, kann 9138215 keine Quadratzahl sein. (b) Ist 9281732 eine Quadratzahl? Hier hilft der Rest modulo 8 nicht weiter, denn dieser ist 4 und damit ein quadratischer Rest. Allerdings hilft der Rest bei Division durch 5, denn dieser ist 2 und damit kein quadratischer Rest. Folglich ist 9281732 keine Quadratzahl. (c) Ist 4929216 eine Quadratzahl? Hier helfen weder der Rest modulo 8 noch der Rest modulo 5. Allerdings ist 4929216 ≡ 6 mod 9 und da 6 ein quadratischer Nichtrest modulo 9 ist, kann 4929216 keine Quadratzahl sein. Die Mächtigkeit quadratischer Reste rührt offenbar daher, dass eine Quadratzahl modulo jedem m 6= 0 ein quadratischer Rest sein muss. Wenn eine Zahl keine Quadratzahl ist, dann können wir dies also zeigen, indem wir ihren Rest modulo m für alle m mit der Tabelle der quadratischen Reste abgleichen. 2.2 Aufgaben zu quadratischen Resten Bevor wir quadratische Reste weiter allgemein untersuchen, schauen wir uns ein paar Anwendungen der quadratischen Reste in olympiadeartigen Aufgaben an. Aufgabe 2.4. Sei (x, y, z) ein pythagoreisches Tripel, das heißt x, y und z sind ganze Zahlen und erfüllen die Eigenschaft x 2 + y 2 = z 2 . Zeige, dass dann eine der drei Zahlen x, y, z durch 5 teilbar ist. Lösung. Wir betrachten die gegebene Gleichung x 2 + y 2 = z 2 modulo 5. Da x 2 , y 2 und z 2 Quadratzahlen sind, müssen die Zahlen modulo 5 ein quadratischer Rest sein. Davon gibt es nur 0, 1 und 4. Außerdem wissen wir nach Voraussetzung, dass die Summe der ersten beiden dieser Reste gleich dem dritten Rest ist. Nun probieren wir alle Möglichkeiten, x 2 , y 2 und z 2 mit je einem der Reste 0, 1 und 4 zu belegen, durch und schauen, wann die Summe stimmt. Alle möglichen Lösungen (bis auf Vertauschung von x und y) sind in Tabelle 2.2 zusammengefasst. x2 0 1 4 1 y2 0 0 0 4 z2 0 1 4 0 Tabelle 2.2: Mögliche Werte für x 2 , y 2 und z 2 modulo 5 bei Aufgabe 2.4. Es gibt keine weiteren Möglichkeiten. Wählt man zum Beispiel x 2 ≡ 1 und y 2 ≡ 1 modulo 5, dann ist x + y 2 ≡ 2 mod 5 und das ist kein quadratischer Rest. Nun sehen wir aber, dass in jeder Zeile der Tabelle einmal der Eintrag 0 vorkommt, das heißt in jedem Fall ist eine der drei Zahlen x 2 , y 2 , z 2 durch 5 teilbar. Da 5 eine Primzahl ist, folgt somit auch, dass eine der Zahlen x, y, z durch 5 teilbar ist, wie zu beweisen war. 2 Aufgabe 2.5. Finde alle Primzahlen p und q, sodass p 2 − 2q 2 = 1. Lösung. Ein typischer Ansatz, an diese Aufgabe heranzugehen, ist ein paar Beispiele zu probieren. Auf diese Weise findet man schnell die Lösung p = 3, q = 2. Da man keine weiteren Lösungen findet, liegt die Vermutung nahe, dass dies die einzige Lösung ist. Um zu beweisen, dass es keine andere Lösung gibt, können wir versuchen, die Gleichung modulo bestimmter Zahlen zu betrachten. Modulo 2 ergibt sich zum Beispiel p 2 ≡ 1 mod 2, woraus folgt, dass p ungerade ist. Am hilfreichsten ist jedoch, die Gleichung modulo 3 zu betrachten: p 2 + q 2 ≡ 1 mod 3 (beachte, dass −2 ≡ 1 mod 3, das heißt aus −2q 2 wird +q 2 ). p 2 und q 2 sind quadratische Reste und haben daher den Wert 0 oder 1. Man sieht sehr schnell, dass die einzigen beiden Möglichkeiten für p 2 + q 2 ≡ 1 mod 3 daher sind: Entweder p 2 ≡ 0 und q 2 ≡ 1 oder p 2 ≡ 1 und q 2 ≡ 0. Folglich ist eine der beiden Zahlen p, q durch 3 teilbar. Es gibt nur eine einzige durch 3 teilbare Primzahl, nämlich 3. Wir sehen somit, dass entweder p = 3 oder q = 3 gelten muss. Im ersten Fall ist q = 2, im zweiten Fall erhalten wir p 2 = 1 + 2 · 32 = 19, was keine Lösung hat. Damit ist die Behauptung gezeigt. Es folgen zwei Aufgaben aus der Bundesrunde der Matheolympiade, die sich elegant mit quadratischen Resten lösen lassen. 13 Aufgabe 2.6 (MO 440944). Beweise, dass es keine Paare (x, y) von ganzen Zahlen gibt, welche die Gleichung 5x 2 − 11y 2 = 21 erfüllen. Lösung. Angenommen, es gibt eine Lösung (x, y). Dann sind natürlich x 2 und y 2 quadratische Reste modulo jeder beliebigen Zahl. Wir probieren ein paar Moduli durch: 1. Da auf der linken Seite der Gleichung eine 5 auftaucht, lohnt es sich, die Gleichung modulo 5 zu betrachten (da dann der erste Summand verschwindet). Es gilt also −11y 2 ≡ 21 mod 5. Das lässt sich noch vereinfachen zu −y 2 ≡ 1 mod 5. Diese Gleichung hat aber eine Lösung, zum Beispiel y = 2. Somit hilft uns modulo 5 nicht weiter (wir wären jetzt aber fertig, wenn auf der rechten Seite zum Beispiel 22 stehen würde, denn −y 2 ≡ 2 mod 5 ist nicht lösbar; dafür müsste ja −2 ≡ 3 ein quadratischer Rest modulo 5 sein). 2. Was man immer probieren kann, ist die Gleichung modulo 8 zu betrachten, da es modulo 8 bekanntlich nur wenige quadratische Reste gibt. Es gilt 5x 2 + 5y 2 ≡ 5 mod 8. Diese Gleichung hat aber leider ebenfalls eine Lösung, zum Beispiel x = 0, y = 1. 3. Ähnlich zum ersten Versuch können wir die Gleichung auch mal modulo 11 betrachten, da dann links ein Term wegfällt. Es gilt 5x 2 ≡ 10 mod 11. Nun probieren wir für x 2 alle möglichen quadratischen Reste modulo 11 durch, das sind 0, 1, 4, 9, 5, 3. In keinem Fall ist 5x 2 ≡ 10 mod 11 erfüllt, das heißt diese Kongruenzgleichung hat keine Lösung. Damit haben wir aber bereits den gewünschten Widerspruch! Aufgabe 2.7 (MO 420944). Ermittle alle diejenigen Tripel ganzer Zahlen (a, b, c), für die die Gleichung 2a 2 + b 2 = 5c 2 gilt! Lösung. Man findet schnell die Lösung a = b = c = 0. Um zu zeigen, dass dies die einzige Lösung ist, betrachten wir die Gleichung modulo 5 (da 5 auf der rechten Seite vorkommt und somit der Term dort verschwindet): 2a 2 + b 2 ≡ 0 mod 5. a 2 und b 2 sind quadratische Reste modulo 5, können also nur einen der Werte 0, 1, 4 annehmen. Durch kurzes Probieren stellt man fest, dass die einzige Möglichkeit die Kongruenz zu erfüllen ist, dass a 2 ≡ b 2 ≡ 0 mod 5. Da 5 prim ist, folgt a ≡ b ≡ 0 mod 5, also sind a und b durch 5 teilbar. Wir schreiben also a = 5x und b = 5y für ganze Zahlen x und y. Setzen wir dies in die Ausgangsgleichung ein, so erhalten wir 50x 2 + 25y 2 = 5c 2 . Einmal mit 5 kürzen führt zu 10x 2 + 5y 2 = c 2 . Nun ist die linke Seite durch 5 teilbar, das heißt auch die rechte Seite muss durch 5 teilbar sein. Daraus folgt aber, dass c durch 5 teilbar ist. Somit ist c = 5z für eine ganze Zahl z und es gilt 10x 2 + 5y 2 = 25z 2 . Einmal mit 5 kürzen ergibt 2x 2 + y 2 = 5z 2 . Das ist aber genau die gleiche Gleichung, mit der wir angefangen haben! Insbesondere folgt mit der gleichen Argumentation wie zuvor, dass x, y und z durch 5 teilbar sind. Setzt man diese Argumentation fort, so sieht man, dass a, b und c beliebig oft durch 5 teilbar sind, wenn sie die Gleichung 2a 2 +b 2 = 5c 2 erfüllen. Es gibt aber nur eine ganze Zahl, die beliebig oft durch 5 teilbar ist, nämlich 0. Somit folgt a = b = c = 0. 2.3 Theoretische Eigenschaften quadratischer Reste Abschließend beschäftigen wir uns mit ein paar theoretischen Untersuchungen der quadratischen Reste. Als erstes gehen wir der Frage nach, wie viele quadratische Reste modulo einem fixierten m existieren. Die Tabelle 2.1 suggeriert, dass in etwa die Hälfte aller Reste mod m quadratisch sind. Tatsächlich kann man leicht zeigen, dass es nie mehr als (in etwa) die Hälfte sind: Betrachte zum Beispiel den Fall m = 7. Wir berechnen die quadratischen Reste modulo 7, indem wir alle Reste mod 7 quadrieren, wie in Tabelle 2.3 zu sehen. Auf diese Art aufgeschrieben, fällt einem sofort eine Symmetrie auf: Ab a ≡ 4 mod 7 wiederholen sich die quadratischen Reste, allerdings in umgekehrter Reihenfolge. Diese Symmetrie hat einen einfachen Grund, denn 42 ≡ (−3)2 ≡ 32 , 52 ≡ (−2)2 ≡ 22 , 14 62 ≡ (−1)2 ≡ 12 mod 7. a mod 7 a 2 mod 7 0 0 1 1 2 4 3 2 4 2 5 4 6 1 Tabelle 2.3: Quadratische Reste modulo 7. Wir sehen insbesondere, dass es beim Quadrieren sehr hilfreich sein kann, zur Gegenzahl überzugehen. Außerdem muss man zur Bestimmung aller quadratischen Reste modulo m nur die erste Hälfte der Reste durchgehen, da sich danach die Quadrate nur noch wiederholen. Wir fassen zusammen: Satz 2.8. Sei m ≥ 1. Dann ist die Anzahl der quadratischen Reste modulo m höchstens ungefähr die Hälfte von m. Genauer: Wenn m gerade ist, dann gibt es höchstens m 2 + 1 quadratische Reste modulo m und wenn m ungerade ist, dann gibt es höchstens m+1 quadratische Reste modulo m. 2 m+1 Beweis. Die Formeln m 2 + 1 und 2 folgen sofort aus der Tatsache, dass sich die quadratischen Reste wiederholen (wie oben am Beispiel m = 7 gezeigt). Der genaue Nachweis der Formeln sei dem Leser als Übung überlassen. 15 3 Netzwerke In diesem Abschnitt beschäftigten wir uns mit sogenannten Netzwerken. Diese sind ein mathematisches Modell für das Problem, möglichst viele Daten über ein Netz aus Datenkanälen mit beschränkter Kapazität zu schicken. Wir folgten dabei sehr nah den Ausführungen in Kapitel 9 des Buches „Diskrete Mathematik für Einsteiger“ von Albrecht Beutelspacher. Daher gibt es kein gesondertes Skript zu diesem Thema. 16 4 Analytische Geometrie In diesem Kapitel beschäftigen wir uns mit einer neuen und interessanten Herangehensweise an Geometrieaufgaben: Anstatt die Aufgaben auf klassische Weise zu lösen, indem man zum Beispiel geschickte Hilfspunkte oder -geraden findet und bekannte Sätze anwendet, lösen wir die Aufgabe durch explizites „Ausrechnen“ aller geometrischen Objekte in einem Koordinatensystem. Wir beschäftigen uns zunächst mit einigen Grundlagen und dem Rechnen mit Punkten und Vektoren. Anschließend betrachten wir bekannte oder weniger bekannte Sätze aus der klassischen Geometrie und versuchen diese mit unseren neuen Methoden zu beweisen – mit teilweise überraschend einfachen Lösungen. 4.1 Rechnen mit Punkten Im Folgenden wählen wir stets ein fixiertes Koordinatensystem (obwohl das Koordinatensystem während der Rechnungen fixiert bleibt, ist die anfängliche Wahl in vielen Fällen von großer Bedeutung, wie wir später sehen werden) und geben somit jedem Punkt P der Ebene zwei Koordinaten, P = (x, y). Tatsächlich werden wir nicht zwischen einem Punkt der Ebene und dem Paar seiner Koordinaten unterscheiden, das heißt für uns sind Punkte und Paare reeller Zahlen identisch8 . Der Ursprung des Koordinatensystems sei stets mit O bezeichnet. Wir gehen davon aus, dass das Konzept des Koordinatensystems aus der Schule bekannt ist; Abbildung 4.5 verdeutlicht alle eingeführten Bezeichnungen. y P = (x 0 , y 0 ) y0 x0 O x Abbildung 4.5: Ein Punkt P im Koordinatensystem. Zur Motivation der nachfolgenden Definition beginnen wir mit folgender erster Rechnung. Beispiel 4.1. Gegeben seien die beiden Punkte A = (a 1 , a 2 ) und B = (b 1 , b 2 ). Welche Koordinaten hat dann der Mittelpunkt M = (m 1 , m 2 ) der Strecke AB ? Abbildung 4.6 veranschaulicht das Problem. y A a2 M m2 b2 B b1 m1 a1 x Abbildung 4.6: Berechnung des Mittelpunkts einer Strecke. Wie man sofort sieht, sind die Koordinaten m 1 bzw. m 2 genau die Mittelpunkte der Koordinaten a 1 , b 1 bzw. a 2 , b 2 auf dem Zahlenstrahl. Wie man Mittelpunkte auf dem Zahlenstrahl berechnet, ist aber bekannt: m1 = a1 + b1 , 2 m2 = a2 + b2 . 2 Wir sehen, dass der Mittelpunkt von AB in beiden Koordinaten aus dem arithmetischen Mittel der Koordinaten der Punkte besteht. In beiden Koordinaten wird also die gleiche Rechnung durchgeführt, nämlich A+B „ A+B 2 “. Wir wollen nun dafür sorgen, dass der Ausdruck 2 eine tatsächliche mathematisch wohldefinierte Bedeutung bekommt. Dazu führen wir die folgenden naheliegenden Definitionen ein: 8 Wie wir im ersten Kapitel gelernt haben, schreibt man für die Menge aller Paare reeller Zahlen R × R oder auch R2 . Dies sind nun also auch Bezeichnungen für die Menge der Punkte in der Ebene. 17 Definition 4.2. Seien A = (a 1 , a 2 ) und B = (b 1 , b 2 ) zwei Punkte der Ebene und sei t eine beliebige reelle Zahl. Dann definieren wir: (a) A + B ist der Punkt mit den Koordinaten A + B = (a 1 + b 1 , a 2 + b 2 ). (b) t · A ist der Punkt mit den Koordinaten t · A = (t a 1 , t a 2 ). Man sieht leicht, dass die üblichen Rechenregeln für Addition und Multiplikation gelten, also Assoziativgesetz, Kommutativgesetz und Distributivgesetz. Wir können mit den Punkten also genau so rechnen wie mit Zahlen. Beachte aber, dass die Multiplikation zwei unterschiedliche Objekte multipliziert, nämlich eine Zahl und einen Punkt. Mit den neuen Definitionen sieht man: µ ¶ 1 1 A +B 1 = · (A + B ) = (a 1 + b 1 ), (a 2 + b 2 ) , 2 2 2 2 das heißt der Mittelpunkt von AB ist einfach A+B 2 . Wir betrachten nun noch die geometrische Bedeutung der eingeführten Operationen. Zunächst zur Addition (siehe Abbildung 4.7a): Wie man leicht sieht, erhält man den Punkt A + B geometrisch, indem man die Strecke O A parallel so verschiebt, dass O auf B landet; der Endpunkt von A ist dann A + B . Daraus folgt sogleich, dass das Viereck OB (A + B )A ein Parallelogramm ist. Die Multiplikation mit einer reellen Zahl ist in Abbildung 4.7b dargestellt. Wie man leicht sieht, ist das die Skalierung des Punktes auf der Gerade zum Ursprung O. y y A +B 2A A 1A 2 A O x −A B x O (b) Multiplikation mit einer Zahl. (a) Addition. Abbildung 4.7: Geometrische Veranschaulichung der Rechnung mit Punkten. Insgesamt ergibt sich: Zur Berechnung des Punktes A+B 2 berechnen wir zunächst das Parallelogramm OB (A + B )A und dann den Mittelpunkt der Strecke O(A + B ) (wegen des 12 ). Das ist aber, wie wir oben gesehen haben, zugleich der Mittelpunkt der Strecke AB . Wir haben somit (ganz nebenbei) gezeigt, dass sich die Diagonalen im Parallelogramm einander halbieren. 4.2 Geraden Die neben Punkten wohl wichtigsten Objekte der ebenen Geometrie sind Geraden. Wir wollen daher im Folgenden untersuchen, wie man Geraden in einem Koordinatensystem beschreiben kann. Gegeben seien zwei Punkte A = (a 1 , a 2 ) und B = (b 1 , b 2 ). Wie beschreibt man die Gerade g = AB durch A und B ? Man sieht leicht, dass eine Gerade allgemein beschrieben ist durch die folgenden beiden Informationen: • Ein Punkt auf der Gerade. In unserem Beispiel können wir den Punkt A wählen, oder jeden beliebigen anderen Punkt auf g . • Die „Richtung“ der Gerade. Hierbei tritt die Frage auf, was wir genau unter der „Richtung“ verstehen. Eine sinnvolle Beschreibung der Richtung ist durch ein Anstiegsdreieck gegeben, wie in Abbildung 4.8 zu sehen. Dabei interessieren uns nur die Breite und Höhe des Dreiecks, nicht aber die genaue Position. Die Breite des Dreiecks ist b 1 −a 1 und die Höhe ist b 2 −a 2 . Folglich werden Breite und Höhe durch B − A = (b 1 − a 1 , b 2 − a 2 ) beschrieben. 18 y B A x Abbildung 4.8: Anstiegsdreieck einer Geraden. Die Gerade g ist nun dadurch gegeben, dass man bei dem Punkt A startet und dann ein Vielfaches der Steigung B − A addiert. Nennt man dieses Vielfache t ∈ R, so ergibt sich der Punkt A + t · (B − A). Für t = 1 laufen wir von A die ganze Strecke nach B , das heißt wir erhalten den Punkt B (wie man leicht an der Formel sieht). Für t = 2 laufen wir über B hinaus, so lang bis wir insgesamt die doppelte Strecke von A nach B zurückgelegt haben. Für t = 21 landen wir genau in der Mitte zwischen A und B . Für t = −1 laufen wir in die entgegengesetzte Richtung, bis wir von A so weit entfernt sind wie B (nur auf der anderen Seite). Lässt man t durch alle reellen Zahlen laufen, so erhält man insgesamt alle Punkte der Gerade g . Also: g = AB = {A + t · (B − A) | t ∈ R}. Bemerkung 4.3. Wir haben mit B −A so gerechnet, als wäre es ein ganz normaler Punkt. Tatsächlich ist B −A definitionsmäßig auch ein Punkt, weil wir ja das Rechnen mit Punkten definiert haben. Andererseits fassen wir B − A aber nicht wirklich als Punkt auf, sondern eher als ein Paar von Längen, die das Steigungsdreieck festlegen. Obwohl also B − A als Paar von zwei Zahlen ein Punkt ist, denken wir darüber eher als „Richtung“ nach, was in der Mathematik auch oftmals als Vektor bezeichnet wird. Mathematisch gesehen sind Vektoren und Punkte also das gleiche; manchmal ist es aber hilfreicher einen Punkt als Richtung, also als Vektor, zu verstehen (und umgekehrt). Bemerkung 4.4. Man kann Geraden auch als Graphen von linearen (eigentlich „affinen“) Funktionen auffassen, wenn die Gerade nicht parallel zur y-Ache verläuft. Um dies mit obiger Beschreibung von Geraden zu sehen, formen wir die Beschreibung um. Schreibe dazu A = (a 1 , a 2 ) und B = (b 1 , b 2 ). Dann ist g die Menge aller Punkte P = (x, y), für die es ein t ∈ R gibt mit x = a 1 + t · (b 1 − a 1 ), y = a 2 + t · (b 2 − a 2 ). Angenommen, dass b 1 − a 1 6= 0. Dann können wir die erste Gleichung nach t umstellen, t= x − a1 , b1 − a1 und in die Gleichung für y einsetzen: y = a2 + x − a1 b2 − a2 · (b 2 − a 2 ) = a 2 + · (x − a 1 ). b1 − a1 b1 − a1 Dies ist die Gleichung einer linearen Funktion. Nachdem wir nun wissen, wie man eine Gerade beschreiben kann, interessiert uns als nächstes das Schneiden von zwei Geraden; ein großer Teil geometrische Konstruktionen basiert nämlich auf dem Schneiden von geometrischen Objekten. Seien dazu A, B , C und D vier Punkte, und sei g bzw. h die Gerade durch A und B bzw. durch C und D, also g = AB = {A + t · (B − A) | t ∈ R}, h = C D = {C + s · (D −C ) | s ∈ R}. Hierbei bezeichnen wir die Schrittweiten entlang g bzw. h mit t bzw. s. Dies ist erstmal nicht zwingend notwendig, hilft aber, um nicht zu vergessen, dass diese beiden Schrittweiten unabhängig voneinander sind. 19 Wenn wir nun g und h schneiden wollen, müssen wir einen Punkt finden, der sich auf g und h befindet. Wir müssen also die Schrittweite t auf g und die Schrittweite s auf h so bestimmen, dass sich der gleiche Punkt ergibt. Das führt auf die folgende zu lösende Gleichung: A + t · (B − A) = C + s · (D −C ). Das sieht erstmal aus wie eine Gleichung mit zwei Variablen. Tatsächlich sind es aber zwei Gleichungen, je eine für die x- und die y-Koordinate. Dadurch ergibt sich ein System von zwei Gleichungen mit zwei Variablen t und s. Wenn dieses System eine Lösung in t und s hat, so bestimmt diese Lösung den Schnittpunkt der Geraden. Andernfalls sind die Geraden parallel. Eine Anwendung von der analytischen Beschreibung von Geraden ist der folgende, erstaunlich einfache Beweis des Schwerpunktsatzes: Satz 4.5. Sei ABC ein Dreieck. Dann schneiden sich die Seitenhalbierenden von ABC in einem Punkt S (der Schwerpunkt von ABC ) und zwar im Verhältnis 2 : 1. Beweis. Wir berechnen zunächst die Mittelpunkte der drei Seiten: M BC = B +C , 2 MC A = C+A , 2 M AB = A +B . 2 Nun berechnen wir die Seitenhalbierende s a durch A. Dies ist die Gerade durch A und M BC , also s a = {A + t · (M BC − A) | t ∈ R}. Wir setzen M BC ein und formen ein wenig um: ¶ µ t t B +C − A = (1 − t ) · A + · B + · C , s a : A + t · (M BC − A) = A + t · 2 2 2 t ∈ R. Analog können wir die anderen beiden Seitenhalbierenden angeben. Für die Seitenhalbierende s b durch B und MC A erhalten wir: sb : s s · A + (1 − s) · B + · C , 2 2 s ∈ R. Wir wissen, dass es genau einen Schntitpunkt von s a und s b gibt. Diesen können wir erraten: Wir machen den Ansatz, dass der Schnittpunkt durch diejenigen Laufweiten t auf s a und s auf s b gegeben ist, für die die Koeffizienten der Punkte A, B und C übereinstimmen9 . Wir erhalten also die drei Gleichungen s 1−t = , 2 t = 1 − s, 2 t s = . 2 2 Dieses Gleichungssystem ist tatsächlich lösbar und hat die Lösung t = s = 23 . Damit sehen wir: Die Geraden s a und s b schneiden sich in demjenigen Punkt S, der durch die Laufweite 23 auf s a und auf s b gegeben ist. Dieser Punkt ist: µ ¶ 2 2 2 A + B +C S = 1− · A + 3 · B + 3 ·C = . 3 2 2 3 Nun kann man eine analoge Rechnung für s c durchführen. Aufgrund der Symmetrie von der Formel für S ist es nicht weiter überraschend, dass s c auch durch S geht. Wir sehen also, dass S der gesuchte Schwerpunkt ist und auf allen drei Seitenhalbierenden liegt. Die Schrittweite t = 23 sagt zudem, dass der Punkt S auf zwei Dritteln der Strecke von A nach M BC liegt, also AS = 23 AM BC . Wir sehen also, dass S die Strecke AM BC im Verhältnis 2 : 1 teilt. 4.3 Rechte Winkel Der Schwerpunktsatz besitzt einen sehr eleganten analytischen Beweis, da sich der Schwerpunkt auf einfache Weise mittels der Punkte ausdrücken lässt, ohne dass man die Koordinaten der Punkte explizit angeben muss. Schwieriger wird es, wenn man zum Beispiel Winkel ins Spiel bringt. Wir werden uns als Beispiel die Mittelsenkrechten eines Dreiecks ansehen; dafür müssen wir uns zunächst damit beschäftigen, wie man mit rechten Winkeln umgeht. 20 y A0 a1 A a2 a1 −a 2 x Abbildung 4.9: Drehung eines Punktes um 90◦ um den Ursprung. Sei also A = (a 1 , a 2 ) ein Punkt im Koordinatensystem. Wie berechnet man den Punkt A 0 , der aus A durch Drehung um 90◦ um den Ursprung O entsteht? Wie man in Abbildung 4.9 leicht sieht, hat A 0 die Koordinaten A 0 = (−a 2 , a 1 ). Das heißt, um einen Punkt um O um 90◦ zu drehen, tauscht man die beiden Koordinaten und negiert anschließend die erste Koordinate10 . Analog gilt: Wenn B − A ein Anstieg ist, dann erhält man den um 90◦ gedrehten Anstieg, indem man die beiden Koordinaten vertauscht und anschließend eine der Koordinaten negiert. Mit diesem Ergebnis können wir uns nun den Mittelsenkrechten eines Dreiecks widmen. Satz 4.6. Sei ABC ein Dreieck. Dann schneiden sich die Mittelsenkrechten der drei Seiten von ABC in einem Punkt. Beweis. Die Mittelsenkrechten der Seiten sind diejenigen Geraden, die durch die Mittelpunkte der Seiten gehen und senkrecht auf den Seiten stehen. Wir brauchen also die senkrechten Richtungen der Seiten und dafür brauchen wir explizit die Koordinaten der Seiten. Um die Anzahl der unbekannten Koordinaten zu reduzieren und damit die Rechnung (deutlich!) zu vereinfachen, wenden wir einen kleinen Trick an. Bevor wir mit der Rechnung beginnen, schieben wir das Koordinatensystem an eine geeignete Stelle. Wir schieben die x-Achse so, dass sie auf der Gerade AB liegt, wobei der Ursprung O genau auf dem Mittelpunkt von AB liegen soll. Anschließend skalieren wir die x-Achse so, dass B die x-Koordinate 1 hat. Das so erhaltene Koordinatensystem ist in Abbildung 4.10 zu sehen. y 2 C 1 x B 2 1 A 0 −1 −2 Abbildung 4.10: Verschiebung und Skalierung des Koordinatensystems zur einfacheren Berechnung der Mittelsenkrechten. In diesem Koordinatensystem haben A und B die Koordinaten A = (−1, 0) und B = (1, 0). Die Koordinaten von C kennen wir nicht, daher bezeichnen wir sie mit C = (x, y). Nun berechnen wir die drei Mittelsenkrechten. Die Mittelsenkrechte m c von der Seite AB ist besonders einfach: Der Mittelpunkt von AB ist M AB = (0, 0) und die Richtung der Mittelsenkrechte ist genau die Richtung der y-Achse, also (0, 1). Damit erhalten wir: ¡0¢ ¡0¢ mc : t ∈ R. 0 +t · 1 , Nun berechnen wir die Mittelsenkrechte m a von der Seite BC . Der Mittelpunkt von BC hat die Koordinaten µ ¶ B +C 1+x y = , . M BC = 2 2 2 9 Es muss nicht der Fall sein, dass dies möglich ist. Wenn wir es aber erreichen können, dass die Koeffizienten übereinstimmen, dann haben wir natürlich den gleichen Punkt (und damit den Schnittpunkt). 10 Wenn man stattdessen die zweite Koordinate negiert, erhält man eine Drehung um 90◦ in die andere Richtung. 21 Die Richtung der Gerade m a ist die senkrechte Richtung zu der Seite BC . Die Richtung der Seite BC ist C − B = (x − 1, y). Die dazu senkrechte Richtung erhalten wir durch Vertauschung der Koordinaten und Negieren einer der beiden, also (−y, x − 1). Damit ergibt sich die Gerade m a : µ 1+x ¶ ¡ −y ¢ 2 + s · x−1 , s ∈ R. ma : y 2 Analog berechnet sich die Mittelsenkrechte m b von C A: µ −1+x ¶ ¡ −y ¢ 2 mb : + r · x+1 , y r ∈ R. 2 Wir schneiden nun die Mittelsenkrechten m c und m a . Dazu müssen wir die Schrittweiten t auf m c und s auf m a so bestimmen, dass sich der gleiche Punkt ergibt; wir suchen also t und s derart, dass gilt: µ 1+x ¶ ¡ −y ¢ ¡0¢ ¡0¢ 2 + s · x−1 . + t · = y 0 1 2 Schreiben wir beide Koordinaten einzeln, so ergeben sich zwei Gleichungen: 1+x − y · s, 2 y 0 + 1 · t = + (x − 1) · s. 2 0+0·t = Dies sind zwei Gleichungen in zwei Variablen, nämlich in t und s. Aus der ersten Gleichung können wir sofort s bestimmen: s= 1+x . 2y Beachte hierbei, dass wir durch y geteilt haben und somit sicherstellen müssen, dass y nicht 0 ist. Wäre y aber 0, so läge C auf der x-Achse und das Dreieck wäre somit nur eine Gerade; diesen Fall schließen wir einfach aus und haben somit kein Problem. Wir können nun auch noch t berechnen (mit der zweiten Gleichung), aber das ist gar nicht nötig: Wir kennen ja bereits die Schrittweite s auf m a , die zu dem Schnittpunkt führt, daher müssen wir zur Berechnung des Schnittpunkts M nur dieses s in die Gleichung von m a einsetzen: µ 1+x ¶ ´ 1 + x ¡ −y ¢ ³ 0 M = 2y + · x−1 = y + (x+1)(x−1) . 2 2y 2y 2 Auf analoge Weise berechnen wir den Schnittpunkt von m b und m c und erhalten den gleichen Punkt M . Damit ist die Behauptung gezeigt. Der vorige Beweis zeigt zweierlei: Erstens lässt sich der Satz ohne besonders großartige Ideen relativ leicht mit analytischer Geometrie beweisen (die schlaueste Idee war die spezielle Wahl des Koordinatensystems, was aber ein Standardtrick ist). Zweitens ist der Beweis jedoch ziemlich lang und mit einer relativ aufwendigen Rechnung verbunden. Der obige Satz lässt sich übrigens mit normaler Geometrie sehr leicht beweisen: Es ist bekannt, dass die Mittelsenkrechte einer Strecke X Y genau die Menge der Punkte ist, die von X und Y den gleichen Abstand haben. Der Schnittpunkt der Mittelsenkrechten m c und m a hat also den gleichen Abstand zu den Punkten A und B (weil auf m c ) und den gleichen Abstand zu den Punkten B und C (weil auf m a ), folglich hat er den gleichen Abstand zu allen drei Eckpunkten des Dreiecks. Damit hat er aber auch den gleichen Abstand zu den Punkten C und A und liegt folglich auf der Mittelsenkrechte m b von C A. 4.4 Parallelität Wir haben inzwischen gelernt, wie man Geraden beschreiben kann und wie man den Schnittpunkt von zwei Geraden ausrechnen kann. Unbehandelt bleibt noch der Fall, dass zwei Geraden keinen Schnittpunkt haben, also parallel sind. Um zu überprüfen, ob zwei Geraden parallel sind, gibt es zwei Möglichkeiten: 22 1. Versuche, den Schnittpunkt der beiden Geraden zu berechnen. Falls dies nicht möglich ist, sind die Geraden parallel. 2. Überprüfe, ob die Richtungen der beiden Geraden „gleich“ sind. Wir demonstrieren beide Methoden an einem Beispiel. Gegeben seien die Geraden ¡2¢ ¡2¢ g: t ∈ R, 0 +t · 4 , ¡1¢ ¡ −1 ¢ h: s ∈ R. −1 + s · −2 , Wir wenden zuerst die erste Methode an und versuchen den Schnittpunkt von g und h zu berechnen. Dazu müssen wir Schrittweiten t auf g und s auf h finden, sodass sich der gleiche Punkt ergibt, also dass gilt: ¡2¢ ¡2¢ ¡ 1 ¢ ¡ −1 ¢ 0 + t · 4 = −1 + s · −2 In beiden Koordinaten getrennt geschrieben ergibt sich folgendes Gleichungssystem: 2 + 2t = 1 − s, 0 + 4t = −1 − 2s. Wir stellen die erste Gleichung nach s um und erhalten s = −1−2t . Einsetzen in die zweite Gleichung ergibt 4t = −1 − 2 · (−1 − 2t ) = 1 + 4t . Zieht man noch auf beiden Seiten 4t ab, so ergibt sich die Gleichung 0 = 1. Diese Gleichung ist für kein t lösbar und folglich gibt es keinen Schnittpunkt; die Geraden g und h sind parallel. Es könnte bei anderer Wahl von g und h auch sein, dass wir am Ende eine Gleichung der Form 4t = 4t erhalten. In diesem Fall erfüllen alle t die Gleichung, was darauf schließen lässt, dass die Geraden identisch sind. Wir wenden nun die zweite Methode an, vergleichen also die Richtungen. Die Richtung von g ist (2, 4) und die Richtung von h ist (−1, −2). Diese Richtungen sind erstmal nicht gleich. Wenn man sie sich aber in ein Koordinatensystem einzeichnet, sieht man, dass sie bis auf die „Länge“ und das „Vorzeichen“ schon identisch sind; siehe Abbildung 4.11. y (2, 4) x (−1, −2) Abbildung 4.11: Richtungen der Geraden g und h. Die Geraden g und h sind nur verschobene Varianten der durchgezogenen Linie in der Abbildung und folglich parallel. Man kann auch direkt an den Koordinaten der Richtungen sehen, dass sie parallel sind: Es gilt nämlich (−1, −2) = − 21 (2, 4), das heißt (−1, −2) ist Vielfaches von (2, 4) und liegt somit auf der gleichen Gerade durch O. Um herauszufinden, ob zwei Geraden parallel sind, muss man also nur überprüfen, ob die eine Richtung durch Multiplikation der anderen Richtung mit einer reellen Zahl entsteht. Alternativ kann man auch die Anstiege (also die y-Komponente durch die x-Komponente) beider Richtungen ausrechnen; wenn dieser Anstieg gleich ist, sind die Richtungen „gleich“. Im obigen Fall ist der Anstieg 2. 4.5 Skalarprodukt Wir haben uns nun ausgiebig mit Punkten und Geraden beschäftigt. Ein sehr wichtiges und noch fehlendes Konzept ist dagegen der Längen- und der Winkelbegriff. Diese beiden Dinge lassen sich mit dem sogenannten Skalarprodukt berechnen. 23 Zur Motivation der Definition des Skalarprodukts versuchen wir, die Länge einer Strecke zu berechnen. Gegeben seien also zwei Punkte A = (a 1 , a 2 ) und B = (b 1 , b 2 ) und gesucht ist die Länge der Strecke AB . Wir zeichnen die Punkte in ein Koordinatensystem, wie in Abbildung 4.12 zu sehen. y B b2 a2 A a1 b1 x Abbildung 4.12: Längenberechnung. Wir betrachten nun das in der Abbildung zu sehende rechtwinklige Dreieck. Die Strecke AB ist die Hypothenuse des Dreiecks. Die beiden Katheten haben die Längen b 1 − a 1 und b 2 − a 2 . Nach dem Satz des Pythagoras gilt: 2 AB = (b 1 − a 1 )2 + (b 2 − a 2 )2 . Indem wir noch auf beiden Seiten die Wurzel ziehen, haben wir die Länge von AB bestimmt. Man beachte zudem, dass die Vorzeichen von b 1 − a 1 und b 2 − a 2 egal sind, da diese Zahlen quadriert werden. Analog zur Definition von Punktaddition und Multiplikation von Punkten mit Zahlen wollen wir auch die obige Formel kompakter schreiben. Es fällt auf, dass auf der rechten Seite in x- und y-Koordinate die gleiche Berechnung durchgeführt wird: Subtrahiere die Koordinate von A von der Koordinate von B , dann quadriere das Ergebnis. Auf der rechten Seite steht also so etwas wie „(B − A)2 “. Um diesen Ausdruck formal korrekt zu machen, definieren wir allgemein das Produkt von zwei Punkten: Definition 4.7. Seien A = (a 1 , a 2 ) und B = (b 1 , b 2 ) zwei Punkte. Dann definieren wir das Skalarproduk A · B als A · B = a1 b1 + a2 b2 . Ein ganz wichtiges Merkmal des Skalarprodukts ist, dass das Produkt von zwei Punkten nicht ein Punkt, sondern eine Zahl ist; im Gegensatz zu vorigen Rechenoperationen mit Punkten! Dies ist auch die Herkunft des Namens, denn der Begriff „Skalar“ bedeutet so viel wie „Zahl“.11 Mit dieser neuen Definition lässt sich die Längenberechnung sehr kompakt schreiben: q p AB = (b 1 − a 1 )2 + (b 2 − a 2 )2 = (B − A)2 . Wir haben nun eine neue Art von Produkt definiert. Damit gibt es inzwischen drei Arten von Produkten: Das Produkt von zwei Zahlen (also das herkömmliche Produkt), das Produkt einer Zahl mit einem Punkt und das Produkt von zwei Punkten. Es ist wichtig sich klarzumachen, dass diese Produkte auf unterschiedlichen Arten von Objekten definiert sind und sich daher unterscheiden. Wir untersuchen nun, welche Eigenschaften das soeben eingeführte Skalarprodukt besitzt: 1. Von dem Rechnen mit Zahlen kennen wir das Kommutativgesetz, also dass A · B = B · A für alle A und B . Dieses Gesetz gilt auch für das Skalarprodukt, denn für A = (a 1 , a 2 ) und B = (b 1 , b 2 ) gilt: A · B = a 1 b 1 + a 2 b 2 = b 1 a 1 + b 2 a 2 = B · A. 2. Ebenfalls bekannt von dem Rechnen mit Zahlen ist das Assoziativgesetz A ·(B ·C ) = (A ·B )·C , also dass die Klammersetzung keine Rolle spielt. Dieses Gesetz macht aber für das Skalarprodukt erstmal gar keinen Sinn! Denn wenn A, B und C Punkte sind, dann ist (B ·C ) eine Zahl, das heißt das Produkt von A und (B · C ) ist gar nicht mehr das Skalarprodukt, sondern das Produkt einer Zahl mit einem Punkt. Obwohl wir also beide Operationen mit einem „·“ schreiben, sind es verschiedene Operationen. Man kann sich natürlich trotzdem fragen, ob die Regel A · (B ·C ) = (A · B ) ·C erfüllt ist. Die Antwort ist nein, wie das folgende Gegenbeispiel zeigt: Setze A = (1, 1), B = (1, 0) und C = (0, 1). Dann gilt ¡ ¢ ¡¡ ¢ ¡ ¢¢ ¡ ¢ ¡ ¢ ¡ ¢ A · (B · C ) = 11 · 10 · 01 = 11 · (1 · 0 + 0 · 1) = 11 · 0 = 00 , ¡¡ ¢ ¡ ¢¢ ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ (A · B ) · C = 11 · 10 · 01 = (1 · 1 + 1 · 0) · 01 = 1 · 01 = 01 . 11 Denn mit Zahlen kann man Punkte skalieren, indem man die Punkte mit der Zahl multipliziert. 24 3. Das dritte der Rechengesetze von Zahlen ist das Distributivgesetz A · (B + C ) = A · B + A · C , welches uns das Ausmultiplizieren erlaubt. Dieses Gesetz gilt auch für das Skalaprodukt: Seien A = (a 1 , a 2 ), B = (b 1 , b 2 ) und C = (c 1 , c 2 ) drei beliebige Punkte. Dann gilt: A · (B +C ) = a 1 · (b 1 + c 1 ) + a 2 · (b 2 + c 2 ) = a 1 b 1 + a 1 c 1 + a 2 b 2 + a 2 c 2 , A · B + A · C = (a 1 b 1 + a 2 b 2 ) + (a 1 c 1 + a 2 c 2 ). Die beiden rechten Seiten sind gleich, wie man nach einfachem Umordnen der Terme sieht. 4. Wie sieht es mit den binomischen Formeln aus? Wir betrachten zum Beispiel die erste binomische Formel und wenden das Kommutativgesetz und das Distributivgesetz an: (A + B )2 = (A + B ) · (A + B ) = (A + B ) · A + (A + B ) · B = A · A + B · A + A · B + B · B = A 2 + A · B + A · B + B 2 = A 2 + 2A · B + B 2 . Ähnlich zeigt man die anderen binomischen Formeln, also (A − B )2 = A 2 − 2A · B + B 2 , (A + B ) · (A − B ) = A 2 − B 2 . Bemerkenswert ist die Tatsache, dass wir für den Beweis der binomischen Formeln nur das Kommutativegesetz und das Distributivgesetz gebraucht haben; wir mussten nicht wissen, wie unser Produkt genau definiert war. Erkenntnisse dieser Art sind die Grundlage für mathematische Abstraktion und die damit verbundenen Theorien, zum Beispiel über Gruppen und andere Strukturen. 5. Ähnlich wie bei Zahlen gilt auch für Punkte die Ungleichung A 2 ≥ 0 für alle A, und es ist A 2 = 0 genau dann, wenn A = 0. Dies folgt sofort daraus, dass für A = (a 1 , a 2 ) gilt: A 2 = a 12 + a 22 . 6. Wir kommen noch einmal zur Assoziativität zurück. Wie oben besprochen, ist die Frage nach einer Assoziativität der Form A · (B · C ) = (A · B ) · C nicht sehr sinnvoll. Wir können aber einen der Punkte durch eine Zahl ersetzen, also nach einem Gesetz der Form t · (A · B ) = (t · A) · B fragen, wobei t eine reelle Zahl ist. Dieses Gesetz ist tatsächlich richtig, denn: t · (A · B ) = t · (a 1 b 1 + a 2 b 2 ) = t a 1 b 1 + t a 2 b 2 , (t · A) · B = (t · a 1 )b 1 + (t · a 2 )b 2 = t a 1 b 1 + t a 2 b 2 . Beachte, dass in diesem Gesetz alle drei Arten von Produkten vorkommen: A ·B ist das Skalarprodukt, die Multiplikation von t mit A · B ist das Produkt von Zahlen und t · A ist das Produkt einer Zahl mit einem Punkt. Wir wissen nun, dass man mit dem Skalarprodukt so ähnlich rechnen kann wie mit dem normalen Produkt. Motiviert wurde das Skalarprodukt, um dem Term (B − A)2 einen Sinn zu geben, also um Längen elegant berechnen zu können. Aber was bedeutet das Produkt A ·B geometrisch? Diese Frage lässt sich vollständig nur beantworten, wenn wir Sinus und Kosinus zur Verfügung haben, denn das Skalaprodukt misst „gleichzeitig“ die Länge und den Winkel. Da wir in diesem Skript nicht die Kenntnis von Sinus und Kosinus voraussetzen wollen, begnügen wir uns mit zwei „Extremfällen“: • Seien A und B zwei Punkte, die gemeinsam mit O auf einer Gerade liegen, das heißt B = t · A für eine reelle Zahl t . Dann gilt A · B = A · (t · A) = t · (A · A) = t · A 2 = t · p A2 · p A2 = p A2 · p t 2 · A2 = p A2 · p (t · A)2 = p A2 · p B 2. Das Skalarprodukt von A und B ist in diesem Fall also einfach das Produkt der Abstände von A und B zum Ursprung. Allgemeiner gilt: Seien A, B , C und D vier Punkte, sodass die Richtungen B − A und D −C parallel sind, also D −C = t · (B − A) für eine reelle Zahl t . Dann ist p p (B − A) · (D −C ) = (B − A)2 · (D −C )2 = AB · C D. Diese allgemeinere Aussage beweist man genauso wie die zuvor besprochene Formel. 25 • Seien A und B zwei Punkte, deren Verbindungen zu O senkrecht aufeinander stehen. Das heißt B lässt sich schreiben als B = t · A 0 für eine Zahl t und denjenigen Punkt A 0 , den man bei Drehung von A um 90◦ um O erhält. Wie im Zusammenhang mit Abbildung 4.9 besprochen, gilt A 0 = (−a 2 , a 1 ), wobei A = (a 1 , a 2 ) sei. Damit folgt: A · B = A · (t · A 0 ) = t · (A · A 0 ) = t · ¡¡ a1 ¢ ¡ −a2 ¢¢ = t · (a 1 · (−a 2 ) + a 2 · a 1 ) = t · 0 = 0. a2 · a1 Wenn die Punkte A und B also senkrecht aufeinanderstehen, dann ist ihr Skalarprodukt 0. Allgemeiner gilt: Seien A, B , C und D vier Punkte, sodass die Richtungen B − A und D − C senkrecht zueinander sind, also AB ⊥C D. Dann gilt (B − A) · (D −C ) = 0. Hiervon gilt auch die Umkehrung. Das heißt zwei Geraden AB und C D stehen genau dann senkrecht aufeinander, wenn (B − A) · (D −C ) = 0. Als Anwendung dieser geometrischen Bedeutung des Skalarprodukts beweisen wir einige geometrische Sätze, die man auf analytischem Wege relativ leicht sehen kann, die jedoch mit herkömmlichen Methoden schwer zu zeigen sind. Definition 4.8. Die Seitenhalbierenden eines Vierecks ABC D sind die Verbindungen M N und PQ der Mittelpunkte gegenüberliegender Seiten, wie in Abbildung 4.13 zu sehen. C N D Q P A M B Abbildung 4.13: Seitenhalbierende eines Vierecks. Satz 4.9. Sei ABC D ein Viereck. Die Diagonalen AC und B D stehen genau dann senkrecht aufeinander, wenn die Seitenhalbierenden von ABC D gleich lang sind. Beweis. Wir formulieren zunächst die beiden geometrischen Aussagen in analytische Aussagen um. Dass die Diagonalen AC und B D senkrecht aufeinander stehen, ist nach obiger geometrischer Interpretation des Skalarprodukts äquivalent zu AC ⊥B D ⇐⇒ (C − A) · (D − B ) = 0. Dass die Seitenhalbierenden gleich lang sind, lässt sich wie folgt schreiben: 2 2 M N = PQ ⇐⇒ M N = PQ ⇐⇒ (N − M )2 = (Q − P )2 . Wir formen nun beide Aussagen äquivalent ineinander um. Dazu verwenden wir die Formeln M = so weiter für die Mittelpunkte der vier Seiten. Wir formen um: A+B 2 (N − M )2 = (Q − P )2 µ C +D 2 ¶2 N 2 − 2N · M + M 2 = Q 2 − 2Q · P + P 2 µ ¶ µ ¶ µ ¶ C +D A +B A +B 2 D+A 2 D + A B +C B +C 2 −2· + = −2· + . 2 2 2 2 2 2 2 26 und Wir multiplizieren beide Seiten mit 4 und multiplizieren aus: C 2 + 2C D + D 2 − 2(C A +C B + D A + DB ) + A 2 + 2AB + B 2 = D 2 + 2D A + A 2 − 2(DB + DC + AB + AC ) + B 2 + 2BC +C 2 . Nun subtrahieren wir auf beiden Seiten die vier Quadrate und teilen anschließend durch 2: C D −C A −C B − D A − DB + AB = D A − DB − DC − AB − AC + BC . Nun subtrahieren wir die gesame rechte Seite und fassen zusammen: 2C D − 2C B − 2D A + 2AB = 0. Nun teilen wir durch 2 und faktorisieren: (C − A)(D − B ) = 0. Dies ist genau die Aussage, die wir haben wollten. 4.6 Parallelogrammgleichung Mit unseren Methoden der analytischen Geometrie können wir sehr einfach die sogenannte Parallelogrammgleichung herleiten, welche auch in der höheren Mathematik eine wichtige Rolle spielt. Dazu beweisen wir erstmal eine etwas allgemeinere Formel, die für jedes Viereck gilt. Satz 4.10. Sei ABC D ein Viereck mit den Seitenlängen a, b, c, d und den Diagonalenlängen e und f . Sei ferner x der Abstand der beiden Diagonalenmittelpunkte. Dann gilt: a 2 + b 2 + c 2 + d 2 = e 2 + f 2 + 4x 2 . Beweis. Zunächst stellen wir die in der Gleichung vorkommenden Längen durch die Eckpunkte dar: a 2 = (B − A)2 , e 2 = (C − A)2 , b 2 = (C − B )2 , c 2 = (D −C )2 , d 2 = (A − D)2 , µ ¶ C + A D +B 2 f 2 = (D − B )2 , x 2 = − . 2 2 Wir formen nun die behauptete Gleichung äquivalent um; a 2 + b 2 + c 2 + d 2 = e 2 + f 2 + 4x 2 (B − A)2 + (C − B )2 + (D −C )2 + (A − D)2 = (C − A)2 + (D − B )2 + 4 µ C + A D +B − 2 2 ¶2 B 2 − 2AB + A 2 +C 2 − 2BC + B 2 + D 2 − 2C D +C 2 + A 2 − 2AD + D 2 = C 2 − 2AC + A 2 + D 2 − 2DB + B 2 + (C + A)2 + (D + B )2 − 2(C + A)(D + B ) A 2 + B 2 +C 2 + D 2 − 2AB − 2BC − 2C D − 2AD = −2AC − 2DB +C 2 + 2AC + A 2 + D 2 + 2B D + B 2 − 2(C + A)(D + B ) −2AB − 2BC − 2C D − 2AD = −2(C + A)(D + B ). Diese letzte Gleichung ist immer erfüllt, wie man leicht durch Ausmultiplizieren der rechten Seite sieht. In dem Fall, dass ABC D ein Parallelogramm ist, vereinfacht sich die Gleichung: Satz 4.11 (Parallelogrammgleichung). Sei ABC D ein Parallelogramm mit Seitenlängen a und b und Diagonalenlängen e und f . Dann gilt: 2(a 2 + b 2 ) = e 2 + f 2 . Beweis. Folgt sofort aus vorigen Satz, denn in einem Parallelogramm ist c = a, d = b und x = 0. Abchließend betrachten wir eine einfache Anwendung der Parallelogrammgleichung: 27 C b a sc Mc A B c D Abbildung 4.14: Zeichnung zum Beweis von Satz 4.12. Satz 4.12. Sei ABC ein Dreieck mit Seitenlängen a, b, c. Sei M c der Mittelpunkt der Seite AB und s c = C M c die Länge der Seitenhalbierende auf die Seite AB . Dann gilt für die Länge dieser Seitenhalbierenden: 1 1 s c2 = (a 2 + b 2 ) − c 2 . 2 4 Beweis. Wir legen den neuen Punkt D so, dass das Viereck ADBC ein Parallelogramm ist, wie in Abbildung 4.14 zu sehen. Wir wenden nun die Parallelogrammgleichung auf ADBC an und erhalten: 2(a 2 + b 2 ) = c 2 + (2s c )2 . Stellt man dies nach s c um, so erhält man sofort die Behauptung. 28 5 Volständige Induktion In diesem Kapitel werfen wir einen Blick auf das bereits vor zwei Jahren vorgestellte wichtige Prinzip der vollständigen Induktion. Diese Beweismethode bildet ein sehr mächtiges Werkzeug zum Beweis von Aussagen A(n), die von einer natürlichen Zahl n abhängen und für alle diese n zu beweisen sind. Zu Beginn wiederholen wir das Prinzip der vollständigen Induktion. Anchließend schauen wir uns beispielhaft einige Anwendungen der Beweismethode an und werfen insbesondere einen Blick auf das Summenzeichen, welches komplexe Summen kompakt darzustellen vermag. 5.1 Wiederholung Gegeben sei eine Aussage A(n), die von einer natürlichen Zahl n abhängt, zum Beispiel die Aussage A(n) : 1+2+···+n = n(n + 1) . 2 Das Ziel ist, die Gültigkeit von A(n) für alle natürlichen Zahlen n zu zeigen. Das Prinzip der vollständigen Induktion besagt, dass es dafür genügt, die folgenden beiden Aussagen zu beweisen: Induktionsanfang. Beweise, dass die Aussage für das erste n gilt, das heißt, beweise die Gültigkeit von A(0). Induktionsschritt. Beweise für alle natürlichen Zahlen n die Aussage A(n) =⇒ A(n + 1). Das heißt: Angenommen, n ist eine natürliche Zahl derart, dass A(n) erfüllt ist. Zeige, dass dann auch A(n + 1) gilt. Hat man diese beiden Teile gezeigt, so folgt A(n) leicht für alle natürlichen Zahlen n: Wegen des Induktionsanfangs gilt A(0). Aus dem Induktionsschritt folgt dann sofort, dass auch A(1) erfüllt ist, sodann die Gültigkeit von A(2), dann von A(3) und so weiter. Beispiel 5.1. Wir betrachten die obige Aussage A(n), die besagt, dass 1+2+· · ·+n = zu beweisen, wenden wir das Prinzip der vollständigen Induktion an: Induktionsanfang: n = 0. A(0) besagt 0 = 0·(0+1) 2 n(n+1) . Um diese Aussage 2 und dies ist offensichtlich korrekt. Induktionsschritt: n n + 1. Angenommen, A(n) ist erfüllt für eine natürliche Zahl n. Wir nehmen also an, dass n die Eigenschaft 1 + 2 + · · · + n = n(n+1) besitzt. Zu zeigen ist, dass dann auch A(n + 1) gilt, 2 also 1 + 2 + · · · + (n + 1) = (n+1)(n+2) . Das zeigen wir folgendermaßen: 2 1 + 2 + · · · + (n + 1) = (1 + 2 + · · · + n) + (n + 1) = n(n + 1) (n + 1)(n + 2) + (n + 1) = . 2 2 Der zweite Schritt benutzt hierbei die Annahme, dass A(n) erfüllt ist. Der dritte Schritt ist eine einfache Termumformung. Aus dem Prinzip der vollständigen Induktion folgt, dass A(n) für alle n erfüllt ist. Bemerkung 5.2. Das oben genannte Prinzip der vollständigen Induktion lässt sich leicht abwandeln, auf die folgenden Weisen: (i) Statt bei n = 0 anzufangen, kann der Induktionsanfang auf eine beliebige natürliche Zahl n = n 0 angewendet werden. Der Induktionsschritt bleibt der gleiche; am Ende wurde dann die Gültigkeit von A(n) für alle n ≥ n 0 bewiesen. (ii) Im Induktionsschritt n n + 1 darf nicht nur die Gültigkeit von A(n) angenommen werden, sondern sogar die Gültigkeit von A(k) für alle k mit n 0 ≤ k ≤ n. Macht man diese Annahme, wird von starker Induktion gesprochen. 5.2 Beispiele In Bearbeitung . . . 29 6 Programmierung in Python Das Programmieren einfacher Algorithmen gehört zum Handwerkszeug eines Mathematikers, da es das Lösen von mathematischen Problemstellungen erlaubt, die per Hand kaum zu schaffen sind. Die Programmiersprache Python eignet sich besonders gut für derartige Anwendungen, da es von den Grundfunktionen des Computers stark abstrahiert und daher auch ohne große Kenntnisse der Informatik sehr effizient bedienbar ist. Aufbauend auf der Einführung in die Programmierung aus dem letzten Jahr, wurden eigenständig verschiedene Algorithmen entwickelt, unter anderem der Umgang mit Listen und Ziffern, die Berechnung von π und einfache Verschlüsselungsverfahren. Die im Kurs bearbeiteten Aufgaben mitsamt einer kurzen Einführung in Python sind unter https://www.mathematik.hu-berlin.de/~mannluca/msg/9d/material/ programming_problems.pdf abrufbar. 30 7 Mengen und Abbildungen Mengen und Abbildungen zwischen Mengen bilden zusammen mit der Logik das grundlegende Sprachgerüst der Mathematik und sind daher wichtig für alle mathematischen Gebiete. In diesem Kapitel werfen wir einen genaueren Blick auf dieses mathematische Grundgerüst. Wir beginnen mit der Definition von Abbildungen und einigen wichtigen Eigenschaften, die diese besitzen können. 7.1 Abbildungen Wir beginnen mit dem Begriff der Abbildung. Definition 7.1. Seien A und B zwei Mengen. Eine Abbildung f : A → B ist eine Vorschrift, die jedem a ∈ A (genau) ein b ∈ B zuordnet. Dieses zugeordnete b nennen wir b = f (a) und schreiben oft a 7→ b. Die Menge A heißt Definitionsbereich von f und B heißt Wertebereich von f .12 Beispiel 7.2. (a) Seien A 1 = {1, 2, 3} und B 1 = {a, b, c}. Betrachte die Abbildung f 1 : A 1 → B 1 , die durch die folgenden Angaben gegeben ist: f 1 (1) = c, f 1 (2) = a, f 1 (3) = c. Das heißt f 1 sendet 1 auf c, 2 auf a und 3 auf c. Jedem Element in A 1 ist somit ein eindeutiges Element in B 1 zugeordnet. Es ist aber erlaubt, dass mehrere Elemente aus A 1 auf das gleiche Element in B 1 abgebildet werden; siehe Element c aus B 1 . Eine anschaulichere Darstellung der Abbildung f 1 ist in Abbildung 7.15a zu sehen. Die Pfeile geben die von f 1 gegebenen Zuordnungen der Objekte in A 1 zu Objekten in B 1 an. (b) Seien A 2 = {1, 2} und B 2 = {a, b, c} und betrachte die Abbildung f 2 : A 2 → B 2 , die durch folgende Zuordnungen definiert ist: f 2 (1) = b, f 2 (2) = a. Eine anschauliche Darstellung von f 2 ist in Abbildung 7.15b zu sehen. Beachte, dass im Gegensatz zu f 1 keine zwei verschiedenene Elemente aus A 2 auf das gleiche Element in B 2 abgebildet werden. (c) Seien nun A 3 = {1, 2, 3} und B 3 = {a, b} und betrachte die Abbildung f 3 : A 3 → B 3 , die folgendermaßen definiert ist: f 3 (1) = a, f 3 (2) = b, f 3 (3) = a. Eine anschauliche Darstellung von f 3 ist in Abbildung 7.15c zu sehen. Beachte, dass im Gegensatz zu f 1 und f 2 zu jedem b ∈ B 3 ein Element a ∈ A 3 mit f 3 (a) = b existiert. (d) Sei schließlich A 4 = {1, 2, 3} und B 4 = {a, b, c} und sei f 4 : A 4 → B 4 definiert durch f 4 (1) = b, f 4 (2) = c, f 4 (3) = a. Eine anschauliche Darstellung von f 4 ist in Abbildung 7.15d zu sehen. f 4 vereint die beiden in den vorigen Beispielen angesprochenen Eigenschaften. A1 B1 A2 a 1 2 2 B1 1 A1 a c 3 (b) f 2 : A 2 → B 2 . a 2 b (c) f 3 : A 3 → B 3 . B1 1 2 b c (a) f 1 : A 1 → B 1 . A1 a 1 b 3 B2 b c 3 (d) f 4 : A 4 → B 4 . Abbildung 7.15: Anschauliche Darstellung der Abbildungen aus Beispiel 7.2. 12 Die Bezeichnungen für A und B sind in der Literatur nicht einheitlich. Statt Wertebereich wird zum Beispiel oftmals Bildbereich verwendet. 31 Bei den Beispielen 7.2 wurden bereits ein paar Eigenschaften angesprochen, die eine Abbildung f : A → B haben kann. Wir fassen diese Eigenschaften in folgender Definition zusammen: Definition 7.3. Sei f : A → B eine Abbildung. Dann heißt f (a) injektiv, wenn je zwei verschiedene Elemente aus A auf verschiedene Elemente in B abgebildet werden, (b) surjektiv, wenn auf jedes Element in B mindestens einmal abgebildet wird, (c) bijektiv, wenn f injektiv und surjektiv ist. Betrachten wir die Abbildungen aus Beispiel 7.2, so sehen wir: • f 2 ist injektiv. Dies ist in der Abbildung 7.15b daran zu erkennen, dass auf jedes Element in B 2 höchstens ein Pfeil zeigt. • f 3 ist surjektiv. Dies ist in der Abbildung 7.15c daran zu erkennen, dass auf jedes Element in B 3 mindestens ein Pfeil zeigt. • f 4 ist bijektiv. Dies ist in der Abbildung 7.15d daran zu erkennen, dass auf jedes Element in B 4 genau ein Pfeil zeigt. Bemerkung 7.4. Neben den fremdartigen Bezeichnungen injektiv, surjektiv und bijektiv gibt es auch deutsche Wörter für diese Abbildungseigenschaften, zum Beispiel wird injektiv manchmal mit eindeutig und bijektiv manchmal mit eineindeutig bezeichnet. Erfahrungsgemäß führen diese deutschen Begriffe aber oft zu Verwirrung, sodass wir ausschließlich injektiv, surjektiv und bijektiv verwenden werden. Dies hat auch den Vorteil, dass die englischen Übersetzungen fast genauso heißen. Wir betrachten einige komplexere Beispiele: Beispiel 7.5. (a) Wir beginnen mit einem sehr wichtigen allgemeinen Beispiel. Sei A eine beliebige Menge. Dann heißt die Abbildung id A : A → A, x 7→ x die Identitätsabbildung von A. Die Identität ist also einfach die Abbildung, die jedes Element auf sich selbst abbildet. Sie ist bijektiv. (b) Ähnlich wichtig wie die Identitätsabbildung ist die Inklusion: Sei A eine beliebige Menge und sei A 0 ⊂ A eine Teilmenge. Dann definieren wir die Abbildung i : A 0 → A, x 7→ x. Diese Abbildung wird als Inklusionsabbildung bezeichnet. Sie bildet jedes Element in A 0 auf sich selbst ab. Die Inklusion i ist immer injektiv. Sie ist genau dann surjektiv, wenn A 0 = A und in diesem Fall ist sie gleich id A . (c) Betrachte die Abbildung f : R → R, x 7→ x 2 . Diese Abbildung ist nicht injektiv, denn zum Beispiel für x 1 = 2 und x 2 = −2 ergibt f den gleichen Wert: f (2) = 4 = f (−2). f ist auch nicht surjektiv, denn es wird auf keine negative Zahl abgebildet. (d) Wir ändern die Abbildung aus letztem Beispiel leicht ab und betrachten nun f : R → R≥0 (der Wertebereich wurde verkleinert). Diese Abbildung ist immer noch nicht injektiv, sie ist jedoch surjektiv: auf p p jedes y ∈ R≥0 wird durch ein x ∈ R abgebildet, nämlich für x = y und für x = − y. Wir sehen also: Man kann jede Abbildung surjektiv machen, indem man den Wertebereich verkleinert. (e) Betrachte die Abbildung f : R \ {0} → R, x 7→ x1 . Diese Abbildung ist injektiv, denn aus f (x 1 ) = f (x 2 ), also x11 = x12 , folgt x 1 = x 2 . Die Abbildung ist allerdings nicht surjektiv, da nicht auf die 0 abgebildet wird. Wir können f surjektiv machen, indem wir den Wertebereich einschränken: R \ {0} → R \ {0}. Alternativ können wir den Definitionsbereich von R \ {0} auf R vergrößern; nun müssen wir aber noch ein geeignetes Bild für 0 finden (denn 01 ist natürlich nicht möglich): zum Beispel 0 7→ 0. Beide Modifikationen machen f surjektiv und erhalten die Injektivität, somit wird f in beiden Fällen bijektiv. 32 (f) Gibt es eine bijektive Abbildung R \ {0} → R? Nach den in Kapitel 1 besprochenen Eigenschaften von Mächtigkeiten sollte es nicht überraschen, dass R \ {0} und R gleichmächtig sind und sich daher nur durch eine „Umbenennung“ unterscheiden. Eine solche „Umordnung“ ist aber nichts anderes als die gesuchte bijektive Abbildung; wir erwarten daher, dass es eine bijektive Abbildung R \ {0} → R gibt. Nun versuchen wir, eine solche Abbildung explizit anzugeben. Der erste Ansatz, f : R \ {0} → R, x 7→ x, funktioniert schonmal ganz gut: f ist offensichtlich injektiv und fast surjektiv; lediglich auf die 0 wird nicht abgebildet. Wir müssen f leicht modifizieren, um auch auf die 0 abzubilden. Zum Beispiel können wir f (1) = 0 setzen. Dann wird jedoch kein Element mehr auf 1 abgebildet. Dies beheben wir durch die neue Vorschrift f (2) = 1, sodann f (3) = 2 und so weiter. Damit erhalten wir die vollständige Vorschrift: ( x − 1, falls x ∈ N>0 , f : R \ {0} → R, x 7→ x, sonst. Diese Vorschrift definiert die gewünschte bijektive Abbildung. Auf ähnliche Weise lässt sich sogar eine bijektive Abbildung R \ Z → R finden. Dies sei dem Leser als Übung überlassen. (g) Als abschließendes Beispiel betrachten wir eine etwas abstraktere Konstruktion von Abbildungen. Seien M und N zwei beliebige Mengen. Sei dann die Menge Abb(M , N ) die Menge aller Abbildungen von M nach N . Sei ferner m ein beliebiges Element aus M . Dann können wir die Abbildung δm : Abb(M , N ) → N , f 7→ f (m) betrachten; diese Abbildung ordnet jeder Abbildung f ∈ Abb(M , N ) den Wert zu, den f dem Argument m zuordnet. Die Abbildung δm ist surjektiv. Um dies zu sehen, müssen wir zeigen, dass auf jedes n ∈ N abgebildet wird. Dazu genügt es aber zu zeigen, dass es ein f ∈ Abb(M , N ) mit f (m) = n gibt. Das ist jedoch klar! Noch ein wenig abstrakter wird es, wenn wir die Abbildung δ : M → Abb(Abb(M , N ), N ), m 7→ δm betrachten. Dies Abbildung ordnet also jedem m ∈ M die zuvor konstruierte Abbildung δm zu. 7.2 Komposition von Abbildungen In diesem Abschnitt beschäftigen wir uns damit, wie man aus zwei gegebenen Abbildungen eine neue Abbildung zusammensetzen kann. Dazu dient die sogenannte Komposition von Abbildungen („Komposition“ bedeutet „Zusammensetzung“). Definition 7.6. Seien f : A → B und g : B → C zwei Abbildungen (beachte, dass der Wertebereich von f mit dem Definitionsbereich von g übereinstimmt). Dann heißt die Abbildung g ◦ f , definiert durch g ◦ f : A → C, x 7→ g ( f (x)), die Komposition (oder auch Verknüpfung) von f und g . Eine Veranschaulichung der Komposition ist in Abbildung 7.16 zu sehen. Die komponierte Abbildung g ◦ f bildet in diesem Beispiel das Element 1 ∈ A auf y ∈ C und das Element 2 ∈ A auf x ∈ C ab. x 1 2 y A f B g C g◦f Abbildung 7.16: Komposition von zwei Abbildungen. Beispiel 7.7. (a) Seien f : {1, 2, 3} → {a, b, c, d }, 1 7→ b, 2 7→ a, 3 7→ b und g : {a, b, c, d }, a 7→ 1, b 7→ 1, c 7→ 2, d 7→ 2 gegeben. Dann ist g ◦ f die Abbildung g ◦ f : {1, 2, 3} → {1, 2}, 33 x 7→ 1 für alle x ∈ {1, 2, 3}. (b) Seien A und B beliebige Mengen und seien f : A → B und g : B → A beliebige Abbildungen. Für die Identitätsabbildungen id A : A → A und idB : B → B (siehe Beispiel 7.5.(a)) gilt dann idB ◦ f = f , g ◦ id A = g . Dies liegt daran, dass die Identitätsabbildung jedes Element auf sich selbst abbildet. Wir sehen also, dass die Identitätsabbildungen unter der Komposition keine Änderung hervorrufen. (c) Seien A und B beliebige Mengen, sei f : A → B eine beliebige Abbildung und sei A 0 eine Teilmenge von A. Sei ferner i : A 0 → A die Inklusionsabbildung aus Beispiel 7.5.(b). Wir können die Komposition f ◦ i bilden: f ◦ i : A 0 → B, x 7→ f (i (x)) = f (x). Die so entstehende Abbildung ist also im Wesentlichen gleich f , nur dass der Definitionsbereich von ¯ A auf A 0 verkleinert wurde. Wir nennen f ◦i auch die Einschränkung von f auf A 0 und schreiben f ¯ A 0 . (d) Sei f : R \ {0} → R, x 7→ x1 und g : R → R, x 7→ x 2 . In diesem Fall stimmen der Wertebereich von f und der Definitionsbereich von g überein (beide sind R), sodass wir die Komposition g ◦ f bilden können. Diese Komposition ist die Abbildung µ ¶ 1 1 g ◦ f : R \ {0} → R, x 7→ g ( f (x)) = g = 2. x x Kann man auch die umgekehrte Komposition, also f ◦ g bilden? Streng genommen geht das nicht, denn der Wertebereich von g ist R und der Definitionsbereich von f ist R \ {0}, also verschieden. Um das Problem zu beheben, müssen wir die 0 aus dem Wertebereich von g entfernen. Dazu müssen wir aber auch die 0 aus dem Definitionsbereich von g entfernen, da g (0) = 0. Wir erhalten somit die neue Abbildung g̃ : R \ {0} → R \ {0}, x 7→ x 2 . Nun können wir die gewünschte Komposition bilden: f ◦ g̃ : R \ {0} → R, x 7→ f (g̃ (x)) = f (x 2 ) = 1 . x2 Interessanterweise bilden f ◦ g̃ und g ◦ f die gleiche Abbildung; das ist jedoch meistens nicht der Fall. (e) Die Abbildung sgn (der Name ist eine Abkürzung für das englische Wort „sign“, was „Vorzeichen“ bedeutet) ist folgendermaßen definiert: sgn : R → R, x 7→ 1, falls x > 0, −1, falls x < 0, 0, falls x = 0. Sei zusätzlich g : R → R die Abbildung x 7→ (x −3)2 −5. Da sgn und g in Definitions- und Wertebereich übereinstimmen, können wir sowohl g ◦sgn als auch sgn ◦g bilden, was wir im Folgenden tun werden. Betrachten wir zunächst g ◦ sgn. Das ist diejenige Abbildung von R nach R, die auf ein x ∈ R zuerst sgn und anschließend g anwendet. Nach Anwendung von sgn erhalten wir, je nach Vorzeichen von x, den Wert 1, −1 oder 0. Wenn man darauf nun g anwendet, erhält man den Wert g (1) = −1, g (−1) = 11 oder g (0) = 4. Damit ergibt sich g ◦ sgn : R → R, −1, falls x > 0, x 7→ 11, falls x < 0, 4, falls x = 0. Die umgekehrte Komposition sgn ◦g : R → R ist etwas schwieriger zu bestimmen. Da sgn als zweites angewendet wird, hat diese Abbildung nur Werte in {1, −1, 0}. Dabei wird ein x ∈ R genau dann auf 1 gesendet, wenn g (x) > 0, auf −1 für g (x) < 0 und auf 0 für g (x) = 0. Wir müssen also die folgenden drei (Un-)Gleichungen lösen: (x − 3)2 − 5 > 0, (x − 3)2 − 5 < 0, 34 (x − 3)2 − 5 = 0. Dies sind quadratische (Un-)Gleichungen, deren Lösung im normalen p Schulunterricht gelehrt wird. p In diesem Fall erhalten wir, dass (x − 3)2 − 5 = 0 die Lösungen x 1 = 3 − 5 und x 2 = 3 + 5 hat; da g eine nach oben geöffnete Parabel ist (denn der Koeffizient von x 2 ist 1 und somit positiv), gilt g (x) > 0 ⇐⇒ x < x 1 oder x > x 2 , g (x) < 0 ⇐⇒ x 1 < x < x 2 , g (x) = 0 ⇐⇒ x = x 1 oder x = x 2 . Daraus folgt schließlich p p falls x < 3 − 5 oder x > 3 + 5, 1, p p sgn ◦g : R → R x 7→ −1, falls 3 − 5 < x < 3 + 5, p 0, falls x = 3 ± 5. Die Komposition von Abbildungen ist eine Verknüpfung auf der Menge der Abbildungen. Daher spielt sie auch in der Gruppentheorie eine Rolle.13 Dies wird durch das folgende Beispiel gezeigt: Beispiel 7.8. Sei M eine beliebige Menge und sei S(M ) die Menge aller bijektiven Abbildungen M → M . Auf S(M ) ist die Komposition von Abbildungen eine Verknüpfung: Für f , g ∈ S(M ) ist f ◦ g wieder eine bijektive Abbildung M → M , also auch f ◦ g ∈ S(M ). Tatsächlich bildet S(M ) zusammen mit der Verknüpfung ◦ eine Gruppe. Wir überprüfen die drei definierenden Eigenschaften einer Gruppe: (a) Assoziativität: Seien f , g , h ∈ S(M ) drei beliebige Elemente, also drei bijektive Abbildungen M → M . Wir müssen zeigen, dass ( f ◦ g ) ◦ h = f ◦ (g ◦ h). Das ist aber klar, wenn man die Definition der Komposition anwendet: (f ◦ g)◦h : M → M, x → ( f ◦ g )(h(x)) = f (g (h(x))), f ◦ (g ◦ h) : M → M , x → f ((g ◦ h)(x)) = f (g (h(x))). Anders ausgedrückt: Sowohl ( f ◦ g ) ◦ h als auch f ◦ (g ◦ h) bilden ein x ∈ M ab, indem zuerst h, dann g und schließlich f angewendet wird. (b) Existenz des neutralen Elements: Das neutrale Element der Gruppe ist idM , denn für alle f ∈ S(M ) gilt f ◦ idM = f und idM ◦ f = f , wie bereits in Beispiel 7.7.(b) gezeigt. (c) Existenz von Inversen Elementen: Sei f ∈ S(M ). Wir bilden das Inverse f −1 : M → M von f folgendermaßen: Zu jedem y ∈ M gibt es aufgrund der Bijektivität von f genau ein Element x ∈ M , welches von f auf y abgebildet wird. Wir definieren dann f −1 (y) = x. Man sieht leicht, dass f ◦ f −1 = idM und f −1 ◦ f = idM . Tatsächlich wird die Bijektivität der Abbildungen nur für die Existenz der Inversen benötigt. Die Gruppe S(M ) ist nicht kommutativ (das heißt es gilt nicht f ◦ g = g ◦ f für alle f , g ∈ S(M )), sofern M mindestens 3 Elemente enthält. Falls M eine endliche Menge mit n Elementen ist, so wird S(M ) als S n bezeichnet und besteht aus n! Elementen. Insbesondere sehen wir: S 3 ist eine nichtkommutative Gruppe mit 6 Elementen. Im letzten Jahr haben wir alle Gruppen mit 1 bis 5 Elementen klassifiziert und festgestellt, dass diese Gruppen allesamt kommutativ sind. S 3 ist also die kleinste nichtkommutative Gruppe. 7.3 Umkehrung von Abbildungen Im letzten Beispiel aus vorigem Abschnitt haben wir zu einer bijektiven Abbildung f : M → M die inverse Abbildung f −1 : M → M konstruiert, welche die Abbildung f „umkehrt“. Wir untersuchen dieses Konzept nun ein wenig allgemeiner und genauer: 13 Zur Erinnerung: Eine Gruppe ist eine Menge G zusammen mit einer Verknüpfung ◦ (hier steht „◦“ als Platzhalter für eine beliebige Verknüpfung, nicht unbedingt für die Komposition von Abbildungen), welche je zwei Elementen g 1 , g 2 ∈ G ein Element g 1 ◦ g 2 ∈ G zuordnet, sodass folgende Eigenschaften erfüllt sind: (a) Assoziativität: Für alle g 1 , g 2 , g 3 ∈ G gilt (g 1 ◦ g 2 ) ◦ g 3 = g 1 ◦ (g 2 ◦ g 3 ). (b) Existenz eines neutralen Elementes: Es gibt ein e ∈ G, sodass für alle g ∈ G gilt: e ◦ g = g ◦ e = g . (c) Existenz von inversen Elementen: Zu jedem g ∈ G gibt es ein g −1 ∈ G derart, dass g ◦ g −1 = g −1 ◦ g = e. 35 Definition 7.9. Sei f : A → B eine Abbildung. Eine Abbildung g : B → A heißt (a) linksseitiges Inverses von f , falls g ◦ f = id A , (b) rechtsseitiges Inverses von f , falls f ◦ g = idB , (c) beidseitiges Inverses oder auch Umkehrung von f , falls g linksseitiges und rechtsseitiges Inverses von f ist. Die soeben definierten Inversen hängen stark mit Injektivität, Surjektivität und Bijektivität zusammen: Satz 7.10. Sei f : A → B eine Abbildung. Dann gilt: (i) f ist genau dann injektiv, wenn es ein linksseitiges Inverses zu f gibt. (ii) f ist genau dann surjektiv, wenn es ein rechtsseitiges Inverses zu f gibt. (iii) f ist genau dann bijektiv, wenn es eine Umkehrung zu f gibt. Die Umkehrung von f ist eindeutig. Beweis. Wir beweisen alle drei Aussagen: (i) Sei f : A → B injektiv. Gesucht ist eine Abbildung g : B → A derart, dass für jedes x ∈ A gilt: g ( f (x)) = x. g muss also so definiert werden, dass es jedes f (x) ∈ B zurück auf x schickt. Das ist auch tatsächlich möglich, denn aus der Injektivität von f folgt, dass aus f (x) auf eindeutige Weise das x zurückgewonnen werden kann (ohne Injektivität wäre es möglich, dass verschiedene x-Werte von f auf das gleiche y ∈ B abgebildet werden; g müsste dann dieses y gleichzeitig auf all die x-Werte abbilden, was natürlich nicht möglich ist). Somit haben wir g für alle f (x) ∈ B definiert. Die verbleibenden Elemente y ∈ B können von g beliebig abgebildet werden. Insgesamt haben wir das gewünschte g konstruiert. Sei nun umgekehrt f : A → B derart, dass es ein linksseitiges Inverses g : B → A gibt. Wir wollen zeigen, dass f injektiv ist. Sei also angenommen, wir hätten zwei Elemente x 1 , x 2 ∈ A, die von f auf das gleiche Element y = f (x 1 ) = f (x 2 ) in B abgebildet werden. Nun wenden wir g auf y an und erhalten g (y) = g ( f (x 1 )) = g ( f (x 2 )). Da g aber ein linksseitiges Inverses zu f ist, gilt ferner g ( f (x 1 )) = x 1 und g ( f (x 2 )) = x 2 , also insgesamt x 1 = x 2 , wie gewünscht. (ii) Sei f : A → B surjektiv. Gesucht ist eine Abbildung g : B → A derart, dass für jedes y ∈ B gilt: f (g (y)) = y. Das heißt g muss jedes y ∈ B auf ein x ∈ A abbilden derart, dass f dieses x zurück auf y abbildet. Wir wählen daher zu jedem y ∈ B ein beliebiges x ∈ A mit f (x) = y aus (das geht wegen der Surjektivität von f ) und definieren g (y) = x. Damit haben wir die gesuchte Abbildung konstruiert. Sei umgekehrt f : A → B derart, dass es ein rechtsseitiges Inverses g : B → A gibt. Wir zeigen, dass f surjektiv ist. Sei dazu y ∈ B beliebig gegeben; gesucht ist ein x ∈ A mit f (x) = y. Dazu wählen wir x = g (y), denn dann gilt f (x) = f (g (y)) = y wie gewünscht. (iii) Sei f bijektiv. Dann gibt es zu jedem y ∈ B ein eindeutiges x ∈ A mit f (x) = y. Die Umkehrung g : B → A kann und muss also durch g (y) = x definiert werden. Dann ist g ( f (x)) = g (y) = x, also g ◦ f = id A , und f (g (y)) = f (x) = y, also f ◦ g = idB . Umgekehrt: Wenn es eine Umkehrung zu f : A → B gibt, dann gibt es insbesondere ein linksseitiges und ein rechtsseitiges Inverses zu f , also folgt aus obigen Beweisen, dass f injektiv und surjektiv ist; folglich ist f auch bijektiv. In den meisten Anwendungen spielen links- und rechtsseitige Inverse keine Rolle; die Umkehrung einer bijektiven Abbildung wird dagegen oft gebraucht. Wir betrachten einige Beispiele: Beispiel 7.11. (a) Sei f : {1, 2, 3} → {a, b, c}, 1 7→ b, 2 7→ a, 3 7→ c. Die Umkehrung f −1 : {a, b, c} → {1, 2, 3} erhalten wir durch „Umdrehen“ der Abbildungspfeile: a 7→ 2, b 7→ 1, c 7→ 3. (b) Sei f : R → R, x 7→ x 2 . Diese Abbildung hat keine Umkehrung, da sie nicht bijektiv ist: f ist weder injektiv noch surjektiv. Um f surjektiv zu machen, schränken wir den Wertebereich auf die tatsächlich angenommenen Werte ein, also R → R≥0 . Um f injektiv zu machen, müssen wir den Definitionsbereich derart einschränken, dass es zu jedem y ∈ R≥0 nur ein x mit x 2 = f (x) = y gibt. Dazu gibt es zwei kanonische Möglichkeiten: R≥0 und R≤0 . ¯ Die jeweils eingeschränkte Abbildung notieren wir wie in Beispiel 7.7.(c) mit f ¯R≥0 : R≥0 → R≥0 und ¯ f ¯R≤0 : R≤0 → R≥0 . Die Umkehrungen dieser beiden Abbildungen sind wie folgt: ¯ p ( f ¯R≥0 )−1 : R≥0 → R≥0 , x 7→ x, ¯ p ( f ¯R≤0 )−1 : R≤0 → R≥0 , x 7→ − x. 36