Vorkurs Mathematik 30. September 2009 Inhaltsverzeichnis 1 Einführung 1.1 Stenographie mit Sigma und Pi . . . . . . . . . . . . . . . . . . . . . 1.2 Indexverschiebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Das 2.1 2.2 2.3 2.4 Prinzip der Induktion Der Irrtum von Fermat Vollständige Induktion Der kleine Gauß . . . . Alle Dinge sind gleich . . . . . . . . . 3 Kombinatorik – die Kunst des 3.1 Das Urnenmodell . . . . . 3.2 Der Binomialkoeffizient . . 3.3 Der fehlende Fall . . . . . 3.4 Der binomische Lehrsatz . . . . . . . . . . . . . . . . . . . . . Zählens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 5 . . . . 7 7 7 9 10 . . . . 12 12 14 17 18 4 Abbildungen 21 4.1 Wichtige Vokabeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 4.2 Was nicht passt... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 5 Formale Logik 5.1 Aussagenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Prädikatenlogik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 27 28 29 6 Folgen 32 6.1 Das kleine Epsilon . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 6.2 Rasante Schildkröten und 9er-Perioden . . . . . . . . . . . . . . . . . 36 6.3 Die Exponentialreihe . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 1 6.4 Die harmonische Reihe . . . . . . . . . . . . . . . . . . . . . . . . . . 40 7 Zahlbereiche 7.1 Von Gruppen und Körpern – . . . . . . . . . . . . . . . . . . . . . 7.2 Das Füllen der Lücken – . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Die fehlenden Wurzeln – . . . . . . . . . . . . . . . . . . . . . . . . 7.4 Rechnen in . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.5 Die Exponentialfunktion im Komplexen - Trigonometrische Funktionen 42 42 44 46 47 49 8 Untersuchung reeller Funktionen 8.1 Das Epsilon bekommt ein Delta 8.2 Folgenstetigkeit . . . . . . . . . 8.3 Differentialrechnung . . . . . . . 8.4 Rechenregeln für Ableitungen . . 53 53 56 58 62 C R C Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Unendlichkeit 66 9.1 Endliche und unendliche Mengen . . . . . . . . . . . . . . . . . . . . 66 9.2 Überabzählbarkeit – noch mehr als . . . . . . . . . . . . . . . . . . 69 N 10 Lineare Gleichungssysteme 72 10.1 Die erweiterte Koeffizientenmatrix . . . . . . . . . . . . . . . . . . . . 72 10.2 Der Gauß-Algorithmus . . . . . . . . . . . . . . . . . . . . . . . . . . 73 11 Matrizenkalkül 75 11.1 Addition und Multiplikation von Matrizen . . . . . . . . . . . . . . . 75 11.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 12 Vektorräume 12.1 Veranschaulichung am Beispiel 2 und 3 . . . . . . . . . . . . . . . 12.2 Der abstrakte Vektorraumbegriff . . . . . . . . . . . . . . . . . . . . . 12.3 Operationen von Matrizen auf Vektoren . . . . . . . . . . . . . . . . R R 79 79 80 82 13 Der Dimensionsbegriff 85 13.1 Linearkombinationen und Erzeugendensysteme . . . . . . . . . . . . . 85 13.2 Basis und Dimension . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 14 Anhang: Lösungen 90 If people do not believe that mathematics is simple, it is only because they do not realize how complicated life is. John v. Neumann 2 Vorkurs Mathematik 1 Einführung Mathematik ist eine basisdemokratische Wissenschaft. Es gibt keine Geheimnisse, jeder kann eine logische Argumentation nachvollziehen. Prof. A. Beutelsbacher 1.1 Stenographie mit Sigma und Pi N Im Folgenden soll die Menge der natürlichen Zahlen {1, 2, 3, 4, . . .} mit bezeichnet werden. Dabei wird stillschweigend davon ausgegangen, dass 0 ∈ / . Die Menge der natürlichen Zahlen mit 0 soll mit 0 bezeichnet werden. N N (Aus einem IQ-Test) Fügen Sie zu den Reihen diejenige Zahl zu, die logisch folgen müsste: 1, 1, 2, 3, 5, 8, ? 1, 3, 6, 10, ? 65536, 256, 16, ? Bei dieser Art Tests geht es darum, ein System zu erkennen, das der Zahlenreihe zugrunde liegt. Das Erkennen eines solchen Systems wird gemeinhin als “intelligentes Verhalten” gedeutet – aber wie verhält es sich mit der Logik? Schauen wir uns diese Zahlenreihe an: 3, 5, 7, ? Einerseits könnte man sagen, die nächste Zahl sei die 9 und dann käme 11, 13, 15 – der Abstand beträgt jeweils 2. Andererseits stehen dort die ersten drei ungeraden Primzahlen, so dass man diese Reihe auch mit 11, 13, 17 fortsetzen könnte. Keine der beiden Begründungen hat logisch gesehen Vorrang vor der anderen. Kein System ist “besser” oder “naheliegender” als das andere. Hier noch ein vielleicht etwas abstruses Beispiel. Die folgende Reihe von Buchstaben soll “logisch” fortgesetzt werden: M, D, M, D, ?, ?, ? Eine Möglichkeit wäre natürlich die Folgende: M, D, M, D, M, D, M Eine ganz andere Art sieht so aus: M, D, M, D, F, S, S Hierbei interpretiert man die Buchstaben als die Anfangsbuchstaben der Wochentage Montag, Dienstag, Mittwoch und Donnerstag – worauf dann natürlich “logischerweise” Freitag, Samstag und Sonntag folgen. Auch wenn dieses Beispiel nicht ganz ernst gemeint ist, verdeutlicht es doch ein grundlegendes Dilemma: wie kann man solche Zahlenfolgen, mit denen man es auch 1 Einführung 3 Vorkurs Mathematik in der Mathematik zu tun hat, platzsparend aufschreiben ohne in die “Mehrdeutigkeitsfalle” zu tappen? Nehmen wir mal an, wir möchten die Summe der ersten 10 ungeraden Zahlen bilden: 1 + 3 + 5 + 7 + 9 + 11 + 13 + 15 + 17 + 19 = 100 (Wer’s nicht glaubt, rechnet es nach.) Wenn es dann nicht mehr die ersten 10, sondern die ersten 30 (oder 500) ungeraden Zahlen sind, möchte man die Notation vielleicht etwas abkürzen. Aber eine Schreibweise wie 1 + 3 + 5 + · · · + 19 = 100 hat es in sich, wie wir gesehen haben – woher kann man sicher sein, dass der Leser des Textes nicht ein anderes System findet und benutzt? Wie kann man deutlich machen, dass man in dieser Summe wirklich alle ungeraden Zahlen haben möchte und zum Beispiel nicht nur die Primzahlen? Die Lösung liegt in der Benutzung einer besonderen Notation, die das Problem in den Griff bekommt und alle Mehrdeutigkeiten beseitigt. Man schreibt zum Beispiel für die obige Summe 10 X (2k − 1) = 100 k=1 Das sieht auf den ersten Blick verwirrend aus (Wo kommt der Buchstabe k her?), aber ist ungemein praktisch. Das Zeichen ist ein griechischer Buchstabe, ein großes Sigma (Σ). Es soll an S wie Summe erinnern. Der Laufindex k wird eingeführt und soll bei 1 beginnend alle ganzen Zahlen bis einschließlich 10 durchlaufen. (In der Informatik kennt man das als f or-Schleife mit Zählvariable k). Für jeden ganzzahligen Wert von k wird der Ausdruck hinter dem Σ berechnet. Alle diese Ausdrücke werden dann aufaddiert. Es wird sofort deutlich, dass die obige Formulierung tatsächlich das Gewünschte leistet. Für k = 1 ist der Klammerausdruck gleich 1 und jedes Mal, wenn k um eines größer wird, vergrößert sich der nächste Summand um 2, es werden also die ungeraden Zahlen durchlaufen. Für k = 10 kommt man beim letzten Summanden 19 an. Hier zeigt sich ein weiterer Vorteil der Notation: nehmen wir mal an, dass wir uns nicht festlegen wollen, bis wohin unsere Summe geht, sondern einfach eine natürliche Zahl n ∈ wählen und die Summe der ersten n ungeraden Zahlen bilden möchten. Dann schreiben wir einfach n X (2k − 1) N k=1 und erhalten das Gewünschte, ganz gleich ob n = 10 oder n = 500 ist. Später werden wir zeigen, dass der Wert dieser Summe stets n2 ist. 1 Einführung 4 Vorkurs Mathematik Übung 1.1.1. Berechne die folgenden Summen: 7 X (k 2 − k) k=3 7 µ X j=5 6 X 1 2j − 7 ¶ 2α α=0 Analog zum Summenzeichen Σ verwendet man auch ein Zeichen, um Produkte zu bilden. Sollen die Terme miteinander multipliziert werden, verwendet man ein großes Pi (Π). Das Produkt der ersten n natürlichen Zahlen (n! sprich: “n Fakultät.”) kann also wie folgt geschrieben werden: n! = n Y i i=1 Wenn klar ist, über welchen Ausdruck zu summieren bzw. multiplizieren ist, werden die Klammern oft fortgelassen. 1.2 Indexverschiebung Kommen wir nun zu einem etwas formaleren Aspekt der Notation mit Summenbzw. Produktzeichen. Dabei soll im Folgenden nur das Summenzeichen betrachtet werden, die Überlegungen für das Produktzeichen laufen völlig analog. Ausgangspunkt dieser Überlegung ist, dass die Wahl des Bereiches, die unsere Zählvariable durchläuft etwas willkürlich ist. Das folgende Beispiel soll das illustrieren: 4 X (k + 1)2 = 22 + 32 + 42 + 52 = k=1 5 X k2 k=2 Es ist offensichtlich, dass beide Notationen mit dem Summenzeichen die gleiche Summe meinen. Der Unterschied besteht darin, dass der Laufindex k “verschoben” wurde. In der zweiten Summe läuft er nicht von 1 bis 4, sondern von 2 bis 5 – dafür muss zum Ausgleich in der Summe das k durch k − 1 ersetzt werden (bzw. k + 1 durch k). Ein weiteres Beispiel, aus der obigen Übung: 7 µ X j=5 1 2j − 7 ¶ = 3 µ X j=1 1 2(j + 4) − 7 ¶ = 3 µ X j=1 1 2j + 1 ¶ Die wichtige Regel ist also: wird der Wertebereich des Laufindexes nach unten verschoben, so muss der Index selbst zum Ausgleich vergrößert werden und umgekehrt. 1 Einführung 5 Vorkurs Mathematik Übung 1.2.1. Berechne folgenden Ausdruck: 10 X (k − k + k) + 7 5 30 X ¡ (k − 20)5 − (k − 20)7 ¢ k=21 k=1 Als Anwendung der Indexverschiebung soll für eine reelle Zahl q 6= 1 die folgende Formel bewiesen werden: n X 1 − q n+1 Für alle n ∈ gilt: qk = 1−q k=0 N Beweis. Nach Multiplikation mit dem Nenner genügt es zu zeigen: n X (1 − q) · q k = 1 − q n+1 k=0 Multipliziere die linke Seite aus: n n n X X X k k (1 − q) · q = (q ) − q · qk k=0 k=0 = = n X k=0 n X k=0 (q k ) − (q k ) − k=0 n+1 X k=1 k=0 = 1+ n X n X (q k ) − q k+1 qk à n X ! (q k ) + q n+1 k=1 k=1 n+1 = 1−q In diesem Beweis wird ein weiteres wichtiges Prinzip beim Rechnen mit Summen deutlich: man kann Summanden abspalten und einzeln hinschreiben. So kann man zum Beispiel die folgende Summe umschreiben: n+1 X k=1 2 k = n X (k 2 ) + (n + 1)2 k=1 Oder die folgende elementare Formel für Fakultäten notieren: (n + 1) · n! = (n + 1) · n Y i= i=1 n+1 Y i = (n + 1)! i=1 Als Schlussbemerkung noch eine Konvention: taucht ein Summenzeichen auf, das keine Summanden enthält, so wird dies die “leere Summe” genannt und bekommt per Definition den Wert 0. Dies macht Sinn, weil 0 das “neutrale Element” der Addition ist – die Addition einer 0 ändert den Wert einer Summe nicht. Analog wird das “leere Produkt” als 1 definiert, da bei der Multiplikation die 1 das neutrale Element ist. Als Konsequenz erhalten wir: 0! = 0 Y i=1 i=1 1 Einführung 6 Vorkurs Mathematik 2 Das Prinzip der Induktion 2.1 Der Irrtum von Fermat Pierre de Fermat (franz. Mathematiker) betrachtete Zahlen der Form n Fn = 22 + 1 n∈ N Die ersten dieser Zahlen lauten: F0 F1 F2 F3 F4 = = = = = 3 5 17 257 65537 Dies sind alles Primzahlen und so vermutete Fermat im Jahre 1637, dass alle weiteren Zahlen dieser Form ebenfalls Primzahlen seien. Ein solcher Schluss wird in der Logik “Induktion” genannt: man schließt von einer Teilmenge an Beispielen auf die Gesamtheit. Induktionsschlüsse sind im Alltag weit verbreitet: “Morgen wird die Sonne aufgehen, weil sie es heute tat und gestern und vorgestern...” Logisch gesehen sind solche Schlüsse allerdings nicht zulässig! Selbst wenn man noch so viele Beispiele kennt, zeigt dies nicht den allgemeinen Fall. Der Satz: “Alle Menschen sind weiblich.” ist mit Sicherheit falsch und doch gibt es sehr viele Beispiele, die diese Behauptung stützen können. Ähnlich verhält es sich auch mit den Fermat-Zahlen. Etwa 100 Jahre nach der Vermutung entdeckte Euler im Jahre 1732, dass die nächste Fermat-Zahl keine Primzahl ist: F5 = 4294967297 = 641 · 6700417 Inzwischen wird sogar vermutet, dass alle weiteren Fermat-Zahlen Fn mit n ≥ 5 keine Primzahlen sind, aber ein formaler Beweis steht bislang noch aus. 2.2 Vollständige Induktion Wir wollen hier ein anderes Beispiel betrachten. Schauen wir uns die Summen der ersten ungeraden Zahlen an, die wir schon im ersten Kapitel gesehen haben: 1 4 9 16 25 = = = = = 1 1+3 1+3+5 1+3+5+7 1+3+5+7+9 Es fällt auf, dass auf der linken Seite stets eine Quadratzahl steht. Diese Vermutung kann man jetzt mit Hilfe der Summennotation allgemein für beliebiges n ∈ formulieren: N 2 Das Prinzip der Induktion 7 Vorkurs Mathematik Vermutung. Für alle n ∈ N gilt: n X (2k − 1) = n2 k=1 Für n ∈ {1, 2, 3, 4, 5} haben wir uns schon von der Richtigkeit der Vermutung überzeugt. Aber das Beispiel der Fermat-Zahlen lehrt uns, dass dies noch kein Beweis für die Richtigkeit der allgemeinen Vermutung ist. Und natürlich kann man nicht alle Fälle nachrechnen, weil das unendlich viele sind. Was ist der Ausweg aus diesem Dilemma? Die Lösung des Problems ist ein Beweisverfahren, das unter dem Namen “vollständige Induktion” bekannt ist. Gegeben ist eine Aussage in Abhängigkeit von n, sagen wir A(n). In unserem Fall ist also A(n) die Aussage n X N (2k − 1) = n2 k=1 Für gegebenes n ∈ kann A(n) wahr oder falsch sein. Wir haben uns oben davon überzeugt, dass A(1) bis A(5) wahr sind, möchten aber gern beweisen, dass A(n) für alle n ∈ eine wahre Aussage darstellt. Die vollständige Induktion geht nun in zwei Schritten vor: N 1) Der Induktionsanfang. Man beweist, dass A(1) gilt. 2) Der Induktionsschritt. Man beweist: falls für ein n ∈ ist, dann auch die Aussage A(n + 1). N die Aussage A(n) wahr Der Trick besteht also darin, dass man im Induktionsschritt von der Aussage für ein beliebiges n ∈ auf den Nachfolger n + 1 schließt. Hat man beide Schritte gezeigt, ist man fertig und hat bewiesen, dass die Aussage für alle n ∈ gilt. N N Im Detail stelle man sich das so vor: der Induktionsanfang beinhaltet die Wahrheit der Aussage A(1). Jetzt wenden wir den Induktionsschritt für n = 1 an und erhalten, dass A(2) eine wahre Aussage ist. Jetzt aber können wir wieder den Induktionsschritt für n = 2 anwenden und erhalten A(3) und so weiter. Ein hilfreiches Bild ist vielleicht das Folgende: man stelle sich die Aussagen wie Dominosteine vor, die aneinander gereiht sind. Wenn ein Dominostein umfällt, dann soll das bedeuten, dass die Aussage wahr ist. Der Induktionsschritt formuliert nun das Gesetz, dass ein fallender Dominostein seinen Nachbarn umstößt. (Wenn A(n) gilt, dann auch A(n + 1).) Und der Induktionsanfang garantiert uns das Fallen des ersten Steins – und damit fallen alle um. Soweit die graue Theorie. Widmen wir uns dem Beweis der obigen Vermutung – der Induktionsanfang ist geleistet, wir haben uns davon überzeugt, dass A(1) wahr ist. Kommen wir also zum Induktionsschritt: Beweis. Sei n ∈ N beliebig, so dass A(n) wahr ist, d.h. es gelte n X (2k − 1) = n2 k=1 2 Das Prinzip der Induktion 8 Vorkurs Mathematik Zu zeigen ist, dass aus dieser Voraussetzung A(n + 1) folgt. Rechnen wir das nach: n+1 X n X ¡ ¢ IV (2k − 1) + 2(n + 1) − 1 = n2 + 2n + 1 = (n + 1)2 (2k − 1) = k=1 k=1 Das kleine “IV” (Induktionsvoraussetzung) deutet die Stelle an, an der benutzt wird, dass A(n) laut Annahme gilt. Zusammenfassend kann man sagen, dass der eigentliche Trick der Induktion darin besteht, den Schluss von einer Zahl auf ihren Nachfolger allgemein zu formulieren, so dass dieser im Prinzip beliebig oft anwendbar ist. Zum Schluss noch eine geometrische Anschauung der soeben bewiesenen Formel: Beginnend mit einem Kästchen in der oberen linken Ecke, wird immer eine ungerade Anzahl an Kästchen hinzugefügt und es entsteht jeweils wieder ein Quadrat. 2.3 Der kleine Gauß Es wird eine Anekdote über den deutschen Mathematiker Carl-Friedrich Gauß erzählt, der im Alter von neun Jahren in der Schule die Strafarbeit aufbekam, die natürlichen Zahlen von 1 bis 100 alle aufzuaddieren. Die abkürzende Notation benutzend sollte also die Summe 100 X i i=1 berechnet werden. Laut der Anekdote soll der “kleine Gauß” seinen Lehrer damit überrascht haben, in kürzester Zeit auf das (korrekte) Ergebnis 5050 zu kommen. Aufgrund dieser Anekdote, deren Wahrheitsgehalt ungewiss ist, trägt die folgende Formel den Namen “Gaußsche Summenformel” oder manchmal auch einfach “der kleine Gauß”: n X n(n + 1) i= 2 i=1 2 Das Prinzip der Induktion 9 Vorkurs Mathematik Für n = 100 ergibt sich gerade 100·101 = 50 · 101 = 5050. Der Beweis der Formel 2 funktioniert über vollständige Induktion. Beweis. a) Induktionsanfang Sei n = 1. Dann steht auf der linken Seite 1 P i = 1 und auf i=1 der rechten gerade 1·2 =1 2 Die Aussage ist also für n = 1 wahr. b) Induktionsschritt Die Aussage gelte für n ∈ n+1 X i=1 i= n X i=1 N. Es folgt: n · (n + 1) 2n + 2 n2 + 3n + 2 i + (n + 1) = + = 2 2 2 IV Andererseits gilt aber n2 + 3n + 2 (n + 1)(n + 2) = 2 2 Dies zeigt die Behauptung. Übung 2.3.1. Zeige mit vollständiger Induktion: n X j2 = j=1 Übung 2.3.2. Seien a, d ∈ druck n(n + 1)(2n + 1) 6 N. Gesucht ist eine geschlossene Formel für den Ausn X (a + kd) k=0 Stelle eine Vermutung auf und beweise sie mit vollständiger Induktion. 2.4 Alle Dinge sind gleich Zum Schluss des Kapitels über vollständige Induktion noch eine kleine Warnung: manchmal muss man bei solchen Beweisen sehr genau hinschauen, sonst können sich Fehler einschleichen. Wir werden nun eine offensichtlich falsche Aussage mit vollständiger Induktion beweisen. Die Aussage lautet: “Alle Studierenden an der Universität Bielefeld studieren das Gleiche.” Um diese Aussage mit Induktion angehen zu können, muss noch eine natürliche Zahl n irgendwo auftauchen. Daher wird die Aussage in Abhängigkeit von n wie folgt umformuliert: “In einer beliebigen Menge von n Studierenden studieren alle das Gleiche.” Dies soll die Aussage A(n) sein, die im Folgenden mit vollständiger Induktion bewiesen wird. 2 Das Prinzip der Induktion 10 Vorkurs Mathematik Beweis. a) Induktionssanfang Sei n = 1. In einer beliebigen Menge, die nur einen Studenten oder eine Studentin enthält, ist die Aussage klar. N b) Induktionsschritt Nehmen wir an, die Aussage sei für n ∈ bewiesen. Wir nehmen uns nun eine beliebige Menge M her, in der n+1 Studierende sind und wollen zeigen, dass die alle das Gleiche studieren. Geben wir den Elementen von M Namen: M = {a1 , a2 , . . . , an+1 } Betrachten wir nun eine Teilmenge von M , in welcher der erste Studierende fehlt: M 0 = {a2 , a3 , . . . , an+1 } M 0 enthält nur n Studierende und die studieren nach Induktionsvoraussetzung alle das Gleiche. Fehlt noch a1 – aber zu diesem Zweck betrachten wir eine zweite Teilmenge: M̃ = {a1 , a2 , . . . , an } Auch in dieser Menge sind nur n Studierende enthalten, die wieder nach Induktionsvoraussetzung alle das Gleiche studieren. Nehmen wir uns nun ein beliebiges Element ak aus dem Schnitt (also ein ak aus der Menge {a2 , . . . , an }), so folgt, dass a1 das Gleiche studiert wie ak und ak das Gleiche wie an+1 , denn a1 und ak liegen in M̃ und ak und an+1 liegen in M 0 . Damit ist die Aussage bewiesen und alle Studierenden aus M studieren das Gleiche. Da an der Universität nur endlich viele Studierende eingeschrieben sind, muss man n nur groß genug wählen und die Aussage A(n) für dieses n zeigt die Behauptung. Natürlich kann man diesen Beweis nun für beliebige Dinge führen: Alle Bücher heißen gleich, alle Menschen haben das gleiche Geschlecht, alle Häuser sind gleich hoch... Übung 2.4.1. Finde den Fehler im vorliegenden Induktionsbeweis. N Übung 2.4.2. Sei M eine Menge mit n Elementen für ein n ∈ . Zeige mit vollständiger Induktion: Die Menge aller Teilmengen von M enthält 2n Elemente. Beachte, dass auch die leere Menge ∅ := {} und M selbst Teilmengen von M sind. 2 Das Prinzip der Induktion 11 Vorkurs Mathematik 3 Kombinatorik – die Kunst des Zählens 3.1 Das Urnenmodell In diesem Kapitel soll die Kombinatorik behandelt werden. Grob gesprochen versteht man unter Kombinatorik das “Abzählen von Möglichkeiten”. Was damit gemeint ist, soll folgendes Beispiel illustrieren: Angenommen ein Kleiderschrank enthält 4 Pullover, 6 Hosen und 3 Paar Schuhe. Wieviele Möglichkeiten gibt es für den Besitzer des Kleiderschrankes, sich damit einzukleiden? Da zu jedem der 4 Pullover jede der 6 Hosen getragen werden kann (modische Überlegungen kurz außer Acht gelassen), gibt es rein rechnerisch 4 · 6 = 24 Möglichkeiten. Hier wird das wichtigste Prinzip der Kombinatorik deutlich: wenn verschiedene Möglichkeiten kombiniert werden, dann müssen die Zahlen multipliziert werden (und nicht etwa addiert). Hinzu kommen noch die 3 Paar Schuhe – wieder kann man jede der 24 vorher genannten Möglichkeiten mit jedem Paar Schuhe kombinieren, so dass man auf das Ergebnis 3 · 24 = 72 kommt. Einfache Fälle wie diese kann man direkt berechnen. Für die komplexeren Aufgabenstellungen hat sich das sogenannte “Urnenmodell” bewährt. Dabei stellt man sich einen Versuch als Urnenziehung vor: in einer Urne befindet sich eine gewisse Anzahl unterscheidbarer Kugeln (diese sind z.B. durchnummeriert) und der Versuch besteht darin, die Kugeln aus der Urne zu ziehen. Dazu ein Beispiel: Angenommen man hat einen Würfel, mit dem man 10 Mal würfelt und die Ergebnisse nacheinander notiert. Wieviele Möglichkeiten gibt es dafür? Diesen Versuch kann man auch über eine Urnenziehung simulieren: man stellt sich eine Urne mit 6 Kugeln vor, aus der nacheinander gezogen wird, wobei nach jeder Ziehung das Ergebnis notiert und die Kugel wieder in die Urne geworfen wird (schließlich kann beim Würfeln die gleiche Zahl mehrfach fallen). Ein anderes Beispiel: bei einem Preisausschreiben gibt es drei verschiedene Preise zu gewinnen. Die Namen aller Teilnehmer befinden sich in der Urne und die Gewinner werden nacheinander gezogen. Wieviele Möglichkeiten gibt es dafür? Es gibt viele weitere Beispiele, die sich durch solche Urnenziehungen modellieren lassen. Daher genügt es, die Lösungen für diese Modelle anzugeben. Im ersten Fall ist das nicht schwer: man spricht von einem Modell “mit Zurücklegen”, d.h. die Kugeln werden nach der Ziehung wieder in die Urne geworfen. Ein solcher Fall liegt immer vor, wenn (wie beim Würfel) ein Ergebnis mehrfach auftreten kann. Nehmen wir an, dass die Urne n Kugeln enthält und k Mal gezogen wird. Für die erste Kugel gibt es n Möglichkeiten, für die zweite ebenso usw. Da nach der obigen Regel multipliziert werden soll, erhalten wir für die Anzahl der Möglichkeiten k |n · n · n{z· . . . · n} = n k Faktoren 3 Kombinatorik – die Kunst des Zählens 12 Vorkurs Mathematik In unserem Würfelbeispiel ist n = 6 und k = 10, es ergibt sich also eine Zahl von 610 = 60466176 Möglichkeiten. Etwas schwieriger ist der Fall beim Preisausschreiben: hier wird die gezogene Kugel nicht zurück in die Urne gelegt, es gibt also bei weiteren Ziehungen weniger Möglichkeiten. In diesem Fall muss auch n ≥ k vorausgesetzt werden, denn aus einer Urne mit n Kugeln können nicht mehr als n herausgenommen werden. Wie sieht also eine Formel in diesem Fall aus? Nun, für die erste Kugel gibt es wie oben noch n Möglichkeiten, für die zweite nur noch (n − 1), für die dritte (n − 2) und so weiter. Die Formel lautet also n · (n − 1) · (n − 2) · . . . · (n − k + 1) = | {z } k Faktoren k−1 Y (n − i) i=0 Diese Formel sieht etwas kompliziert aus, aber es gibt glücklicherweise eine Art, die einfach aufzuschreiben. Dazu ergänzt man einfach die fehlenden Faktoren bis 1 und erhält so n!. Die zuviel hinzugefügten Faktoren kürzt man dann wieder raus. Das ändert am Ergebnis nichts, ist aber eine übersichtlichere Art das Ganze aufzuschreiben: n Y n! i= (n − k)! i=n−k+1 Nehmen wir zum Beispiel an, dass 50 Personen an dem Preissausschreiben teilgenommen haben, bei dem es 3 verschiedene Preise zu gewinnen gab, so ergeben sich 50! 50! = = 50 · 49 · 48 = 117600 (50 − 3)! 47! Möglichkeiten. Als wichtiger Spezialfall sei noch folgendes Problem genannt: gegeben sind n Objekte. Wieviele Möglichkeiten gibt es, diese anzuordnen? Auch dies kann man mit Hilfe einer Urne simulieren. Man nimmt eine Urne mit n Kugeln, die den Objekten eindeutig zugeordnet sind und zieht dann n Mal ohne Zurücklegen. Die Reihenfolge, in der die Kugeln gezogen werden liefert die Anordnung der Objekte. Hierfür gibt es dann natürlich n · (n − 1) · (n − 2) · . . . · 2 · 1 = n! Möglichkeiten: n für die erste Kugel, (n − 1) für die zweite und so weiter. Aber natürlich kann man auch obige Formel für k = n anwenden und erhält: n! n! = = n! (n − n)! 0! Hier zeigt sich jetzt, dass unsere Konvention 0! = 1 aus dem ersten Kapitel in diesem Zusammenhang sehr sinnvoll ist, man erspart sich unerlaubte Divisonen durch 0. Übung 3.1.1. Wieviele Möglichkeiten hat ein Skatspieler sein Blatt zu Beginn des Spiels anzuordnen? Beim Skat erhält jeder Spieler 10 verschiedene Karten. 3 Kombinatorik – die Kunst des Zählens 13 Vorkurs Mathematik Übung 3.1.2. Am Roulette-Tisch werden stets die letzten 6 gezogenen Zahlen gezeigt - wieviele Möglichkeiten gibt es für diese Anzeige? (Beim Roulette gibt es in jeder Runde 37 Möglichkeiten.) Übung 3.1.3. Gegeben sei ein Toto-Schein für 11 Spiele. Bei jedem Spiel hat man die Möglichkeit, 0, 1 oder 2 anzukreuzen. Wieviele Möglichkeiten gibt es, den Schein auszufüllen? Übung 3.1.4. Wieviele Summanden enthält der folgende Ausdruck, wenn er ausmultipliziert wird? (a + b + c) · (d + e) · (f + g + h + j) · (u + w + x + y + z) 3.2 Der Binomialkoeffizient Alle Beispiele des vorigen Abschnittes hatten eines gemeinsam: es kam auf die Reihenfolge des Ergebnisses an. Konkret: im Beispiel mit den Würfelreihen bezeichnet die Reihe 1, 2, 1, 2, 1, 2, 1, 2, 1, 2 eine andere Reihe als 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, obwohl die gleichen Zahlen nur in anderer Reihenfolge auftreten. Aber in vielen Beispielen ist das anders: betrachten wir das Lottospiel “6 aus 49”. Dieses Spiel ist bereits als Urnenziehung gegeben, dort werden 6 Kugeln aus 49 gezogen und zwar ohne Zurücklegen. Aber die Reihenfolge in der die Kugeln gezogen werden spielt für das Ergebnis keine Rolle, die Ziehung (3, 12, 34, 1, 44, 20) ist identisch mit der Ziehung (34, 12, 44, 20, 1, 3). Wie kann man für einen solchen Fall die Anzahl der Möglichkeiten bestimmen? Ausgangspunkt der Überlegungen ist die Formel aus dem vorigen Kapitel. Wir stellen uns wieder eine Urne mit n Kugeln vor, aus denen k ohne Zurücklegen gezogen werden, wobei es uns diesmal nicht auf die Reihenfolge ankommt. Die Formel aus dem letzten Kapitel lautete n! (n − k)! Wenn ich nun aber mein Ergebnis, bestehend aus k Zahlen, vor mir habe, gibt es noch k! Möglichkeiten, diese Zahlen umzusortieren, wie oben gesehen. Es fallen also je k! Möglichkeiten zu einer zusammen, da beliebig umsortiert werden darf. Wenn aber je k! Möglichkeiten zu einer zusammengefasst werden, muss man die obige Formel einfach durch k! dividieren, um auf das gewünschte Ergebnis zu kommen. Die Formel für diesen Fall lautet also: n! (n − k)! · k! Weil dieser Ausdruck so häufig vorkommt, gibt es eine abkürzende Schreibweise dafür: µ ¶ n n! := k (n − k)! · k! ¡n¢ Man spricht das Symbol k dann “n über k” und nennt das “Binomialkoeffizienten”. Warum das so merkwürdig heißt, sehen wir später noch. 3 Kombinatorik – die Kunst des Zählens 14 Vorkurs Mathematik Als erste Anwendung kann gleich das Lottospiel dienen: es gibt beim Lotto exakt µ ¶ 49 49! 49 · 48 · 47 · 46 · 45 · 44 = = = 13983816 6 43! · 6! 6! Möglichkeiten. Übung 3.2.1. In der Vorlesung “Mathematik für Informatiker” sitzen 200 Personen. Das Studentenwerk verlost 3 Mensagutscheine mit einem Wert von je 10 Euro. Wieviele Möglichkeiten gibt es, 3 Preisträger auszuwählen? Übung 3.2.2. Zeige: µ ¶ µ ¶ n n = =1 n 0 und µ ¶ µ ¶ n n = k n−k Der Binomialkoeffizient gibt auch eine Antwort auf eine weitere Frage, die in der Mathematik manchmal von Bedeutung ist: Sei M eine Menge mit n Elementen und sei k ≤ n. Wieviele Teilmengen von M gibt es, die genau k Elemente haben? Die ¡n¢ Antwort ist k . Man kann sich die Bildung einer Teilmenge auch wieder als Urnenziehung vorstellen. Die Reihenfolge, in der die Elemente auftauchen spielt dabei keine Rolle. Diese Anschauung im Hinterkopf fällt uns dann auch die Interpretation und der Beweis der folgenden grundlegenden Formel für das Rechnen mit Binomialkoeffizienten nicht schwer. Es gilt nämlich für n ∈ und k ≤ n: ¶ µ ¶ ¶ µ µ n n n+1 + = k k−1 k N Beweis. Die linke Seite der Gleichung wird als Anzahl der k-elementigen Teilmenge der (n + 1)-elementigen Menge M = {a1 , a2 , . . . , an+1 } interpretiert. Wir teilen diese zu zählenden Teilmengen in zwei Typen ein: Typ 1: Teilmengen, die das Element an+1 enthalten. Zusätzlich kommen dann 0 noch (k − 1) Elemente ¡ n ¢ aus der n-elementigen Menge M = {a1 , . . . , an } hinzu und dafür gibt es k−1 Möglichkeiten. Typ 2: Teilmengen, die das Element an+1 nicht enthalten. Dann müssen aber alle k Elemente aus der Menge M 0 kommen, die n Elemente hat und dafür ¡n¢ gibt es k Möglichkeiten. Da jede k-elementige Teilmenge von M entweder vom Typ 1 oder vom Typ 2 ist, müssen wir diese Anzahlen einfach addieren und erhalten das gewünschte Ergebnis. Übung 3.2.3. Beweise die Formel µ ¶ µ ¶ µ ¶ n+1 n n = + k k−1 k ¡n¢ n! . elementar mit Hilfe der Definition von k als (n−k)!·k! 3 Kombinatorik – die Kunst des Zählens 15 Vorkurs Mathematik Diese Formel erlaubt uns jetzt, die Binomialkoeffizienten mit Hilfe des sogenannten Pascalschen Dreiecks hinzuschreiben und damit¡ auszurechnen. Die n-te Zeile des ¢ ¡n¢ n Dreiecks enthält dabei die Binomialkoeffizienten 0 bis n , wobei man zweckmäßig mit Zeile 0 beginnt. Das sieht dann so aus: 1 1 1 1 1 1 1 2 3 4 5 6 1 3 6 10 15 1 1 4 10 20 .. . 1 5 15 1 6 1 Wie das Dreieck aufgebaut wird, ist klar: man benutzt die Formel, die einem in diesem Fall sagt, dass jeder Eintrag in dem Dreieck gleich der Summe der beiden Einträge darüber ist. Man kann aber auch die ursprüngliche kombinatorische Bedeutung der Einträge in dem Diagramm wiederfinden. Dazu interpretiert man die Positionen als Knotenpunkte und die Zahlen geben dann die Anzahl der Wege an, auf denen man einen bestimmten Knoten von der Spitze aus erreichen kann, wenn man nur nach unten gehen darf. Das kann man auf zwei Arten einsehen: einerseits ist das Dreieck so aufgebaut, dass die Zahl in jedem Knoten die Summe der beiden direkt darüber liegenden Zahlen ist. Wenn ich also den Knoten links oben auf a Wege erreichen kann und den Knoten rechts auf b Wege, dann habe ich insgesamt a + b Wege für den Knoten, der zwischen den beiden darunter liegt, weil ich ja entweder von dem einen oder dem anderen herkomme. Andererseits kann man einen “Weg durch das Diagramm” als Folge von Entscheidungen notieren, entweder nach links oder nach rechts zu gehen. Um in Zeile n den Knoten Nummer k zu erreichen, muss man n Mal die Entscheidung “links oder rechts” treffen und dabei genau k Mal nach rechts gehen. Im Urnenmodell formuliert: In der Urne liegen die Kugeln beschriftet mit den Zahlen von 1 bis n und es wird k Mal gezogen, ohne Zurücklegen, wobei die Reihenfolge unerheblich ist. Die gezogenen Zahlen geben die Positionen an, bei denen nach rechts gegangen werden soll. Ein Beispiel: für n = 5 und k = 3 werden die Kugeln 1, 4 und 5 gezogen. Also geht man von der Spitze aus zunächst nach rechts unten , dann zwei Mal nach links unten ¡¢ und dann wieder zwei Mal nach rechts unten und landet bei dem Knoten, der 53 entspricht. 3 Kombinatorik – die Kunst des Zählens 16 Vorkurs Mathematik 3.3 Der fehlende Fall Unsere bisherige Behandlung von Urnenmodellen kann man in der folgenden Tabelle zusammenfassen. Dabei soll die Urne jeweils n Kugeln enthalten, von denen k gezogen werden. Reihenfolge wichtig Reihenfolge unwichtig Mit Zurücklegen Ohne Zurücklegen nk n! (n−k)! ¡n¢ ? k = n! (n−k)!·k! Im Folgenden soll es darum gehen, den fehlenden Fall mit dem ? zu behandeln. Dazu folgende Überlegung: da die Reihenfolge unwichtig ist, kann man die Kugeln aufsteigend anordnen. Allerdings kann eine Kugel mehrfach gezogen werden, ein Ergebnis sieht im Allgemeinen also folgendermaßen aus: 1, 1, 1, 1, 2, 2, 4, 5, 7, 7, 7, 9, . . . Dies soll andeuten, dass im vorliegenden Fall die Kugel mit der Nummer 1 genau vier Mal gezogen wurde, Kugel Nummer 2 wurde zwei Mal gezogen, Kugel Nummer 3 überhaupt nicht und so weiter. Aber wieviele Möglichkeiten gibt es dafür bei n Kugeln und k Ziehungen? Um das zu sehen, ändern wir die Notation ein wenig, so dass nur noch zwei Zeichen verwendet werden. Das Zeichen O soll für eine Kugel stehen und das Zeichen X soll ein Trennzeichen sein. Die obige Ziehung schreibt man dann so um: OOOOXOOXXOXOXXOOOXXO . . . Man kann sich vorstellen, dass man n Schubladen hat, eine für jede Kugelsorte. Die X deuten die Trennwände zwischen den Schubladen an. Wenn in einer Schublade keine Kugeln sind (also diese Kugelsorte nicht gezogen wurde) stehen demnach zwei Trennzeichen direkt nebeneinander. Es ist offensichtlich, dass man jede Ziehung auf eindeutige Art so aufschreiben kann, das Problem reduziert sich also auf die Frage, wieviele Möglichkeiten es gibt, eine solche Folge von O und X aufzuschreiben. Aber diese Frage haben wir schon beantwortet! Denn insgesamt beinhaltet jede solche Möglichkeit die gleiche Anzahl an Zeichen, nämlich k Mal das Zeichen O (es werden ja k Kugeln gezogen) und (n − 1) Mal das Zeichen X. Es muss also aus der (n + k − 1)-elementigen Menge der verfügbaren Positionen eine k-elementige Teilmenge ausgewählt werden, nämlich die Positionen, auf denen nachher ein O steht. Dafür aber gibt es genau µ n+k−1 k ¶ Möglichkeiten. Die vollständige Tabelle sieht also so aus: 3 Kombinatorik – die Kunst des Zählens 17 Vorkurs Mathematik Reihenfolge wichtig Reihenfolge unwichtig Mit Zurücklegen Ohne Zurücklegen nk n! (n−k)! ¡n+k−1¢ ¡n¢ k k = n! (n−k)!·k! Übung 3.3.1. Eine Eisdiele bietet zehn verschiedene Eissorten an. Wieviele Möglichkeiten hat man, sich daraus ein Eis mit vier Eiskugeln zusammenzustellen? Übung 3.3.2. Beweise mit Hilfe der obigen Tabelle, dass es nur drei binomische Formeln gibt, d.h. Formeln für Ausdrücke der Form (a ± b) · (a ± b) 3.4 Der binomische Lehrsatz Die erste binomische Formel lautet (x + y)2 = x2 + 2xy + y 2 Die Koeffizienten lauten hier 1, 2 und 1. Wenn man sich die dritte Potenz der Summe anschaut, ergibt sich (x + y)3 = (x2 + 2xy + y 2 ) · (x + y) = x3 + 3x2 y + 3xy 2 + y 3 Hier lauten die Koeffizienten 1, 3, 3 und 1. Dies sind genau die Zahlen aus dem Pascalschen Dreieck. Das ist natürlich kein Zufall. Die Überlegung dahinter ist die Folgende: ein Ausdruck der Form (x + y)n = (x + y) · (x + y) · (x + y) · . . . · (x + y) soll ausmultipliziert werden. Das Endergebnis ist eine gigantische Summe, in der jeder einzelne Summand aus den einzelnen Summanden der Klammern gebildet wird, die miteinander multipliziert werden müssen. Wählt man zum Beispiel aus jeder Klammer den ersten Summanden x aus, erhält man im Ergebnis den Summanden xn . Bei diesem Verfahren kommen aber etliche Summanden mehrfach vor. Da die Multiplikation kommutativ ist, gilt ja zum Beispiel x · x · y · x = y · x · x · x = x3 y Dieser Summand kann also auf mehrere Arten gewonnen werden. Und auf wieviele genau, das verrät uns die Kombinatorik. In jedem Summanden kommen ja genau n Faktoren vor, einer aus jeder Klammer und jeder Faktor ist entweder x oder y. Also kann man jeden Summanden in der Form xk y n−k für ein k ≤ n schreiben, wobei k = 0 auch zugelassen ist. k n−k Und wieviele Möglichkeiten gibt es, aus den Klam¡n¢sich den Summanden x y mern zusammenzusuchen? Genau k ! Man muss aus der n-elementigen Menge der 3 Kombinatorik – die Kunst des Zählens 18 Vorkurs Mathematik Klammern eine k-elementige Teilmenge ¡nder ¢ Klammern auswählen, aus denen ein x kommen soll und dafür gibt es genau k Möglichkeiten. Diese unformalen Überlegungen begründen den folgenden Satz 3.4.1 (Binomischer Lehrsatz). Für x, y ∈ und n ∈ gilt: R N n (x + y) = n µ ¶ X n k k=0 xk y n−k Die obigen Überlegungen sind noch nicht als strenger Beweis formuliert. Daher soll dieser Satz nun mit Hilfe des Verfahrens der vollständigen Induktion bewiesen werden. Beweis. 1) Induktionsanfang: Sei n = 1. Dann gilt 1 µ ¶ X 1 k=0 k xk y 1−k = 1 · y + 1 · x = (x + y)1 2) Induktionsschritt: Wir nehmen an, dass der Satz für ein n ∈ Nun soll er für (n + 1) gezeigt werden. Es gilt aber n+1 (x + y) n IV = (x + y) · (x + y) = (x + y) · n µ ¶ X n k=0 k N bereits gilt. xk y n−k Multipliziert man die Klammer im rechten Ausdruck aus, so ergibt sich (x + y) · n µ ¶ X n k=0 k k n−k x y = n µ ¶ X n k=0 k x k+1 n−k y + n µ ¶ X n k=0 k xk y n−k+1 In der ersten Summe ist einfach ein x hinzugekommen und in der zweiten ein y. Um die beiden Ausdrücke addieren zu können, ist eine Indexverschiebung notwendig. Betrachten wir nur die erste Summe, so kann diese umgeschrieben werden: ¶ n µ ¶ n+1 µ X n k+1 n−k X n x y = xk y n−k+1 k k−1 k=0 k=1 Dies hat den immensen Vorteil, dass jetzt die Exponenten von x und y übereinstimmen. Also können wir die Summen wie folgt zusammenziehen: (x + y) n+1 = ... = x n+1 +y n+1 3 Kombinatorik – die Kunst des Zählens ¶ µ ¶¶ n µµ X n n + + xk y n−k+1 k−1 k k=1 19 Vorkurs Mathematik Hier wurde der letzte Ausdruck aus der ersten Summe (der für k = n + 1) und der erste Ausdruck aus der letzten Summe (der für k = 0) gesondert aufgeschrieben und der Rest wurde addiert. Nach der Rechenregel für Binomialkoeffizienten ergibt sich aber gerade das Gewünschte: n+1 (x + y) = ... = ¶ n+1 µ X n+1 k=0 k xk y n+1−k Der binomische Lehrsatz erlaubt uns eine weitere nette Formel zu beweisen: Übung 3.4.2. Zeige: n µ ¶ X n k=0 k = 2n (Hinweis: Wähle x und y im binomischen Lehrsatz geeignet.) Diese Formel hat auch eine anschauliche Interpretation: es handelt sich um die Summe der Einträge in der Zeile Nummer n des Pascalschen Dreiecks. Aufgrund des Aufbaus ist es relativ offensichtlich, dass sich die Summe dieser Einträge von Zeile zu Zeile verdoppeln muss, da jeder Eintrag in die beiden Einträge schräg darunter “einfließt”. Übung 3.4.3. Wie lautet die Formel für (x − y)n ? 3 Kombinatorik – die Kunst des Zählens 20 Vorkurs Mathematik 4 Abbildungen In mathematics you don’t understand things. You get used to them. John v. Neumann Notation: Von jetzt an wird in den Beispielen die Menge der reellen Zahlen (geschrieben ) eine Rolle spielen. Diese Menge wird später genauer eingeführt, im Moment reicht es, sich auf sein Schulwissen zu verlassen. Bestimmte wichtige Teilmengen von werden wie folgt notiert: R R R+ = {x ∈ R : x ≥ 0}; R∗ = {x ∈ R : x 6= 0}; R∗+ = {x ∈ R : x > 0} 4.1 Wichtige Vokabeln Der Begriff der Abbildung spielt in allen Bereichen der Mathematik eine große Rolle. Anfangs mögen die vielen Begriffe, die neu gelernt werden wollen, etwas ungewohnt erscheinen, aber wie das obige Zitat verdeutlichen soll ist alles eine Frage der Gewohnheit. Abbildungen sind sogenannte “eindeutige Zuordnungen”. Formal bedeutet dies das Folgende: sind zwei Mengen X und Y gegeben, so ist eine Abbildung f : X → Y eine Vorschrift, die jedem Element x ∈ X genau ein Element in Y zuordnet, das normalerweise mit f (x) bezeichnet wird. Die Menge X heißt dann Definitionsmenge und die Menge Y wird Wertemenge genannt. Dieses Konzept der eindeutigen Zuordnung ist uns aus dem Alltag vertraut, so kann man jedem Professor an der Uni sein Büro zuordnen, jedem Teilnehmer einer Klausur sein Ergebnis, etc. Beachtenswert ist hier, dass durchaus erlaubt ist, verschiedenen Elementen der Definitionsmenge das gleiche Element der Wertemenge zuzuordnen und dass es auch durchaus Elemente der Wertemenge geben kann, denen kein Element zugeordnet wird. Ein extremes Beispiel: wenn die Klausur so gut ausfällt, dass alle Studenten eine 1 schreiben, so wird jedem Studenten diese Note zugeordnet und andere Noten kommen nicht vor. R In der Schule betrachtet man häufig Abbildungen von der Menge der reellen Zahlen in sich (man spricht in dem Fall manchmal auch von Funktionen), zum Beispiel die Abbildung gegeben durch f: R→R f (x) = x2 Ein Wort zur Notation: will man direkt notieren, wohin ein gewisses Element der Definitionsmenge unter einer Abbildung abgebildet wird, schreibt man dies kurz so (hier am obigen Beispiel illustriert): f : x 7→ x2 Das kann man natürlich nur machen, wenn klar ist, um welche Mengen es sich handelt! 4 Abbildungen 21 Vorkurs Mathematik Ist nun eine Teilmenge A ⊆ X gegeben, so kann man die Teilmenge von Y betrachten, auf die diese Menge A abgebildet wird. Dies liefert die Definition des Bildes einer Abbildung: f (A) := {f (a) : a ∈ A} Das Bild der gesamten Menge X wird kurz als Bild von f bezeichnet, geschrieben f (X). Um bei unserem Beispiel zu bleiben: hier ist f ( ) = {x ∈ : x ≥ 0} = + . R R R Ähnlich wie das Bild kann man für Teilmengen B ⊆ Y das Urbild definieren: f −1 (B) := {x ∈ X : f (x) ∈ B} In Worten: das Urbild von B ist die Menge derjenigen Elemente aus X, die von f in die Menge B abgebildet werden. Es ist klar (oder?), dass f −1 (Y ) = X gilt. Warnung! Auch wenn es von der Notation her so aussieht, darf das Urbild nicht mit der Umkehrabbildung verwechselt werden, die nicht in allen Fällen existiert! Denn das Urbild muss nicht immer ein Element enthalten: wieder mit obigem Beispiel gilt f −1 ({−1}) = ∅, f −1 ({4}) = {−2, 2}, f −1 ([0, 9]) = [−3, 3]. Zu beachten ist, dass Bild und Urbild keine Abbildungen der ursprünglichen Mengen sind, sondern vielmehr selbst mengenwertig sind! Übung 4.1.1. Gegeben sei die Abbildung f : {−2, 0, 1, 2, 3} → {−16, −1, 0, 1, 4, 16, 81, 256} durch x 7→ x4 Bestimme folgende Mengen: f −1 f ({0, 3}), f ({−2, 2}), −1 ({−16, 0, 16}), f ({−1, 4, 256}), f −1 ({−1, 1, 81}). Übung 4.1.2. Gebe Mengen X und Y und eine Abbildung f : X → Y , sowie Teilmengen A ⊆ X und B ⊆ Y an mit ¡ ¢ ¡ ¢ f −1 f (A) 6= A und f f −1 (B) 6= B Übung 4.1.3. Seien X und Y Mengen, f : X → Y eine Abbildung und A, B ⊆ Y . Zeige: f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B) f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B) Hierbei bezeichnen ∪ und ∩ Vereinigung bzw. Schnitt von Mengen. Die Definitionen lauten: A ∪ B = {x : x ∈ A oder x ∈ B} A ∩ B = {x : x ∈ A und x ∈ B} Der Umgang mit Bild und Urbild erfordert etwas Übung und wie Aufgabe 4.1.2 zeigt ist die Intuition nicht immer der beste Ratgeber. Solche Phänomene müssen aber nicht auftreten und wenn sie vermieden werden, hat man spezielle Namen für die Abbildungen. 4 Abbildungen 22 Vorkurs Mathematik Definition 4.1.4. Seien X und Y Mengen und f : X → Y eine Abbildung. Diese heißt injektiv, falls jedes y ∈ Y höchstens ein Urbild hat. Mit anderen Worten: keinem y werden zwei oder mehr verschiedene Elemente zugeordnet. Formal kann man die Injektivität einer Abbildung auch so formulieren: sind x, x0 ∈ X gegeben mit f (x) = f (x0 ), dann folgt bei einer injektiven Abbildung automatisch x = x0 . Ob eine Abbildung injektiv ist oder nicht hängt allerdings nicht nur von der Abbildungsvorschrift, sondern auch von den beteiligten Mengen ab! Betrachte zum Beispiel die Abbildung f : → gegeben durch f (n) = n2 . Diese Abbildung ist injektiv, denn aus n2 = m2 folgt n = m (Übung!). Betrachtet man aber die Abbildung f : → mit f (x) = x2 , so ist diese nicht injektiv, da zum Beispiel f (3) = f (−3), aber 3 6= −3. N R N R Definition 4.1.5. Seien wieder X und Y Mengen und f : X → Y eine Abbildung. Diese heißt surjektiv, wenn es zu jedem y ∈ Y (mindestens) ein x ∈ X gibt mit f (x) = y, d.h. jedes y ∈ Y soll mindestens ein Urbild haben. Die Surjektivität einer Abbildung garantiert nun, dass jedes Element im Wertebereich auch “getroffen” wird. √ Als Beispiel betrachten wir die Funktion f : + → + gegeben durch f (x) = x. Diese ist surjektiv: y ∈ + beliebig gegeben, dann ist x := y 2 ein Urbild unter √ seip f , denn f (x) = x = y 2 = y. R R R Injektivität und Surjektivität schließen einander nicht aus: wenn jedes y ∈ Y genau ein Urbild unter f hat, dann ist die Abbildung sowohl injektiv als auch surjektiv und wird in diesem Fall bijektiv genannt. Dann (und nur dann!) kann man wirklich eine “Umkehrabbildung” definieren, also eine Abbildung g : Y → X, die f in gewissem Sinn rückgängig macht, indem nämlich jedem y ∈ Y sein eindeutig bestimmtes Urbild zugeordnet wird. Diese Umkehrabbildung wird oft auch mit f −1 bezeichnet, was allerdings nicht mit dem Urbild verwechselt werden darf! Die Wurzelfunktion√aus dem √ obigen Beispiel ist nicht nur surjektiv, sondern auch injektiv, denn falls x = x0 , dann folgt durch Quadrieren sofort x = x0 (Beachte, dass aufgrund der Mengen x ≥ 0 und x0 ≥ 0 gilt!). Die Abbildung ist also bijektiv und y 7→ y 2 ist die Umkehrabbildung. Zum Schluss des Abschnittes soll noch die Verkettung von Abbildungen definiert werden. Seien X, Y und Z Mengen und seien Abbildungen f : X → Y und g : Y → Z gegeben. Dann kann man die Verkettung (oder Verknüpfung) von f und g wie folgt definieren: die verkettete Abbildung wird mit g ◦ f : X → Z bezeichnet und ist definiert durch ¡ ¢ (g ◦ f )(x) := g f (x) Dies kann man sich leicht anhand des folgenden Diagramms vorstellen: X f /Y g /7 Z g◦f 4 Abbildungen 23 Vorkurs Mathematik Zu guter Letzt noch eine spezielle Abbildung: ist X eine Menge, so gibt es stets die Abbildung f : X → X mit f (x) = x für jedes x ∈ X. Diese Abbildung wird oft als Identität auf X bezeichnet und mit idX notiert. Mit Hilfe der Identität kann nun die Umkehrabbildung formal sauber definiert werden: Definition 4.1.6. Seien X und Y Mengen und f : X → Y eine bijektive Abbildung. Die Umkehrabbildung g : Y → X ist durch die Eigenschaften g ◦ f = idX und f ◦ g = idY eindeutig bestimmt. Mit anderen Worten: verkettet man eine bijektive Abbildung mit ihrer Umkehrabbildung, erhält man immer die Identität. Übung 4.1.7. Gebe eine (möglichst einfache) Menge X und zwei Abbildungen f : X → X und g : X → X an, so dass gilt f ◦ g 6= g ◦ f . Ist es auch möglich, f und g bijektiv mit dieser Eigenschaft zu wählen? Übung 4.1.8. Welche der folgenden Abbildungen sind injektiv, surjektiv bzw. bijektiv? N → N mit f (n) = n + 1. f : R → R mit f (n) = n + 1. f : N → N mit f (n) = n2 . f : R → R+ mit f (x) = x2 . f : R → R mit f (x) = sin(x). f : R+ → R mit f (x) = 3x − 7. a) f : b) c) d) e) f) Übung 4.1.9. Seien X, Y und Z Mengen und f : X → Y und g : Y → Z bijektive Abbildungen. Zeige: dann ist auch (g ◦ f ) : X → Z bijektiv. 4.2 Was nicht passt... Oft möchte man auch Abbildungen umkehren können, die nicht bijektiv sind. Dies geht durch Änderung der beteiligten Mengen: Seien X und Y Mengen und f : X → Y eine Abbildung. Das Bild von f ist eine Teilmenge von Y : f (X) ⊆ Y und es gilt genau dann f (X) = Y , wenn f surjektiv ist. Betrachte nun die Abbildung f : X → f (X) definiert durch f (x) := f (x). Was ist hier geschehen? Im Grunde nichts! Die Abbildung ist im Wesentlichen immer noch die gleiche geblieben, lediglich die Wertemenge hat sich (unter Umständen) geändert: wir haben einfach alles aus der Wertemenge entfernt, was nicht im Bild von f liegt, also ohnehin für die Abbildung nicht relevant ist und die Abbildung auf diese Weise mit Gewalt surjektiv gemacht. 4 Abbildungen 24 Vorkurs Mathematik R R Beispiel 4.2.1. Die Exponentialfunktion exp : → gegeben durch exp(x) := ex ist injektiv, aber nicht surjektiv, da ex > 0 für alle x ∈ gilt. Schränkt man den Wertebereich entsprechend ein, erhält man die Abbildung exp : → ∗+ , die dann surjektiv (also insgesamt bijektiv) ist. Diese hat demnach eine Umkehrabbildung, den (natürlichen) Logarithmus ln : ∗+ → . R R R R R Wie steht es mit der Injektivität? Kann man auch diese erzwingen, indem man die Mengen ändert? Die Antwort lautet: natürlich. Ist eine Abbildung nicht injektiv, so ist sie mehrdeutig, das heißt es gibt Elemente y der Wertemenge, die mehr als ein Urbild besitzen. Verkleinert man nun die Definitionsmenge, indem man diese zusätzlichen Urbilder entfernt und damit die Mehrdeutigkeiten auflöst, wird die neue Abbildung injektiv. R R Beispiel 4.2.2. Sei f : → gegeben durch f (x) = x2 . Diese Abbildung ist weder injektiv noch surjektiv. Nutzt man jedoch + als Definitionsmenge, ist die Abbildung injektiv, denn für positive reelle Zahlen x und x0 gilt: aus x2 = x02 folgt x = x0 . Verkleinert man nun noch den Wertebereich, liefert dies eine bijektive Abbildung g : + → + mit g(x) = x2 . Die Umkehrabbildung ist das bekannte Ziehen der Wurzel, das für positive reelle Zahlen definiert ist. R R R So weit, so gut. Allerdings verbirgt sich in diesem einfach wirkenden Verfahren eine Falle: das Abändern der Wertemenge, um eine Funktion surjektiv zu machen, geht nur auf eine Art: es werden einfach alle Elemente der Wertemenge entfernt, die kein Urbild besitzen. Dort hat man keine Auswahlmöglichkeit. Im anderen Fall ist das nicht so! Zwar kann man immer Mehrdeutigkeiten verhindern, aber hier muss man (willkürlich?) auswählen, welche Elemente man aus der Definitionsmenge entfernt! Im obigen Beispiel hätten wir genauso gut die negativen reellen Zahlen als Definitionsmenge nehmen können und eine injektive Abbildung erhalten. Oder hätten positive und negative Zahlen munter mischen können. Für die Umkehrabbildung spielt diese Auswahl eine entscheidende Rolle! Beim Wurzelziehen √ hat man sich irgendwann geeinigt, dass mit a die positive Wurzel gemeint sein soll. Ein weiteres Beispiel soll dies verdeutlichen: Beispiel 4.2.3. Betrachte die Sinus-Funktion sin : noch surjektiv, was der Graph verdeutlicht: R → R. Diese ist weder injektiv 1 -1 Die Einschränkung der Wertemenge auf das Intervall [−1, 1] sorgt dafür, dass die Abbildung surjektiv wird, aber jeder Punkt aus diesem Intervall hat immer noch 4 Abbildungen 25 Vorkurs Mathematik unendlich viele Urbilder. Es gibt also viele Möglichkeiten die Definitionsmenge so zu wählen, dass eine injektive Abbildung dabei herauskommt. Ein Beispiel sieht man in diesem Bild: 1 -1 ◦ Durch Einschränkung auf das Intervall von − π2 bis π2 bzw. im Gradmaß von −90 £ π bis ¤ −1 ◦ 90 wird die Abbildung injektiv und die Umkehrabbildung sin : [−1, 1] → − 2 , π2 kann definiert werden. Und genau so versteht sie auch der Taschenrechner. Wen nun die vielleicht ungewohnte Notation der Winkel im Bogenmaß verwirrt: Kapitel ?? wird sich eingehender mit der an der Universität üblichen Bezeichnung befassen. Übung 4.2.4. Gegeben sei die Abbildung f : {−5, −3, −2, −1, 0, 2, 5} → {−7, 0, 2, 3, 4, 5, 7, 9, 12, 15, 16, 19, 25, 26, 28, 30} durch f (x) := x2 + 3. Verkleinere Definitionsmenge und Wertemenge so, dass f bijektiv wird und gebe eine Umkehrabbildung an. 4 Abbildungen 26 Vorkurs Mathematik 5 Formale Logik 5.1 Aussagenlogik Die formale Logik beschäftigt sich mit Aussagen, also Objekten, denen genau einer von zwei “Wahrheitswerten”, nämlich wahr oder falsch, zugeordnet werden kann. Eine Aussage, der man diesen Wert einfach zuordnet ohne sie weiter zu zerlegen, nennt man auch atomare Aussage. Folgende Zeichen sind bei der Aussagenlogik in Gebrauch: ∧ “und” ∨ “oder” ¬ “nicht” Die Definition dieser Zeichen gibt man am besten heitstafeln an: ∧ W F ∨ W W W F W W F F F F W mit Hilfe sogenannter WahrF W F Der fehlende Operator ¬ dreht den Wahrheitsgehalt der nachfolgenden Aussage einfach um: aus wahr wird falsch und umgekehrt. Zum Beispiel gilt für alle Aussagen A: ¬(¬A) = A. Mit der Gleichheit von Aussagen soll in diesem Fall gemeint sein, dass sie den gleichen Wahrheitswert besitzen. Die Tabellen sind wie folgt zu lesen: werden zwei atomare Aussagen A und B beispielsweise mit dem Operator ∧ verknüpft, so gibt die Tabelle den Wahrheitswert der neuen Aussage (A ∧ B) in Abhängigkeit der Wahrheit von A und B an. Der Operator ∧ liefert also nur dann eine wahre Aussage, wenn A und B wahr sind, der Operator ∨ liefert eine wahre Aussage, wenn A oder B oder beide wahr sind. Übung 5.1.1. Zeige mit Hilfe von Wahrheitstafeln die folgenden Regeln für Aussagen A und B: ¬(A ∧ B) = (¬A) ∨ (¬B) ¬(A ∨ B) = (¬A) ∧ (¬B) Aus diesen grundlegenden Operatoren (die auch Junktoren genannt werden) kann man nun weitere zusammensetzen: A ⇒ B := (¬A) ∨ B A ⇔ B := (A ⇒ B) ∧ (B ⇒ A) Die Äquivalenz zweier Aussagen (⇔) als gegenseitige Implikation zu sehen überrascht nicht, aber die Definition der Implikation selbst wirkt auf den ersten Blick ein wenig seltsam. Die Wahrheitstafel sieht folgendermaßen aus: ⇒ W F W W F F W W Ist die Aussage A also falsch, so ist die Implikation A ⇒ B in jedem Fall wahr. Das leuchtet vielleicht ein, wenn man sich auf folgenden Standpunkt stellt: wie kann man eine solche Implikation denn widerlegen, d.h. wie würde man beweisen, dass aus A 5 Formale Logik 27 Vorkurs Mathematik eben nicht B folgt? Man müsste zeigen, dass A eintreten kann (also wahr ist), aber B nicht. Das ist die einzige Stelle in der Tabelle, an der eine falsche Aussage steht. Nun kann auch die Kontraposition “bewiesen” werden. Lemma 5.1.2 (Kontraposition). Für Aussagen A und B gilt: A ⇒ B = (¬B) ⇒ (¬A) Beweis.¡ Die linke ¢ Seite entspricht nach Definition (¬A) ∨ B. Die rechte Seite entspricht ¬(¬B) ∨ (¬A) und wegen ¬(¬B) = B folgt die Behauptung. Eine kleine Warnung zum Umgang mit Aussagenlogik: mit etwas Mogeln ist es möglich, jeden Satz zu beweisen. Sei S ein beliebiger Satz, dann betrachte die Aussage: “Entweder diese Aussage ist falsch oder der Satz S ist wahr.” Nennt man die Aussage kurz A, so kann man dies logisch umformulieren zu: A = (¬A ∧ ¬S) ∨ (A ∧ S) Betrachte nun zwei Fälle: Fall 1: A ist wahr. Dann folgt S, denn die Wahrheit von A lässt nur die zweite Alternative zu. Fall 2: A ist falsch. Wenn A falsch ist, dann gilt ¬A, was nach Übung 5.1.1 bedeutet (A ∨ S) ∧ (¬A ∨ ¬S) Da dies wahr ist, müssen beide Klammern wahr sein, aber die vordere Klammer kann nur wahr sein, wenn S wahr ist. Daher ist S wahr. Die Aussage S war völlig beliebig. Der Grund, warum man auf diese Art eine beliebige Aussage beweisen kann liegt darin, dass die Aussage A einen Selbstbezug enthält, etwas, das in der Aussagenlogik streng verboten ist. Zum Schluss noch einige Vokabeln: eine Aussage, die in jedem Fall wahr ist (wie z.B. A ∨ (¬A)) nennt man eine Tautologie und eine Aussage, die in keinem Fall wahr ist (wie A ∧ (¬A) nennt man unerfüllbar. 5.2 Prädikatenlogik Mit der Aussagenlogik ist es möglich, atomare Aussagen mit Hilfe der Grundoperationen zusammenzufassen. Allerdings lassen sich Aussagen wie “Alle Menschen sind sterblich.” oder “Es gibt eine natürliche Zahl, deren Quadrat gleich 2 ist.” damit nicht weiter zerlegen. Zu diesem Zweck benötigt man die Prädikatenlogik und die sogenannten Quantoren. Formal definiert man sich dazu eine Menge U aller Objekte, die man betrachten möchte und nennt dies das Universum. Ein (einstelliges) Prädikat auf diesem Universum ist eine Abbildung P : U → {W, F}, wobei W und F für die Wahrheitswerte 5 Formale Logik 28 Vorkurs Mathematik wahr und falsch stehen. Mehrstellige Prädikate sind entsprechend Abbildungen, die mehrere Objekte des Universums als Argument haben. Ein Prädikat ordnet also jedem Element des Universums einen Wahrheitsgehalt zu, es ist also keine atomare Aussage, die unabhängig von allem anderen den Wert wahr oder falsch hat, sondern eine Aussage über die Objekte des Universums. Beispielsweise könnte U die Menge aller Menschen sein und das Prädikat S könnte so definiert sein, dass S(x) genau dann wahr ist, wenn der Mensch x sterblich ist. Jetzt können die beiden Quantoren definiert werden, der Allquantor ∀ und der Existenzquantor ∃: ¡ ¢ ¡ ¢ ∀ x : P (x) := P (U) = {W} ; ∃ x : P (x) := P −1 ({W}) 6= ∅ In Worten: der Allquantor ∀ liefert eine wahre Aussage, wenn das Prädikat für alle Objekte des Universums Gültigkeit hat und der Existenzquantor ∃ ist wahr, wenn das Prädikat für (mindestens) ein Objekt wahr ist. Die Reihenfolge der Quantoren spielt eine entscheidende Rolle! Ein Alltagsbeispiel soll dies verdeutlichen. Sei D die Menge aller Deckel und T die Menge aller Töpfe. Das Prädikat P (d, t) sei für einen Deckel d und einen Topf t genau dann wahr, wenn d auf t passt. Dann gilt ∀ t ∈ T ∃ d ∈ D : P (d, t) 6= ∃ d ∈ D ∀ t ∈ T : P (d, t) Die erste Aussage ist das Sprichwort “Auf jeden Topf passt ein Deckel.”, wohingegen die zweite Aussage besagt, dass es einen Universaldeckel gibt, der auf alle Töpfe passt. Anders ausgedrückt: im ersten Beispiel hängt das d (der gefundene Deckel) vom Topf t ab und im zweiten nicht. Zum Abschluss noch ein paar Worte zur Negation von Quantoren. Wird der Allquantor verneint, so ergibt sich der Existenzquantor und umgekehrt. Das ist logisch völlig klar, eine Behauptung wie “Für alle Objekte k gilt Aussage A(k).” wird widerlegt durch ein Gegenbeispiel, also mindestens ein konkretes Objekt k, für das A(k) eben nicht gilt. Umgekehrt kann die Aussage “Es gibt ein Objekt k, für das A(k) zutrifft.” nur widerlegt werden, indem gezeigt wird: “Für jedes Objekt k ist A(k) falsch.”. Formal verneint man also Aussagen mit Quantoren so, dass alle Quantoren durch den jeweils anderen ersetzt werden und die getroffene Aussage verneint wird. Der oben angegebene Spruch “Auf jeden Topf passt ein Deckel” wird also verneint durch: ¡ ¢ ¬ ∀ t ∈ T ∃ d ∈ D : P (d, t) = ∃ t ∈ T ∀ d ∈ D : ¬P (d, t) Oder in Worten: Es gibt einen Topf, auf den alle Deckel nicht passen, also auf den kein Deckel passt. 5.3 Relationen Sei X eine beliebige Menge. Ein zweistelliges Prädikat auf X heißt Relation. Eine Relation ist also eine Aussage über Paare aus X. Zum Beispiel ist für X = durch R 5 Formale Logik 29 Vorkurs Mathematik das Zeichen < eine Relation gegeben. Definition 5.3.1. Sei X eine Menge und ∼ eine Relation auf X. Dann heißt ∼ Äquivalenzrelation, wenn folgende Bedingungen erfüllt sind: i) Für x ∈ X gilt: x ∼ x. (Reflexivität) ii) Für x, y ∈ X gilt: x ∼ y ⇒ y ∼ x. (Symmetrie) iii) Für x, y, z ∈ X gilt: x ∼ y ∧ y ∼ z ⇒ x ∼ z. (Transitivität) Ein Beispiel für eine Äquivalenzrelation auf der Menge aller Studenten in Bielefeld wäre die Relation x ∼ y ⇔ x studiert das Gleiche wie y. Äquivalenzrelationen helfen dabei, Dinge zu ordnen, gewissermaßen in Schubfächer zu unterteilen. Ein weiteres Beispiel ist das Folgende: betrachte die Menge X aller Geraden in der Ebene und die Relation k, definiert durch gkh ⇔ g ist parallel zu h. Dies ist eine Äquivalenzrelation auf X. Definition 5.3.2. Sei X eine Menge mit einer Äquivalenzrelation ∼ und x ∈ X. Dann heißt [x] := {y ∈ X : y ∼ x} eine Äquivalenzklasse von X. Das Element x ist dabei der Vertreter oder Repräsentant der Äquivalenzklasse. Beispielsweise könnte ein beliebiger Student Repräsentant für seinen Studiengang, gegeben durch die Menge aller Studenten dieses Studienganges, sein. Die Menge der Äquivalenzklassen wird mit X/ ∼ bezeichnet. Definition 5.3.3. Eine Teilmenge R ⊆ X heißt Repräsentantensystem, falls gilt: © ª i) X/ ∼= [r] : r ∈ R . ii) Für r, r0 ∈ R gilt: r ∼ r0 ⇒ r = r0 . Mit anderen Worten: ein Repräsentantensystem enthält aus jeder Äquivalenzklasse genau einen Repräsentanten. Übung 5.3.4. Betrachte wieder die Menge X aller Geraden der Ebene und die Relation k. Gebe ein Repräsentantensystem für diese Äquivalenzrelation an. Übung 5.3.5. Bei welchen der folgenden Relationen auf der Menge sich um Äquivalenzrelationen? Gib ggf. ein Repräsentantensystem an. a) a ∼ b ⇔ ∃ k ∈ Z handelt es Z : (a − b) = k · m für ein m ∈ Z. b) a ∼ b ⇔ a ≤ b. c) a ∼ b ⇔ |a − b| < 1. d) a ∼ b ⇔ ∃ c ∈ 5 Formale Logik Z : a2 + b2 = c2. 30 Vorkurs Mathematik Übung 5.3.6. Seien X und Y Mengen und f : X → Y eine surjektive Abbildung. Zeige: die Relation ∼ auf X gegeben durch x ∼ x0 ⇔ f (x) = f (x0 ) ist eine Äquivalenzrelation und es gibt eine Bijektion zwischen X/ ∼ und Y . Zeige weiter: ist umgekehrt ∼ eine Äquivalenzrelation auf einer Menge X, dann gibt es eine Menge Y und eine surjektive Abbildung f : X → Y , so dass ∼ wie oben beschrieben werden kann. In Worten: Äquivalenzrelationen und surjektive Abbildungen entsprechen einander. 5 Formale Logik 31 Vorkurs Mathematik 6 Folgen Im folgenden Abschnitt wird der Absolutbetrag von reellen Zahlen auftauchen. Die formale Definition sieht folgendermaßen aus: ½ x , falls x ≥ 0 |x| := −x , falls x < 0 Anschaulich gesprochen ignoriert der Absolutbetrag einfach das Vorzeichen einer reellen Zahl: ist die Zahl positiv, bleibt sie erhalten, ist die Zahl negativ, wird ihr Vorzeichen geändert. Für Rechnen mit Beträgen bieten sich Fallunterscheidungen an. Wesentlich ist die wichtige Dreiecksungleichung: für alle Zahlen x, y ∈ gilt: R |x + y| ≤ |x| + |y| Der Beweis wird zur Übung überlassen. Eine direkte Folge der Dreiecksungleichung ist die sogenannte “umgekehrten Dreiecksungleichung”: ¯ ¯ |x − y| ≥ ¯|x| − |y|¯. Beweis. Seien x, y ∈ R beliebig. Aus der Dreiecksungleichung folgt: |x| = |x − y + y| ≤ |x − y| + |y| ⇒ |x − y| ≥ |x| − |y|. Ebenso folgt |y| = |y − x + x| ≤ |y − x| + |x| ⇒ |x − y| ≥ |y| − |x|. Insgesamt folgt die Behauptung, denn für alle reellen Zahlen a und b gilt: a ≥ b und a ≥ −b ⇒ a ≥ |b|. Die letzte Ungleichung ist klar, da der Betrag von b nach Definition ja entweder gleich b oder gleich −b ist. 6.1 Das kleine Epsilon In der Analysis spielen Abbildungen eine große Rolle. Um die “klassischen” Abbildungen von der Menge der reellen Zahlen in sich besser verstehen zu können, benötigen wir den Begriff einer Folge. Dazu folgende N R Definition 6.1.1. Eine Abbildung a : → heißt (reelle) Folge. Statt a(n) schreibt man kurz an und die gesamte Folge wird manchmal mit der Notation (an )n∈N abgekürzt. Einige einfache Beispiele: an = 6 Folgen 1 n bn = (−1)n cn = 2n2 − 10n + 5 √ n 32 Vorkurs Mathematik Auch wenn es aus der Definition einer Folge als Abbildung nicht so deutlich wird, sollte man sich eine Folge als etwas vorstellen, das durch die reellen Zahlen “läuft”, bei dem ersten Beispiel also 1 1 1 1 1 1, , , , , , . . . 2 3 4 5 6 Oder im zweiten Beispiel: −1, 1, −1, 1, −1, 1, −1, 1, −1, 1, . . . Wir sind am “Langzeitverhalten” solcher Folgen interessiert. Die Anschauung hilft dabei, dieses schwammige Konzept ein wenig zu erläutern: bei näherer Betrachtung der ersten Beispielfolge fällt auf, dass die Folgenglieder immer kleiner werden, sich mit fortschreitendem n also der 0 nähern – und das obwohl die 0 selbst nicht Teil der Folge ist, denn n1 > 0 für alle n ∈ . N Diese Beobachtung soll die folgende Definition motivieren: Definition 6.1.2. Sei (an )n∈N eine reelle Folge. Diese heißt konvergent mit Grenzwert a ∈ , falls für jedes ε > 0 ein n0 ∈ existiert, so dass für alle natürlichen Zahlen n ≥ n0 gilt: |an − a| < ε. Ist eine Folge konvergent gegen a, so schreibt man auch lim an = a R N n→∞ Diese Verklausulierung des anschaulichen Begriffs der Konvergenz einer Folge sieht auf den ersten Blick furchterregend aus. Was heißt es also genau? Das Beispiel oben zeigt, dass man im Allgemeinen nicht erwarten kann, dass eine Folge, die einem Wert zustrebt diesen jemals erreicht, sie kommt ihm nur “immer näher”. Dies soll in dieser Definition ausgedrückt werden: man verlangt nicht, dass irgendwann an = a gilt, sondern nur, dass der “Fehler”, also die Differenz |an − a| beliebig klein wird, Genau das steht in der Definition! Zu jedem Fehler ε, den man sich vorgibt (hierbei stelle man sich ε als eine sehr kleine positive Zahl vor, z.B. 0, 000000001) gibt es einen Index n0 (der natürlich von ε abhängt), so dass sich ab diesem Index alle Folgenglieder um höchstens ε vom geforderten Grenzwert unterscheiden. Man achtet also gar nicht auf den “Anfang” der Folge, die Elemente bis an0 (das sind “nur” endlich viele), sondern trifft eine Aussage über die unendlich vielen Folgenglieder, die noch kommen. Es ist nicht schwer mit dieser Definition zu beweisen, dass die Beispielfolge an = tatsächlich gegen 0 konvergiert: 1 n Beweis. Sei ε > 0 beliebig vorgegeben. Zu zeigen ist, dass es eine natürliche Zahl n0 gibt, so dass für alle n ≥ n0 gilt: | n1 − 0| = n1 < ε. Betrachte dazu die reelle Zahl 1ε . Diese kann man “aufrunden”, es gibt also eine natürliche Zahl n0 mit 1ε < n0 . Ist nun n ≥ n0 , dann folgt auch n > 1ε , was nach Mulitplikation mit ε und Division durch n äquivalent ist zu n1 < ε. Leider ist nicht jede Folge auch konvergent. Wenn es keine Zahl a gibt, welche die Eigenschaft aus der Definition besitzt, dann nennt man die Folge divergent. Ein 6 Folgen 33 Vorkurs Mathematik einfaches Beispiel für eine divergente Folge ist an = n die Folge der natürlichen Zahlen. Diese strebt keinem Grenzwert zu, sondern überwindet jede Schranke. In diesem Fall schreibt man lim an = ∞ n→∞ Um sich klarzumachen, was man für die Divergenz einer Folge zeigen muss, notiert man am besten die Definition der Konvergenz einer Folge (an ) gegen einen Grenzwert a formal mit Quantoren: ∀ ε > 0 ∃ no ∈ N ∀ n ≥ n0 : |an − a| < ε. Die Verneinung dieser Aussage sieht dann so aus. Eine Folge ist divergent, wenn für alle a ∈ gilt: ∃ ε > 0 ∀ n0 ∈ ∃ n ≥ n0 : |an − a| ≥ ε. R N Wie sieht es mit der Beispielfolge bn = (−1)n von oben aus? Diese ist divergent: Beweis. Zunächst zeigen wir, dass die Zahl 1 als einziger möglicher Grenzwert in Frage kommt. Sei nämlich a 6= 1 eine beliebige reelle Zahl, dann definieren wir ε := |a−1| > 0. 2 Ich behaupte, dass a nicht Grenzwert der Folge bn sein kann. Wäre dies nämlich der Fall, dann gäbe es ein n0 , so dass |bn − a| < ε für alle n ≥ n0 . Ist aber n ≥ n0 eine gerade Zahl, dann ist bn = 1 und es folgt |bn − a| = |a − 1| = 2ε > ε. Damit kommt als einziger Grenzwert a = 1 in Frage. Dies erfüllt die Bedingung aber auch nicht: wähle ε := 12 . Wäre a = 1 der Grenzwert, dann gäbe es wieder ein n0 , so dass für alle n ≥ n0 gilt: |bn − 1| < ε. Ist n ≥ n0 aber ungerade, dann gilt bn = −1, also |bn − 1| = | − 1 − 1| = | − 2| = 2 > 12 = ε. Beachte, dass die Wahl des ε im zweiten Teil die pure Willkür ist: jedes ε mit ε < 2 leistet das Gewünschte. Anschaulich gesprochen “springt” die Folge immer zwischen den Werten −1 und 1 hin und her und kann damit die Bedingung an Konvergenz nicht erfüllen, nämlich dass zu gegebenem (winzigen) Fehler ε alle Folgenglieder ab einem Index so nahe an dem Grenzwert liegen. Noch eine Bemerkung: konvergente Folgen sind immer beschränkt, d.h. wenn (an )n∈N eine Folge mit Grenzwert a ist, dann gibt es eine reelle Zahl M > 0 mit |an | < M für jedes n ∈ . Der Grund dafür liegt darin, dass ab einem gewissen Index alle Folgenglieder nahe bei a liegen (bis auf den Fehler ε) und die übrigen nur endlich viele sind, also insbesondere ein Maximum haben. Betrachten wir ein weiteres Beispiel: N n Beispiel 6.1.3. Betrachte die Folge an = n+1 . Die ersten Glieder der Folge lauten also: 2 3 4 5 6 1 a1 = ; a2 = ; a3 = ; a4 = ; a5 = ; a6 = . 2 3 4 5 6 7 Es liegt die Vermutung nahe, dass diese Folge gegen 1 konvergiert, denn jeder der Brüche ist kleiner als 1 (der Nenner ist immer um eins größer als der Zähler), aber der Abstand wird immer geringer. Der formale Beweis sieht folgendermaßen aus: 6 Folgen 34 Vorkurs Mathematik Beweis. Sei ε > 0 beliebig. Betrachte ¯ ¯ ¯ n ¯ ¯=1− n = n+1 − n = 1 ¯ − 1 ¯n + 1 ¯ n+1 n+1 n+1 n+1 ¡ ¢ Da die Folge n1 n∈N wie oben gezeigt gegen 0 konvergiert, gibt es also ein N ∈ mit N1 < ε. Ist nun n > N − 1, also n + 1 > N , so folgt N 1 1 < < ε. n+1 N Also folgt für n0 := N − 1 das Gewünschte. Übung 6.1.4. Untersuche diese Folgen auf Konvergenz und ermittele ggf. den Grenzwert. a) an = 1 n2 b) an = n2 −1 n+1 c) an = c für eine reelle Zahl c. ½ (−1)n/2 , falls n gerade n d) an = 0 , falls n ungerade Übung 6.1.5. Seien (an )n∈N und (bn )n∈N konvergente Folgen mit Grenzwert a bzw. b. Zeige, dass die Folge (cn )n∈N gegeben durch cn = an + bn konvergent ist mit Grenzwert a + b. Hat die Folge (dn )n∈N mit dn = an · bn entsprechend auch den Grenzwert a · b? Bemerkung 6.1.6. Die formale Definition der Konvergenz ist aus mathematischer Sicht unerlässlich, weil auf diese Weise präzise definiert worden ist, was unter Konvergenz verstanden werden soll. Dennoch erweist sie sich in der Praxis als recht unhandlich, wenn man Grenzwerte konkreter Folgen bestimmen muss. Dafür ist Übung 6.1.5 besser geeignet, wie sich im Folgenden zeigen wird. 6 Folgen 35 Vorkurs Mathematik 6.2 Rasante Schildkröten und 9er-Perioden Der griechische Philosoph Zeno ersann folgendes Paradoxon: Angenommen der Held Achilles läuft mit einer langsamen Schildkröte um die Wette. Um das Rennen fairer zu gestalten, gewährt er dem Reptil einen Vorsprung. Beide starten zugleich und es wird angenommen, dass sich beide die ganze Zeit über mit konstanter Geschwindigkeit bewegen, Achilles schneller als die Schildkröte. Dann wird er sie nie erreichen, so der Philosoph: Sobald Achilles den Punkt erreicht, an dem die Schildkröte gestartet ist, ist diese schon ein Stück weiter gekrochen. Erreicht der Held aber auch diesen Punkt kurze Zeit später, so ist die Schildkröte wieder etwas weiter und so fort, so dass er sie niemals erreicht. Zeichnung: Wiebke Klement Es hat mehrere Versuche gegeben, dieses Paradoxon argumentativ aufzuheben und einer davon kommt aus der Mathematik und hat mit Folgen zu tun, genauer gesagt mit der Tatsache, dass eine Folge bestehend aus unendlich vielen Folgengliedern einen endlichen Grenzwert besitzen kann. Zur Veranschaulichung führen wir einige Zahlen ein: nehmen wir einmal an, dass Achilles der Schildkröte 90m Vorsprung gewährt. Er bewegt sich mit rasanten 10 ms fort, wohingegen die Schildkröte nur 1 ms schafft (Es ist trotz allem eine recht schnelle Schildkröte). Dann dauert es 9s bis Achilles die 90m Vorsprung überbrückt und den Punkt erreicht, an dem die Schildkröte gestartet ist. Diesen Zeitpunkt (9s nach dem Start) nennen wir t0 . Nach 9s hat die Schildkröte 9m zurückgelegt. Um diese Strecke zu überbrücken braucht Achilles weitere 0, 9s, also erreicht er diesen zweiten Punkt zum Zeitpunkt t1 = 9s + 0, 9s = 9, 9s. Dann aber hat die Schildkröte weitere 0, 9m geschafft und Achilles benötigt um diese Strecke aufzuholen wiederum 0, 09s, schafft dies also zum Zeitpunkt t2 = 9s + 0, 9s + 0, 09s = 9, 99s usw. Allgemein sieht die entstehende Folge also so aus: n X 9 tn = 9s + 0, 9s + · · · + 0, 00 . . . 09s = 9, 99 . . . 9s = s 10k k=0 Die (tn )n∈N0 bilden eine Folge und man kann sich jetzt fragen, ob diese einen Grenzwert besitzt und falls ja, wie dieser aussieht. Mit dem Satz aus Kapitel 1.2 können wir obige Summe leicht umschreiben: ¡ 1 ¢n+1 ¶k n µ X 1 − 10 1 s=9· s tn = 9 · 1 10 1 − 10 k=0 Um diesen Grenzwert in den Griff zu bekommen betrachten wir folgendes Hilfslemma R Lemma 6.2.1. Sei q ∈ eine reelle Zahl mit 0 < q < 1. Definiere die Folge (an )n∈N durch an := q n . Dann ist an konvergent und es gilt lim an = 0 n→∞ 6 Folgen 36 Vorkurs Mathematik N Beweis. Sei ε > 0 beliebig. Gesucht ist ein n0 ∈ , so dass für alle n ≥ n0 gilt: q n < ε. Mit Hilfe der Logarithmusfunktion kann diese Gleichung umgestellt werden: q n < ε ⇔ log q n < log ε ⇔ n · log q < log ε ⇔ n > log ε log q Hierbei ist zu beachten, dass log q < 0 wegen q < 1 und daher dreht sich das log ε Ungleichungszeichen um. Wenn also n0 > log gewählt wird, gilt die geforderte q Ungleichung. Mit Hilfe von den Ergebnissen aus Übung 6.1.5 ergibt sich nun die Lösung: die Folge der tn ist konvergent mit Grenzwert 10s. Beweis. Es ist ¡ 1 ¢n+1 1 − 10 9 lim tn = lim 9 · s = 9 s = 10s = 9, 9999s 1 n→∞ n→∞ 1 − 10 10 Die Folge der betrachteten Zeitpunkte, obgleich “unendlich lang” hat also einen endlichen Grenzwert. Und nach 10s hat Achilles rein rechnerisch tatsächlich 100m zurückgelegt und die Schildkröte 10m, wodurch sie wegen der 90m Vorsprung auf gleicher Höhe sind. Zu beachten ist hierbei, dass dieses Paradoxon mathematisch befriedigend gelöst sein mag, vom philosophischen Standpunkt aber noch Fragen offen bleiben. Wer sich für solche Dinge interessiert, der sei auf Google und Wikipedia verwiesen, wo die Problematik ausführlich diskutiert wird. Eine Folge wie die der tn , die dadurch entsteht, dass immer mehr Terme aufsummiert werden, trägt den Namen “Reihe”. Als Schreibweise hat sich Folgendes eingebürgert: ist (ak )k∈N eine Folge, so entsteht die Reihe als Grenzwert der Folge der Partialsummen: setze n X ak bn := k=1 und definiere dann ∞ X k=1 ak := lim n→∞ n X ak = lim bn k=1 n→∞ Dies ist natürlich nur dann definiert, wenn die Folge der (bn )n∈N auch konvergiert. Die Folge (ak )k∈N wird auch unterliegende Folge der Reihe genannt. Analog zu obigem Beispiel haben wir eine Reihe samt Grenzwert bereits kennengelernt: Satz 6.2.2. Sei q ∈ R eine reelle Zahl mit 0 < q < 1. Dann gilt ∞ X k=0 6 Folgen qk = 1 1−q 37 Vorkurs Mathematik Beweis. Nach Kapitel 1.2 gilt bn = n X qk = k=0 1 − q n+1 1−q Wegen lim q n = 0 folgt die Behauptung. n→∞ 6.3 Die Exponentialreihe In diesem werden wir eine weitere Reihe kennenlernen, die ExponentialP Abschnitt xk reihe ∞ mit x ∈ . In diesem Zusammenhang wird der Begriff der absoluten k=0 k! P∞ Konvergenz wichtig sein: P Eine Reihe k=1 ak konvergiert absolut, wenn die Rei∞ he ihrer Absolutbeträge, k=1 |ak |, konvergiert. Absolut konvergente Reihen sind immer auch konvergent, die absolute Konvergenz ist also eine stärkere Eigenschaft. R Satz 6.3.1. Die Reihe exp(x) := konvergiert für alle x ∈ ∞ X xk k=0 R absolut. k! Beweis. Sei ohne Einschränkung x ≥ 0 (denn wäre x < 0, so ist −x = |x| > 0). Da die unterliegende Folge nichtnegativ ist, reicht es zu zeigen, dass die Folge der Partialsummen beschränkt ist. Sei N ∈ mit N ≥ 2x, n ∈ mit n > N . Dann ist N n X xk k=0 k! = = N X xk k=0 n X k=0 = ≤ n X xk−N xk N +x k! k! k=N +1 n X 111 x 1 x x [ +x ··· ··· ] k! 123 N N +1N +2 k k=N +1 N X xk k=0 ≤ n X xk + k! k=N +1 k! N X xk k=0 ≤ N n X 1 ( )k−1 +x k! 2 k=N +1 N X xk k=0 N X k=0 N N ∞ X 1 ( )k +x k! 2 k=0 N xk + 2xN k! Der letzte Term hängt nun aber gar nicht mehr von n ab! Somit gilt für alle Partialsummen n N X x k X xk ≤ + 2xN k! k! k=0 k=0 und somit sind diese beschränkt und die Reihe konvergent. 6 Folgen 38 Vorkurs Mathematik Mit der Exponentialreihe können wir nun auf kanonische (d.h. auf die naheliegende) Weise eine Funktion auf definieren: R exp : R → R, x 7→ exp(x). Diese Abbildung nennt man Exponentialfunktion. Die Exponentialfunktion ist von hoher Bedeutung in der Mathematik. Wir wollen nun noch ihre Funktionalgleichung herleiten. Dazu brauchen wir ein Resultat über das Produkt unendlicher absolut konvergenter Reihen, das sogenannte Cauchy-Produkt, das wir hier nicht beweisen wollen: P P∞ Satz 6.3.2. Seien ∞ k=0 ak und k=0 bk absolut konvergente Reihen. Definiere die Folge k X ck := aj bk−j . Dann ist die Reihe P∞ j=0 k=0 ck absolut konvergent mit ∞ X k=0 ck = ∞ ³X ak ∞ ´³ X k=0 ´ bk . k=0 Die Aussage dieses Satzes ist, dass das Produkt zweier absolut konvergenter Reihen das Gleiche ist, wie die Reihe, die durch sukzessives Ausmultiplizieren entsteht. Mit Hilfe dieses Satzes können wir nun die Funktionalgleichung der Exponentialfunktion als Korollar folgern: Korollar 6.3.3. Seien x, y ∈ R. Dann gilt exp(x + y) = exp(x) exp(y) . k k Beweis. Setze in der Notation des obigen Satzes ak := xk! und bk := yk! . Dann ergibt sich die unterliegende Folge der Produktreihe wie folgt: k k k µ ¶ X X xj y k−j 1 X k j k−j 1 ck := aj bk−j = = xy = (x + y)k , j! (k − j)! k! j=0 j k! j=0 j=0 wobei die letze Gleichheit aus dem binomischen Lehrsatz folgt. Wir formulieren nun noch ein weiteres Korollar: Korollar 6.3.4. Sei x ∈ 1. exp(−x) = R, k ∈ Z. Dann gilt 1 , exp(x) 2. exp(x) > 0 3. exp(k) = ek , wo e := exp(1) = 2, 718... die Eulersche Zahl ist. Übung 6.3.5. Zeige obiges Korollar mit Hilfe der Funktionalgleichung der Exponentialfunktion. Aus dem dritten Punkt des Korollars folgt, dass die Exponentialfunktion die Potenz ek interpoliert. 6 Folgen 39 Vorkurs Mathematik 6.4 Die harmonische Reihe Folgender Sachverhalt ist im Bezug auf Reihen und ihren unterliegenden Folgen sofort einleuchtend: ∞ X ak ist konvergent ⇒ lim ak = 0 k→∞ k=1 In Worten ausgedrückt: wenn eine Reihe konvergiert, dann muss ihre unterliegende Folge eine Nullfolge sein. Denn Konvergenz der Reihe bedeutet ja, dass sich ab einem Index n0 alles in einer ε-Umgebung eines Grenzwertes abspielt, insbesondere können sich die Folgenglieder der Folge der Partialsummen nicht mehr viel voneinander unterscheiden. Übung 6.4.1. Beweise obige Aussage formal exakt mit Hilfe von ε und n0 . Die Frage, die man sich nun stellen kann (und sollte) ist die Folgende: gilt Äquivalenz, d.h. ist eine Reihe genau dann konvergent, wenn die unterliegende Folge eine Nullfolge ist? Kann man Konvergenz von Reihen an diesem griffigen Kriterium festmachen? Die Antwort ist leider nein, wie folgendes Gegenbeispiel zeigt: Satz 6.4.2. Die harmonische Reihe ∞ X 1 n n=1 divergiert. Beweis. Zunächst halten wir folgenden einfachen Sachverhalt fest: sind m und n natürliche Zahlen mit m ≥ n, dann folgt m1 ≤ n1 . Betrachte nun eine natürliche Zahl n und die zugehörige 2er Potenz 2n . Dann gilt: 2X 2X 1 1 1 2n−1 1 + n−1 + ··· + n = ≥ = n = n−1 n−1 n 2 +1 2 +2 2 2 +k 2 2 2 k=1 k=1 n−1 1 n−1 1 Der Sinn dieser Abschätzung liegt in folgender Beobachtung: ∞ X 1 1 1 1 1 1 1 1 = 1 + + + + + + + +··· n 2 |3 {z 4} |5 6 {z 7 8} n=1 ≥ 12 ≥ 12 Die Terme zwischen zwei Kehrwerten einer 2er Potenz sind also aufsummiert immer grösser als 21 . Damit ist die Folge der Partialsummen aber unbeschränkt und daraus folgt die Divergenz der harmonischen Reihe. Diese harmonische Reihe ist also ein Beispiel einer nicht konvergenten Reihe, die trotzdem eine Nullfolge als unterliegende Folge besitzt. Mit ihrer Hilfe kann man auch die folgende Aufgabe angehen: 6 Folgen 40 Vorkurs Mathematik Übung 6.4.3. Der Dämon und die Schnecke. Es war einmal eine Schnecke, die am Anfang eines Gummibandes saß, welches die Länge von 1m hatte. Eines Tages kroch sie los, um die andere Seite zu erreichen und legte dabei pro Tag 5cm zurück. Normalerweise wäre sie nach 20 Tagen am anderen Ende angekommen, hätte es nicht einen bösen Dämonen gegeben, der in jeder Nacht um Punkt Mitternacht das Gummiband mitsamt der Schnecke gleichförmig um 1m dehnte. Kommt die Schnecke trotzdem ans Ziel, wenn man davon ausgeht, dass dieses Spezial-Gummi unbegrenzt dehnbar ist und sowohl Dämon als auch Schnecke lange genug leben? Und wenn ja nach wievielen Tagen wird es spätestens soweit sein? 6 Folgen 41 Vorkurs Mathematik 7 Zahlbereiche Die natürlichen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk. Leopold Kronecker 7.1 Von Gruppen und Körpern – Q Im folgenden Kapitel wollen wir Verallgemeinerungen des Zahlbegriffes ansehen, die im Laufe der mathematischen Entwicklung stattfanden. Die natürlichen Zahlen, mit denen man ganze Größen zählt, stoßen schnell an ihre Grenzen. N Es gibt auf der Menge 0 der natürlichen Zahlen inklusive 0 eine sogenannte Verknüpfung, nämlich +. Das bedeutet, dass zu zwei Zahlen n, m ∈ 0 eine dritte Zahl (n+m) ∈ 0 existiert, die eindeutig bestimmt ist. Die 0 spielt für diese Verknüpfung eine Sonderrolle: es handelt sich um ein sogenanntes “neutrales Element”, d.h. die Addition von 0 ändert eine natürliche Zahl nicht. Für alle n ∈ 0 gilt N N N n+0=0+n=n Die natürlichen Zahlen mit 0 bilden bezüglich + eine Struktur, die man Monoid nennt. Die allgemeine Definition sieht folgendermaßen aus: Definition 7.1.1. Sei M eine Menge und ◦ : M × M → M eine Verknüpfung auf M . Dann nennt man M einen Monoid, falls folgende Eigenschaften erfüllt sind: i) Assoziativität: Es gilt (a ◦ b) ◦ c = a ◦ (b ◦ c) für alle a, b, c ∈ M . ii) Neutrales Element: Es gibt ein Element e ∈ M , so dass für alle m ∈ M gilt: e ◦ m = m ◦ e = m. Diese Definition verallgemeinert und abstrahiert einige der Eigenschaften der Addition von natürlichen Zahlen. Warum diese Abstraktion wichtig ist, zeigt sich daran, dass diese beiden formalen Eigenschaften auch von Strukturen erfüllt werden, von denen man es vielleicht nicht erwartet und die wir zum Teil auch schon kennen. Ist zum Beispiel X eine Menge, dann kann man die Menge der Abbildungen von X in sich betrachten: Abb(X, X) = {f : X → X} Auf dieser Menge gibt es eine Verknüpfung ◦, die wir in Abschnitt 4.1 schon kennengelernt haben, die Verkettung von Abbildungen. Diese ist assoziativ (Übung!) und das neutrale Element ist die Identität idX . Die Menge Abb(X, X) ist also ein Monoid. Ein anderes Beispiel spielt in der theoretischen Informatik eine gewisse Rolle: Beispiel 7.1.2. Sei Σ eine endliche Menge von Zeichen (das sogenannte Alphabet), dann betrachte folgende Menge sogenannter Worte über Σ: W (Σ) = {a1 . . . ak : k ∈ 7 Zahlbereiche N0, ai ∈ Σ} 42 Vorkurs Mathematik Diese Menge kann man sich als Strings (also Zeichenketten) über dem gegebenen Alphabet Σ vorstellen. Beachte, dass auch die leere Zeichenkette, also das Wort der Länge 0 zugelassen ist. Zur Verdeutlichung bezeichnet man dieses oft mit ε. Um W (Σ) als Monoiden zu identifizieren benötigen wir noch eine Verknüpfung: die Konkatenation (Hintereinanderreihung) von Worten. Sind also a1 . . . ak und b1 . . . bl Worte über Σ, so definiere (a1 . . . ak ) ◦ (b1 . . . bl ) = a1 . . . ak b1 . . . bl Es ist nicht schwer zu sehen (oder?), dass diese Verknüpfung assoziativ ist und dass das leere Wort ε das neutrale Element ist. Zurück zu den natürlichen Zahlen und der Verknüpfung +. Um die Operation des Addierens “rückgängig” machen zu können, braucht man negative Zahlen. Diese werden in gewisser Weise einfach “hinzuerfunden”: zu jeder natürlichen Zahl n ∈ 0 erklärt man die Existenz einer negativen Zahl −n, für die dann gelten soll: N n + (−n) = (−n) + n = 0 Die Menge aller positiven und negativen Zahlen nennt man dann schlicht die Menge der “ganzen Zahlen” und kürzt sie mit dem Buchstaben ab: Z Z = {. . . , −3, −2, −1, 0, 1, 2, 3, . . .} Die ganzen Zahlen zusammen mit der Verknüpfung + bilden eine Struktur, die man Gruppe nennt. Definition 7.1.3. Sei G eine Menge mit einer Verknüpfung ◦ : G × G → G. Dann heißt G eine Gruppe, falls gilt: i) Assoziativität: Es gilt (a ◦ b) ◦ c = a ◦ (b ◦ c) für alle a, b, c ∈ G. ii) Neutrales Element: Es gibt ein Element e ∈ G, so dass für alle g ∈ G gilt: e ◦ g = g ◦ e = g. iii) Inverses Element: Zu jedem g ∈ G gibt es ein Element g −1 ∈ G, so dass gilt: g ◦ g −1 = g −1 ◦ g = e. Wichtig ist an dieser Stelle für uns die philosophische Frage der Existenz: Gibt es negative Zahlen? Wenn man Zahlen nur als Größen von Dingen kennengelernt hat, die man zählen kann, so ist die Antwort natürlich Nein. Der alte Witz “Wenn 5 Leute in einem Raum sind und 7 kommen raus, dann müssen 2 rein, damit der Raum leer ist.” basiert darauf. Aber natürlich sind uns aus dem Alltag viele Beispiele geläufig, wo negative Größen eine Rolle spielen: Geldgeschäfte, Temperaturmessungen, etc. Dies alles sind nicht wirklich greifbare Größen, dennoch wird niemand den Nutzen der negativen Zahlen bestreiten. Auf der Menge der ganzen Zahlen gibt es allerdings noch eine zweite Verknüpfung, nämlich “·”: für beliebige ganze Zahlen u, v ∈ ist das Produkt u · v definiert Z 7 Zahlbereiche 43 Vorkurs Mathematik und wieder eine ganze Zahl. Für diese Verknüpfung übernimmt die 1 die Rolle des neutralen Elementes. Für alle u ∈ gilt Z 1·u=u·1=u Z Und wieder fehlt in für die meisten Zahlen das sogenannte Inverse, um die Operation rückgängig zu machen. Daher führt man eine symbolische Schreibweise ein und erklärt für ein u ∈ mit u 6= 0 einfach die Existenz einer “Zahl” u1 , für die gelten soll: 1 1 u· = ·u=1 u u Die 0 muss man hierbei fortlassen, da a·0 = 0 für alle Zahlen a gilt und die 0 folglich kein Inverses besitzen kann. Z Wenn diese Überlegungen konsequent fortgesetzt werden, erhält man die Menge der rationalen Zahlen, die mit abgekürzt wird: nu o = : u, v ∈ , v 6= 0 v Q Q Z Diese Menge bildet bezüglich der Verknüpfungen + und · einen sogenannten Körper, nämlich eine Gruppe bezüglich + und auch eine Gruppe bezüglich ·, wenn man die 0 entfernt. 7.2 Das Füllen der Lücken – R Die rationalen Zahlen kann man sich als Verhältnis von Größen vorstellen. Den Griechen war die Menge der positiven rationalen Zahlen bekannt und sie glaubten auch, dass sich jede vorstellbare Größe als Verhältnis (also als Bruch) darstellen lässt. Leider ist das nicht richtig: der Satz des Pythargoras sagt, dass die Länge der Diagonale im Einheitsquadrat eine Größe a ist mit der Eigenschaft a2 = 2. 1 1 a Es gibt aber keine rationale Zahl mit dieser Eigenschaft. Der Beweis funktioniert am besten über einen Widerspruch: Beweis. Angenommen es gibt eine positive Zahl a ∈ a als gekürzter Bruch schreiben: a= 7 Zahlbereiche p q mit p, q ∈ Q mit a2 = 2. Dann lässt sich Z teilerfremd 44 Vorkurs Mathematik Es gilt aber µ ¶2 p p2 a = = 2 = 2 ⇐⇒ p2 = 2q 2 q q 2 Damit ist p2 eine gerade Zahl. Dann muss aber auch p gerade sein, denn das Quadrat einer ungeraden Zahl ist stets ungerade: (2n + 1)2 = 4n2 + 4n + 1 Da also p selbst eine gerade Zahl ist, gibt es eine Zahl r ∈ eingesetzt ergibt: Z mit p = 2r. Dies (2r)2 = 2q 2 ⇐⇒ 4r2 = 2q 2 ⇐⇒ 2r2 = q 2 Also ist q 2 gerade und demnach, mit demselben Argument wie oben, auch q. Das aber ist ein Widerspruch! Denn wenn p und q beide gerade sind, sind beide durch 2 teilbar - wir hatten aber vorausgesetzt, dass die Darstellung von a als Bruch gekürzt ist, d.h. p und q sollten teilerfremd sein. E √ Übung 7.2.1. Sei p ∈ eine Primzahl. Zeige: p ist nicht rational. N Wieder haben wir also eine Größe, die in unserer bisherigen Zahlenmenge nicht vorkommt. Aber die Prozedur ist √ die gleiche wie vorher: wir erfinden ein Symbol für diese Größe (in diesem Fall 2) und nehmen solcherlei Elemente einfach mit auf. Die größere Menge, die wir enthalten, nennen wir dann : die Menge der reellen Zahlen. R In Wahrheit ist die Konstruktion der reellen Zahlen aus den rationalen um einiges komplizierter. Man kann es sich ungefähr so vorstellen: jede der neuen reellen Zahlen kann man beliebig gut durch rationale Zahlen approximieren, d.h. annähern. Konkret heißt dies, dass in jeder noch so kleinen Umgebung einer reellen Zahl auf dem Zahlenstrahl unendlich viele rationale Zahlen liegen. Die reellen Zahlen füllen quasi die Lücken zwischen den rationalen Zahlen aus. Q Genauer gesprochen gilt: betrachtet man Folgen in , so gibt es darunter solche, die zwar konvergieren sollten, weil die Abstände der Folgenglieder immer geringer werden, es aber dennoch nicht tun, weil ihr Grenzwert keine rationale Zahl √ ist. So kann man beispielsweise eine Folge rationaler Zahlen angeben, die gegen 2 konvergiert. Man erhält die reellen Zahlen nun aus den rationalen, indem man alle diese “fehlenden Grenzwerte” hinzunimmt, man spricht in diesem Zusammenhang auch von einer Vervollständigung. Eine andere Art die reellen Zahlen aufzufassen ist die Entwicklung als Dezimalbrüche: man betrachtet die Menge aller “Zahlen” der Form ak ak−1 . . . a1 a0 , a−1 a−2 . . . Dabei sind die ai ∈ {0, 1, . . . , 9} die Ziffern. Gemeint ist mit obigem Ausdruck natürlich eigentlich folgende Reihe: ∞ X a−i 10i i=−k 7 Zahlbereiche 45 Vorkurs Mathematik Nicht alle Zahlen dieser Form sind rational: wann immer man von einem Bruch ausgeht, entsteht eine Dezimalzahl, die periodisch ist, also ab einem Punkt wiederholen sich die Ziffernfolgen. Die reellen Zahlen kann man also als Menge aller (periodischer und nicht periodischer) Dezimalzahlen auffassen. Eine detailliertere Behandlung der reellen Zahlen würde den Rahmen des Vorkurses bei Weitem sprengen. In beinahe jedem Lehrbuch der Analysis wird dieses Thema mehr oder weniger ausführlich behandelt, Interessierte seien also darauf verwiesen. Außerdem wird die Konstruktion der reellen Zahlen mit an Sicherheit grenzender Wahrscheinlichkeit auch Gegenstand der Mathematikvorlesung im kommenden Semester sein. Übung 7.2.2. Gibt es irrationale Zahlen a, b ∈ 7.3 Die fehlenden Wurzeln – R\Q mit ab ∈ Q? C Schon in der Schule lernt man, dass das Produkt zweier negativer Zahlen positiv ist, ebenso wie das Produkt zweier positiver Zahlen. Es folgt, dass für jede reelle Zahl a ∈ gilt: a2 ≥ 0 R Das bedeutet auch, dass die Gleichung x2 + 1 = 0 keine Lösungen besitzt, oder anders ausgedrückt: es existiert keine reelle Zahl, deren Quadrat gleich (−1) ist. Diese Lücke schließen wir nun auf die gewohnte Art: wir führen eine neue Zahl i ein, für die gelten soll: i2 = −1 Diese Zahl heißt imaginäre Einheit. Den neu erschlossenen Zahlbereich nennen wir dann Menge der komplexen Zahlen und kürzen diese mit dem Buchstaben ab: C C = {a + bi : a, b ∈ R} Man kann also jede komplexe Zahl als Summe a + b · i darstellen, wobei a und b reelle Zahlen sind. Man nennt a den Realteil und b den Imaginärteil der komplexen Zahl z = a + ib. Ist das Problem des Wurzelziehens denn nun vollständig gelöst? Die Wurzel aus (−1) können wir ziehen, wie sieht es mit anderen negativen Zahlen aus? Sei dazu a ∈ + eine beliebige positive Zahl. Dann können wir nun die Wurzel aus −a wie folgt ziehen: p √ √ √ √ −a = (−1) · a = −1 · a = i · a ∈ R C Und wie sieht es mit unseren Verknüpfungen aus? Wenn man die üblichen Rechenregeln zugrundelegt, kann man Summe und Produkt von komplexen Zahlen ganz einfach erklären: (a + ib) + (c + id) = (a + c) + i · (b + d) Und ebenso (a + ib) · (c + id) = ac + iad + ibc + i2 bd = (ac − bd) + i · (ad + bc) 7 Zahlbereiche 46 Vorkurs Mathematik Es gibt auch die Möglichkeit, sich die komplexen Zahlen graphisch vorzustellen. Wo die reellen Zahlen eine Zahlengerade bilden, sind die komplexen Zahlen Punkte in einer Ebene: i· R a + ib b R a Die Addition der komplexen Zahlen ist dann die gewöhnliche Vektoraddition, wie sie in Kapitel 12.1 noch behandelt wird. Die Multiplikation hingegen ist ein wenig komplizierter. Um sie besser zu verstehen, werden wir komplexe Zahlen später in Polarkoordinaten betrachten. Übung 7.3.1. Löse die Gleichung (a + ib)2 = i algebraisch. Wieviele Lösungen gibt es? Wo liegen sie in der Ebene? 7.4 Rechnen in C Um bequem mit komplexen Zahlen rechnen zu können, behandeln wir noch ein paar Tricks. Eine wichtige Frage ist oft die Folgende: ist z = a+ib gegeben, wie bestimme ich dann z1 ? Oder konkreter ausgedrückt möchte man auch z1 gern in der Form c + id schreiben, aber wie ermittelt man c und d? Zu diesem Zweck ist es nützlich, die sogenannte komplexe Konjugation einer Zahl zu betrachten. Dahinter verbirgt sich nichts Mysteriöses, es handelt sich lediglich um eine Spiegelung an der reellen Achse: ist z = a + ib, so ist das komplex Konjugierte z definiert durch z = a + ib = a − ib Mit anderen Worten: der Realteil bleibt erhalten, der Imaginärteil wird durch sein Negatives ersetzt. 7 Zahlbereiche 47 Vorkurs Mathematik i· b R z = a + ib R a −b z = a − ib Auf den ersten Blick ist das nicht so spektakulär, aber die Wichtigkeit wird durch folgende Formel deutlich: z · z = (a + ib) · (a − ib) = a2 + b2 ∈ R+ Das Produkt einer Zahl mit ihrer komplex Konjugierten ist also reell und nichtnegativ. Wir definieren im Komplexen die Betragsfunktion folgendermas̈sen: √ |z| := zz und interpretieren diesen Wert als Abstand des Punktes z vom Ursprung. Mit Hilfe dieses Tricks lässt sich die obige Aufgabe z1 zu finden aber leicht lösen: wir erweitern den Bruch z1 einfach mit z: 1 z z 1 a −b = = = 2 = 2 +i 2 2 a + ib z z·z |z| a +b a + b2 Übung 7.4.1. Schreibe folgende komplexe Zahlen in der Form a + ib: 1 , 3 − 4i 2 + 7i , −1 − 2i µ ¶ 1 i Manchmal gibt es mehr als eine Lösung. Dann reicht eine beliebige. Übung 7.4.2. Bestimme alle Lösungen der Gleichung z 4 = 1. Was fällt auf? Wo liegen die Ergebnisse geometrisch? C N Übung 7.4.3. Sei ζ ∈ (Zeta) eine komplexe Zahl mit ζ n = 1 für ein n ∈ und ζ 6= 1. (Eine solche Zahl heißt auch n-te Einheitswurzel.) Berechne den folgenden Ausdruck: n−1 X ζk k=0 7 Zahlbereiche 48 Vorkurs Mathematik 7.5 Die Exponentialfunktion im Komplexen - Trigonometrische Funktionen P∞ xk Wie schon gezeigt, konvergiert die Exponentialreihe exp(x) = k=0 k! für alle x ∈ . Was passiert, wenn wir komplexe Zahlen einsetzen? Dies ist formal selbstverständlich möglich, weil Multiplikation und Addition komplexer Zaheln definiert sind. Es stellt sich darüber hinaus die Frage nach der Konvergenz. Bislang kannten wir Konvergenz ja überhaupt nur auf der Menge der reellen Zahlen. Hier haben wir den Betrag der Differenz zweier reeller Zahlen als deren Abstand aufgefasst und in unserer Definition einer konvergenten Folge eingebracht. Gleiches ist auch in eine sinnvolle Wahl, wir kennen die Betragsfunktion in ja auch in der Tat schon als Abstand in der komplexen Zahlenebene einer Zahl vom Ursprung. Man kann für die Exponentialreihe zeigen, dass diese auch für alle komplexen Zahlen konvergent ist. Dies definiert uns dann genauso wie schon auf eine Funktion auf . Ferner gilt auch die Funktionalgleichung der Exponentialfunktion für zwei komplexe Zahlen z und z 0 : exp(z + z 0 ) = exp(z) exp(z 0 ). R C C R C Dies wollen wir hier auch nicht zeigen, es folgt aber aus Resultaten, die völlig analog zum reellen Fall sind. Wir wollen uns ein wenig näher anschauen, welche Werte die Exponentialfunktion im Komplexen annimmt. Wegen der Funktionalgleichung reicht es zu wissen, auf welche Werte der Realteil und der Imaginärteil abgebildet werden, das Bild der komplexen Zahl z = a + bi ist dann einfach das Produkt der Bilder von a und bi, wobei wir ersteres ja schon kennen. Also brauchen wir nur noch die Werte exp(ix), x ∈ zu untersuchen. Wir interessieren uns zunächst für deren Betrag, dazu benötigen wir also exp(ix). Hierbei gilt folgende Beziehung: R exp(ix) = ∞ X (ix)k k=0 k! = ∞ X (ix)k k=0 k! = exp((ix)) = exp(−ix). Wegen der Funktionalgleichung gilt nun für den Betrag von exp(ix): q p p | exp(ix)| = exp(ix)exp(ix) = exp(ix) exp(−ix) = exp(0) = 1. Dies bedeutet, dass alle Funktionswerte auf dem Einheitskreis, dem Kreis mit Radius 1 liegen. Wir wollen die Koordinaten eines Punktes auf dem Einheitskreis in der komplexen Zahlenebene näher untersuchen. 7 Zahlbereiche 49 Vorkurs Mathematik sin α α cos α Wenn wir den Punkt z auf dem Einheitskreis mit dem Ursprung verbinden und das Lot auf die reelle Achse fällen, so entsteht ein rechtwinkliges Dreieck, den Winkel zwischen Verbindungslinie und reeeller Achse nennen wir α. Die Hypothenuse hat Länge 1. Aus der Schule kennt man die trigonometrischen Funktionen sin und cos als Längenverhältnisse im rechtwinkligen Dreieck, und zwar cos α = Ankathete , Hypothenuse sin α = Gegenkathete . Hypothenuse Gemäß dieser Definition stellen sie also genau den Realteil (bzw x-Koordinate) und Imaginärteil (bzw y-Koordinate) von Punkten auf dem Einheitskreis in der komplexen Ebene (bzw in der reellen Ebene) dar. In diesem zweiten Sinne kann man die trigonometrischen Funktionen also genauso auffassen, als Koordinaten von Punkten auf dem Einheitskreis. In diesem Zusammenhang ist es jedoch üblich, den Punkt auf dem Einheitskreis nicht über den Winkel, den dieser zur positiven x-Achse hat, zu beschreiben, sondern über die Strecke, die man von diesem Punkt in Uhrzeigerrichtung zu dem Punkt (1, 0) zurücklegen muss, wenn man nur auf dem Einheitskreis entlanggeht. Den Punkt (0, 1) zum Beispiel kann man mit dem Winkel 90 bezeichnen oder damit, dass man ein Viertel des Einheitskreises, der den Umfang 2π hat, zurücklegen muss, um (1, 0) zu erreichen, also die Strecke π2 . Dies bedeutet, wir können die trigonometrischen Funktionen sinnvoll auf zwei verschiedenen Definitionsmengen definieren, nämlich dem Winkel im Gradmaß von 0◦ bis 360◦ oder dem Winkel im Bogenmaß von 0 bis 2π. Zu bemerken ist, dass die Definition über den Einheitskreis sofort naheliegend die Funktionen für Winkel ab 90◦ erklärt. An der Uni fasst man die Argumente von cos und sin auch in der Regel als im Bogenmaß stehend auf. Die Formel für die Umrechnung lautet, wenn α Winkel im Gradmaß und x Winkel im Bogenmaß ist: α 7 Zahlbereiche π = x. 180 50 Vorkurs Mathematik Ein weiterer Vorteil der Definition am Einheitskreis ist, dass wir sofort folgende Gleichheiten sehen können: sin(−x) = − sin x cos(−x) = cos x. Kommen wir nun zurück zur Exponentialfunktion. Wie wir gesehen haben, liegen alle Werte auf dem Einheitskreis, der Kosinus als Realteil, der Sinus als Imaginärteil. Äquivalent zu den vorherigen Definitionen dieser Funktionen ist auch die folgende Gleichung (was wir hier aber nicht nachrechnen wollen...): exp(ix) = cos x + i sin x x ∈ R. Diese Definition ist unter Mathematikern am gebräuchlichsten, weil sie auch am einfachsten ist. Mit obiger Gleichung wollen wir noch eine weitere Darstellung komplexer Zahlen kennenlernen, die häufig sehr anschaulich ist. Sei z ∈ eine komplexe Zahl. Wenn wir diese in der komplexen Zahlenebene abtragen und mit einer Linie mit dem Ursprung verbinden, so hat diese die Länge |z| und schneidet den Einheitskreis in genau einem Punkt. Diesen Punkt können wir aber auch als Funktionswert von exp auffassen, das heißt, es gibt ein x ∈ [0, 2π] so dass exp(ix) genau dieser Punkt ist. Dann können wir z aber auch so darstellen: C z = |z| exp(ix). Diese Darstellung nennt man Darstellung in Polarkoordinaten, nämlich in den Koordinaten (|z|, x). Diese Darstellung erlaubt eine schöne geometrische Interpretation der Multiplikation in . Sei nämlich z 0 = |z 0 | exp(iy) eine weitere komplexe Zahl, so gilt für das Produkt von z und z 0 : C zz 0 = |z| exp(ix)|z 0 | exp(iy) = |z||z 0 | exp(i(x + y)) wegen der Funktionalgleichung der Exponentialfunktion. Beim Multiplizieren komplexer Zahlen multipliziert man also die Beträge und addiert die Winkel! √ Dies erlaubt uns, die Lösung des folgenden Problems zu erraten: was ist i? Müssen wir hier schon wieder unsere Menge erweitern? Hört der Prozess erst auf, wenn uns die Buchstaben ausgehen? √ Zum Glück ist i wieder eine komplexe Zahl. Und die Formel der Multiplikation oben verrät uns, dass sie die Länge 1 haben muss (denn i hat die Länge 1 und die Längen multiplizieren sich ja) und einen Winkel von 45 Grad (oder π4 im Bogenmaß ausgedrückt.) Und eine solche Zahl gibt es wirklich: √ 1+i i= √ 2 Die Probe zeigt, dass wir richtig liegen: µ ¶2 (1 + i)2 1+i 1 + 2i − 1 √ = = = i. 2 2 2 7 Zahlbereiche 51 Vorkurs Mathematik Übung 7.5.1. Schreibe folgende Zahl in der Form z = a + bi: s 1+i √ . 2 Übung 7.5.2. Wie könnte {exp(r + ir), r ≥ 0} in der komplexen Zahlenebene aussehen? Übung 7.5.3. Aus der Schule sind vielleicht noch die Additionstheoreme für Sinus und Kosinus bekannt: sin(x + y) = sin x · cos y + cos x · sin y cos(x + y) = cos x · cos y − sin x · sin y. Rechne diese nach (Hinweis: Exponentialfunktion im Komplexen...). 7 Zahlbereiche 52 Vorkurs Mathematik 8 Untersuchung reeller Funktionen In diesem Abschnitt geht es um die Untersuchung reeller Funktionen, darunter sollen Funktionen f : → verstanden werden. Manchmal ist es zweckmäßig, den Definitionsbereich einer solchen Funktion einzuschränken, also für eine Teilmenge D ⊆ eine Funktion f : D → zu betrachten. R R R R Beispielsweise kann die Funktion, die durch die Vorschrift f (x) = nur auf der Menge \{3} sinnvoll definiert werden. R 1 x−3 gegeben ist, 8.1 Das Epsilon bekommt ein Delta Betrachten wir zunächst folgende Abbildungen: f: g: ½ R→R gegeben durch f (x) = R→R gegeben durch g(x) = ½ −2 , falls x < 1 −1 , falls x ≥ 1 −x + 3 , falls x < 2 x−1 , falls x ≥ 2 Beide Graphen sind in folgendem Koordinatensystem dargestellt. g f Auffällig ist, dass zwar beide Funktionen “stückweise” definiert sind, aber der Graph von g eher “zusammenhängt”, d.h. in einem Stück gezeichnet werden kann, während man beim Graphen von f eine Art Sprungstelle hat. Die Funktion f ist also unstetig am Punkt 1, wohingegen g überall stetig ist. Formal definiert man den Begriff der Stetigkeit folgendermaßen: R R Definition 8.1.1. Sei D ⊆ , f : D → eine Abbildung und a ∈ D. Die Abbildung f heißt stetig an der Stelle a, falls es für jedes ε > 0 ein δ > 0 gibt, so dass für alle x ∈ D mit |x − a| < δ gilt: |f (x) − f (a)| < ε. Ist eine Funktion f stetig an allen Punkten a ∈ D, so spricht man kurz von einer stetigen Funktion. 8 Untersuchung reeller Funktionen 53 Vorkurs Mathematik Übung 8.1.2. Notiere die Stetigkeit einer Funktion f formal mit Quantoren. Verneine diese Aussage dann ebenfalls formal. In Worten: Stetigkeit an der Stelle a bedeutet, dass die Bilder von Punkten “in der Nähe” von a auch nahe am Bildpunkt von a liegen. Das δ spielt in der Definition in gewisser Weise die Rolle von n0 in der Definition von Folgenkonvergenz. Es ist nicht schwer nachzuweisen, dass die obige Beispielfunktion f nicht stetig im Punkt 1 ist: Beweis. Sei a = 1 und wähle ε := 12 . Es genügt zu zeigen, dass es für dieses spezielle ε kein δ gibt, das die obige Bedingung erfüllt. Sei also δ > 0 beliebig. Betrachte den Punkt x := 1 − 2δ . Es gilt ¯ ¯ ¯ ¯ ¯ ¯ ¯ δ¯ δ δ x < 1 und |x − a| = |x − 1| = ¯¯1 − − 1¯¯ = ¯¯− ¯¯ = < δ. 2 2 2 Aber f (x) = −2 und f (a) = −1, also folgt |f (x) − f (a)| = | − 2 + 1| = | − 1| = 1 > 1 = ε. 2 Damit ist die Bedingung der Stetigkeit verletzt. Übung 8.1.3. Zeige formal, dass die oben angegebene Funktion g im Punkt a = 2 stetig ist. (Hinweis: Überlege Dir anhand des Graphen, wie das δ in Abhängigkeit von ε gewählt werden kann.) √ Ein weiteres Beispiel: die Wurzelfunktion f : + → + gegeben durch f (x) = x ist stetig auf ganz + . R R R Beweis. Zeige zunächst Stetigkeit im Punkt a = 0. Sei ε > 0 beliebig und wähle δ := ε2 . Dann ist δ > 0 und für x ∈ + mit |x − a| = |x| = x < δ gilt: √ √ √ √ √ | x − 0| = x < δ = ε2 = ε R Also ist f stetig im Punkt a = 0. √ Sei nun a > 0 beliebig, ebenso wie ε > 0. Wähle nun δ := ε a. Dann ist δ > 0. Sei nun x ∈ + mit |x − a| < δ. Es folgt ¯ ¯ √ ¯ x − a ¯ |x − a| √ √ δ ε a ¯ ¯ √ ≤ √ |f (x) − f (a)| = | x − a| = ¯ √ < √ = √ = ε. x + a¯ a a a R Also ist f stetig im Punkt a und da a > 0 beliebig war, ist f damit stetig auf ganz +. R Die meisten der in der Analysis betrachteten Funktionen sind stetig, z.B. alle Polynomfunktionen, also Funktionen der Form f: R→R gegeben durch f (x) = n X ak xk mit ak ∈ R k=0 Der Beweis ist nicht ganz so einfach und wird am besten mit Hilfe des folgenden Satzes geführt. 8 Untersuchung reeller Funktionen 54 Vorkurs Mathematik R R Satz 8.1.4. Seien f : → und g : beliebige Zahl. Definiere dann R R R R R R (f + g) : → (f · g) : → (α · f ) : → R → R stetige Funktionen und α ∈ R eine gegeben durch (f + g)(x) = f (x) + g(x) gegeben durch (f · g)(x) = f (x) · g(x) gegeben durch (α · f )(x) = α · f (x). Diese Funktionen sind dann alle stetig. R Beweis. Betrachte zunächst die Funktion h := (f + g). Sei a ∈ beliebig und ε > 0 vorgegeben. Aufgrund der Stetigkeit von f gibt es dann ein δ1 > 0 derart, dass für alle x ∈ mit |x−a| < δ1 gilt: |f (x)−f (a)| < 2ε . Ebenso gibt es wegen der Stetigkeit von g ein δ2 > 0, so dass für alle x ∈ mit |x − a| < δ2 gilt: |g(x) − g(a)| < 2ε . R R Setze δ := min{δ1 , δ2 }. Dann gilt für x ∈ und |x − a| < δ2 , also folgt R mit |x−a| < δ auf jeden Fall |x−a| < δ1 |h(x)−h(a)| = |f (x)+g(x)−f (a)−g(a)| ≤ |f (x)−f (a)|+|g(x)−g(a)| < ε ε + = ε. 2 2 Also ist h stetig. Betrachte nun die Funktion r := (f · g) und nimm an, dass f (a) 6= 0 und g(a) = 6 0 gilt. Aufgrund der Stetigkeit von f gibt es ein δ1 > 0, so dass für alle x ∈ mit |x − a| < δ1 gilt: ½r ¾ ε ε |f (x) − f (a)| < min , . 3 3|g(a)| R Ebenso gibt es wegen der Steigkeit von g ein δ2 > 0, so dass für alle x ∈ |x − a| < δ2 gilt: ½r ¾ ε ε |g(x) − g(a)| < min , . 3 3|f (a)| Setze dann δ := min{δ1 , δ2 }. Für x ∈ R mit R mit |x − a| < δ gilt dann |r(x) − r(a)| = |f (x) · g(x) − f (a) · g(a)| = |f (x) · g(x) − f (x) · g(a) + f (x) · g(a) − f (a) · g(a)| ≤ |f (x)| · |g(x) − g(a)| + |g(a)| · |f (x) − f (a)| ε < |f (x)| · |g(x) − g(a)| + |g(a)| · 3|g(a)| ε = |f (x) − f (a) + f (a)| · |g(x) − g(a)| + 3 ε ≤ |f (x) − f (a)| · |g(x) − g(a)| + |f (a)| · |g(x) − g(a)| + 3 r r ε ε ε ε ε ε ε · + |f (a)| · + = + + = ε. < 3 3 3|f (a)| 3 3 3 3 Diese Abschätzung zeigt die Behauptung. Falls f (a) = 0 oder g(a) = 0, so fällt der entsprechende Term einfach weg. Übung 8.1.5. Zeige den letzten Teil des Satzes, also die Stetigkeit von (α · f ) mit dem ε-δ-Kriterium. 8 Untersuchung reeller Funktionen 55 Vorkurs Mathematik Nun haben wir fast alles beisammen, um die Stetigkeit aller Polynomfunktionen beweisen zu können. Es fehlen nur noch zwei Beobachtungen, die im folgenden Lemma zusammengefasst sind. R R R Lemma 8.1.6. Sei c ∈ eine reelle Zahl. Betrachte die Funktionen f : → gegeben durch f (x) = c und idR : → gegeben durch idR (x) = x. Dann sind f und idR stetig. R R R Beweis. Die Stetigkeit von f an einer beliebigen Stelle a ∈ ist kein Problem: ist ε > 0 vorgegeben, so kann man δ > 0 völlig beliebig wählen, denn für jedes x ∈ gilt ja: |f (x) − f (a)| = |c − c| = 0 < ε. R R Nun zur Stetigkeit von idR . Sei a ∈ beliebig und ε > 0 vorgegeben. Wähle dann δ := ε. Dann gilt für x ∈ mit |x − a| < δ: R | idR (x) − idR (a)| = |x − a| < δ = ε. Damit ist idR stetig. R R Insgesamt folgt nun für eine beliebige Polynomfunktion f : → mit f (x) = P n k k=0 ak x , dass f stetig ist, denn f lässt sich schreiben als Summe von Produkten von konstanten Funktionen und der Funktion idR und nach Satz 8.1.4 folgt die Stetigkeit von f . 8.2 Folgenstetigkeit Das ε-δ-Kriterium für die Stetigkeit einer Funktion ist zwar sehr nützlich, manchmal aber etwas unhandlich. In den meisten Fällen bietet sich die alternative Formulierung der Folgenstetigkeit an. R R R Dazu erstmal eine Schreibweise: ist f : → eine Funktion und a ∈ , so kann für eine beliebige Folge (xn )n∈N mit Grenzwert a der folgende Grenzwert betrachtet werden: lim f (xn ). n→∞ Für den Fall, dass dieser Grenzwert existiert und unabhängig ist von der gewählten Folge (xn )n∈N , d.h. wenn dieser Wert für jede Folge mit Grenzwert a gleich ist, dann sagt man, dass der Grenzwert “für x gegen a” existiert und schreibt kurz lim f (x). x→a R R Satz 8.2.1. Sei D ⊆ und f : D → eine Funktion. Sei weiter a ∈ D. Dann gilt: f ist genau dann stetig im Punkt a, wenn lim f (x) = f (a). x→a Dieser Satz enthält eine Äquivalenz, also eine “Genau dann, wenn”-Aussage. Insofern zeigt sich, dass man Stetigkeit auch über das Folgenkriterium hätte definieren können – beide Begriffe sind absolut gleichwertig. Um eine solche Äquivalenz zu beweisen geht man meist einzeln in beide Richtungen 8 Untersuchung reeller Funktionen 56 Vorkurs Mathematik vor, man zeigt also zwei Implikationen: wenn die Funktion f stetig im ε-δ-Sinn ist, dann erfüllt sie das Folgenkriterium und umgekehrt, wenn sie das Folgenkriterium erfüllt, dann ist sie stetig im ε-δ-Sinn. Beweis. Nimm zunächst an, dass f stetig in a ist und sei (xn )n∈N eine beliebige Folge in D mit lim xn = a. Zu zeigen ist: n→∞ lim f (xn ) = f (a). n→∞ Sei dazu ε > 0 beliebig. Wegen der Stetigkeit von f gibt es ein δ > 0, so dass für alle x ∈ D mit |x − a| < δ gilt: f (x) − f (a)| < ε. N Da die Folge (xn )n∈N gegen a konvergiert, gibt es zu obigem δ > 0 ein n0 ∈ , so dass für alle n ≥ n0 gilt: |xn − a| < δ. Damit aber folgt wiederum für alle n ≥ n0 : |f (xn ) − f (a)| < ε. ¡ ¢ Also konvergiert die Folge f (xn ) n∈N gegen f (a). Sei nun umgekehrt das Folgenkriterium erfüllt, d.h. es gelte lim f (x) = f (a). x→a Zu zeigen ist, dass f stetig im Punkt a ist. Wir führen einen Beweis durch Widerspruch: angenommen, f wäre nicht stetig im Punkt a. Dann würde es ein ε > 0 geben, so dass es für alle δ > 0 einen Punkt x ∈ D mit |x − a| < δ gibt, aber trotzdem |f (x) − f (a)| ≥ ε gilt. N Wähle zu n ∈ das δn := n1 und nenne das gefundene x einfach xn . Dann ergibt sich eine Folge (xn )n∈N aus D mit folgenden Eigenschaften: |xn − a| < 1 n und |f (xn ) − f (a)| ≥ ε. Die erste Eigenschaft impliziert lim xn = a, aber die zweite zeigt lim f (xn ) 6= f (a). n→∞ n→∞ Dies ist ein Widerspruch zur Annahme. E R R Beispiel 8.2.2. Betrachte die Funktion f : ∗ → gegeben durch f (x) = x1 . Diese ist in jedem Punkt ihres Definitionsbereichs stetig. Zeige dies mit dem Folgenkriterium: R R Beweis. Sei a ∈ ∗ beliebig und (an )n∈N eine Folge in ∗ , die gegen a konvergiert. Da |an − a| nach Voraussetzung beliebig klein wird und wegen |a| > 0, gibt es ein n1 ∈ mit |a| für alle n ≥ n1 . |an − a| ≤ 2 Verwende nun die umgekehrte Dreiecksungleichung: N |a| − |an | ≤ |an − a| ≤ |a| |a| ⇒ |an | ≥ 2 2 8 Untersuchung reeller Funktionen für alle n ≥ n1 . 57 Vorkurs Mathematik ¡ ¢ Zu zeigen ist nun die Konvergenz der Folge f (an ) n∈N gegen den Wert f (a). Sei ε > 0 beliebig. Es gilt: ¯ ¯ ¯1 1 ¯¯ |an − a| 2 ¯ |f (an ) − f (a)| = ¯ − ¯ = ≤ 2 · |an − a|. an a |an | · |a| |a| Diese Ungleichung gilt wiederum für alle n ≥ n1 . Nun verwenden wir erneut, dass |an − a| beliebig klein wird, insbesondere gibt es ein n2 ∈ mit N |an − a| < |a|2 · ε 2 für alle n ≥ n2 . Sei nun n0 := max{n1 , n2 }. Dann folgt für alle n ≥ n0 nach der Ungleichung oben: |f (an ) − f (a)| ≤ 2 2 |a|2 · ε · |a − a| ≤ · = ε. n |a|2 |a|2 2 Und dies zeigt die Stetigkeit nach dem Folgenkriterium. Übung 8.2.3. Zeige die Aussagen von Satz 8.1.4 mit Hilfe des Folgenkriteriums. Dabei dürfen die Ergebnisse von Übung 6.1.5 verwendet werden. R R R R Übung 8.2.4. Seien f : → und g : → stetig. Beweise die Stetigkeit von (g ◦ f ) mit dem Folgenkriterium und mit dem ε-δ-Kriterium. R R R R Übung 8.2.5. Sei f : → stetig und sei a ∈ mit f (a) 6= 0. Zeige: es gibt ein δ > 0, so dass für alle x ∈ mit |x − a| < δ gilt: f (x) 6= 0. Man sagt, dass f in einer Umgebung von a von 0 verschieden ist. Übung 8.2.6. Untersuche die Gauß-Klammer [·] : R→R gegeben durch [x] = max{a ∈ Z : a ≤ x} auf Stetigkeit, d.h. gebe die Menge aller Punkte an, an denen die Funktion stetig ist und die Menge aller Punkte, an denen sie unstetig ist (mit Beweis). 8.3 Differentialrechnung Wir betrachten zunächst lineare Funktionen, also Funktionen der Form f: R→R gegeben durch f (x) = ax + b mit a, b ∈ R. Diese sind durch die Parameter a (Steigung) und b (y-Achsenabschnitt) eindeutig bestimmt. Ist eine lineare Funktion f gegeben, so gilt natürlich b = f (0). Die Steigung a kann ermittelt werden, indem zwei beliebige Punkte x0 , x1 ∈ mit x0 6= x1 gewählt werden. Dann gilt nämlich R f (x1 ) − f (x0 ) = ax1 + b − ax0 − b = a(x1 − x0 ) ⇔ a= f (x1 ) − f (x0 ) . x1 − x0 Der Ausdruck rechts heißt auch Differenzenquotient. Seine geometrische Bedeutung liegt in der Interpretation als Steigungsdreieck: 8 Untersuchung reeller Funktionen 58 Vorkurs Mathematik f (x1 ) − f (x0 ) x1 − x0 x0 x1 Dieser Wert des Differenzenquotienten ist bei linearen Funktionen unabhängig von der Wahl der Punkte x0 und x1 . Anders sieht es aus, wenn wir denselben Ausdruck für beliebige Funktionen f : → betrachten (nur der Einfachheit halber, denn natürlich sind auch Funktionen f : D → mit D ⊆ zugelassen). Ein Bild soll das verdeutlichen: R R x0 R x1 R x2 R R Der hier abgebildete Graph gehört zur Funktion f : → gegeben durch f (x) = x2 − x + 74 mit x0 = 1, x1 = 3 und x2 = 5. Die verschiedenen Differenzenquotienten 4 entsprechen den Steigungen der Sekanten durch die entsprechenden Punkte: f (x1 ) − f (x0 ) = x 1 − x0 9 4 − 3 + 74 − 14 + 1 − 3−1 7 4 25 4 − 5 + 74 − 14 + 1 − 5−1 7 4 = 0 =0 2 = 2 1 = 4 2 Und ebenso ergibt sich f (x2 ) − f (x0 ) = x2 − x0 In diesem Fall ist der Differenzenquotient also nicht unabhängig von der Wahl der Punkte. Trotzdem ist es in vielen Fällen hilfreich, die Funktion f linear zu ¡ approxi-¢ mieren, d.h. anzunähern. Gesucht ist also eine Gerade, die sich im Punkt x0 , f (x0 ) möglichst gut an f “anschmiegt”, man sucht also die Tangente. Anschaulich gesprochen kann man die Steigung der Tangente (im Bild gestrichelt markiert) bestimmen, indem man Sekantensteigungen betrachtet und den zweiten Punkt gegen x0 gehen lässt. Man betrachtet also folgenden Grenzwert: lim x→x0 8 Untersuchung reeller Funktionen f (x) − f (x0 ) . x − x0 59 Vorkurs Mathematik Falls dieser existiert (wiederum: für alle Folgen (xn )n∈N , die gegen x0 konvergieren muss der Grenzwert existieren und alle diese Folgen müssen den gleichen Grenzwert liefern), so wird er als Steigung der Tangente oder auch Ableitung im Punkt x0 bezeichnet. Die Schreibweise dafür ist f 0 (x0 ) und die Funktion f heißt dann im Punkt x0 differenzierbar. Wie bei Stetigkeit auch nennt man eine Funktion schlicht differenzierbar, wenn sie in jedem ihrer Punkte differenzierbar ist. Für das obige Rechenbeispiel ergibt sich: f (x) − f (x0 ) = x − x0 x2 4 − x + 74 − 41 + 1 − x−1 7 4 = 1 x2 − 1 x − 1 x+1 · − = − 1. 4 x−1 x−1 4 Also gilt f (x) − f (x0 ) f (x0 ) = lim = lim x→x0 x→1 x − x0 0 µ x+1 −1 4 R ¶ = 2 1 −1=− . 4 2 R Die Tangente ist¢also eine lineare Funktion t : → , die den Graphen von f im ¡ Punkt x0 , f (x0 ) berührt (d.h. es gilt t(x0 ) = f (x0 )) und die Steigung von t ist so gewählt, dass die Funktion f gut approximiert wird. Was das heißt zeigt folgende Überlegung: Angenommen f : R → R ist im Punkt x0 differenzierbar mit Ableitung f 0 (x0 ) = lim x→x0 f (x) − f (x0 ) . x − x0 Diesen Grenzwertprozess kann man folgendermaßen umschreiben: für x 6= x0 setze ϕ(x) := R f (x) − f (x0 ) − f 0 (x0 ). x − x0 R Dann ist ϕ : \{x0 } → eine Funktion (in gewisser Weise der “Fehler” der gemacht wird, wenn man die Ableitung über einen Differenzenquotienten, also eine Sekantensteigung annähert) mit der Eigenschaft: lim ϕ(x) = 0. x→x0 Dies sagt nämlich gerade, dass dieser Fehler verschwindet, wenn x gegen x0 läuft. Was ist nun die Gleichung der Tangente t : → im Punkt x0 ? Die Tangente ist eine lineare Funktion mit Steigung f 0 (x0 ), d.h. sie hat die Form R R t(x) = f 0 (x0 ) · x + b für einen y-Achsenabschnitt b. Wegen t(x0 ) = f (x0 ) kann man das b berechnen: f (x0 ) = f 0 (x0 ) · x0 + b ⇔ b = f (x0 ) − f 0 (x0 ) · x0 . Es folgt: t(x) = f 0 (x0 ) · x + f (x0 ) − f 0 (x0 ) · x0 = f (x0 ) + f 0 (x0 ) · (x − x0 ). 8 Untersuchung reeller Funktionen 60 Vorkurs Mathematik Betrachte nun erneut die Definition von ϕ und multipliziere diese mit dem Nenner (x − x0 ), dann ergibt sich: ϕ(x) = f (x) − f (x0 ) −f 0 (x0 ) x − x0 (x−x0 )·ϕ(x) = f (x)−f (x0 )−f 0 (x0 )·(x−x0 ). ⇔ Löst man diese Gleichung nach f (x) auf, so ergibt sich: f (x) = f (x0 ) + f 0 (x0 ) · (x − x0 ) + (x − x0 ) · ϕ(x) = t(x) + ψ(x) | {z } | {z } =t(x) =:ψ(x) Die neu eingeführte Funktion ψ bestimmt also die Abweichung zwischen der Funktion f und ihrer Tangente t. Wegen ψ(x) = (x − x0 ) · ϕ(x) gilt: lim x→x0 ψ(x) = lim ϕ(x) = 0. x − x0 x→x0 Der Fehler ψ(x) geht also nicht einfach gegen 0, wenn das x gegen x0 läuft, sondern sogar dann noch, wenn erschwerend durch (x − x0 ) dividiert wird. Man sagt, ψ geht schneller als linear gegen 0. R R eine Funktion, die im Punkt x0 Satz 8.3.1. Sei D ⊆ und f : D → differenzierbar ist. Dann ist f stetig in x0 . ∈ D R R Beweis. Die Tangente t : → an den Punkt x0 ist linear, also ein Polynom und daher stetig. Daher gilt nach obiger Beschreibung ¡ ¢ lim f (x) = lim t(x) + ψ(x) = t(x0 ) = f (x0 ). x→x0 x→x0 Daher ist f stetig nach dem Folgenkriterium. Vorsicht! Die Umkehrung dieses Satzes gilt im Allgemeinen nicht, es gibt Funktionen, die zwar stetig an einem Punkt a sind, dort aber nicht differenzierbar. Übung 8.3.2. Betrachte die Betragsfunktion. Zur Erinnerung: diese war definiert durch ½ −x , falls x < 0. |·|: → mit |x| = x , falls x ≥ 0. R R Zeige: die Betragsfunktion ist im Punkt 0 stetig, dort aber nicht differenzierbar. Noch eine Bemerkung: manchmal nennt man den Term x−x0 einfach h, man definiert also h := x − x0 . Dann sieht der Differenzenquotient etwas anders aus, beschreibt aber genau den gleichen Sachverhalt, es ist nämlich f 0 (x0 ) = lim x→x0 N f (x0 + h) − f (x0 ) f (x) − f (x0 ) = lim . h→0 x − x0 h R R Übung 8.3.3. Sei n ∈ und f : → gegeben durch f (x) = xn . Bestimme für einen beliebigen Punkt x0 ∈ die Ableitung von f mit Hilfe des Differenzenquotienten. (Hinweis: Verwende die Formulierung mit dem h und den binomischen Lehrsatz, Satz 3.4.1.) R 8 Untersuchung reeller Funktionen 61 Vorkurs Mathematik 8.4 Rechenregeln für Ableitungen Schon Übung 8.3.3 zeigt, wie mühsam es manchmal ist, Ableitungen direkt mit dem Differenzenquotienten zu bestimmen. Zum Glück gibt es einige Rechenregeln, die einem das Leben erleichtern. Diese wiederum werden natürlich mit Hilfe des Differenzenquotienten bewiesen. R R R Übung 8.4.1. Seien f : → und g : → α ∈ beliebig. Zeige die folgenden Regeln: R (f + g)0 = f 0 + g 0 (Summenregel) R differenzierbare Funktionen und (α · f )0 = α · f 0 (Faktorrregel) Nicht ganz so elementar ist die folgende Regel: R R Satz 8.4.2 (Produktregel). Seien f : → und g : Funktionen. Dann gilt: (f · g)0 = f 0 · g + f · g 0 R → R differenzierbare R Beweis. Sei x0 ∈ beliebig und betrachte die Ableitung von (f · g) an der Stelle x0 . Für den Differenzenquotienten gilt: (f · g)(x) − (f · g)(x0 ) f (x) · g(x) − f (x0 ) · g(x0 ) = x − x0 x − x0 f (x) · g(x) − f (x0 ) · g(x) + f (x0 ) · g(x) − f (x0 ) · g(x0 ) = x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = · g(x) + f (x0 ) · x − x0 x − x0 Bildet man vom letzten Ausdruck den Grenzwert für x gegen x0 , so ergibt sich f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ), da f und g nach Voraussetzung in x0 differenzierbar sind und weil g nach Satz 8.3.1 stetig in x0 ist. R R Übung 8.4.3. Berechne erneut die Ableitung der Funktionen f : → gegeben durch f (x) = xn für alle n ∈ , diesmal allerdings mit Hilfe der Produktregel und vollständiger Induktion nach n. N Übung 8.4.4. Bestimme die Ableitung der Funktion f : R → R gegeben durch f (x) = (x2 + 3x − 2) · (x4 + x − 2) Eine weitere wichtige Regel zur Bestimmung von Ableitungen ist die Quotientenregel. Folgendes Lemma hilft beim Beweis: Lemma 8.4.5. Sei f : R → R differenzierbar und betrachte die Menge D := {x ∈ R : f (x) 6= 0} ⊆ R. Falls D 6= ∅ kann man den Kehrwert von f definieren durch µ ¶ 1 1 1 :D→ (x) = f f f (x) R Dann gilt µ ¶0 f0 1 =− 2 f f 8 Untersuchung reeller Funktionen 62 Vorkurs Mathematik Beweis. Sei x0 ∈ D. Betrachte den Differenzenquotienten: 1 f (x) − 1 f (x0 ) f (x0 ) f (x)·f (x0 ) − f (x) f (x)·f (x0 ) = x − x0 x − x0 f (x0 ) − f (x) f (x) − f (x0 ) 1 = =− · f (x) · f (x0 ) · (x − x0 ) x − x0 f (x) · f (x0 ) Bildet man nun den Grenzwert für x gegen x0 ergibt sich das Gewünschte, da f nach Voraussetzung in x0 differenzierbar und damit nach Satz 8.3.1 auch stetig ist. R R R R Satz 8.4.6 (Quotientenregel). Seien f : → und g : → differenzierbar und betrachte wieder D = {x ∈ : g(x) 6= 0}. Dann ist die Funktion µ ¶ f (x) f f :D→ (x) = g g g(x) R R differenzierbar und es gilt µ ¶0 f 0 · g − f · g0 f = g g2 Beweis. Das folgt direkt nach Lemma 8.4.5 und der Produktregel: µ ¶0 µ ¶0 µ 0¶ f 1 g f 0 · g f · g0 f 0 · g − f · g0 0 1 = f· =f · +f · − 2 = 2 − 2 = g g g g g g g2 Übung 8.4.7. Bestimme die Ableitung der Funktion f : durch 4x3 + 9 f (x) = 2 6x − 2x R\ © 0, 31 ª → R gegeben Jetzt haben wir fast alle wichtigen Regeln, beisammen, es fehlt allerdings noch die Regel zur Ableitung von verketteten Abbildungen, die (wie üblich) mit Hilfe des Differenzenquotienten bewiesen werden kann. Satz 8.4.8 (Kettenregel). Seien f : auch (f ◦ g) und es gilt: R → R und g : R → R differenzierbar, dann ¡ ¢ (f ◦ g)0 (x0 ) = g 0 (x0 ) · f 0 g(x0 ) Beweis. Es gilt ¡ ¢ ¡ ¢ ¡ ¢ ¡ ¢ f g(x) − f g(x0 ) g(x) − g(x0 ) f g(x) − f g(x0 ) = · x − x0 x − x0 g(x) − g(x0 ) Bildet man wieder den Grenzwert, so geht der erste Faktor gegen g 0 (x0 ) und für den zweiten Faktor gilt, dass wegen der Stetigkeit von g in x0 (erneut Satz 8.3.1) folgt: falls x gegen x¢0 geht, dann geht g(x) gegen g(x0 ). Daher geht der zweite Faktor ¡ gegen f 0 g(x0 ) . 8 Untersuchung reeller Funktionen 63 Vorkurs Mathematik An dieser Stelle noch eine kurze Bemerkung zur Kettenregel: sind f : g : → zwei lineare Funktionen, also R R f (x) = ax + b und R → R und g(x) = cx + d, dann gilt für ihre Verkettung: (f ◦ g)(x) = a · g(x) + b = a · (cx + d) + b = (ac) · x + ad + b. Man sieht sofort, dass (f ◦g) wieder linear ist und die Steigung ist gerade das Produkt der Steigungen von f und g. Für allgemeine Funktionen gilt dies ebenso: approximiert man mit der Tangenten an einen Punkt und setzt die Funktionen ineinander ein, so ergibt sich für die Verkettung als Tangente gerade die Verkettung der Tangenten und daher ist die Ableitung der Verkettung das Produkt der Ableitungen an den entsprechenden Punkten. Übung 8.4.9. Bestimme die Ableitung der Funktion f : R → R gegeben durch f (x) = (x + 2)17 Zum Abschluss betrachten wir die Ableitung der Umkehrfunktion. Angenommen f : → ist differenzierbar und bijektiv, so dass die Umkehrabbildung f −1 auch differenzierbar ist. Dann gilt folgende Regel für die Ableitung der Umkehrabbildung: R R (f −1 )0 = (f 0 1 ◦ f −1 ) Beweis. Nach Definition der Umkehrabbildung gilt (f ◦ f −1 ) = idR , also folgt nach der Kettenregel, wenn auf beiden Seiten die Ableitung gebildet wird für alle x0 ∈ : R ¡ ¢ (f −1 )0 (x0 ) · f 0 f −1 (x0 ) = 1 ⇔ (f −1 )0 (x0 ) = 1 (f 0 ◦ f −1 )(x0 ) R R Als Anwendung betrachte die Exponentialfunktion exp : → ∗+ gegeben durch exp(x) = ex . Diese ist dadurch gekennzeichnet, dass gilt exp0 = exp, was hier nicht bewiesen werden soll. Ihre Umkehrabbildung ist der (natürliche) Logarithmus log : ∗+ → . R R Eine Anmerkung zur Notation: manchmal ist auch die Schreibweise ln (Logarithmus naturalis) für den natürlichen Logarithmus in Gebrauch, allerdings ist in mathematischen Vorlesungen meistens genau dieser gemeint, wenn log an der Tafel steht und nicht etwa wie aus der Schule gewohnt der Logarithmus zur Basis 10. Mit obiger Regel fällt es nun leicht, die Ableitung des Logarithmus zu bestimmen: (log)0 (x0 ) = exp0 ¡ 1 1 1 ¢= ¡ ¢= x0 log(x0 ) exp log(x0 ) Die Ableitung des Logarithmus ist also die Funktion, die jedem positiven Wert x seinen Kehrwert x1 zuordnet. 8 Untersuchung reeller Funktionen 64 Vorkurs Mathematik √ Übung 8.4.10. Betrachte die Wurzelfunktion f : + → mit f (x) = x. Was ist f 0 (x) für x ∈ ∗+ ? Wie sieht es für x = 0 aus? Und was ist die Ableitung der n-ten √ n Wurzel f (x) = x? R R Übung 8.4.11. Sei a ∈ R R∗+ beliebig und betrachte f : R → R gegeben durch f (x) = ax Bestimme die Ableitung von f . (Hinweis: Schreibe f mit Hilfe der Rechenregeln für Potenzen und des Logarithmus so um, dass die Exponentialfunktion vorkommt.) R Übung 8.4.12. Sei a ∈ ∗+ eine positive reelle Zahl. Das Quadrat mit Seitenlänge a hat dann die Fläche a2 , man kann also die Fläche des Quadrates als Funktion der Seitenlänge ausdrücken: AQ (a) = a2 A0Q (a) = 2a Die Ableitung ist die Hälfte des Umfangs UQ (a) = 4a = 2 · A0Q (a). Betrachtet man den Kreis mit Radius r ∈ ∗+ , so ist seine Fläche gerade πr2 , es gilt also AK (r) = πr2 A0K (r) = 2πr = UK (r). R In diesem Fall ist die Ableitung der Flächenfunktion identisch mit der Umfangsfunktion. Woran liegt das? Und wie kann man den Zusammenhang zwischen Fläche und Umfang geometrisch deuten? Das gleiche Phänomen tritt übrigens in 3 Dimensionen auch auf: für das Volumen des Würfels mit Kantenlänge a gilt VW (a) = a3 VW0 (a) = 3a2 = 1 · OW (a). 2 Die Ableitung des Volumens gibt hier die Hälfte der Oberfläche. Bei der Kugel mit Radius r sieht das anders aus: 4 VK (r) = πr3 3 VK0 (r) = 4πr2 = OK (r). Was ist der Grund? 8 Untersuchung reeller Funktionen 65 Vorkurs Mathematik 9 Unendlichkeit Das Unendliche hat wie keine andere Frage von jeher so tief das Gemüt der Menschen bewegt. Das Unendliche hat wie kaum eine andere Idee auf den Verstand so anregend gewirkt. Das Unendliche ist aber auch wie kein anderer Begriff der Aufklärung bedürftig. David Hilbert 9.1 Endliche und unendliche Mengen Jeder Mensch kommt verhältnismäßig früh im Leben in Kontakt mit dem Begriff der Unendlichkeit: beim Zählen nämlich. Das schwer zu fassende Konzept, dass die natürlichen Zahlen “immer weiter” gehen, man also nie aufhören kann zu zählen ist anfangs gewöhnungsbedürftig, schließlich sind wir nur von endlichen Größen umgeben. Mit der Zeit gewöhnt man sich aber daran und akzeptiert es. Eine wichtige Eigenschaft endlicher Mengen ist, dass es keine Bijektion auf eine echte Teilmenge geben kann. Satz 9.1.1. Seien n und m natürliche Zahlen mit n > m und betrachte die Mengen N : k ≤ n} = {1, . . . , n} N := {k ∈ M := {k ∈ N : k ≤ m} = {1, . . . , m} Dann gilt M ( N und es gibt keine bijektive Abbildung f : N → M . Beweis. Sei f : N → M surjektiv und wähle für k ∈ M ein Urbild ak ∈ N aus. Falls diese nicht paarweise verschieden sind (d.h. ak 6= al für k 6= l), dann ist f keinesfalls injektiv. Nimm also an, dass diese paarweise verschieden sind und betrachte N \{a1 , . . . , am }. Diese Menge ist nicht leer, da n > m ist, sei also b ∈ N \{a1 , . . . , am }. Wegen f (b) ∈ M gilt f (b) = k für ein k ≤ m, also folgt f (b) = f (ak ), aber wegen b 6= ak ist f nicht injektiv. Der Beweis wirkt tautologisch, aber genau diese Eigenschaft von endlichen Mengen ist es, die abhanden kommt, wenn man unendliche Mengen wie zum Beispiel die natürlichen Zahlen betrachtet: setze M := {n ∈ : n > 4} = {5, 6, 7, . . .}. N N, aber f : N → M gegeben durch f (n) = n + 4 ist eine Bijektion. Dann ist M ( 1 2 3 4 5 6 ² ² ² ² ² ² 5 6 7 8 9 10 _ _ _ _ _ _ ... ... Das kann man natürlich auch formal zeigen. Beweis. Die Abbildung f ist injektiv, denn aus f (n) = f (m) folgt n + 4 = m + 4 und daher m = n. Aber f ist auch surjektiv, denn falls m ∈ M , dann ist m > 4 und daher ist m − 4 > 0, also m − 4 ∈ und f (m − 4) = (m − 4) + 4 = m. Daher ist (m − 4) ein Urbild von m unter f . N 9 Unendlichkeit 66 Vorkurs Mathematik Aus genau demselben Grund gibt es auch eine Bijektion zwischen den Mengen und 0 , obwohl erstere eine echte Teilmenge von letzterer ist. N N Mengen zwischen denen eine Bijektion existiert heißen auch gleichmächtig (Im Zeichen: N ∼ = M , wenn N und M gleichmächtig sind). Die natürlichen Zahlen sind also gleichmächtig zu einer echten Teilmenge von sich. Diese Eigenschaft nahm der Mathematiker Dedekind als definierende Eigenschaft der Unendlichkeit. Definition 9.1.2. Sei N eine Menge. Wenn es eine echte Teilmenge M ( N und eine Bijektion f : N → M gibt, dann heißt N unendlich. Eine alternative Definition ist die Folgende: eine Menge N heißt endlich, wenn sie entweder leer ist oder es eine natürliche Zahl n und eine Bijektion f : N → {k ∈ N : k ≤ n} = {1, . . . , n} gibt. Alle Mengen, die nicht endlich sind heißen unendlich. Beide Definitionen sind gleichwertig, der Beweis erfordert allerdings ein etwas umstrittenes Axiom der Mengenlehre, das Auswahlaxiom. Darauf wollen wir hier nicht näher eingehen. In den behandelten Beispielen war die echte Teilmenge, die betrachtet wurde, nur um endlich viele Elemente kleiner als . Dass dies nicht immer so sein muss, zeigen folgende Beispiele: betrachte die Mengen N N} = {2, 4, 6, 8, 10, . . .} ( N und N} = {1, 4, 9, 16, 25, . . .} ( N der geraden Zahlen bzw. der Quadratzahlen in N. Beide Mengen sind gleichmächtig zu N. Beweis. Die Abbildungen f : N → G und g : N → Q gegeben durch G := {2n : n ∈ Q := {n2 : n ∈ f (n) = 2n bzw. g(n) = n2 sind Bijektionen. Ihre Umkehrabbildungen sind gegeben durch f −1 (n) = √ g −1 (n) = n. n 2 bzw. Mit diesem Verfahren kann man auch zeigen, dass die Menge der ganzen Zahlen zur Menge der natürlichen Zahlen gleichmächtig ist. N Z Beweis. Nach Übung 4.1.9 ist “gleichmächtig” zu sein transitiv, d.h. wenn X ∼ =Y ∼ ∼ ∼ und Y = Z, dann gilt auch X = Z. Wegen = 0 reicht es zu zeigen, dass gilt: ∼ = 0 . Betrachte dazu folgende Abbildung: ½ 2x , falls x ≥ 0 f: → 0 f (x) = −2x − 1 , falls x < 0 N N Z N Z N N Zunächst zur Surjektivität. Sei n ∈ 0 beliebig. Falls n gerade ist, dann ist x := n2 eine ganze Zahl mit x ≥ 0, also folgt f (x) = 2x = n. Falls n ungerade ist, dann ist . Es folgt x < 0, also n + 1 gerade und wir setzen x := − n+1 2 f (x) = −2x − 1 = 2 · 9 Unendlichkeit n+1 − 1 = n + 1 − 1 = n. 2 67 Vorkurs Mathematik Z Zur Injektivität: sind x, y ∈ mit f (x) = f (y), so gibt es zwei Fälle: ist f (x) gerade, dann folgt x = f (x) = f (y) = y. Ist f (x) hingegen ungerade, dann ist nach obigem 2 2 f (x)+1 Argument x = − 2 = − f (y)+1 = y. 2 Die Abbildung f aus dem Beweis kann man sich folgendermaßen bildlich vorstellen: ... −3 −2 −1 0 1 2 3 ² ² ² ² ² ² ² 5 3 1 0 2 4 6 _ ... _ _ _ _ _ ... _ ... Die negativen ganzen Zahlen werden auf die ungeraden Zahlen abgebildet, die positiven Zahlen gehen auf die geraden Zahlen und die 0 geht auf die 0. Q Und was ist mit der Menge der rationalen Zahlen, ? Sind das denn wenigstens “mehr”? Die Antwort ist überraschenderweise nein: es gilt wieder ∼ = . Q Q Q N N Beweis. Zunächst halten wir fest, dass es reicht, ∗+ = {q ∈ : q > 0} ∼ zu = ∗ zeigen, denn ∼ = + folgt dann wie oben. Es reicht sogar eine surjektive Abbildung f : → ∗+ anzugeben, denn nach Kapitel 4.2 kann diese durch Verkleinern der Definitionsmenge injektiv, insgesamt also bijektiv gemacht werden und eine Bijektion zwischen ∗+ und einer echten nicht endlichen Teilmenge der natürlichen Zahlen reicht aus. Wie findet man diese surjektive Abbildung f ? Betrachte folgendes Bild: N Q Q Q Q 1 1 1 2 / ¥ ¥ ¥ ¥¥ ¥ ¥£ ¥ ¥B ¥¥ ¥ ¥ ² ¥¥¥ 1 3 1 4 ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¥¥ ¥ ¥¥ ² ¥¥¥ 1 5 .. . ¦ ¦¦ ¦ ¦ ¦¦ ¦£ ¦ 2 1 2 2 2 3 2 4 2 5 .. . ¥B ¥¥ ¥ ¥¥ ¥¥ ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¥¥ ¥ ¥ ¥¥ ¥ ¥ ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¦¦ ¦ ¦¦ ¦¦ ¦ ¦ 3 1 3 2 3 3 3 4 3 5 .. . / ¥ ¥ ¥ ¥¥ ¥ ¥£ ¥ ¥B ¥¥ ¥ ¥¥ ¥¥ ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¥¥ ¥ ¥ ¥¥ ¥ ¥ ¦ ¦¦ ¦ ¦ ¦¦ ¦£ ¦ 4 1 4 2 4 3 4 4 4 5 .. . ¥B ¥¥ ¥ ¥¥ ¥¥ ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¥¥ ¥ ¥ ¥¥ ¥ ¥ ¥ ¥¥ ¥ ¥¥ ¥£ ¥ B ¦¦ ¦ ¦¦ ¦¦ ¦ ¦ 5 1 5 2 5 3 5 4 5 5 / ··· £ £ ££ £ ££ £¡ £ ··· £@ £ ££ ££ £ ££ ··· ££ ££ £ ££ £¡ £ ··· £@ £ ££ ££ £ ££ ··· .. . .. . Das Bild ist so zu verstehen, dass die obere linke Ecke das Bild der Zahl 1 sein soll. Danach folgt man den Pfeilen und erhält so eine “Aufzählung” der positiven Brüche, also eine Abbildung f : → ∗+ . Diese ist surjektiv, da jeder Bruch in dem Bild vorkommt, aber natürlich kommt jeder Bruch sogar mehrfach vor, da auch ungekürzte Schreibweisen auftauchen. N Q N Definition 9.1.3. Sei M eine unendliche Menge. Falls ∼ = M , so heißt M abzählbar. Dieser Begriff leitet sich daraus her, dass eine bijektive Abbildung f : → M 9 Unendlichkeit N 68 Vorkurs Mathematik eine Abzählung der Elemente von M darstellt, man kann mit Hilfe dieser Abbildungen die Elemente von M also der Reihe nach hinschreiben. N Zum Beispiel kann man für n ∈ folgende Schreibweise einführen: an := f (n). Dann ist an ∈ M für alle n ∈ und es gilt aufgrund der Bijektivität von f : N M = {a1 , a2 , a3 , a4 , a5 , a6 , . . .} Übung 9.1.4. Hilberts Hotel. Die folgende Übung ist der interessante Vergleich von Hilbert zum Thema Unendlichkeit, der als “Hilberts Hotel” bekannt geworden ist. Dieses Hotel ist ein fiktiver Ort, der Zimmer hat, also für jede natürliche Zahl ein Zimmer, mit anderen Worten: unendlich viele. Stellen wir uns vor, dass alle Zimmer belegt sind, das Hotel also restlos ausgebucht ist. N Trotzdem hat der Portier die Anweisung, alle neu ankommenden Gäste unterzubringen ohne bereits vorhandene Gäste ausquartieren zu müssen. Umquartieren innerhalb des Hotels ist ihm aber erlaubt. Wie kommt er mit folgenden Situationen klar? a) Ein neuer Gast kommt an. b) Es kommen n Gäste an, wobei n ∈ c) Ein Großraumbus mit N eine natürliche Zahl ist. N Gästen kommt an. d) Es kommen n Großraumbusse an. e) Eine Kolonne mit N Großraumbussen kommt an. 9.2 Überabzählbarkeit – noch mehr als N Das Unendliche ist weit, vor allem gegen Ende. Alphonse Allais N Z Q ∼ ∼ Im vorigen Abschnitt haben wir gesehen, dass gilt. Da liegt doch = = die Vermutung nahe, dass jede unendliche Menge gleichmächtig zu den natürlichen Zahlen ist, also z.B. auch die Menge der reellen Zahlen. Dies ist aber falsch: zunächst werden wir ein Argument erarbeiten, das zeigt, dass nicht automatisch je zwei unendliche Mengen bijektiv zueinander sind und danach zeigen, dass es keine surjektive Abbildung f : → gibt, die reellen Zahlen also tatsächlich mächtiger sind (man sagt: eine größere Kardinalität besitzen) als die natürlichen Zahlen. R N R Definition 9.2.1. Sei M eine beliebige Menge. Betrachte dazu die Menge aller Teilmengen von M : P(M ) := {A ⊆ M }. Diese wird als Potenzmenge von M bezeichnet. Beispielsweise gilt: © ª P({a, b, c}) = ∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c} Übung 9.2.2. Sei M eine endliche Menge mit n Elementen. Zeige: die Potenzmenge von M hat 2n Elemente. 9 Unendlichkeit 69 Vorkurs Mathematik Satz 9.2.3. Sei M eine beliebige Menge. Dann gibt es keine surjektive Abbildung f : M → P(M ). Insbesondere gilt M ∼ 6= P(M ). Beweis. Wieder ein Beweis durch Widerspruch. Angenommen f : M → P(M ) wäre surjektiv. Betrachte dann folgende Menge X := {m ∈ M : m ∈ / f (m)} ⊆ M Da X ⊆ M gilt X ∈ P(M ). Wegen der Surjektivität von f gibt es also ein x ∈ M mit f (x) = X. Nun unterscheiden wir zwei Fälle: Fall 1: x ∈ f (x). Da f (x) = X folgt nach Definition von X: x ∈ / f (x). E Fall 2: x ∈ / f (x). Dann folgt aber x ∈ X = f (x). E Beide Fälle führen also zu einem Widerspruch. Daher kann f nicht surjektiv sein, die Menge X kann kein Urbild haben. Der Beweis basiert auf einem Paradoxon, das auch bekannt ist als der “Barbier von Sevilla”: das ist derjenige Mensch in dem Ort Sevilla, der alle Männer rasiert, die sich nicht selbst rasieren. Die Frage, ob er sich denn selbst rasiere führt auf einen ähnlichen unlösbaren Widerspruch. Es folgt auch, dass es unendlich viele unendliche Mengen gibt, die alle untereinander nicht gleichmächtig sind: starte mit einer unendlichen Menge M , dann ist ¡ ¢ M∼ 6= P(M ) ∼ 6= P P(M ) ∼ 6= . . . N → R, d.h. N ∼6= R. Beweis. Es reicht zu zeigen, dass es keine surjektive Abbildung f : N → [0, 1] = {x ∈ R : 0 ≤ x ≤ 1} gibt, denn dann gibt es erst Recht keine Surjektion nach R. Sei dazu eine beliebige Abbildung f : N → [0, 1] gegeben und schreibe zu n ∈ N das Satz 9.2.4. Es gibt keine surjektive Abbildung f : Bild f (n) als Dezimalzahl f (n) = 0, an,1 an,2 an,3 an,4 an,5 an,6 . . . an,i ∈ {0, 1, . . . , 9} Die ersten Zahlen könnten beispielweise so aussehen: f (1) f (2) f (3) f (4) f (5) = = = = = 0, 4190318539 . . . 0, 2901387503 . . . 0, 8091244112 . . . 0, 9933187609 . . . 0, 0290047014 . . . N Definiere nun zu n ∈ die Ziffer bn := an,n + 1 falls an,n 6= 9, sonst setze bn := 0. Dann ist bn eine Ziffer zwischen 0 und 9, die man erhält, indem man aus der Zahl f (n) die n-te Nachkommastelle um 1 erhöht bzw. zu 0 macht, wenn dort eine 9 9 Unendlichkeit 70 Vorkurs Mathematik steht. Daraus kann man nun eine Zahl x = 0, b1 b2 b3 b4 b5 b6 . . . ∈ [0, 1] konstruieren. Diese liegt nicht im Bild von f ! Denn sie unterscheidet sich an der ersten Nachkommastelle von f (1), an der zweiten von f (2) usw. und an der n-ten Nachkommastelle von f (n). Da diese Zahl x nicht im Bild von f liegt, ist f daher nicht surjektiv. Dieses Verfahren heißt auch Diagonalverfahren nach Cantor. N Definition 9.2.5. Ist M eine unendliche Menge mit M ∼ 6= , so heißt M überabzählbar. Der eben bewiesene Satz zeigt die Überabzählbarkeit der reellen Zahlen. R Natürlich gibt es Mengen, die mächtiger sind als die reellen Zahlen, z.B. P( ). An dieser Stelle ist vor allem der Unterschied zwischen abzählbaren und überabzählbaren Mengen wichtig. Insbesondere folgt, dass es keine Möglichkeit gibt, die reellen Zahlen aufzuzählen, was für die rationalen Zahlen sehr wohl funktioniert. Übung 9.2.6. Betrachte die Menge X = {A ⊆ N : A ist unendlich und abzählbar} Zeige: X ist überabzählbar. Was ist mit der Menge Y = {A ⊆ N : A ist überabzählbar}? Übung 9.2.7. Sei I eine beliebige Menge (möglicherweise überabzählbar) und sei f : I → + eine Abbildung. Betrachte X f (i) R i∈I und nimm an, dass diese Summe konvergent ist. Zeige: dann ist X = {i ∈ I : f (i) 6= 0} abzählbar oder endlich. 9 Unendlichkeit 71 Vorkurs Mathematik 10 Lineare Gleichungssysteme 10.1 Die erweiterte Koeffizientenmatrix In diesem Kapitel betrachten wir lineare Gleichungssysteme und Verfahren zu ihrer Lösung. Unter einer linearen Gleichung (mit reellen Koeeffizienten) verstehen wir eine Gleichung der Form ax = b mit a, b ∈ R Gesucht sind alle Lösungen für x, d.h. alle reellen Werte für x, die diese Gleichung lösen. Dazu unterscheidet man einige Fälle: Fall 1: a 6= 0. Dann ist x = b a die einzige Lösung. Fall 2: a = 0. Hier braucht man eine weitere Fallunterscheidung: Fall 2a: b 6= 0. Dann gibt es keine Lösung, denn die Gleichung 0 · x = b ist für kein x ∈ erfüllt. Fall 2b: b = 0. In diesem Fall ist jedes x ∈ eine Lösung, denn 0 · x = 0 ist für alle x ∈ erfüllt. R R R Dieser einfache Spezialfall einer Gleichung mit einer Unbekannten wird verallgemeinert für m Gleichungen mit n Unbekannten: a1,1 x1 + a1,2 x2 + · · · + a1,n xn = b1 a2,1 x1 + a2,2 x2 + · · · + a2,n xn = b2 .. . am,1 x1 + am,2 x2 + · · · + am,n xn = bm R R Hierbei gilt wieder ai,j ∈ und bi ∈ und gesucht sind alle Werte für x1 , . . . , xn , die alle Gleichungen simultan erfüllen. Um sich Notationsarbeit zu sparen, schreibt man auch oft nur die Koeffizienten in eine Tabelle und nennt dieses Konstrukt dann Matrix. Allgemein sieht das dann so aus: a1,1 a1,2 · · · a1,n b1 a2,1 a2,2 · · · a2,n b2 .. .. . . . . . am,1 am,2 · · · am,n bm Diese Matrix heißt auch erweiterte Koeffizientenmatrix. Erweitert deshalb, weil die Spalte mit den bi aufgenommen wurde, kommt diese nicht vor, spricht man schlicht von der Koeffizientenmatrix. Es handelt sich hierbei lediglich um eine geschickte Art der Notation, die überflüssige Schreibarbeit ersparen soll. Um ein Gleichungssystem aber lösen zu können, muss man mit den Gleichungen, also den Matrizen rechnen können. Zu diesem Zweck betrachtet man sogenannte elementare Zeilenumformungen, die in vier Typen daher kommen. 10 Lineare Gleichungssysteme 72 Vorkurs Mathematik Typ 1: Multiplikation einer Zeile der Matrix mit einer reellen Zahl λ 6= 0. Diese Operation entspricht der Multiplikation der entsprechenden Gleichung mit λ und führt zu einer äquivalenten Gleichung. Typ 2: Addition einer Zeile zu einer anderen. Diese Operation entspricht der Addition der Gleichungen. Typ 3: Addition des λ-fachen einer Zeile zu einer anderen. Dies ist keine wirklich neue Zeilenoperation, sondern schlicht eine Kombination der ersten beiden Typen. Typ 4: Vertauschung zweier Zeilen. Dies entspricht lediglich einer Vertauschung zweier Gleichungen. Wie man sofort sieht, ändern diese Operationen zwar die Matrix, nicht aber die Lösungsmenge des Gleichungssystems. Die Frage ist jetzt, ob es eine Möglichkeit gibt, mit Hilfe der Zeilenumformungen die Matrix in eine Gestalt zu bringen, die es direkt erlaubt, die Lösungen zu bestimmen. Es gibt verschiedene Varianten dies zu tun und eine davon ist der sogenannte Gauß-Algorithmus. 10.2 Der Gauß-Algorithmus Gegeben sei ein Gleichungssystem mit m Gleichungen und n Variablen und die erweiterte Koeffizientenmatrix wie oben. Der Algorithmus funktioniert folgendermaßen. Schritt 1: Suche die erste Spalte mit einem von 0 verschiedenen Eintrag. Sollte es keine geben, ist der Algorithmus am Ende, die erweiterte Koeffizientenmatrix ist dann die sogenannte Nullmatrix, in der alle Einträge gleich 0 sind. Angenommen die erste Spalte mit einem von 0 verschiedenen Eintrag ist die Spalte j. Schritt 2: Falls a1,j = 0 führe eine Vertauschung von Zeilen (Typ 4) durch, so dass a1,j 6= 0. Schritt 3: Führe wiederholt Zeilenumformungen vom Typ 3 durch, um alle ai,j -fache von Einträge ai,j mit i ≥ 2 zu 0 zu machen, indem zur Zeile i das − a1,j Zeile 1 addiert wird. Schritt 4: Wende den Algorithmus auf die Untermatrix an, die aus der erweiterten Koeffizientenmatrix entsteht, indem die erste Zeile und die ersten j Spalten fortgelassen werden. Am Ende des Algorithmus hat die Matrix eine spezielle Gestalt, die Zeilenstufenform genannt wird. Schreibt man diese wieder in Gleichungen um, so sieht man, dass sich die Zahl der Unbekannten von Gleichung zu Gleichung jedes Mal um mindestens eine reduziert. Hier ein Beispiel einer Matrix in Zeilenstufenform: 0 0 4 1 0 −5 9 0 0 0 0 −2 0 −10 0 0 0 0 0 14 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 10 Lineare Gleichungssysteme 73 Vorkurs Mathematik Die fettgedruckten Elemente sind jeweils die Stufen des Systems und heißen auch Pivot-Elemente der Matrix. Sie sind per Definition von 0 verschieden. Anhand der Zeilenstufenform ist es nun nicht schwer, das System zu lösen: Falls die letzte Spalte ein Pivot-Element b enthält, ist das System nicht lösbar, denn die entstehende Gleichung lautet 0 · x 1 + 0 · x2 + · · · + 0 · xn = b Wegen b 6= 0 ist diese Gleichung nie erfüllt. Enthält die letzte Spalte kein Pivot-Element, so ist das System lösbar. Jede Variable, die zu einer Spalte mit Pivot-Element gehört heißt gebundene Variable, die anderen heißen freie Variablen. Letztere können wie der Name schon sagt frei gewählt werden. Es gilt: Ein lösbares System hat genau dann unendlich viele Lösungen, wenn freie Variablen existieren, ansonsten ist die Lösung eindeutig bestimmt. Die Ermittlung der Lösung geschieht mittels “rückwärts einsetzen”: Betrachte die unterste Zeile, die keine Nullzeile ist (sagen wir Zeile i). Nimm an, dass die Spalte j das Pivot-Element enthält, dann ergibt sich die Gleichung ai,j xj + ai,j+1 xj+1 + · · · + ai,n xn = bi mit ai,j 6= 0 Werden nun xj+1 bis xn beliebig gewählt (als freie Variablen), so ist xj dadurch eindeutig bestimmt: bi − ai,j+1 xj+1 − · · · − ai,n xn xj = ai,j Auf diese Weise erhält man alle Lösungen des Gleichungssystems. Übung 10.2.1. Finde alle Lösungen für folgendes Gleichungssystem. x2 + 3x3 + 3x4 x1 + 3x2 − 5x3 + 9x4 −2x1 − 5x2 + 12x3 − 23x4 3x1 + 11x2 − 8x3 + 41x4 2x1 + 7x2 − 7x3 + 22x4 = = = = = 1 −3 8 −8 0 Übung 10.2.2. Gegeben sei ein Quadrat mit 3 × 3 Kästchen: Diese Kästchen sollen mit rationalen Zahlen gefüllt werden, so dass die Summe in horizontaler, vertikaler und diagonaler Richtung stets den gleichen Wert a ∈ ergibt. Geht das für jeden Wert a? Wieviele Möglichkeiten gibt es für gegebenes a? Für welche a können die Einträge ganzzahlig gewählt werden? Q 10 Lineare Gleichungssysteme 74 Vorkurs Mathematik 11 Matrizenkalkül 11.1 Addition und Multiplikation von Matrizen Nachdem im letzten Abschnitt eine Matrix als Notationshilfe eingeführt wurde, soll hier nun mit Matrizen abstrakt gerechnet werden. Die Menge aller Matrizen mit m Zeilen und n Spalten (wobei m, n ∈ ) und reellen Einträgen soll mit M (m × n, ) bezeichnet werden. N R Zur Notation: eine Matrix A mit m Zeilen und n Spalten (oder kurz: eine m × nMatrix) soll kurz A = (aij )i,j geschrieben werden, wobei sich aij ∈ auf den Eintrag in Zeile i und Spalte j bezieht. R R Definition 11.1.1. Auf der Menge der m × n Matrizen M (m × n, ) wird die Addition komponentenweise definiert, d.h. für A = (aij )i,j und B = (bij )i,j setzt man A + B = C = (aij + bij )i,j In Worten: der Eintrag in Zeile i und Spalte j der Summenmatrix entsteht, indem die Einträge der Summanden an den entsprechen Stellen addiert werden. R Übung 11.1.2. Zeige: Die Menge M (m × n, ) bildet mit der Verknüpfung + eine Gruppe. Neben der Addition definiert man auch die Multiplikation von Matrizen. Diese ist nicht komponentenweise definiert und sieht auf den ersten Blick furchtbar kompliziert aus, ist aber ungemein praktisch, wie sich später zeigen wird. N R Definition 11.1.3. Seien m, n, r ∈ und A = (aij )i,j ∈ M (m × n, ) und B = (bij )i,j ∈ M (n × r, ) Matrizen. Dann ist A · B folgendermaßen definiert : R R A · B = C = (cij )i,j ∈ M (m × r, ) mit cij = n X aik bkj k=1 Bildlich gesprochen geschieht hier folgendes: multipliziert werden dürfen Matrizen, bei denen die Anzahl der Spalten der ersten Matrix A mit der Anzahl der Zeilen der zweiten Matrix B übereinstimmt. Die Produktmatrix hat dann genausoviele Zeilen wie A und genauso viele Spalten wie B. Der Eintrag in Zeile i und Spalte j des Produktes wird gebildet, indem Zeile i von Matrix A und Spalte j von Matrix B (beide haben gleich viele Einträge!) eintragsweise multipliziert und dann aufaddiert werden. b1j ··· b2j c11 · · · c1r .. . . . . . . . .. = a a · · · a a · C = . cij i,n−1 in . . n Zeilen i1 i2 . bn−1,j cm1 · · · cmr ··· bnj | {z } n Spalten Um sich mit diesem seltsamen Konzept vertraut zu machen hilft es, zur Übung einige Matrizen zu multiplizieren. 11 Matrizenkalkül 75 Vorkurs Mathematik Übung 11.1.4. Bilde die folgenden Matrizenprodukte, sofern dies möglich ist. 2 0 3 3 ¡ ¢ ¡ ¢ −5 · 17 , −2 · 1 0 4 , 1 0 4 · −2 1 −8 0 0 µ ¶ µ ¶ −2 5 0 1 3 2 9 −3 2 0 7 −2 2 4 10 · −2 0 · , 1 −4 0 3 −1 6 −9 0 −4 −1 4 −7 Eine erste Anwendung, die zeigen soll, wie praktisch dieses Konzept der Multiplikation sein kann, ist Folgende: betrachte erneut ein Gleichungssystem wie oben: a1,1 x1 + a1,2 x2 + · · · + a1,n xn = b1 a2,1 x1 + a2,2 x2 + · · · + a2,n xn = b2 .. . am,1 x1 + am,2 x2 + · · · + am,n xn = bm Mit Hilfe der Multiplikation von Matrizen kann dies nun anders geschrieben werden. Setze nämlich A := (aij )i,j ∈ M (m × n, ) und definiere zwei Matrizen mit nur einer Spalte x := (xi )i ∈ M (n × 1, ), sowie b = (bi )i ∈ M (m × 1, ), dann schreibt sich das System kurz als A·x=b R R R Und wer das nicht glaubt, rechnet’s nach. Noch eine kleine Anmerkung: Matrizen mit nur einer Spalte nennt man auch Vektoren (oder um ganz genau zu sein Spaltenvektoren zur Unterscheidung von Zeilenvektoren, also Matrizen mit nur einer Zeile). 11.2 Rechenregeln Im Folgenden sollen einige Rechenregeln für Matrizen erarbeitet werden. Dazu ist es zweckmässig für n ∈ nur sogenannte quadratische Matrizen, also n×n-Matrizen zu betrachten. Die Regeln haben zwar allgemeinere Gültigkeit, allerdings muss man im allgemeinen Fall sehr viel genauer darauf achten, welche Produkte man bilden kann und welche nicht. Quadratische Matrizen kann man untereinander beliebig addieren und multiplizieren und es ergeben sich in jedem Fall wieder quadratische Matrizen. N Übung 11.2.1. Finde (möglichst einfache) quadratische Matrizen A und B für die gilt: AB 6= BA (Hinweis: Das geht schon für n = 2.) Diese Übung zeigt, dass Matrizenmultiplikation nicht kommutativ ist. Hingegen gilt: Satz 11.2.2. Sei n ∈ N und A, B, C ∈ M (n × n, R). Dann gelten die Gleichungen (A · B) · C = A · (B · C) A · (B + C) = A · B + A · C (A + B) · C = A · C + B · C 11 Matrizenkalkül (Assoziativität) (Distributivität) 76 Vorkurs Mathematik Beweis. Setze D = (dij )i,j := (A · B) · C und E = (eij )i,j = A · (B · C). Dann gilt für i, j ∈ {1, . . . , n}: à n ! n n X X X aik bkl clj = aik bkl clj . dij = l=1 k=1 k,l=1 Diese Notation in der Summe bedeutet, dass die Indizes k und l unabhängig von 1 bis n laufen, also alle Kombinationen gebildet und aufsummiert werden. Für die Matrix E ergibt sich entsprechend à n ! n n X X X eij = aik bkl clj = aik bkl clj = dij . k=1 l=1 k,l=1 Es folgt D = E. Betrachte nun F = (fij )i,j = A·(B +C) und G = (gij )i,j = A·B +A·C. Nachrechnen ergibt fij = n X aik · (bkj + ckj ) = n X (aik · bkj + aik · ckj ) = k=1 k=1 k=1 n X aik bkj + n X aik ckj = gij . k=1 Insgesamt ergibt sich wieder F = G. Die zweite Distributivitätsgleichung folgt analog. Die Multiplikation stellt neben der Addition eine zweite Verknüpfung auf der Menge der quadratischen Matrizen dar. Aber wie reiht sich diese Menge in unsere bekannten Strukturen ein, bilden die Matrizen vielleicht einen Körper? Zu diesem Zweck brauchen wir zunächst ein neutrales Element der Multiplikation. Definition 11.2.3. Sei n ∈ N. Definiere die Einheitsmatrix durch ½ R In = (δij )i,j ∈ M (n × n, ) , wobei δij = 1 , falls i = j 0 , falls i = 6 j Die Einheitsmatrix hat also auf der Diagonalen lauter Einsen und ansonsten nur Nullen. Eine kleine Bemerkung: es ist kein Zufall, dass die Einträge mit δ bezeichnet sind, die Notation ist auch als “Kronecker-δ” bekannt. 1 0 ··· 0 . . . .. . 0 1 In = . . . .. . . . . 0 0 ··· 0 1 Diese Einheitsmatrix ist das neutrale Element der Matrizenmultiplikation: für eine beliebige Matrix A = (aij )i,j ∈ M (n × n, ) gilt: R A · In = In · A = A 11 Matrizenkalkül 77 Vorkurs Mathematik Beweis. Setze B = (bij )i,j = A · In . Dann gilt bij = n X aik δkj = aij · δjj = aij k=1 Also ist A · In = A. Die andere Gleichung folgt analog. R Die Menge der n×n Matrizen mit Einträgen in bilden also einen Monoid bzgl. der Matrizenmultiplikation. Damit sie eine Gruppe bilden können, muss jede Matrix, die nicht die Nullmatrix ist, ein inverses Element besitzen. Dies ist leider nicht der Fall, wie folgendes Beispiel zeigt: Satz 11.2.4. Die 2 × 2-Matrix µ A= ¶ 0 1 0 0 R ist nicht invertierbar, d.h. es gibt keine Matrix B ∈ M (2 × 2, ) mit A · B = I2 . R Beweis. Für jedes B = (bij )i,j ∈ M (2 × 2, ) gilt: µ ¶ µ ¶ µ ¶ 0 1 b11 b12 b21 b22 A·B = · = 0 0 b21 b22 0 0 Insbesondere ist der Eintrag in Zeile 2 und Spalte 2 des Produktes immer 0, also kann nie die Einheitsmatrix I2 herauskommen. Die Menge der Matrizen ohne die Nullmatrix bildet also keine Gruppe bezüglich der Multiplikation, daher ist die Struktur der Menge nur die eines Ringes und sie bildet keinen Körper. Am Rande: auch die ganzen Zahlen bilden einen Ring, bei dem die Multiplikation allerdings kommutativ ist. Z Übung 11.2.5. Für eine n × n Matrix A und ein k ∈ A0 := In N definiere Ak induktiv: Ak := A · Ak−1 A1 := A für k > 1. Sei A = (aij )i,j gegeben durch ½ aij = 1 , falls j − i = 1 0 , falls j − i 6= 1 Zeige: An = 0n , wobei 0n die Nullmatrix bezeichnet. Eine solche Matrix, bei der eine Potenz gleich der Nullmatrix ist, heißt nilpotent. N Übung 11.2.6. Sei n ∈ . Eine n × n Matrix A heißt invertierbar, wenn es eine n × n-Matrix A−1 gibt mit A · A−1 = A−1 · A = In . R Betrachte nun folgende Relation ∼ auf der Menge M (n × n, ): R A ∼ B ⇔ ∃ P ∈ M (n × n, ) invertierbar, mit A = P BP −1 Zeige: ∼ ist eine Äquivalenzrelation. 11 Matrizenkalkül 78 Vorkurs Mathematik 12 Vektorräume 12.1 Veranschaulichung am Beispiel N R R2 und R3 R Sei n ∈ und betrachte die Menge der Spaltenvektoren M (n × 1, ). Dieser wird meist mit n bezeichnet. Im letzten Kapitel haben wir gesehen, dass diese Menge mit der Verknüpfung + (komponentenweise Addition) eine Gruppe bildet. Das neutrale Element (der Vektor, in dem alle Einträge gleich 0 sind) wird in diesem Fall oft als Nullvektor bezeichnet. Für n = 2 und n = 3 gibt es eine Möglichkeit, sich diese Gruppe und die Addition in ihr zu veranschaulichen. Im ersten Fall stelle man sich die Ebene (sonst den Raum) vor und wähle darin einen beliebigen Punkt, der fortan der “Ursprung” sein soll. Ein Spaltenvektor wird dann als Verschiebevorschriftµ betrachtet: man “einigt” sich ¶ 3 auf zwei Richtungen und dann bedeutet der Vektor einfach eine Verschiebung 7 um 3 Einheiten in x-Richtung und um 7 Einheiten in y-Richtung. Graphisch wird dies oft durch einen Pfeil symoblisiert. Mit diesem Bild im Kopf ist auch die graphische Veranschaulichung der Vektoraddition nicht schwer: sind v und w Vektoren, z.B. µ ¶ µ ¶ µ ¶ 7 −3 4 v= w= ⇒ v+w = 1 2 3 dann beschreibt der Summenvektor v + w was geschieht, wenn die beiden Verschiebungen nacheinander (gleich in welcher Reihenfolge) ausgeführt werden. w v+w v Zeichnerisch stellt man das so dar, dass die beiden Vektoren aneinander gezeichnet werden, als “durchliefe man die Strecke”. Für n = 3 gilt dasselbe Bild im Raum. Das Problem besteht oft in der “Wahl der Richtung”. Im Fall der Ebene kann man dies zum Beispiel folgendermaßen bewerkstelligen: man sucht sich zwei Vektoren aus, die aneinandergelegt nicht auf einer Geraden liegen. Dies sollen die beiden Richtungen sein und die jeweiligen Längen der Vektoren geben die Einheitenlängen an. Man spricht auch von der Wahl eines Koordinatensystems oder einer Basis. Wir haben meist folgende Basis im Kopf und auch das obige Bild basiert darauf: die beiden Basisvektoren sind e1 und e2 und entsprechen den üblichen x und y Achsenrichtungen. e2 e1 12 Vektorräume 79 Vorkurs Mathematik Es gibt eine weitere Operation, die mit Vektoren (und generell mit Matrizen) durchgeführt werden kann: die Multiplikation mit Skalaren. In unseren Beispielen sind Skalare schlicht reelle Zahlen (die auch negativ sein dürfen) und werden zur Unterscheidung von Vektoren oft mit griechischen Buchstaben abgekürzt. Definition 12.1.1. Sei v = (vi )i ∈ Rn ein Vektor und λ ∈ R. Definiere dann v1 λ · v1 v2 λ · v2 λ · v = λ · .. = .. . . vn λ · vn Übung 12.1.2. Zeige folgende Rechenregeln für Vektoren v, w ∈ λ, µ ∈ : R Rn und Skalare a) (λ · µ) · v = λ · (µ · v) b) (λ + µ) · v = λ · v + µ · v c) λ · (v + w) = λ · v + λ · w d) 1 · v = v und (−1) · v = −v (Hierbei ist −v das Inverse zu v bzgl. +) e) Ist λ · v = 0V , dann folgt λ = 0 oder v = 0V .Hierbei bezeichnet 0V den Nullvektor, das neutrale Element der Addition in V . In der Anschauung wirkt die Multiplikation mit Skalaren als “Stauchung” oder “Streckung” der Vektoren bzw. bei negativen Skalaren auch als Umkehrung der Pfeilrichtung. 3·v v 12.2 Der abstrakte Vektorraumbegriff Wie bei anderen Strukturen wie Gruppen und Körpern auch schon, kann nun abstrakt definiert werden, was ein Vektorraum ist. Die schon bekannten Räume n für n ∈ sind dann Beispiele für solche Strukturen, ähnlich wie ein Beispiel für einen abstrakten Ring und ein Beispiel für einen Körper ist. N Q R Z R Definition 12.2.1. Sei K ein Körper (in unserem Fall meist K = , aber auch K = oder K = wären denkbar) und V eine Menge. Dann heißt V Vektorraum über K, falls es eine Verknüpfung + auf V gibt bzgl. derer V eine kommutative Gruppe ist und wenn weiterhin für v ∈ V und λ ∈ K die Skalarmultiplikation definiert, d.h. λ · v ∈ V erklärt ist, so die Rechenregeln aus Übung 12.1.2 gelten. Q 12 Vektorräume C 80 Vorkurs Mathematik R N ein Beispiel für einen Vektorraum. Ein Wie erwähnt ist der n für jedes n ∈ weiteres ist das Folgende: sei R R → R : f ist stetig} die Menge der stetigen Funktionen von R in sich. Zusammen mit der Verknüpfung C( ) = {f : + und der Skalarmultiplikation definiert durch (f + g)(x) := f (x) + g(x) (λ · f )(x) := λ · f (x) R mit f, g ∈ C( ), λ ∈ R R ist diese Menge ein Vektorraum über . Dies folgt aus dem Satz 8.1.4, der besagt, dass die neu definierten Funktionen wieder stetig sind. Übung 12.2.2. Sei X eine endliche Menge mit n Elementen, z.B. X = {x1 , x2 , . . . , xn }. Betrachte die Menge V := {f : X → } R R Zeige: diese Menge bildet bzgl. der gleichen Verknüpfungen wie bei C( ) einen Vektorraum über . Zu i ∈ {1, . . . , n} definiere die Funktion ei ∈ V durch ½ 1 , falls i = j ei (xj ) = δij = 0 , falls i 6= j R Zeige: zu jedem f ∈ V gibt es eindeutig bestimmte reelle Zahlen λ1 , . . . , λn mit f= n X λi · ei . i=1 Was hat V mit Rn zu tun? Definition 12.2.3. Sei K ein Körper und V ein Vektorraum über K (oder kurz: ein K-Vektorraum). Sei weiter U ⊆ V eine Teilmenge. Dann heißt U ein Untervektorraum von V , wenn folgende Bedingungen erfüllt sind: (1) 0V ∈ U , wobei 0V wieder den Nullvektor bezeichnet. (2) Falls v, w ∈ U , dann ist auch v + w ∈ U . (3) Ist v ∈ U und λ ∈ K, dann ist auch λ · v ∈ U . Die letzten beiden Eigenschaften bezeichnet man auch als Abgeschlossenheit von U bezüglich + bzw. der Skalarmultiplikation. Die Wichtigkeit des Begriffes liegt in folgender Beobachtung: ist U ein Untervektorraum von V , dann ist U ein Vektorraum in eigenem Recht: wenn man den Rest von V “vergisst” und sich nur auf das U einschränkt, sind alle Bedingungen für einen Vektorraum erfüllt. R Betrachte zum Beispiel den Raum 3 und eine Ebene darin, sagen wir die xy-Ebene gegeben durch x1 E = x2 ∈ 3 : x3 = 0 ⊆ 3 . x3 R Dann ist E selbst ein Vektorraum, der mit 12 Vektorräume R R2 identifiziert werden kann. 81 Vorkurs Mathematik R Übung 12.2.4. Sei V = 3 und betrachte folgende Teilmengen. Bei welchen handelt es sich um Untervektorräume? 0 a) U1 = 0 . 0 x1 x2 : x1 · x2 ≥ 0 . b) U2 = x3 x1 c) U3 = x2 : x3 = b für ein b ∈ . x3 x1 x2 : 7x1 − x2 + 2x3 = 0 . d) U4 = x3 x1 e) U5 = x2 : x21 + x22 = x23 . x3 R 12.3 Operationen von Matrizen auf Vektoren N R R Sei n ∈ . Ist v ∈ n ein Vektor und A ∈ M (n × n, ) eine n × n-Matrix, so kann man das Produkt A·v bilden und erhält nach den Regeln der Matrizenmultiplikation wieder einen Vektor im n . Oder anders ausgedrückt: zu gegebener Matrix A kann man die Abbildung R fA : Rn → Rn gegeben durch fA (v) = A · v bilden. Diese Abbildung hat zwei wichtige Eigenschaften, denn für v, w ∈ λ ∈ gilt: R Rn und • fA (v + w) = A · (v + w) = A · v + A · w = fA (v) + fA (w). • fA (λv) = A · (λv) = λ · (A · v) = λ · fA (v). Die erste Gleichung folgt aus den bekannten Rechenregeln für Matrizen, die zweite beruht auf der Tatsache, dass es möglich ist, das λ auszuklammern (Übung!). Eine Abbildung zwischen Vektorräumen mit diesen beiden Eigenschaften nennt man auch linear. R R Übung 12.3.1. Betrachte die reellen Zahlen = 1 als Vektorraum und eine lineare Abbildung f : → , d.h. f (x + y) = f (x) + f (y) und f (λ · x) = λ · f (x) für alle x, y, λ ∈ . R R R R Zeige: dann gibt es ein a ∈ , so dass f gegeben ist durch f (x) = a·x. Die Abbildung f ist also linear (ohne y-Achsenabschnitt), ihr Graph eine Ursprungsgerade. 12 Vektorräume 82 Vorkurs Mathematik Eine kleine Bemerkung am Rande: die Menge der beliebig oft differenzierbaren Abbildungen f : → bildet einen Vektorraum D( ). Der Vorgang des Differenzierens, d.h.die Abbildung R R R R R gegeben durch D(f ) = f 0 D : D( ) → D( ) ist linear, wie wir gesehen haben, denn es gilt ja (f + g)0 = f 0 + g 0 (Summenregel) und (λ · f )0 = λ · f 0 (Faktorregel) nach Übung 8.4.1. R Zurück zu den Gleichungssystemen. Sei A ∈ M (m × n, ) und betrachte ein Gleichungssystem der Form Ax = 0Rm . Ein solches System, bei dem nur Nullen als Ergebnisse vorkommen, heißt homogen. Das Schöne an homogenen Gleichungssystemen ist, dass sie immer eine Lösung haben (nämlich die “triviale” Lösung, die entsteht, wenn für jedes xi der Wert 0 eingesetzt wird), was man auch am Algorithmus von Gauß sehen kann, denn in der letzten Nullspalte kann keinesfalls ein Pivot-Element stehen. Betrachte nun die Lösungsmenge dieses Systems: Rn : Ax = 0R = Rn . L = {x ∈ Dies ist ein Untervektorraum von V m }. Beweis. Zunächst gilt, wie eben schon erwähnt, 0V ∈ L, denn A · 0V = 0Rm . Sind nun v, w ∈ L beliebige Lösungen, dann gilt: A · (v + w) = A · v + A · w = 0Rm + 0Rm = 0Rm . Also ist v + w ∈ L. Desweiteren gilt für λ ∈ R: A · (λv) = λ · (Av) = λ · 0Rm = 0Rm . Dies zeigt die Behauptung. Lösungsmengen homogener Gleichungssysteme sind also selbst Vektorräume. Im allgemeinen Fall eines Gleichunssystems der Form Ax = b für b ∈ m gilt dies leider nicht mehr, da für b 6= 0Rm schon 0V keine Lösung ist. Trotzdem ist die Struktur der Lösungsmenge in diesem Fall nicht schwer zu verstehen. R R Satz 12.3.2. Sei A ∈ M (m × n, ) und b ∈ chungssystem Ax = b. Definiere L = {x ∈ Rm und betrachte das lineare Glei- Rn : Ax = 0R m } R die Lösungsmenge des entsprechenden homogenen Systems und sei v0 ∈ n eine beliebige Lösung des inhomogenen Systems Ax = b. Dann ist die Lösungsmenge gegeben durch U := L + v0 = {x + v0 : x ∈ L}. 12 Vektorräume 83 Vorkurs Mathematik Beweis. Es sind zwei Dinge zu zeigen. Zunächst müssen wir einsehen, dass jedes Element der Menge U tatsächlich das System Ax = b löst. Andererseits ist zu zeigen, dass wir auf diese Weise alle Lösungen erhalten, dass also eine beliebige Lösung wirklich in U liegt. Sei also v ∈ U beliebig. Dann gibt es nach Definition von U ein Element w ∈ L mit v = w + v0 . Es folgt Av = A(w + v0 ) = Aw + Av0 = 0Rm + b = b. Also ist v eine Lösung. Sei umgekehrt u ∈ Au = b. Betrachte v := u − v0 . Dann gilt Rm eine beliebige Lösung, d.h. es gelte Av = A(u − v0 ) = Au − Av0 = b − b = 0Rm . Daraus folgt v ∈ L, also gilt u = v + v0 ∈ U wie behauptet. Lösungsmengen solcher inhomogener Gleichungssysteme sind also keine Untervektorräume, aber sie unterscheiden sich nicht viel von solchen, sie sind quasi “verschoben”. Solche Gebilde nennt man auch affine Unterräume. R Übung 12.3.3. Seien A, C ∈ M (m × n, ) und b, d ∈ chungssysteme Ax = b und Cx = d Rm. Betrachte die Glei- und nimm an, dass beide lösbar sind, mit Lösungsmengen LA = {x ∈ und LC = {x ∈ n : Cx = d}. R Rn : Ax = b} Zeige: Die gemeinsamen Lösungen, also der Durchschnitt LA ∩LC bilden wieder einen affinen Unterraum, sofern dieser Schnitt nicht leer ist. Zu welchem Gleichungssystem gehört er? 12 Vektorräume 84 Vorkurs Mathematik 13 Der Dimensionsbegriff 13.1 Linearkombinationen und Erzeugendensysteme Wir beginnen mit einer allgemeinen Beobachtung, die in vielen späteren Anwendungen ebenfalls eine große Rolle spielen wird. Sei dazu K ein Körper und V ein Vektorraum über K. Lemma 13.1.1. Sei I eine beliebige Indexmenge und zu jedem i ∈ I sei Wi ⊆ V ein Untervektorraum. Dann ist auch \ Wi W := i∈I ein Untervektorraum von V . Beweis. Zunächst gilt 0 ∈ W , da 0 ∈ Wi für alle i ∈ I. Seien nun also v, w ∈ W und λ ∈ K. Dann gilt für alle i ∈ I natürlich v ∈ Wi und w ∈ Wi und da dies Untervektorräume sind, gilt auch v + w ∈ Wi und daher auch v + w ∈ W . Ebenso gilt jeweils λ · v ∈ Wi für alle i ∈ I und daher λ · v ∈ W . Dieses Lemma zeigt, dass der Durchschnitt über eine beliebige Menge von Untervektorräumen eines gegebenen Vektorraumes wieder ein Vektorraum ist. Diese Beobachtung ist sehr wichtig, denn sie erlaubt es uns, zu einer beliebigen Teilmenge A ⊆ V einen Vektorraum zu konstruieren, der A enthält, aber zugleich nicht mehr als nötig. Es gibt also einen kleinsten Untervektorraum, der A enthält, den man dadurch bekommt, dass man alle Untervektorräume, die A enthalten schneidet. Das obige Lemma garantiert, dass ein Untervektorraum herauskommt, der natürlich das A enthält. Man nennt diesen die lineare Hülle von A und notiert ihn hAi oder auch span(A). Ein wichtiger Spezialfall dieser Konstruktion ist der Fall einer endlichen Menge A, also zum Beispiel A = {v1 , v2 , . . . , vk } mit vi ∈ V für 1 ≤ i ≤ k. N Lemma 13.1.2. Sei k ∈ eine natürliche Zahl und seien v1 , v2 , . . . , vk ∈ V beliebige Vektoren. Betrachte die Menge A := {v1 , . . . , vk }. Dann gilt hv1 , . . . , vk i := hAi = {λ1 v1 + λ2 v2 + · · · + λk vk : λi ∈ K}. Dieses Lemma liefert uns also eine konkrete Beschreibung der linearen Hülle endlich vieler Vektoren, nämlich als Menge aller Linearkombinationen. Um zu zeigen, dass dies wirklich die lineare Hülle ist, müssen wir nachrechnen, dass die obige Menge ein Untervektorraum ist, der A enthält und dass er der kleinste solche ist. Beweis. Setze W := {λ1 v1 + λ2 v2 + · · · + λk vk : λi ∈ K}. Zunächst gilt offensichtlich 0 ∈ W , denn wenn alle λi den Wert 0 haben, dann ist diese Linearkobination der Nullvektor. Seien also v = λ1 v1 + · · · + λk vk und w = µ1 v1 + · · · + µk vk beliebige Elemente von W . Dann gilt v+w = k X i=1 13 Der Dimensionsbegriff λi v i + k X i=1 µi vi = k X (λi + µi )vi ∈ W. i=1 85 Vorkurs Mathematik Weiter gilt für λ ∈ K: λ·v =λ· k X λi v i = i=1 k X (λ · λi )vi ∈ W. i=1 Also ist W ein Untervektorraum. Natürlich gilt vi ∈ W für alle 1 ≤ i ≤ k, wähle dazu einfach λi = 1 und λj = 0 für j 6= i. Also ist W ein Untervektorraum, der die Menge A enthält. Ist nun W 0 ein beliebiger weiterer Untervektorraum, der A enthält, so enthählt W 0 nach Definition jeden der Vektoren vi und damit auch alle Linearkombinationen der vi , also auch W . Linearkombinationen sind also das Mittel, um Vektorräume mit Hilfe endlich vieler Vektoren zu beschreiben. Besonders schön sind natürlich solche Vektorräume, die auf diese Art beschrieben werden können. Definition 13.1.3. Sei K ein Körper und V ein Vektorraum über K. Dann heißt V endlich erzeugt, wenn es Vektoren v1 , . . . , vk ∈ V gibt, so dass hv1 , . . . , vk i = V. Beispiele endlich erzeugter Vektorräume haben wir schon gesehen. Für jede natürliche Zahl n ∈ wird der Vektorraum n über erzeugt von der Menge der Einheitsvektoren e1 , . . . , en . Auch Übung 12.2.2 gibt ein Beispiel eines endlich erzeugten Vektorraums. N R R Aber nicht jeder Vektorraum ist endlich erzeugt, der Vektorraum der stetigen Funktionen von nach zum Beispiel besitzt kein endliches Erzeugendensystem, was hier allerdings nicht bewiesen werden soll. Statt dessen wollen wir uns im Folgenden auf das Studium der endlich erzeugten Vektorräume beschränken und versuchen, eine möglichst schöne Menge an erzeugenden Vektoren zu finden. Möglichst schön heißt in diesem Fall möglichst klein und dazu brauchen wir den folgenden Begriff. R R Definition 13.1.4. Sei K ein Körper und V ein Vektorraum über K. Sei weiter k ∈ eine natürliche Zahl. Endlich viele Vektoren v1 , . . . , vk ∈ V heißen linear unabhängig, falls für N k X λi v i = 0 mit λ1 , . . . , λk ∈ K i=1 bereits folgt λ1 = λ2 = · · · = λk = 0. Mit anderen Worten: Falls das System linear unabhängig ist, dann gibt es nur eine einzige Art, den Nullvektor darzustellen. Ein System, das nicht linear unabhängig ist, heißt linear abhängig. Die Definition ist auf den ersten Blick schwer zu verstehen. Ein möglicher verwirrender Punkt ist die scheinbare Fixierung auf den Nullvektor. Wieso ist es so wichtig, diesen nur auf eine Art darstellen zu können? Die Antwort liegt im folgenden Lemma, welches zeigt, dass die Eindeutigkeit der Darstellung des Nullvektors schon die Eindeutigkeit anderer Darstellungen nach sich zieht. 13 Der Dimensionsbegriff 86 Vorkurs Mathematik N Lemma 13.1.5. Sei V ein Vektorraum über einem Körper K, k ∈ und seien v1 , . . . , vk ∈ V linear unabhängig. Sind nun λ1 , · · · , λk ∈ K, sowie µ1 , . . . , µk ∈ K gegeben mit k k X X λi v i = µi vi , i=1 i=1 so folgt für 1 ≤ i ≤ k schon λi = µi . Beweis. Dies ist offensichtlich, wenn man alle Terme der obigen Summe auf eine Seite bringt: n k k X X X 0= λi vi − µi vi = (λi − µi )vi . i=1 i=1 i=1 Da das System linear unabhängig ist, folgt direkt λi − µi = 0 für alle 1 ≤ i ≤ k und daher λi = µi . R Um im Fall V = n die lineare Unabhängigkeit von Vektoren nachzurechnen, muss man ein homgenes Gleichungssystem lösen (Warum?). Die Frage in diesem Fall ist, ob die Lösungsmenge des homogenen Systems (diese war ja stets ein Untervektorraum) nur aus dem Nullvektor besteht, ob das System also eindeutig lösbar ist. R Übung 13.1.6. Sei V = 3 . Untersuche die folgenden Mengen von Vektoren auf lineare Unabhängigkeit. 0 1 1 a) 0 , 1 , 1 . 0 0 0 2 7 b) 1 , 8 . 0 −5 3 −1 8 0 c) 0 , 2 , 2 , 0 . 0 0 5 0 13.2 Basis und Dimension Sei wieder K ein Körper und V ein Vektorraum über K. Wir betrachten wie erwähnt im Rahmen des Vorkurses nur endlich erzeugte Vektorräume. Die wichtige (und nicht triviale) Erkenntnis ist, dass es stets kleinstmögliche Erzeugendensysteme gibt, die dadurch charakterisiert sind, dass die Vektoren darin ein linear unabhängiges System bilden. Definition 13.2.1. Ein linear unabhängiges Erzeugendensystem v1 , . . . , vk für V wird Basis von V genannt. Den Begriff gibt es auch für unendliche Erzeugendensysteme. Wir wollen im endlich erzeugten Fall bleiben und zeigen, dass es immer eine Basis gibt und mehr noch, dass die Anzahl der Vektoren einer Basis eindeutig bestimmt ist und nur von V abhängt. Diese Zahl heißt Dimension von V und ist eine wichtige sogenannte Invariante. Zunächst sammeln wir einige Erkenntnisse über Basen. 13 Der Dimensionsbegriff 87 Vorkurs Mathematik Lemma 13.2.2. Sei V ein Vektorraum und v1 , . . . , vk eine Basis von V . Dann ist diese unverkürzbar, d.h. Fortlassen eines beliebigen Vektors aus dem System liefert eine Menge, die kein Erzeugendensystem mehr ist. Ist umgekehrt v1 , . . . , vk ein unverkürzbares Erzeugendensystem, so ist es bereits linear unabhängig, also eine Basis. N Beweis. Sei i ∈ mit 1 ≤ i ≤ k beliebig und betrachte das System v1 , . . . , vi−1 , vi+1 , . . . , vk . Die Behauptung ist, dass dieses kein Erzeugendensystem mehr sein kann. Falls doch, dann ließe sich jeder Vektor aus V als Linearkombination dieser Vektoren darstellen, insbesondere auch vi . Es gäbe also Koeffizienten λ1 , . . . , λi−1 , λi+1 , . . . , λk ∈ K mit vi = λ1 v1 + · · · + λi−1 vi−1 + λi+1 vi+1 + · · · + λk vk Umgestellt ergibt das 0= k X λj vj mit λi = −1 6= 0. j=1 Also ist es gelungen, den Nullvektor darzustellen, ohne dass alle Koeffizienten gleich 0 sind, was nicht geht, da das System linear unabhängig war. Sei nun umgekehrt v1 , . . . , vk ein unverkürzbares Erzeugendensystem. Dann ist zu zeigen, dass es linear unabhängig ist. Angenommen, dies wäre nicht der Fall, dann gäbe es Koeffizienten λ1 , . . . , λk ∈ K mit k X λi vi = 0, i=1 wobei nicht alle Koeffizienten gleich 0 sind, es gibt also ein i ∈ λi 6= 0. Dann folgt aber durch Umstellen und Dividieren: vi = − N mit 1 ≤ i ≤ k und λ1 λi−1 λi+1 λk v1 − · · · − vi−1 − vi+1 − · · · − vk . λi λi λi λi Insbesondere lässt sich vi als Linearkombination der übrigen Vektoren darstellen, dieser Vektor kann also fortgelassen werden und die anderen bilden trotzdem noch ein Erzeugendensystem. Dieses Lemma zeigt ein Verfahren zur Konstruktion einer Basis. Da V nach Voraussetzung ein endliches Erzeugendensystem besitzt, startet man mit einem solchen. Falls es bereits eine Basis ist, sind wir fertig, ansonsten können wir so lange Vektoren fortlassen, bis das System unverkürzbar ist und damit automatisch linear unabhängig, also eine Basis. Es ist mit diesem Verfahren aber nicht offensichtlich, dass die Anzahl der Vektoren einer Basis eindeutig bestimmt ist! Es wäre ja möglich, dass eine andere Zahl herauskommt, wenn man mit einem anderen System startet oder dass man eine Auswahl hat, welche Vektoren man fortlassen kann und sich dadurch das Verfahren ändert. Dass dies nicht der Fall ist, wird meist mit dem Austauschsatz von Steinitz bewiesen. 13 Der Dimensionsbegriff 88 Vorkurs Mathematik Satz 13.2.3 (Austauschsatz von Steinitz). Sei V ein Vektorraum, v1 , . . . , vk eine Basis von V und sei w 6= 0 ein Vektor von V mit der Darstellung w= k X λi vi mit λ1 , . . . , λk ∈ K. i=1 N Ist nun ein i ∈ mit 1 ≤ i ≤ k und λi 6= 0 gegeben, so kann man vi in der Basis durch w ersetzen, d.h. die Menge v1 , . . . , vi−1 , w, vi+1 , . . . , vk bildet wieder eine Basis von V . Beweis. Um die Notation zu vereinfachen kann man annehmen, dass i = 1 gilt, dass also λ1 6= 0 ist. Es muss also gezeigt werden, dass w, v2 , . . . , vk ein linear unabhängiges Erzeugendensystem ist. Betrachte zur linearen Unabhängigkeit zunächst eine Linearkombination µw + µ2 v2 + · · · + µk vk = 0. Setze dann die Definition von w ein. Es ergibt sich: à k ! k k X X X 0=µ λi v i + µi vi = µλ1 v1 + (µλi + µi )vi . i=1 i=2 i=2 Da die v1 , . . . , vk linear unabhängig sind, sind alle Koeffizienten in dieser Linearkombination gleich 0. Wegen λ1 6= 0 folgt also µ = 0 und damit auch µ2 = · · · = µk = 0 wie gefordert. Es bleibt zu zeigen, dass w, v2 , . . . , vk ein Erzeugendensystem ist. Durch Umstellung der Gleichung von w erhalten wir 1 λ2 λk v1 = w − v2 − · · · − vk . λ1 λ1 λ1 Also lässt sich v1 in dem System darstellen und damit jeder Vektor in V , da die v1 , . . . , vk ein Erzeugendensystem bilden. Dieser Satz zeigt nun, was wir wollen: Satz 13.2.4. Sei V ein endlich erzeugter Vektorraum und seien v1 , . . . , vk und w1 , . . . , wr Basen von V . Dann gilt k = r. Beweis. Wegen w1 6= 0 kann der Austauschsatz auf die Basis v1 , . . . , vk und den Vektor w1 angewandt werden. Dann kann aus dieser Basis einer der Vektoren gegen w2 ausgetauscht werden, wobei wir wegen der linearen Unabhängigkeit der wi einen der verbliebenen vi wählen können.Auf diese Weise erhalten wir einen Weg von der einen Basis in die andere. Insbesondere sind ihre Längen gleich, da diese sich in jedem Schritt nicht ändert. Definition 13.2.5. Sei V ein endlich erzeugter Vektorraum. Die Anzahl k der Elemente einer Basis von V ist unabhängig von der gewählten Basis und wird Dimension von V genannt. Schreibe auch dim V = k C bzw. dimK V = k. R Übung 13.2.6. Der Körper der komplexen Zahlen kann als Vektorraum über aufgefasst werden. Zeige, dass seine Dimension gleich 2 ist und z.B. durch die Vektoren {1, i} eine Basis gegeben ist. Gib irgendeine andere Basis für diesen Vektorraum an. 13 Der Dimensionsbegriff 89 Vorkurs Mathematik 14 Anhang: Lösungen Es folgen Musterlösungen zu ausgewählten Aufgaben. Lösung zu Übung 2.4.1: Der Induktionsschritt ist korrekt für n ≥ 2. Für den Schluss von 1 auf 2 hingegen versagt er und damit ist der ganze Beweis hinfällig. Der Grund dafür liegt darin, dass für n = 1 kein ak in der Menge {a2 , . . . , an } existiert, da die Menge in diesem Fall leer ist. R Lösung zu Übung 4.1.2: Sei X = Y = und definiere die Abbildung f : X → Y durch f (x) = 0. Sei A := {3} ⊆ X = und B := {−1} ⊆ Y = . Dann folgt: ¡ ¢ ¡ ¢ f −1 f (A) = f −1 f ({3}) = f −1 ({0}) = 6= A. Und ebenso: R R R ¡ ¢ ¡ ¢ f f −1 (B) = f f −1 ({−1}) = f (∅) = ∅ 6= B. Lösung zu Übung 4.1.3: Seien X und Y Mengen, f : X → Y eine Abbildung und A, B ⊆ Y . Zeige zunächst: f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B). Sei dazu x ∈ f −1 (A ∪ B). Dann gilt nach Definition des Urbildes f (x) ∈ A ∪ B, also f (x) ∈ A oder f (x) ∈ B. Falls f (x) ∈ A, dann folgt x ∈ f −1 (A) und aus f (x) ∈ B folgt x ∈ f −1 (B), insgesamt also x ∈ f −1 (A) ∪ f −1 (B). Dies zeigt eine Inklusion: f −1 (A ∪ B) ⊆ f −1 (A) ∪ f −1 (B). Sei nun umgekehrt x ∈ f −1 (A) ∪ f −1 (B). Dann gilt x ∈ f −1 (A) oder x ∈ f −1 (B), also f (x) ∈ A oder f (x) ∈ B. Daraus folgt f (x) ∈ A ∪ B, also x ∈ f −1 (A∪B). Dies zeigt die andere Inklusion f −1 (A)∪f −1 (B) ⊆ f −1 (A∪B), insgesamt folgt also die Gleichheit beider Mengen. Der Beweis für den Schnitt verläuft analog, man ersetze einfach “oder” durch “und”. Lösung zu Übung 4.1.9: Seien f : X → Y und g : Y → Z bijektive Abbildungen. Zu zeigen ist, dass (g ◦ f ) : X → Z ebenfalls bijektiv ist. Zur Injektivität: Seien x, x0 ∈ X mit (g ◦ f )(x) = (g ◦ f )(x0 ). Wir müssen zeigen, dass x = x0 gilt. Aus der Definition von verketteten Abbildungen folgt ¡ ¢ ¡ ¢ g f (x) = g f (x0 ) Da g injektiv ist, folgt sofort f (x) = f (x0 ), da verschiedene Punkte in Y nicht das gleiche Bild unter g haben können. Aus der Injektivität von f folgt jetzt sofort x = x0 . Zur Surjektivität: sei z ∈ Z beliebig. Wir müssen die Existenz eines Elementes x ∈ X nachweisen, für das gilt (g ◦ f )(x) = z. Da g surjektiv ist, gibt es zu dem gewählten z ∈ Z ein y ∈ Y mit g(y) = z. Und da f surjektiv ist, finden wir zu dem y ∈ Y ein x ∈ X mit f (x) = y. Eingesetzt ergibt sich ¡ ¢ (g ◦ f )(x) = g f (x) = g(y) = z, was zu zeigen war. 14 Anhang: Lösungen 90 Vorkurs Mathematik Lösung zu Übung 5.3.6: Die Reflexivität von ∼ ist klar, denn es gilt f (x) = f (x) für alle x ∈ X. Sind x, x0 ∈ X mit x ∼ x0 , so heißt das f (x) = f (x0 ), aber das zeigt auch f (x0 ) = f (x). Die Transitivität folgt ebenso. ¡ ¢ Betrachte nun die Abbildung g : X/ ∼ → Y gegeben durch g [x] = f (x). Die Abbildung g ist auf einer Klasse definiert, es ist also nachzuweisen, dass diese Definition unabhängig vom gewählten Vertreter ¡ ¢ ist, ¡ mit ¢ anderen Worten: falls x ∼ x0 , also [x] = [x0 ], so sollte auch g [x] = g [x0 ] gelten, aber das folgt direkt per Definition. Bleibt zu zeigen, dass g bijektiv ist. Zunächst zur Surjektivität: ist y ∈ Y beliebig, so gibt ¡ ¢es wegen der Surjektivität von f ein x ∈ X mit f (x) = y. Dann folgt g [x] = f (x) = y, also ist [x] ein Urbild von y unter g. ¡ ¢ ¡ ¢ Zur Injektivität: seien [x] und [x0 ] Klassen in X/ ∼ mit g [x] = g [x0 ] . Dann folgt nach Definition von g aber f (x) = f (x0 ), also x ∼ x0 bzw. [x] = [x0 ] und das zeigt die Injektivität. Sei umgekehrt X eine Menge und ∼ eine Äquivalenzrelation auf X. Setze Y := X/ ∼ und definiere die Abbildung f : X → Y durch f (x) := [x]. Dann ist f surjektiv, denn zu jeder Klasse in X/ ∼ gibt es mindestens einen Vertreter x ∈ X. Weiter gilt für x, x0 ∈ X: x ∼ x0 ⇐⇒ [x] = [x0 ] ⇐⇒ f (x) = f (x0 ) Also ist die Relation so beschrieben wie gefordert. R Lösung zu Übung 6.1.5: Seien (an )n∈N und (bn )n∈N konvergente Folgen in mit Grenzwert a bzw. b und definiere cn := an + bn . Zu zeigen: dann ist (cn )n∈N konvergent mit Grenzwert c = a + b. Sei ε > 0 vorgegeben. Da die Folge (an )n∈N gegen a konvergiert, gibt es ein n1 ∈ , so dass für n ≥ n1 gilt: N |an − a| < ε 2 N Ebenso gibt es wegen der Konvergenz der (bn )n∈N ein n2 ∈ , so dass für n ≥ n2 gilt: ε |bn − b| < 2 Definiere nun n0 := max{n1 , n2 }. Für n ≥ n0 folgt dann n ≥ n1 und n ≥ n2 und für solche n gilt: |cn − c| = |an + bn − (a + b)| = |an − a + bn − b| ≤ |an − a| + |bn − b| < ε ε + =ε 2 2 Betrachte nun die Folge (dn )n∈N definiert durch dn = an · bn . Zu zeigen: diese konvergiert gegen den Grenzwert d = a · b. Sei dazu wieder ε > 0 vorgegeben. Wegen der Konvergenz der Folge (an )n∈N ist diese beschränkt, es gibt also ein M > 0 mit |an | < M für allo n ∈ . Nimm zunächst an, dass b 6= 0 gilt und sei n1 ∈ so gewählt, dass für n ≥ n1 gilt: N N |an − a| < 14 Anhang: Lösungen ε 2|b| 91 Vorkurs Mathematik Dies geht aufgrund der Konvergenz der Folge (an )n∈N . Sei weiter n2 ∈ derart, dass für n ≥ n2 gilt: |bn − b| < N ε 2M Dann folgt für n0 := max{n1 , n2 } und n ≥ n0 : |dn − d| = |an bn − ab| = |an bn − an b + an b − ab| ≤ |an bn − an b| + |an b − ab| ε ε = |an | · |bn − b| + |b| · |an − a| < M · + |b| · =ε 2M 2|b| Für b = 0 ist die zweite Abschätzung unnötig, dort wird lediglich die Beschränktheit der Folge (an )n∈N benötigt. Lösung zu Übung 6.4.1: Sei (ak )k∈N eine reelle Folge, so dass die daraus gebildete Reihe gegen den Grenzwert A ∈ konvergiert: R ∞ X ak = lim k=1 n→∞ n X ak = A k=1 Zu zeigen: die Folge der (ak )k∈N konvergiert gegen 0. Sei dazu ε > 0 beliebig. Zu zeigen ist, dass es ein n0 ∈ gibt, so dass für n ≥ n0 gilt: |an −0| = |an | < ε. N Aus der Konvergenz der Reihe folgt die Existenz einer natürlichen Zahl n1 ∈ so dass für n ≥ n1 gilt: ¯ ¯ n ¯X ¯ ε ¯ ¯ ak − A¯ < ¯ ¯ ¯ 2 k=1 N, Setze n0 := n1 + 1. Für n ≥ n0 folgt dann n − 1 ≥ n1 , also gilt: ¯ ¯ ¯ ¯ n−1 n−1 n n ¯ ¯X ¯ ¯X X X ¯ ¯ ¯ ¯ ak ¯ = ¯ ak ¯ ak − ak − A + A − |an | = ¯ ¯ ¯ ¯ ¯ k=1 k=1 k=1 ¯ ¯ ¯ ¯ k=1 n n−1 ¯X ¯ ¯X ¯ ε ε ¯ ¯ ¯ ¯ ≤ ¯ ak − A¯ + ¯ ak − A¯ < + = ε ¯ ¯ ¯ 2 2 ¯ k=1 k=1 1 Lösung zu Übung 6.4.3: 5cm sind genau 20 der Gesamtstrecke von 1m, also bewäl1 tigt die Schnecke am ersten Tag 20 des Bandes. Da die Dehnung gleichmäßig erfolgt, ändert sich dieser Wert nicht über Nacht. Am nächsten Tag hat das 1 des Bandes, am Band eine Gesamtlänge von 2m, also schafft sie nur noch 40 1 3. Tag dann 60 und so weiter. Nach n Tagen ist der Anteil den sie geschafft hat also X 1 1 1 1 1 X1 1 + + + ··· + = = . 20 40 60 20 · n k=1 20 · k 20 k=1 k n n Erreicht dieser Ausdruck je den Wert 1, also 100% des Bandes? Ja, da die harmonische Reihe divergiert, insbesondere grösser als 20 wird. Nach der (groben) Abschätzung ist dies spätestens für n = 238 soweit. 14 Anhang: Lösungen 92 Vorkurs Mathematik √ √2 Lösung zu Übung 7.2.2: Betrachte zunächst 2√ . Wir unterscheiden zwei Fälle. Falls diese Zahl rational ist, wähle a = b = 2. Ist diese Zahl irrational, setze √ √2 √ a = 2 und b = 2. Es ergibt sich: µ b a = √ √ 2 2 ¶√ 2 = √ √ √ 2· 2 2 = √ 2 2 =2 und dies ist rational. Lösung zu Übung 7.3.1: Gesucht sind alle a, b ∈ zieren ergibt die Gleichung: R mit (a + ib)2 = i. Ausmultipli- 0 + i · 1 = i = (a + ib)2 = (a2 − b2 ) + i(2ab) Dies liefert die beiden Gleichungen a2 − b2 = 0 und 2ab = 1 Die erste Gleichung lässt sich al a2 = b2 schreiben und daraus folgt a = b oder a = −b. Im zweiten Fall folgt aus der zweiten Gleichung 1 = 2ab = 2(−b)b = −2b2 R Da b ∈ ist die rechte Seite negativ, die Gleichung besitzt also keine Lösung. Daher folgt a = b. Setzt man dies in die zweite Gleichung ein, so liefert das: 1 = 2ab = 2b2 ⇔ b2 = 1 2 ⇔ 1 b = ±√ 2 Insgesamt gibt es also zwei Lösungen: 1+i √ 2 und −1 − i √ . 2 Lösung zu Übung 7.4.3: Wegen ζ 6= 1 kann die Gleichung aus Kapitel 1.2 angewandt werden: n−1 X 1 − ζn 0 ζk = = =0 1 − ζ 1 − ζ k=0 Lösung zu Übung 8.1.3: Es ist g(2) = 1. Sei ε > 0 beliebig und setze δ := ε. Für x ∈ mit |x − a| = |x − 2| < δ machen wir eine Fallunterscheidung: R Fall 1: x ≥ 2. Dann ist g(x) = x − 1 und wegen |x − 2| < δ folgt: |g(x) − g(2)| = |x − 1 − 1| = |x − 2| < δ = ε Fall 2: x < 2. Dann ist g(x) = −x + 3. Es folgt wieder |g(x) − g(2)| = | − x + 3 − 1| = | − x + 2| = |x − 2| < δ = ε Hierbei wurde benutzt, dass |y| = | − y| für alle y ∈ folgt die Stetigkeit von g im Punkt a = 2. 14 Anhang: Lösungen R gilt. Insgesamt 93 Vorkurs Mathematik Lösung zu Übung 8.2.5: Es gilt |f (a)| = 6 0, setze also ε := |f (a)| , dann ist ε > 0. 2 Wegen der Stetigkeit von f im Punkt a gibt es ein δ > 0 mit |f (x) − f (a)| < ε für |x − a| < δ. Behauptung: das so gefundene δ erfüllt die geforderte Bedingung, dass nämlich f (x) 6= 0 ist für alle x ∈ mit |x − a| < δ. Wäre nämlich f (x) = 0 für ein solches x, dann folgte R |f (x) − f (a)| = |0 − f (a)| = |f (a)| = 2ε Das kann aber wegen |f (x) − f (a)| < ε nicht sein. R Lösung zu Übung 8.2.6: Sei a ∈ . Behauptung: die Gauß-Klammer ist genau dann stetig in a, wenn a ∈ / . Zum Beweis nimm zunächst an, dass a ∈ / und zeige die Stetigkeit der Funktion in a. Z Z Z Z Definiere b := [a] = max{x ∈ : x ≤ a} und c := min{y ∈ : y ≥ a}. Damit gilt b, c ∈ und b ist die nächstkleinere ganze Zahl und c die nächstgrößere. Insbesondere gilt b 6= a 6= c, da a ∈ / . © ª Sei ε > 0 beliebig und setze δ := min a−b , c−a . Für x ∈ mit |x − a| < δ 2 2 folgt dann x > b, denn wäre x ≤ b, so folgte |x − a| = a − x ≥ a − b ≥ 2δ, im Widerspruch zu |x − a| < δ. Ebenso gilt x < c, denn wäre x ≥ c, dann folgte wieder |x − a| = x − a ≥ c − a ≥ 2δ, was auf denselben Widerspruch führt. Z Z R Insbesondere folgt [x] = [a], also ist |[x] − [a]| = 0 < ε. Z Sei nun a ∈ . Zu zeigen ist, dass die Gauß-Klammer unstetig bei a ist. Setze ε := 12 und sei δ > 0 beliebig. Zu zeigen ist die Existenz eines Elementes x ∈ mit |x − a| < δ und |[x] − [a]| ≥ ε. R Setze x := a − 2δ . Dann ist |x − a| = [x] = a − 1, da x < a, also folgt δ 2 < δ, aber wegen a ∈ |[x] − [a]| = |a − 1 − a| = | − 1| = 1 ≥ Z ist [a] = a und 1 =ε 2 Lösung zu Übung 8.4.11: Es gilt: x f (x) = ax = eln(a ) = ex·ln a Nach den Rechenregeln für Ableitungen folgt nun: f 0 (x) = (ln a) · ex·ln a = (ln a) · ax Lösung zu Übung 8.4.12: Der Grund für die seltsam aussehende Diskrepanz zwischen dem Quadrat und dem Kreis liegt schlicht darin, dass die Fläche des Kreises in Abhängigkeit vom Radius, also dem Abstand vom Rand zum Mittelpunkt angegeben ist. Beim Quadrat wird die gesamte Seitenlänge genommen. Gibt man Fläche und Umfang des Kreises in Abhängigkeit vom Durchmesser an, ergibt sich auch hier der Faktor 12 , denn es gilt für einen Kreis mit Durchmesser d: µ ¶2 π · d2 d = AK (d) = π · 2 4 14 Anhang: Lösungen 94 Vorkurs Mathematik Der Umfang beträgt UK (d) = 2π · d =π·d 2 Und es gilt: π·d 1 = UK (d) 2 2 Dieselbe Erklärung funktioniert auch für die dreidimensionalen Objekte. A0K (d) = N Lösung zu Übung 9.2.6: Zunächst gilt: es gibt nur eine Teilmenge von mit 0 Elementen, nämlich die leere Menge ∅. Es gibt abzählbar viele Teilmengen mit genau einem Element, nämlich genau die Mengen {n} mit n ∈ . N Ebenfalls gibt es abzählbar viele Teilmengen mit zwei Elementen, also Mengen der Form {n, m} mit n, m ∈ und n 6= m. Das Argument hierfür ist das gleiche wie für die Abzählbarkeit der rationalen Zahlen, man ordne die Elemente in einem Gitter an und zähle diagonal hindurch. N Genauso folgt nun, dass die Menge aller 3-elementigen Teilmengen abzählbar sind, denn die 2-elementigen sind es und die 1-elementigen auch und wieder kann das gleiche Argument angewandt werden. Induktiv folgt: die Menge X 0 = {A ⊆ N : A ist endlich} ist abzählbar. Wäre nun X auch abzählbar, so wäre die Vereinigung X ∪ X 0 wieder abzählbar (bilde die geraden Zahlen nach X und die ungeraden nach X 0 ab), aber das kann nicht sein, denn es gilt X ∪ X 0 = P( ) und diese Menge ist überabzählbar nach Satz 9.2.3. N N abzählbar ist, folgt, dass die Menge Y Zu n ∈ N betrachte Da jede Teilmenge A ⊆ Lösung zu Übung 9.2.7: ½ In := 1 i ∈ I : f (i) ≥ n leer ist. ¾ Wenn In unendlich viele Elemente besäße, dann könnte die Summe nicht konvergieren, also hat In für jedes n ∈ nur endlich viele Elemente. Es gilt aber: [ {i ∈ I : f (i) 6= 0} = In , N N n∈ N denn für jedes i ∈ I mit f (i) 6= 0 gibt es ein n ∈ mit f (i) ≥ n1 . Die Menge X lässt sich also als abzählbare Vereinigung endlicher Mengen schreiben, kann also selbst nur abzählbar viele Elemente besitzen. Lösung zu Übung 11.2.1: Definiere folgende 2 × 2 Matrizen: µ ¶ µ ¶ 0 1 0 0 A := B := 0 0 0 1 Dann folgt: µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ 0 1 0 0 0 1 0 0 0 0 0 1 A·B = · = 6= = · =B·A 0 0 0 1 0 0 0 0 0 1 0 0 14 Anhang: Lösungen 95 Vorkurs Mathematik (k) Lösung zu Übung 11.2.5: Zunächst eine Bezeichnung: Ak = (aij )i,j . Dann gilt: ½ 1 , falls j − i = k (k) aij = 0 , falls j − i 6= k Diese Behauptung soll mit vollständiger Induktion über k bewiesen werden. Der Induktionsanfang für k = 1 ist gerade die Definition der Matrix A. Betrachte also den Induktionsschritt von k auf k + 1. Es gilt Ak+1 = Ak · A, also folgt n X (k+1) (k) (1) aij = ail · alj l=1 Der hintere Eintrag ist nur dann von 0 verschieden, wenn j − l = 1 bzw. wenn l = j − 1. Es bleibt also nur dieser Summand übrig: (k+1) aij (k) = ai,j−1 Dieser Eintrag ist nach Induktionsvoraussetzung genau dann gleich 1, wenn (j − 1) − i = k, woraus folgt j − i = k + 1. Dies zeigt die Behauptung. Für k = n folgt nun An = 0n , da die Bedingung j − i = n für kein Paar (i, j) erfüllt sein kann, da sowohl i als auch j natürliche Zahlen aus der Menge {1, . . . , n} sind. Lösung zu Übung 13.2.6: Zunächst zur Reflexivität. Die Einheitsmatrix In ist invertierbar mit In−1 = In , denn In · In = In . Es folgt: A = In · A · In−1 also gilt A ∼ A für jede Matrix A. Seien nun A und B Matrizen mit A ∼ B, also gibt es eine invertierbare Matrix P mit A = P BP −1 . Zu zeigen ist die Symmetrie der Relation, also B ∼ A. Dazu ist die Existenz einer invertierbaren Matrix Q nachzuweisen mit B = QAQ−1 . Setze Q := P −1 . Dann ist Q invertierbar mit Q−1 = P , denn Q · P = P −1 · P = In . Die Gleichung B = QAQ−1 folgt nun durch Multiplikation der Gleichung A = P BP −1 von links mit Q und von rechts mit Q−1 = P . Fehlt noch die Transitivität. Seien also A, B, C Matrizen mit A ∼ B und B ∼ C, es gibt also invertierbare Matrizen P und Q, so dass gilt A = P BP −1 und B = QCQ−1 . Zu zeigen: es gibt eine invertierbare Matrix R mit A = RCR−1 . Setzt man die Gleichungen ineinander ein, so ergibt sich A = P BP −1 = P QCQ−1 P −1 Setze R := P Q. Dann ist R invertierbar mit R−1 = Q−1 P −1 , denn es gilt: R · Q−1 P −1 = P Q · Q−1 P −1 = P · In · P −1 = P P −1 = In Also folgt A = RCR−1 wie verlangt. 14 Anhang: Lösungen 96 Vorkurs Mathematik Lösung zu Übung 12.2.2: Die Vektorraumaxiome sind klar: zu f, g ∈ V und λ ∈ werden f + g ∈ V und λ · f ∈ V definiert durch R (λ · f )(xi ) = λ · f (xi ) (f + g)(xi ) = f (xi ) + g(xi ) Der Nullvektor ist diejenige Abbildung, die alle Elemente xi auf 0 abbildet, denn dies ist genau das neutrale Element der Addition. Sei nun f ∈ V beliebig. Setze λi := f (xi ). Dann folgt: à n ! n n X X X λi ei (xj ) = λi ei (xj ) = λi δij = λj = f (xj ) i=1 i=1 i=1 Daraus folgt die geforderte Gleichheit, denn f und die Summe stimmen auf allen xj überein, sind also als Abbildungen gleich. Zur Eindeutigkeit: angenommen, es gibt eine weitere Darstellung n X f= µi ei i=1 Dann folgt wie oben: à λj = f (xj ) = n X ! µi ei (xj ) = µj i=1 Also sind die λi eindeutig bestimmt. Lösung zu Übung 12.2.4: a) U1 ist ein Unterraum: der Nullvektor ist enthalten und für u, u0 ∈ U1 folgt: 0 0 0 0 u + u = 0 + 0 = 0 ∈ U1 0 0 0 Und für λ ∈ R und u ∈ U1 folgt 0 λ·0 0 λ · u = λ · 0 = λ · 0 = 0 ∈ U1 0 λ·0 0 Also sind die Bedingungen alle erfüllt. b) U2 ist kein Unterraum. Betrachte dazu die Vektoren 1 −2 0 0 ∈ U2 u = 1 ∈ U2 und u = 0 0 Dann folgt 14 Anhang: Lösungen −1 u + u0 = 1 ∈ / U2 0 97 Vorkurs Mathematik c) Für b 6= 0 ist U3 kein Unterraum, da der Nullvektor nicht in der Menge enthalten ist. Für b = 0 ist U3 allerdings ein Unterraum, isomorph zu 2 . d) U4 ist ein Unterraum. Der Nullvektor ist enthalten, da gilt 7·0−0+2·0 = 0. Sind nun x, y ∈ U4 , dann gilt R 7x1 − x2 + 2x3 = 0 7y1 − y2 + 2y3 = 0 und Addition beider Gleichungen liefert 7(x1 + y1 ) − (x2 + y2 ) + 2(x3 + y3 ) = 0 also folgt x + y ∈ U4 . Ebenso gilt für λ ∈ λ · (7x1 − x2 + 2x3 ) = 0 ⇔ R: 7(λ · x1 ) − (λ · x2 ) + 2(λ · x3 ) = 0 also gilt auch λ · x ∈ U4 . e) U5 ist kein Unterraum. Betrachte zum Beispiel die Vektoren 3 5 0 u = 4 ∈ U5 und u = 12 ∈ U5 5 13 Diese liegen in U5 , da 32 + 42 = 25 = 52 und 52 + 122 = 169 = 132 . Allerdings gilt 8 / U5 u + u0 = 16 ∈ 18 wegen 82 + 162 = 64 + 256 = 320 6= 324 = 182 . R Lösung zu Übung 12.3.1: Setze a := f (1). Für x ∈ beliebig folgt wegen der Linearität: f (x) = f (x · 1) = x · f (1) = x · a = ax Dies zeigt die Behauptung. R Lösung zu Übung 12.3.3: Bilde eine neue Matrix E ∈ M (2m × n, ) und einen Vektor f ∈ 2m auf folgende Weise: R E= A C b f = d Die Matrizen und die Vektoren werden untereinandergeschrieben, das heißt alle Gleichungen der Systeme Ax = b und Cx = d werden in ein großes System Ex = f zusammengefasst. Die Lösungsmenge dieses Systems ist genau LA ∩ LC und wieder ein affiner Unterraum, da es Lösungsmenge eines linearen Gleichungssystems ist. 14 Anhang: Lösungen 98 Vorkurs Mathematik Lösung zu Übung 13.2.6: Zunächst gilt nach Definition ja C = {a + ib : a, b ∈ R}, wodurch direkt ersichtlich ist, dass {1, i} ein Erzeugendensystem von bildet. Weiter gilt R C über a + ib = 0 ⇐⇒ a = 0 und b = 0 und dies zeigt die lineare Unabhängigkeit. Daher ist {1, i} eine Basis von über und es gilt dimR = 2. R C C Eine weitere Basis ist z.B. {1 + i, 1 − i}. Zunächst ist diese Menge ein Erzeugendensystem, ist nämlich z = a + ib ∈ beliebig, so setze C λ := a+b 2 und µ := a−b . 2 Es folgt λ(1 + i) + µ(1 − i) = λ + λi + µ − µi = (λ + µ) + i(λ − µ). Wegen λ+µ= a+b a−b + =a 2 2 und λ−µ= a+b a−b − =b 2 2 folgt das Gewünschte. Da dieses Erzeugendensystem die richtige Länge hat, ist es automatisch eine Basis, denn sonst könnte man es verkürzen. 14 Anhang: Lösungen 99