Elementarmathematik Im Sommersemester 2012 hat Steffen Fröhlich die Vorlesung Elementarmathematik an der Universität Mainz gehalten und ein Skript dazu geschrieben. Für die Vorlesung Elementarmathematik im Sommersemester 2013 hat Alan Rendall dieses Skript nach seinem Geschmack abgeändert. Der vorliegende Text ist das Ergebnis. Die Abschnitte 2-7 basieren auf dem Text von Fröhlich. Die Hauptquelle für die Abschnitte 9 und 10 ist das Buch von Clark und Holton [1]. Die Hauptquelle für den Abschnitt 11 ist das Buch von Feller [2]. 1 Einleitung Im Buch ’Virus Dynamics’ von M. Nowak und R. May findet man das Zitat: ... mathematics is no more, but no less, than a way of thinking clearly [3]. (... die Mathematik ist nichts mehr, aber nichts weniger, als eine Art, klar zu denken.) Wenn wir diese Art zu denken gut beherrschen, dann haben wir etwas, was uns in vielen Lebenslagen helfen kann. Ausserdem ist die Mathematik an und für sich schön. Diese Vorlesung soll den Hörern wichtige Aspekte der Mathematik nahebringen, die praktisch eingesetzt werden können und hoffentlich auch etwas von der Schönheit des Fachs vermitteln. 2 Zahlen Wer an Mathematik denkt, denkt sofort an Zahlen. Zahlen spielen in der Tat eine zentrale Rolle in der Mathematik und in dieser Vorlesung sind sie unser erstes Thema. Es gibt verschiedene Arten von Zahlen und diese möchten wir Revue passieren lassen. Es gibt natürliche Zahlen, ganze Zahlen, rationale Zahlen, reelle Zahlen und komplexe Zahlen. Jetzt wird beschrieben, was diese unterschiedlichen Arten von Zahlen sind und was man damit machen kann. Die einfachsten Zahlen sind die natürlichen Zahlen {1, 2, 3, 4, . . .}, (1) die Zahlen, die wir in der Kindheit kennenlernen. Die Menge der natürlichen Zahlen wird mit N bezeichnet. Wenn a und b natürliche Zahlen sind, dann 1 sind die Summe a + b und das Produkt ab auch natürliche Zahlen. Im Rahmen der natürlichen Zahlen können wir aber nicht immer subtrahieren. Z.B. gibt es 2 − 3 nicht als natürliche Zahl. Anders gesagt, gibt es keine natürliche Zahl a mit der Eigenschaft, dass 3 + a = 2. Die Lösung dieses Problems ist schon lange bekannt. Wir können die Null einführen (wie es schon die alten Inder getan haben) und die negativen Zahlen. Dann können wir 2 − 3 = −1 schreiben. Wenn die natürlichen Zahlen durch die Null und die negativen Zahlen {−1, −2, −3, −4, . . .}, (2) erweitert werden, dann bekommen wir die ganzen Zahlen. Die Menge der ganzen Zahlen wird mit Z bezeichnet. Im Rahmen der ganzen Zahlen ist die Subtraktion ohne Einschränkung möglich. Wenn a und b ganze Zahlen sind, dann ist a − b immer sinnvoll. Durch eine Erweiterung des Zahlensystems haben wir uns mehr Möglichkeiten geschaffen. Addition und Multiplikation sind immer noch möglich, so dass durch die Erweiterung nichts verlorengegangen ist. Einige Autoren rechnen die Null zu den natürlichen Zahlen. Diese Alternative übernehmen wir hier nicht. Wir bezeichnen die Menge der natürlichen Zahlen mit der Null dazu als N0 , d.h. N0 = N ∪ {0}. Im Rahmen der ganzen Zahlen ist die Division nur begrenzt möglich. Z.B. gibt es 32 nicht als ganze Zahl. Es gibt keine ganze Zahl a mit der Eigenschaft dass 3a = 2. Diese Einschränkung kann aufgehoben werden in dem wir die ganzen Zahlen durch die Brüche erweitern. Die Brüche, einschliesslich der ganzen Zahlen heissen rationale Zahlen. Das Wort ’rational’ hier soll nicht als ’vernünftig’ interpretiert werden sondern kommt vom lateinischen ’ratio’ (Verhältnis). Die Menge der rationalen Zahlen wird mit Q bezeichnet. (Q steht für Quotienten.) Die bekannten Regeln der Bruchrechnung erlauben es im Rahmen der rationalen Zahlen die vier Grundrechenarten ohne Einschränkung auszuführen bis auf die Tatsache, dass die Division durch Null nicht definiert ist. Zusammenfassend, haben wir jetzt drei Zahlenarten N, Z, Q eingeführt mit N ⊂ Z ⊂ Q. Es gibt noch eine weitere Klasse von Zahlen, die sehr wichtig sind, die reellen Zahlen, √ die mit R bezeichnet werden. Ausser den rationalen Zahlen enthalten sie z. B. 2 und die Kreiszahl π. Diese Zahlen sind notwendig für die Anwendungen der Mathematik in den Naturwissenschaften und, innerhalb der Mathematik, auf die Geometrie. Sie werden gebraucht, um die diagonale des Quadrats mit Seitenlänge Eins oder den Umfang des Kreises mit Radius Eins auszudrücken. Diese Zahlen sind keine rationalen Zahlen (was nicht offensichtlich ist). Auf diese Dinge gehen wir später genauer ein. Die reellen Zahlen, die keine rationalen Zahlen sind, heissen irrationale Zahlen. Selbst innerhalb der reellen Zahlen hat die Gleichung z 2 = −1 keine Lösung. Um dieses Problem zu umgehen führt man eine Grösse i ein, die imaginäre Einheit, mit der Eigenschaft i2 = −1. Es gilt auch (−i)2 = −1. Dann hat unsere Gleichung zwei Lösungen. Man kann eine Klasse von Zahlen definieren, die komplexen Zahlen, die auch i enthält. Sie wird mit C bezeichnet. Die Zahlen der Form ai mit a reell heissen imaginär und die Bezeichnung ’reelle 2 Zahlen’ entstand als Gegensatz zum Begriff ’imaginäre Zahlen’. 2.1 Die reellen Zahlen Wir haben jetzt von den reellen Zahlen gesprochen, nicht aber genau gesagt, was sie sind. Ein anschauliches Bild der reellen Zahlen wird durch die Zahlengerade gegeben. Betrachten wir eine Gerade auf dem ein Punkt (der Ursprung) ausgezeichnet wird. Eine Richtung auf der Gerade wird als positiv deklariert. Z. B. wird oft eine waagerechte Gerade genommen und die positive Richtung als ’nach rechts’ gewählt. Der Ursprung wird mit der Zahl Null identifiziert. Eine positive Zahl a wird mit dem Punkt identifiziert, der in positiver Richtung im Abstand a zum Ursprung liegt. Eine negative Zahl a wird mit dem Punkt identifiziert, der in negativer Richtung im Abstand −a zum Ursprung liegt. Auf diese Weise bekommt insbesondere jede rationale Zahl eine Darstellung auf der Zahlengerade. Wie schon angedeutet entsprechen aber nicht alle Punkte auf der Gerade rationalen Zahlen. Es ist relativ kompliziert, eine präzise und vollständige Definition der reellen Zahlen zu geben und eine solche Definition kann im Rahmen dieser Vorlesung nicht gebracht werden. Ein wesentlicher Umstand ist dass die rationalen Zahlen in den reellen Zahlen dicht liegen. Das heisst, dass wenn a eine reelle Zahl ist und > 0 es eine rationale Zahl b gibt, so dass |a − b| < . Man kann eine reelle Zahl beliebig gut durch rationale Zahlen approximieren. Praktische Messungen in der realen Welt haben nur eine endliche Genauigkeit. Wenn wir die Länge eines Stabs messen wird das Ergebnis immer nur mit endlich vielen Dezimalstellen angegeben. Das heisst, das Ergebnis ist eine rationale Zahl. Die reellen Zahlen sind trotzdem für die Anwendungen der Mathematik von großer Bedeutung. Die Vorteile dieses Begriffs hängen damit zusammen, dass wir ein intuitives Bild der Gerade in uns tragen. Eine Definition der reellen Zahlen wurde erst 1872 von Richard Dedekind aufgestellt, der damals Professor der Mathematik in seinem Geburtsort Braunschweig war. Seine Konstruktion, der ’Dedekindsche Schnitt’ wird bis heute verwendet. Jetzt soll gezeigt werden, warum die rationalen Zahlen für die Geometrie nicht ausreichen. Die alten Griechen √ wussten, dass die Diagonale eines Quadrats der Seitenlänge eins die Länge 2 hat, und dass diese Zahl irrational ist. Der Beweis ist ein sogenannter ’indirekter Beweis’ oder Beweis durch Widerspruch. Man nimmt an, dass eine bestimmte Aussage wahr sei und leitet aus dieser Aussage durch logische Schritte einen Widerspruch. Daraus schliesst man, dass die Annahme falsch gewesen sein muss. Im Beispiel, das uns interessiert führt die √ Annahme, 2 sei rational zu einem Widerspruch und damit ist bewiesen, dass √ 2 irrational ist. Bevor wir den Beweis durchführen machen wir auf folgenden Umstand aufmerksam. Wenn eine ganze Zahl a gerade ist, dann ist definitionsgemäss a = 2b für eine ganze Zahl b. Dann ist a2 = 4b2 = 2(2b2 ) auch gerade. Wenn dagegen a ungerade ist, dann ist a = 2b + 1 für eine ganze Zahl b und a2 = (2b + 1)2 = 2(2b2 + 2b) + 1 auch ungerade. Zusammenfassend, eine ganze 2 Zahl a ist gerade √ wenn und nur wenn a gerade ist. Satz Die Zahl 2 ist irrational. 3 √ Beweis Wenn√wir annehmen, dass 2 rational ist, dann gibt es natürliche Zahlen p und q mit 2 = pq . Wir können annehmen, dass p und q teilerfremd sind, weil wir sie sonst durch andere Zahlen ersetzten könnten die es sind. Quadrieren und mit q 2 multiplizieren gibt p2 = 2q 2 . Deshalb ist p2 gerade. Es folgt aus der obigen Diskussion, dass p gerade ist, also p = 2r für eine ganze Zahl r. Deshalb ist 4r2 = 2q 2 und q 2 = 2r2 . Daraus folgt, dass q 2 und deshalb auch q gerade ist. Die Zahlen p und q sind also beide gerade und haben den gemeinsamen Teiler 2, was der Teilerfremdheit widerspricht. Damit ist der Beweis geführt. Es ist viel schwieriger zu beweisen, dass π irrational ist. Der erste Beweis stammt vom schweizer Mathematiker Johann Heinrich Lambert im Jahr 1761. 3 Der Goldene Schnitt Der Goldene Schnitt ist ein Verhältnis von Längen, das in der Kunst als besonders schön gilt. Sie kommt auch an vielen Stellen in der Natur vor, z.B. bei der Blattstellung von Pflanzen (Phyllotaxis). 3.1 Definition des Goldenen Schnitts Der Goldene Schnitt wird durch eine Art definiert, eine Strecke zu schneiden, liefert aber am Ende eine reine Zahl. Definition Eine Strecke der Länge s > 0 wird im Goldenen Schnitt s = a + b geteilt, wenn sich die ganze Länge s sum grösseren Abschnitt a wie dieser zum kleineren Abschnitt b verhält. Das heisst, es ist a s = . a b (3) Aus dieser Beziehung folgt, dass s a = , a s−a a 2 s + a −1=0 s (4) Die Formel für die Lösung einer quadratischen Gleichung liefert a 1 1√ 5. =− ± s 2 2 (5) Eine dieser Lösungen ist negativ und deshalb für das ursprüngliche Problem nicht relevant. Die andere ist a 1 √ = ( 5 − 1) = 0, 618 . . . . s 2 Die Zahl Φ= s a = = 1, 618 . . . b a ist das Goldene Verhältnis. 4 (6) (7) Es wird manchmal behauptet, dass bei bestimmten schönen Gebäuden das Verhältnis der Dimensionen das Goldene Verhältnis ergibt (z. B. das Parthenon in Athen, der Dom von Florenz, Notre Dame in Paris). Es gibt aber anscheinend keine Dokumente die belegen würden dass beim Bau an so etwas bewusst gedacht wurde. Vielleicht war es der unbewusste Sinn des Architekten nach Schönheit. In der Natur findet man das Goldene Schnitt bei der Anordnung der Blätter bestimmter Pflanzen. Der Goldene Winkel ist, in Grad ausgedrückt, 360 Φ . Bei bestimmten Pflanzen wo die Blätter um einen Stiel herum angeord net sind ist der Winkel zwischen aufeinanderfolgen Blättern 360 1 − Φ1 . Nach einer Theorie erreicht die Pflanze dadurch, dass die Blätter sich möglichst wenig überdecken und sich dadurch bei der Photosynthese möglichst wenig gegenseitig behindern. 3.2 Harmonische Rechtecke Ein Rechteck heisst harmonisch wenn die Längen der Seiten a, b mit a > b so a . In diesem Fall gilt ab = Φ. Wenn man ein Rechteck in ein sind, dass ab = a+b Quadrat und einen Rest zerlegt, dann ist der Rest harmonisch. 3.3 Vergleich mit der DIN-Norm für Papierformate Wie werden die üblichen Papierformate (A0, A1, A2, A3, A4, . . .) definiert? Sie haben die Eigenschaft, dass wenn man ein Blatt in einem dieser Formate halbiert, das Ergebnis ein Blatt im nächsten Format der Reihe ist. Alle Formate der Reihe haben das gleiche Verhältnis der Breite zur Länge. Dieses Verhältnis kann man folgendermassen berechnen. Wenn Länge und Breite des ersten Blattes a und b sind, dann ist die Bedingung die erfüllt werden muss ab = 2b a . Daraus √ folgt, dass ab = 2. Um zu wissen, wie groß die einzelnen Blätter sind muss man noch wissen, wie groß eins der Formate ist. Es wird festgelegt, dass das A0-Blatt die Fläche ein Quadratmeter haben soll. Die Länge des A0-Blatts ist dann die vierte Wurzel aus zwei. Sie ist nicht rational und insbesondere keine ganze Zahl von Millimetern. In der Praxis arbeitet man mit einer gewissen Toleranz. Der Richtwert ergibt eine Fläche von 999.949 Quadratmillimetern. 4 4.1 Die Fibonacci-Zahlen Definition der Fibonacci-Zahlen Leonardo da Pisa, Fibonacci genannt, war einer der ersten, der die indo-arabischen Ziffern in Europa bekannt gemacht hat. In seinem Buch ’Liber Abbaci’ (um 1200 erschienen) hat er folgendes Beispiel beschrieben: Ein bestimmter Mann hat ein Kaninchenpaar an einem Ort gehalten der auf allen Seiten von einer Mauer umgeben war. Wie viele Kaninchenpaare können in einem Jahr aus diesem Paar produziert werden wenn angenommen wird, 5 dass jedes Paar in jedem Monat ein weiteres Paar hervorbringt, welches ab dem zweiten Monat fruchtbar wird? Dieses Beispiel hat natürlich wenig mit Biologie und viel mit Mathematik zu tun. Die Fibonacci-Folge (die schon vor mehr als 2000 Jahren von anderen betrachtet wurde) wird folgendermassen definiert Definition Die Fibonacci-Folge {Fn } wird rekursiv durch F1 = F2 = 1, (8) Fn = Fn−1 + Fn−2 , n = 3, 4, . . . (9) definiert. Die ersten Elemente der Folge sind 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . . 4.2 (10) Goldener Schnitt und Fibonacci-Zahlen Betrachten wir die Zahlen √ √ 1− 5 1+ 5 = −0, 618 . . . , Φ = = 1, 618 . . . . (11) φ= 2 2 Die Zahl Φ ist nichts anderes als das Goldene Verhältnis. Die Zahlen φ und Φ sind beide Lösungen der Gleichung x2 − x − 1 = 0. Von diesem Ausgangspunkt können wir verschiedene Gleichungen für φ herleiten: 1 + φ = φ2 1 + 2φ = φ3 , 4 1 + 2φ = 1 + φ + φ = φ + φ2 = φ(1 + φ) = φ3 2 + 3φ = φ , 2 + 3φ = 1 + φ + 1 + 2φ = φ2 + φ3 = φ2 (1 + φ) = φ4 3 + 5φ = φ5 , 3 + 5φ = 1 + 2φ + 2 + 3φ = φ3 + φ4 = φ3 (1 + φ) = φ5 5 + 8φ = φ6 , 5 + 8φ = 2 + 3φ + 3 + 5φ = φ4 + φ5 = φ4 (1 + φ) = φ6 Diese Rechnung könnten wir beliebig lange weiterführen. Die gleichen Identitäten gelten für Φ, da Φ die gleiche Ausgangsleichung erfüllt wie φ. Hier baut sich ein Muster auf, wo die Fibonacci-Zahlen zum Vorschein kommen. Wenn wir die Gleichungen dieser Folge für φ von den entsprechenden Gleichungen für Φ subtrahieren dann ergeben sich die Gleichungen Φ2 − φ 2 Φ3 − φ 3 Φ4 − φ 4 Φ5 − φ 5 = 1, = 2, = 3, = 5, usw. (12) Φ−φ Φ−φ Φ−φ Φ−φ √ In diesen Formeln können wir den Nenner durch 5 ersetzen. Durch diese Überlegungen kommt man auf folgende Aussage, die von de Moivre und Binet bewiesen wurde. (Die soeben gemachten Rechnungen beweisen den Satz nicht.) Satz Zwischen den Fibonacci-Zahlen Fn und den Goldenen Zahlen φ und Φ besteht der Zusammenhang 1 Fn = √ (Φn − φn ), 5 6 n = 1, 2, 3, . . . (13) Da |φ| < 1 folgt aus diesem Satz, dass für n groß Fn ungefähr gleich 4.3 √1 Φn 5 ist. Binomischer Lehrsatz und Pascalsches Dreieck Die Fakultät wird durch n! = 1 · 2 · 3 · . . . · n definiert. Die Binomialkoeffizienten werden durch n n! n n = , = 1, =1 (14) k k!(n − k)! 0 n definiert. In diesem Zusammenhang ist es auch günstig 0! = 1 zu definieren. Satz (Binomischer Lehrsatz) n X n n−k k (a + b)n = a b . (15) k k=0 Dieser Satz wird normalerweise durch vollständige Induktion bewiesen. Dieser Beweismethode wenden wir uns im nächsten Abschnitt zu. Im Fall n = 1 reduziert sich der Satz auf die uninteressante Gleichung a + b = a + b. Dagegen sind die Fälle n = 2 und n = 3 schon für algebraische Rechnungen sehr nützlich. Sie lauten (a + b)2 = a2 + 2ab + b2 , (16) (a + b)3 = a3 + 3a2 b + 3ab2 + b3 . (17) Wenn wir (a + b)n für grössere Werte von n auf diese Weise ermitteln wollten, dann könnten die Rechnungen langwierig werden. Sie lassen sich einfacher sukzessiv durch die Verwendung der Identität n+1 n n = + (18) k k−1 k berechnen. Diese Identität bekommt eine geometrische Interpretation durch das Pascalsche Dreieck. [In der Vorlesung wird das Dreieck angeschrieben.] 4.4 Pascal und Fibonacci Wenn man im Pascalschen Dreieck geeignete diagonale Summen bildet dann kommen wieder die Fibonacci-Zahlen zum Vorschein. [In der Vorlesung wird dieser Umstand genauer beschrieben.] 4.5 Das Pascalsche Dreieck und Restklassen nach Division Definition Für zwei ganze Zahlen a, b ∈ Z und eine positive natürliche Zahl m ∈ N schreiben wir a ≡ b mod m bzw. a − b ≡ 0 mod m (19) genau dann, wenn a und b nach Division durch m den gleichen ganzzahligen Rest lassen. Es sind also z. B. 1 ≡ 5 mod 2 und 5 ≡ 14 mod 3. Die Division 7 durch zwei teilt die natürlichen Zahlen N offenbar in zwei disjunkte Restklassen ein. Es sind die Restklasse aller ungeraden Zahlen (die Division durch zwei lässt den Rest 1) und die Restklasse aller geraden Zahlen (die Division durch zwei lässt den Rest 0). Wir schreiben 0̄ = {2, 4, 6, 8, 10 . . .}, 1̄ = {1, 3, 5, 7, 9 . . .}. Analog zerlegt die Division durch 5 die Menge N in fünf einander disjunkte Restklassen, deren Elemente durch den gemeinsamen Rest 0, 1, 2, 3 oder 4 charakterisiert sind: 0̄ = {5, 10, 15, 20, 25 . . .}, 1̄ = {1, 6, 11, 16, 21 . . .}, 2̄ = {2, 7, 12, 17, 22 . . .}, 3̄ = {3, 8, 13, 18, 23, . . .}, 4̄ = {4, 9, 14, 19, 24 . . .}. (20) Wir wollen die Elemente einer solchen Restklasse als äquivalent ansehen, gekennzeichnet durch das Symbol ∼, schreiben also z. B. 5 ∼ 10, 5 ∼ 15 , 10 ∼ 15 usw. (21) für die Restklasse 0̄ bei Division durch 5. Für dieses Beispiel schreibt man allgemeiner a ∼ b genau dann, wenn a − b ≡ 0 mod 5. (22) Die hierdurch eingeführte Relation zwischen zwei Elementen a und b besitzt interessante Eigenschaften, die sie als sogenannte Äquivalenzrelation auszeichnen. Definition Eine Äquivalenzrelation ist durch folgende Eigenschaften charakterisiert. Sie ist reflexiv: es gilt stets x ∼ x symmetrisch: wenn x ∼ y dann gilt auch y ∼ x transitiv: wenn x ∼ y und y ∼ z dann gilt auch x ∼ z Der Begriff der Äquivalenzrelation hat in der Mathematik viele Anwendungen. Diese Definition kann im Rahmen der Mengenlehre präzisiert werden. Wir fangen mit einer Menge X an. Die Produktmenge X × X ist die Menge aller Paare (a, b) mit a, b ∈ X. Eine Relation auf X wird durch eine Teilmenge R von X × X definiert. Die Relation heisst Äquivalenzrelation wenn folgende drei Eigenschaften gelten, die den schon oben genannten Eigenschaften entsprechen. Für jedes Element a ∈ X ist (a, a) ∈ R. Wenn (a, b) ∈ R, dann auch (b, a). Wenn (a, b) ∈ R und (b, c) ∈ R dann ist (a, c) ∈ R. Die Beziehung zwischen den zwei Schreibweisen ist, dass (a, b) ∈ R der Aussage a ∼ b entspricht. Es werden jetzt verschiedene Rechenregeln fuer Restklassen ohne Beweis angegeben. 8 Aus a ≡ b mod m und c ∈ Z folgt a + c ≡ b + c mod m Aus a ≡ b mod m und c ≡ d mod m folgt a + c ≡ b + d mod m Aus a ≡ b mod m und c ∈ Z folgt ac ≡ bc mod m Aus a ≡ b mod m und c ≡ d mod m folgt ac ≡ bd mod m Aus a ≡ b mod m und n ∈ N folgt an ≡ b√n mod m Denken wir an den Beweis zurück, dass 2 irrational ist. Die einzige wichtige Eigenschaft der Zahl 2 die wir dabei verwendet haben ist, dass eine Zahl n gerade ist wenn und nur wenn n2 gerade ist. Dies ist die Aussage dass n ≡ 0 mod 2 genau dann, wenn n ≡ 0 mod 2. In dem Fall, dass für eine andere Zahl k gilt, dass n ≡ 0 mod k wenn und nur wenn n2 ≡ 0 mod k, dann kann man ähnlich argumentieren wie im Fall k = 2. Dass die zweite Aussage aus der ersten folgt sieht man aus den obigen Rechenregeln. Die Umkehrung kann man für einen gegebenen Wert von k überprüfen, in dem man alle Fälle durchgeht. Z. B. im Fall k = 5. 2 2 12 ≡ 1 mod 5, 22 ≡ 4 mod √ 5, 3 ≡ 4 mod 5, 4 ≡ 1 mod 5 Damit ist bewiesen dass 5 irrational ist und dass das goldene Verhältnis irrational ist. 4.6 Fermatsche Primzahlen In diesem Abschnitt werden die Rechenregeln für Restklassen verwendet, um ein klassisches Beispiel zu untersuchen. Der französische Mathematiker Pierre de Fermat hat 1637 vermutet, dass alle Zahlen der Form n Fn = 22 + 1 (23) Primzahlen sind, also natürliche Zahlen, die grösser als 1 und nur durch sich selbst teilbar sind. Diese Zahlen heissen aus diesem Grund Fermatsche Zahlen. Sie sind beispielsweise F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537. (24) Leonhard Euler bewies aber dass F5 = 4294967297 keine Primzahl ist, sondern den Teiler 641 besitzt. 5 22 + 1 = 232 + 1 ≡ 0 mod 641. (25) Diese Aussage wird jetzt bewiesen. Zunächst ist 641 = 640 + 1 = 5 · 27 + 1 und 5 · 27 ≡ −1 mod 641. (26) In dem wir die vierte Potenz bilden bekommen wir 54 · 228 ≡ 1 mod 641. (27) 54 + 24 = 625 + 16 = 641 und 54 ≡ −24 mod 641. (28) Andererseits ist Diese Gleichung wird jetzt mit 228 multipliziert, mit dem Ergebnis 232 ≡ −54 · 228 mod 641 ≡ −1 mod 641. 9 (29) 5 5.1 Summenformeln Was sind Summenformeln? Wir in diesem Abschnitt explizite Darstellungen für die Summen Sp (n) = Pn wollen p p k=1 k für Potenzen k mit p ∈ N kennenlernen. An solchen Beispielen lernt man in der Regel die Beweismethode der vollständigen Induktion. Diese Vorgehensweise hat den Nachteil, dass man die richtige Antwort kennen muss, bevor man sie beweist. Wir wollen daher auch der Frage nachgehen, wie explizite Darstellungen für Summen von Potenzen auf direktem Wege hergeleitet werden können. Zweitens Pn leiten wir eine explizite Darstellung für die geometrische Summe Gq (n) = k=0 q k ab und diskutieren an einem Beispiel ihre Anwendung im Bereich der Zinsrechnung. 5.2 Die Summe der ersten n Zahlen Wir beginnen mit dem Satz Es gilt S1 (n) = n X k= k=1 n(n + 1) . 2 (30) Beweis Die Idee des nachfolgenden Beweises stammt vom neunjährigen C. F. Gauß: wir schreiben die Summe zweimal untereinander, einmal aufsteigend, einmal absteigend, auf und summieren die Elemente in den einzelnen Spalten 1+ 2 + ... n + (n − 1) + . . . +(n − 1) + n (31) + (32) 2 +1 Jede Spalte liefert einen Beitrag n + 1 und es gibt n davon. Das Ergebnis ist das doppelte der Summe, die wir ausrechnen wollten. Damit ist der Satz bewiesen. 5.3 Die Summe der ersten n Quadratzahlen Wir wollen eine explizite Darstellung für S2 (n) herleiten. Dazu benötigen wir den Hilfssatz Für jedes n gilt 1 + 3 + 5 + 7 + . . . + (2n − 1) = n2 . (33) Erster Beweis Dieser Beweis benutzt das Ergebnis des letzten Satzes. Die Summe die uns hier interessiert kann als die Summe von drei Beiträgen geschrieben werden. Dazu wird die Identität 2k − 1 = (k − 1) + (k − 1) + 1 benutzt. Die Summe von k ist das bereits bekannte n(n+1) während die Summe von 1 ist n. 2 Deshalb ist die Gesamtsumme n(n − 1) n(n − 1) + + n = n2 2 2 10 (34) Dieser Beweis stammt von T. Weißschuh. Zweiter Beweis Dieser geometrische Beweis wird an der Tafel gezeigt. Satz S2 (n) = n(n+1)(2n+1) . 6 In der Vorlesung wird eine geometrische Darstellung dieser Identität im Fall n = 4 gegeben. Dabei werden sowohl der Hilfssatz als die Formel für die Summe der ersten n Zahlen verwendet. 5.4 Summe der ersten n Kubikzahlen - vollständige Induktion Eine explizite Darstellung von S3 (n) kann man mittels vollständiger Induktion bekommen. Die Beweismethode der vollständigen Induktion können wir wie folgt zusammenfassen. Satz Für jedes n ∈ N ∪ {0} sei eine Aussage An der Art gegeben, so dass gelten (i) die Aussage A0 is richtig, und (ii) aus der Richtigkeit von An für beliebig gewähltes n ∈ N0 folgt die Richtigkeit von An+1 . Dann gilt An für alle n ∈ N0 . Der erste Punkt wird als Induktionsvoraussetzung bezeichnet. Der Induktionsschritt is dann Inhalt des zweiten Punktes. Der Beweis dieses Satzes ist eng mit dem axiomatischen Aufbau der Zahlensysteme verwandt und wird hier nicht behandelt. Jetzt wird diese Beweismethode zur Bestimmung der Grösse S3 (n) verwendet. Satz Es gilt n X n2 (n + 1)2 (35) k3 = S3 (n) = 4 k=1 Beweis Es reicht zu beweisen, dass S3 (n) = (S1 (n))2 , was jetzt mit vollständiger Induktion gemacht wird. Induktionsanfang: (S1 (1))2 = 1 = S3 (1). Die Aussage gilt also für n = 1. Induktionsschritt: Es sei vorausgesetzt, dass (S1 (n))2 = S3 (n) für einen bestimmten Wert von n. Dann berechnen wir 2 2 (n + 1)(n + 2) n(n + 1) 2 + (n + 1) (36) (S1 (n + 1)) = = 2 2 = (S1 (n))2 + n(n + 1)2 + (n + 1)2 3 = S3 (n) + (n + 1) = S3 (n + 1). (37) (38) Damit ist die Behauptung bewiesen. 5.5 Die geometrische Reihe Die geometrische Reihe ist die unendliche Summe der Glieder der sogenannten geometrischen Folge, d.h. derjenigen Zahlenfolge {ak } für welche das Verhältnis benachbarter Folgenglieder stets konstant ist. Hier ist k ∈ N0 . Sei q = aak+1 k 11 dieses Verhältnis. Dann ist ak = a0 q k . Für die n-te Partialsumme Sn der geometrischen Zahlenfolge ist daher Sn = n X ak = a0 k=0 n X qk (39) k=0 Satz Sei q 6= 1. Dann gilt n X qk = k=0 1 − q n+1 . 1−q (40) Ist ferner |q| < 1, so haben wir im Grenzfall n → ∞ ∞ X qk = k=0 1 . 1−q (41) Beweis Wir schreiben die n-te Partialsumme wie folgt aus Sn = n X qk = 1 + q + q2 + . . . + qn . (42) k=0 Es folgt, dass (1 − q)Sn = (1 + q + q 2 + . . . q n ) − (q + q 2 + q 3 + . . . q n+1 )) 1 − q n+1 . (43) Für q 6= 1 bekommen wir daraus die erste Behauptung. Um die Grenzformel zu bekommen benutzt man die Tatsache dass |q| < 1 impliziert |q|n → 0 for n → ∞. Die geometrische Reihe findet insbesondere Anwendung in der Zinseszinsrechnung bei Sparanlagen. Hier ist ein Beispiel. Zu Beginn eines jeden Jahres zahlt man 2000 Euro bei einer Bank bei einem Zinssatz von 5% ein. Wieviel Geld hat man nach fünf Jahren angespart? Wir gehen wie folgt vor. Zunächst berechnen wir den Zinsfaktor 1,05. Um diesen Faktor vermehrt sich das Geld in einem Jahr. Das im ersten Jahr eingezahlte Geld wird fünf Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)5 . Das im zweiten Jahr eingezahlte Geld wird vier Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)4 . Das gesamt angesparte Kapital ergibt sich also aus folgender Rechnung: 2000 · (1, 05)5 + 2000 · (1, 05)4 + 2000 · (1, 05)3 + 2000 · (1, 05)2 + 2000 · (1, 05)1 = 2000 · 1, 05 · ((1, 05)4 + (1, 05)3 + (1, 05)2 + (1, 05)1 + (1, 05)0 ) = 2000 · 1, 05 · 4 X (1, 05)k = 2000 · 1, 05 · k=0 = 11.602, 826 12 1 − (1, 05)5 1 − 1, 05 nach Rundung. Durch Zinsen hat sich das eingezahlte Kapital um 1.602,83 Euro erhöht. Hätte man die 10000 Euro am Anfang eingezählt und zu 5% auf 5 Jahre verzinst so wäre der Endbetrag 10000 · (1, 05)5 = 12.762, 82 gewesen, also wesentlich mehr. 5.6 Beweis der binomischen Formel Die Methode der vollständigen Induktion kann angewendet werden um die binomische Formel zu beweisen. Die Aussage An , die es zu beweisen gilt ist die Formel für einen gegebenen P Wert von n. Betrachten wir zuerst die Aussage 0 A0 . (a + b)0 = 1 während k=0 a−k bk = 00 = 1. Als nächtes kommt der Induktionschritt. n X n n−k k n+1 n (a + b) = (a + b)(a + b) = (a + b) a b k k=0 n n X n n−k+1 k X n n−k k+1 = a b + a b (44) k k k=0 k=0 Die zweite Summe auf der rechten Seite kann durch n+1 X n an−k+1 bk k−1 (45) k=1 ersetzt werden. Deshalb ist n n n+1 X n n n n+1 (a + b)n+1 = a + + an−k+1 bk + b 0 k k−1 n k=1 n n n+1 n n+1 X n + 1 n−k+1 k a + a b + b = k n 0 k=1 n+1 X n + 1 = an−k+1 bk . (46) k k=0 Mit der letzten Aussage haben wir An+1 bewiesen und auch den binomischen Lehrsatz. 6 Der Satz des Pythagoras Abgesehen von den Zahlen ist ein anderes bekanntes Gebiet der Mathematik die Geometrie. Sie ist eng mit unseren Vorstellungen des Raumes verbunden, der uns umgibt. Die alten Griechen haben die Geometrie als eigenständige Theorie aufgebaut. Das kanonische Werk dazu sind die ’Elemente’ des Euklid. Seit den Arbeiten von René Descartes, ist bekannt, dass man die eulidischen Geometrie auf den Zahlen aufbauen kann durch die Verwendung von Koordinaten. Es gibt z. B. eine Korrespondenz zwischen Punkten in der Ebene und Paaren (x, y) von reellen Zahlen. 13 6.1 Aussage und erster Beweis Die vielleicht bekannteste Aussage der elementaren Geometrie ist der Pythagoreische Lehrsatz. Zu dessen Beweis brauchen wir nur die Tatsache, dass ein echteck mit den Seitenlängen a uns b den Inhalt ab hat. Satz Für ein rechtwinkliges Dreieck mit den beiden Katheten a und b und der Hypotenuse c gilt a2 + b2 = c2 . Beweis [In der Vorlesung kommt hier ein Bild] Wir betrachten ein Quadrat mit der Seitenlänge a + b und Eckpunkte P1 , P2 , P3 , P4 . Die Punkte werden in dieser Reihenfolge durchlaufen wenn wir um den Rand des Quadrats im Uhrzeigersinn laufen. Bei diesem Umlauf sei Qi der Punkt, der einen Abstand a nach Pi kommt. Die Geraden Qi Qi+1 teilen das Quadrat in vier Dreiecke und ein kleineres Quadrat mit Seitenlänge c. Hier sind die Indizes mod 4 zu verstehen. Die Fläche des Großen Quadrats is (a + b)2 . Sie ist gleich der Summe 2 der vier Dreiecke und des kleinen Quadrats, also 4 · ab 2 + c . Wenn wir diese Ausdrücke gleichsetzten bekommen wir a2 + 2ab + b2 = 2ab + c2 , (47) was zur Behauptung des Satzes führt. Diesen Beweis findet man in einer chinesischen Schrift von etwa 100 vor Christi 6.2 Beweis nach Bhaskara Hier geht es um einen Beweis des indischen Mathematikers und Astronoms Bhaskara (1114-1185). [In der Vorlesung kommt an dieser Stelle ein Bild.] Diesmal setzt sich ein Quadrat mit der Seitenlänge c aus vier Dreiecken mit Seitenlängen a und b und ein Quadrat mit der Seitenlänge |a − b| zusammen. Diesmal ergibt der Vergleich c2 = 4 · 6.3 ab + (a − b)2 = 2ab + a2 − 2ab + b2 = a2 + b2 . 2 (48) Ähnliche Dreiecke und Beweis nach Einstein Für einen dritten Beweis des Satzes brauchen wir den Begriff der ähnlichen Dreiecke. Definition Zwei Dreiecke ABC und DEF heissen ähnlich, wenn die Verhältnisse der Längen der entsprechenden Seiten alle gleich sind, also |AB| |BC| |CA| = = . |DE| |EF | |F D| (49) Eine äquivalente Bedingung, was hier nicht bewiesen wird, ist dass die entsprechenden Winkel gleich sind. Da die Summe der Winkel eines Dreiecks 180 Grad ist, reicht es zu wissen, dass zwei der Winkel gleich sind. Auf die Idee des folgenden 14 Beweises ist Albert Einstein mit elf Jahren gekommen. Wenn die x- und yRichtung in der Ebene mit dem gleichen Faktor λ skaliert werden, dann skalieren sich die Flächen rechtwinkliger Dreiecke mit dem Faktor λ2 . Die Dreiecke, die durch eine solche Skalierung aus einem Dreeick hervorgehen sind alle ähnlich. Als Referenzdreieck wählen wir ein Dreieck mit der Hypotenusenlänge 1 und dem Inhalt Fref . Wir betrachten ein rechtwinkliges Dreieck ABC mit dem rechten Winkel im Punkt C. Der Punkt C kann mit einem Punkt D der gegenüberliengen Seite verbunden werden derart, dass die Gerade CD senkrecht auf die Gerade AB steht. Bezeichnen wir mit F1 , F2 und F3 die Flächen der Dreiecke ABC, ADC und DBC. Diese drei Dreiecke sind alle ähnlich. Es gilt F1 = c2 Fref , F2 = a2 Fref , F3 = b2 Fref . (50) Auf der anderen Seite ist F1 = F2 + F3 und wir erhalten c2 Fref = a2 Fref + b2 Fref . (51) 2 Jetzt müssen wir nur noch den Faktor Fref kürzen. 6.4 Großer Fermatscher Satz Pierre de Fermat, dem wir in einem früheren Abschnitt begegnet sind ist aus einem anderen Grund in der Mathematik sehr bekannt. Im Zusammenhang mit dem Satz des Pythagoras weiss man, dass es unendlich viele Lösungen (a, b, c) der Gleichung a2 + b2 = c2 gibt mit a, b und c natürliche Zahlen. Wenn man eine Lösung hat, z. B. (3, 4, 5) kann man andere Lösungen bekommen in dem man a, b und c mit der gleichen natürlichen Zahl k > 1 multipliziert. Das ist zu offensichtlich, um interessant zu sein. Es gibt aber andere Möglichkeit, Lösungen zu produzieren, die auf Euklid zurückgeht. Man fängt mit zwei natürlichen Zahlen m und n an, die beliebig sind bis auf die Bedingung, dass m > n. Dann definiert man a = m2 − n2 , b = 2mn, c = m2 + n2 . (52) Diese Zahlen erfüllen a2 + b2 = c2 und es gibt einfache Bedingungen die dafür sorgen, dass a, b und c nicht alle durch die gleiche Zahl k ohne Rest teilbar sind. Ausgehend von dieser Fülle könnte man auf die Idee kommen, Lösungen von an + bn = cn zu suchen, wobei a, b und c wieder natürliche Zahlen sind und n eine natürliche Zahl grösser zwei. Eine vielleicht überraschende Tatsache ist: es gibt keine. Diese Aussage wird heutzutage als großer Fermatscher Satz bezeichnet. Es wäre aber angemessener, sie als Fermatsche Vermutung zu bezeichnen, da er sie nicht nachweislich bewiesen hat. Die Geschichte fängt damit an, dass Fermat um 1640 etwas als Randnotiz in sein Exemplar der Arithmetika des Diophantus geschrieben hat. Zuerst hat er die Aussage seines ’Satzes’ behauptet und dann folgenden berühmten Text (hier eine Übersetzung aus dem ursprünglichen Latein): Ich habe hierfür einen wahrhaft wunderbaren Beweis gefunden, doch ist der Rand hier zu schmal, um ihn zu fassen. 15 Fermat hatte einen Beweis im Spezialfall n = 4 gefunden aber im allgemeinen Fall hat er sich bestimmt vermacht. Jedenfalls wurde, trotz vieler Versuche bedeutender Mathematiker in den darauffolgenden 350 Jahren kein Beweis gefunden. Erst 1995 hat der englische Mathematiker Andrew Wiles einen Beweis vorgestellt. Sein erster Versuch enthielt noch eine Lücke aber dieser konnte mit Hilfe seines Schülers Richard Taylor geschlossen werden. Die spannende Geschichte wird in einem Buch von Simon Singh [4] erzählt. 7 Kegelschnitte Wir widmen uns nun elementargeometrischen Untersuchungen zu den ebenen Kegelschnitten Kreis, Ellipse, Hyperbel und Parabel. Wir beginnen mit der algebraischen Definition, kommen aber dann sofort zu geometrischen Charakterisierungen vermittels spezieller Abstandsregeln unter Verwendung sogenannter Brennpunkte. 7.1 Algebraische Definition von Kegelschnitten Auf algebraischer Art können wir die Kegelschnitte wie folgt charakterisieren. Ein Kegelschnitt ist die Menge der Punkte (x, y) ∈ R2 die die Beziehung ax2 + by 2 + 2cxy + dx + ey + f = 0 (53) erfüllen mit reellen Zahlen a, b, c, d, e, f . Geometrisch handelt es sich um einen Schnitt einer Ebene mit einem Kegel oder einem Zylinder. 7.2 Der Kreis Eine zur Mittelpunktsachse eines Zylinders senkrechte Ebene schneidet diese Rotationsfläche in einem Kreis. Definition Der Kreis ist eine ebene Kurve, deren Punkte P von einem fest gewählten Punkt M , dem Mittelpunkt, einen festen Abstand besitzen. Dieser fest gewählte Abstand r > 0 heisst der Radius des Kreises. Mit dem Satz von Pythagoras folgt, dass x2 + y 2 = r 2 , (54) wobei wir o.B.d.A. angenommen haben, dass M = (0, 0). Der Kreis ist geschlossen und streng konvex. D. h. die Tangente in einem Punkt hat nur einen gemeinsamen Punkt mit dem Kreis, den Berührpunkt. Im allgemeinen liegt der Mittelpunkt nicht im Koordinaten-Ursprung, sondern in einem Punkt mit Koordinaten (xM , yM ). Dann wird die Gleichung des Kreises verallgemeinert. Satz Die Punkte (x, y) eines Kreises mit Mittelpunkt (xM .yM ) ∈ R2 und Radius r erfüllt die Gleichung (x − xM )2 + (y − yM )2 = r2 . 16 (55) Der Gelehrte Eratosthenes leitete ein halbes Jahrhundert lang die Bibliothek in Alexandria, die bedeutendste Bibliothek der Antike. Er war sehr vielseitig in seinen Interessen und hat sich insbesondere mit Fragen der Astronomie beschäftigt. Seine bekannteste Errungenschaft war eine Bestimmung des Umfangs der Erde. Über der Stadt Assuan, die fast genau südlich von Alexandria liegt, steht am Mittag des Tages der Sommersonnenwende die Sonne genau im Zenit. Ein Gnomon (ein vertikaler Stab auf einem nivellierten Untergrund) wirft daher zu diesem Zeitpunkt keinen Schatten. An einem Mittag der Sommersonnenwende bestimmte Eratosthenes im nördlich gelegenen Alexandria den Winkel zwischen der Sonnenrichtung und einem vertikal positionierten Gnomon und konnte so den Winkel zwischen den Vertikalen in Assuan und Alexandria schätzen. Er kam auf die Antwort, dass dieser Winkel ein Fünfzigstel des Vollkreises war. Der Gesamtumfang der Erde beträgt also in etwa das 50-fache der Entfernung zwischen Alexandria und Assuan, d.h. ungefähr 40.200 Kilometer. Die heutige Bestimmung des Erdumfangs kommt auf 40.024 Kilometer. 7.3 Die Ellipse Eine zur Rotationsachse eines Zylinders schräge Ebene schneidet diese Fläche in einer Ellipse. Hier aber nun unsere Definition Eine Ellipse ist eine ebene Kurve, deren Punkte P konstante Abstandssumme von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten, besitzen. Der Zusammenhang zwischen der geometrischen Idee eines schrägen Schnittes mit dem Zylinder und dieser Definition ist nicht unmittelbar einsichtig und bedarf eines Beweises. Der Mittelpunkt der Gerade F1 F2 nennen wir Mittelpunkt des Ellipses und die Koordinaten werden so gewählt, dass dieser Punkt der Ursprung ist. Ausserdem können wir annehmen, dass die Gerade die die Brennpunkte verbindet auf der x-Achse liegt. Der Abstand zwischen dem Mittelpunkt und den Punkten, wo die Ellipse die x-Achse schneidet heisst große Halbachse und der Abstand zwischen dem Mittelpunkt und den Punkten, wo die Ellipse die y-Achse schneidet heisst kleine Halbachse. Der Name Brennpunkt kommt von folgender physikalischer Idee. Stellen wir uns vor, dass die Ellipse Licht das von innen kommt wie ein Spiegel zurückschickt. Dann ist die Behauptung, dass Lichtstrahlen, die von einem der Brennpunkte ausgehen im anderen Brennpunkt wieder aufeinander treffen. Die mathematische Aussage, die dieser Behauptung entspricht ist, dass wenn P ein Punkt auf der Ellipse ist, die Geraden die P mit den Brennpunkten verbinden den gleichen Winkel machen mit der Tangente zur Ellipse im Punkt P . Diese Aussage wird hier nicht bewiesen. Satz Wenn die Koordinaten wie oben beschrieben gewählt werden erfüllen die Punkte der Ellipse mit großer Halbachse a und kleiner Halbachse b die Gleichung y2 x2 a2 + b2 = 1. Beweis Seien F1 und F2 die Brennpunkte und P ein Punkt auf der Ellipse. Sei r1 = |F1 P |, r2 = |F2 P | und f = |OF1 | = |OF2 |. Für den Punkt P mit 17 Koordinaten (x, y) gilt nach dem Satz von Pythagoras r12 = (f + x)2 + y 2 = f 2 + 2f x + x2 + y 2 , (56) r22 = (f − x)2 + y 2 = f 2 − 2f x + x2 + y 2 . (57) Deshalb ist r12 − r22 = 4f x. (58) Nach der Definition gilt r1 + r2 = 2λ für eine reelle Zahl λ > 0, so dass 4f x = 2λ(r1 − r2 ) und r1 − r2 = 2f x . λ (59) Wenn wir diese Beziehung mit r1 + r2 = 2λ kombinieren bekommen wir r1 = λ + fx , λ r2 = λ − fx . λ (60) Die Gleichung der Ellipse muss natürlich in den vier Scheitelpunkten erfüllt sein. Im Scheitelpunkt rechts von F2 mit den Koordinaten (0, a) gilt 2λ = r1 + r2 = [f + f + (a − f )] + (a − f ) = 2a, (61) so dass λ = a. Im Scheitelpunkt mit den Koordinaten (0, b) gilt r1 = r2 = λ und f 2 + b2 = a2 . Wenn wir zwei Darstellungen von r12 vergleichen, die wir oben hergeleitet haben dann bekommen wir die Gleichung λ2 + 2f x + f 2 x2 = f 2 + 2f x + x2 + y 2 . λ2 (62) f 2 x2 = f 2 + x2 + y 2 . λ2 (63) Es folgt, dass λ2 + Da f 2 + b2 = a2 and λ = a schließen wir, dass b2 a2 + 1 − 2 x2 = x2 + y 2 + a2 − b2 . a (64) Durch subtrahieren von x2 + a2 von beiden Seiten bekommt man − b2 2 x = y 2 − b2 . a2 (65) Das Ergebnis folgt dann leicht. 7.4 Die Hyperbel Jetzt werden die Überlegungen des letzten Abschnitts abgeändert, um die Hyperbel zu bekommen. Betrachten wir zwei Geraden L1 und L2 im dreidimensionalen Raum, die sich in einem Punkt O schneiden. Wenn L2 um den Punkt 18 O gedreht wird, während der Winkel zwischen den zwei Geraden fest bleibt entsteht ein Doppelkegel mit Achse L1 . Die Geraden, die durch Rotation aus L2 entstehen heissen Erzeugende des Kegels. Eine zur Kegelachse Senkrechte Ebene die O nicht enthält schneidet den Kegel in einem Kreis. Wird die Ebene leicht geneigt, wird der Kreis zu einer Ellipse. Wenn sie weiter geneigt wird, bis sie mit einer Erzeugenden des Kegels parallel ist dann wird die Schnittmenge zu einer Parabel. Diese Menge ist nicht mehr beschränkt und enthält Punkte, die von O beliebig weit weg sind. Sie ist in einer der beiden Hälften des Doppelkegels enthalten. Wenn die Ebene noch weiter geneigt wird schneidet sie beide Teile des Doppelkegels und ist eine Hyperbel. Unter einer Hyperbel wollen wir in dieser Vorlesung folgende Punktmenge verstehen. Definition Eine Hyperbel ist eine ebene Kurve, deren Punkte P konstante Abstandsdifferenz von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten, besitzen. Wie im Fall der Ellipse wählen wir die Koordinaten so, dass die Brennpunkte F1 und F2 auf der x-Achse liegen und der Mittelpunkt O der Strecke, die sie verbindet der Koordinatenursprung ist. Die Halbachse a ist der Abstand von O zu den Schnittpunkten der Hyperbel mit der x-Achse. Die Exzentrizität oder Brennweite e ist der Abstand von O zu den Brennpunkten. Nach der Definition einer Hyperbel gilt ||P F1 | − |P F2 || = 2λ für eine reelle Zahl λ. Wenn eine ‘imaginäre Halbachse’ b durch a2 + b2 = e2 definiert wird, dann gilt Satz Mit der reellen Halbachse a und der imaginären Halbachse b gilt für die 2 2 Punkte (x, y) einer Hyperbel die Gleichung xa2 − yb2 = 1. Der Beweis dieser Aussage ist dem der entsprechenden Aussage für die Ellipse ähnlich und wird hier nicht ausgeführt. 7.5 Die Parabel Aus der Ellipse lässt sich durch einen Grenzübergang die Parabel konstruieren. Zu diesem Zweck ist es hilfreich, zu Koordinaten überzugehen wo der linke Scheitelpunkt der Ellipse im Ursprung liegt. In den neuen Koordinaten lautet 2 2 + yb2 = 1. Nach ausmultiplizieren der Klammer die Gleichung der Ellipse (x−a) a2 und multiplizieren mit a erhalten wir x2 ay 2 − 2x + 2 = 0. a b (66) 1 ay 2 x2 x= . + 2 b2 a (67) Anders ausgedrückt Jetzt ändern wir die Parameter so, dass a sehr groß wird während Dann geht die letzte Gleichung im Grenzfall in h a i x= y2 2b2 19 a b2 fest bleibt. (68) über, Gleichungeiner Parabel. Der linke Brennpunkt hat die x-Koordinate die q 2 a 1 − 1 − ba · a1 . Durch die Identität 1− √ 1−c= 1+ c √ 1−c die für jede Konstante c mit 0 < c < 1 gilt, sehen wir, dass ! r b2 1 b2 . a 1− 1− · = q a a b2 1 a 1+ 1− a · a (69) (70) 2 b Für a groß ist also der linke Brennpunkt in der Nähe von 2a , 0 . Der rechte Brennpunkt dagegen wandert nach unendlich in diesem Grenzfall. Die physikalischen Überlegungen die wir im Fall der Ellipse gemacht haben, sind auch im Fall der Parabel interessant. Wenn diese Strahlen an der Innenseite der Parabel gespiegelt werden dann kommen Strahlen die vom Brennpunkt ausgehen parallel hinaus. Umgekehrt treffen sich Strahlen die parallel hineinfallen und an der Parabel gespiegelt werden im Brennpunkt. Lichtstrahlen von einem weit enfernten Object, z. B. von einem Stern kommen parallel an. Dass sie durch den parabolischen Spiegel in einem Punkt konzentriert werden ist genau das, was man sich von einem Teleskop wünscht. Isaac Newton hat diese Idee benutzt, um ein Speigelteleskop zu entwerfen. 7.6 Normalformen der Kegelschnitte Die in den bisherigen Abschnitten diskutierten algebraische Formen der Kegelschnitte liegen alle in Normalform vor. Definition Unter einer Normalform der drei Kegelschnitte verstehen wir die folgenden algebraischen Darstellungen: 2 2 m) m) Ellipse. (x−x + (y−y =1 a2 b2 2 2 m) m) Hyperbel. (x−x − (y−y =1 a2 b2 2 Parabel. (y − ys ) = 2p(x − xs ) mit dem Mittelpunkt (xm , ym ) und dem Scheitelpunkt (xs , ys ). Im dritten Fall hätten wir genauso gut die Rollen von x und y vertauschen können. Die allgemeine Gleichung (53) kann durch affine Transformationen der Koordinaten vereinfacht werden. Abgesehen von Ausnahmefällen kann die Gleichung in eine der Drei Normalformen gebracht werden. Betrachten wir zuerst lineare Transformationen (x, y) 7→ (x0 , y 0 ) der Koordinaten: x0 = Ax + By, (71) y 0 = Cx + Dy. (72) Es gibt einen allgemeinen Satz der sagt, dass man dadurch erreichen kann dass die transformierten Gleichungen keinen Term der Form x0 y 0 enthalten. Diese 20 Aussage ist nicht auf quadratische Ausdrücke in zwei Variablen beschränkt - die entsprechende Aussage gilt für jede Anzahl von Variablen. Die Gleichung lautet dann ax2 + by 2 + dx + ey + f = 0. (73) Wenn a und b beide verschwinden bekommen wir einen Ausnahmefall, wo die Lösungsmenge sich auf eine Gerade reduziert. Wenn dieser Fall ausgeschlossen wird können wir ohne Beschränkung der Allgemeinheit (wenn nötig durch vertauschen von x und y) annehmen, dass a 6= 0. Durch quadratische Ergänzung bekommen wir # " 2 2 d d − 2 . (74) ax2 + dx = a x + 2a 4a Im Fall b = 0 reduziert sich die Gleichung dann auf 2 d e f d2 x+ + y+ − = 0. 2a a e 4ae (75) Es ist dann klar, dass dieser Fall eine Parabel beschreibt und dass die Gleichung schon in Normalform ist. Wenn auch b 6= 0 kann die quadratische Ergänzung auch bei y durchgeführt werden. Das Ergebnis ist 2 d2 e 2 e2 d = +b y+ + − f. (76) a x+ 2a 2b 4a 4b Falls der Ausdruck auf der rechten Seite nicht verschwindet können wir dadurch teilen und die Normalform erhalten. Wenn ab < 0 handelt es sich um eine Hyperbel. (Um die Normalform zu erreichen muss man eventuell die Koordinaten x und y vertauschen.) Wenn a und b das gleiche Vorzeichen haben wie die rechte Seite handelt es sich um eine Ellipse. Wenn die Vorzeichen von a und b dem der rechten Seite entgegengesetzt sind hat die Gleichung keine Lösungen oder, anders gesagt, die Lösungsmenge ist leer. Es bleibt noch ein weiterer 2 d2 Ausnahmefall, nämlich der Fall 4a + e4b − f = 0. Wenn a und b das gleiche Vorzeichen haben, dann besteht die Lösungsmenge aus einem Punkt. Wenn a und b unterschiedliche Vorzeichen haben dann bekommt man zwei Geraden die sich schneiden. Wir betrachten als Beispiel die Gleichung y 2 − 4x + 8y + 6 = 0, (77) also in der allgemeinen Notation a = 0, b = 1, c = 0, d = −4, e = 8 und f = 6. Quadratische Ergänzung für y liefert y 2 + 8y = (y + 4)2 − 16 und damit (78) 5 (y + 4)2 = 2 · 2 · x + . (79) 2 Es handelt sich um eine Parabel, die nach rechts geöffnet ist und den Scheitelpunkt − 52 , −4 besitzt. 21 7.7 Kepler und die Planetenbewegung Die Ellipse hat eine bedeutende Rolle in der historischen Entwicklung der Physik gespielt. In der Antike galt die Bewegung im Kreis als perfekt. Als man gesehen hat, dass die Planeten sich nicht genau in Kreisen bewegten hat man ihre Bewegung mit Hilfe von Kombinationen von Kreisen (Epizyklen) beschrieben. So entstand das ptolemäische System, das viele Jahrhunderte überlebt hat. Und mit diesem theoretischen Konstrukt konnte man die Bewegungen gut beschreiben: man musste nur genügend viele Kreise auf die richtige Weise einführen. Von einer perfekten Einfachheit war dieses System allerdings weit entfernt. Bewegung kam in dieses Gebiet durch die sehr genauen Beobachtungen der Planetenbahnen durch Tycho Brahe. Anschliessend hat Johannes Kepler, der auch Assistent von Brahe war Gesetzmässigkeiten in diesen Daten gefunden. Diese hat er in drei Gesetzen formuliert, die er 1619 veröffentlicht hat. Das erste Keplersche Gesetz besagt, dass die Bahnen der Planeten Ellipsen sind. Die Keplerschen Gesetze waren eine wichtige Grundlage für die Entwicklung der modernen Physik durch Isaac Newton. Die Arbeit von Kepler war rein phänomenologisch. Newton, dagegen hat allgemeine Theorien aufgestellt, die inbesondere die Keplerschen Gesetze reproduzieren. In diesem Zusammenhang merkt man auch, dass andere Kegelschnitte in der Himmelmechanik auftreten. Es gibt z. B. aperiodische Kometen, die nur einmal an der Erde vorbeikommen und sich auf Hyperbeln bewegen. Die bekannten wiederkehrenden Kometen bewegen sich dagegen auf Ellipsen. 8 Mengenlehre und Funktionen In diesem Abschnitt werden einige Begriffe aus der Mengenlehre in Erinnerung gerufen. Abbildungen und Funktionen werden diskutiert. 8.1 Mengen und Abbildungen Hier wird vorausgesetzt, dass die elementaren Begriffe der Mengenlehre, wie z. B. Menge, Element einer Menge, Teilmenge, Vereinigung und Durchschnitt von Mengen bekannt sind. Seien X und Y Mengen. Das Produkt X × Y ist die Menge aller Paare (x, y) mit x ∈ X und y ∈ Y . Wenn, z. B. X die Menge [a, b] aller reellen Zahlen x mit a ≤ x ≤ b ist und Y die Menge aller reellen Zahlen y mit c ≤ y ≤ d, dann ist X × Y die Menge aller Zahlenpaare (x, y) die beide Ungleichungen erfüllen oder, geometrisch gesehen, ein Rechteck in der Ebene. Eine Abbildung f von X nach Y ist, intuitiv gesehen eine Regel, die jedem Element x ∈ X ein Element y = f (x) ∈ Y zuordnet. Sie kann auch als eine Teilmenge von X × Y betrachtet werden, nämlich die Menge {(x, y) ∈ X × Y : y = f (x)}. Diese Menge heisst auch manchmal Graph von f . In dem Fall, dass X und Y die Menge der reellen Zahlen sind entspricht sie dem Begriff ’Graph’ im üblichen Sinne. Eine Abbildung heisst injektiv, wenn f (x1 ) = f (x2 ) die Beziehung x1 = x2 impliziert. Sie heisst surjektiv, wenn es zu jedem y ∈ Y ein Element x ∈ X gibt mit f (x) = y. Eine Abbildung, die sowohl injektiv als 22 auch surjektiv ist heisst bijektiv. Im Fall einer bijektiven Abbildung entspricht jedes Element x ∈ X genau einem Element f (x) von Y . Man redet auch von einer eineindeutigen Korrespondenz. Eine bijektive Abbildung f hat immer eine eindeutige Umkehrabbildung g mit der Eigenschaft, dass y = f (x) wenn und nur wenn x = g(y). Wenn f : X → Y eine Abbildung ist, und Y die Menge der reellen Zahlen ist, nennt man f oft eine Funktion. Besonders anschaulich ist der Fall, dass X auch die Menge der reellen Zahlen ist. Dann kann man die Funktion durch ihren Graphen als eine Kurve in der Ebene darstellen. Hier ist etwas Vorsicht geboten. In der Schule sehen wir Funktionen, die einen bestimmten Namen √ haben, wie Sinus oder durch einfache Formeln wie x2 oder x definiert sind. Die Graphen dieser Funktionen sind normalerweise schöne glatte Funktionen. Es gibt aber auch ganz andere Funktionen. Wenn E eine Teilmenge von X ist, dann wird die charakteristische Funktion von E, χE als die Funktion definiert, mit den Eigenschaften f (x) = 1 für x ∈ E und f (x) = 0 für x ∈ / E. Wenn X die Menge der reellen Zahlen ist und E = {x ∈ R : x > 0} dann ist χE die sogenannte Heaviside-Funktion und sie springt bei x = 0. Wir könnten aber auch E = Q wählen. Jetzt liegen sowohl Q als auch das Komplement R \ Q dicht in den reellen Zahlen. In diesem Fall springt die Funktion χE ‘überall’ und es ist nicht möglich, den Graphen zu zeichnen. 8.2 Abzählbare und überabzählbare Mengen Eine Menge X heisst endlich wenn es eine Bijektion gibt von X auf eine Menge der Form {1, 2, . . . , n} für eine natürliche Zahl n. Wenn es keine solche Bijektion gibt heisst die Menge unendlich. Wenn es eine Bijektion zwischen Mengen X und Y gibt, dann sagt man dass sie die gleiche Mächtigkeit haben und schreibt |X| = |Y |. Dieser Begriff wurde durch Georg Cantor, den Erfinder der Mengenlehre eingeführt im späten neunzehnten Jahrhundert. Intuitiv könnte man sagen, dass zwei Mengen die gleiche Mächtigkeit haben, wenn sie genauso viele Elemente haben. Bei unendlichen Mengen ist es allerdings so, dass X die gleiche Mächtigkeit haben kann wie eine echte Teilmenge von X. Wenn z. B. N die Menge der natürlichen Zahlen ist und G die Teilmenge der geraden natürlichen Zahlen dann ist die Abbildung f : N → G, n 7→ 2n eine Bijektion. Also haben beide Mengen die gleiche Mächtigkeit, obwohl die eine eine echte Teilmenge der anderen ist. Bei endlichen Mengen kann das nicht passieren. Wenn es eine Injektion von X nach Y gibt, d.h. eine Bijektion von X auf eine Teilmenge von Y schreibt man |X| ≤ |Y |. Man kann jetzt fragen ob |X| ≤ |Y | und |Y | ≤ |X| zusammen |X| = |Y | implizieren. Die Antwort auf diese Frage ist positiv und heisst Cantor-Schröder-Bernstein-Theorem. Der Beweis ist nicht einfach aber elementar in dem Sinne, dass er aus Schritten besteht die sehr einfach sind. Satz Sei X und Y Mengen, f : X → Y und g : Y → X injektive Abbildungen. Dann gibt es eine Abbildung h : X → Y die bijektiv ist. Beweis Sei Z die Menge deren Elemente die Elemente von X und Y sind, wobei angenommen wird, dass X und Y keine gemeinsamen Elemente haben. Wenn x ∈ X definieren wir eine Folge xn durch eine Vorschrift, die jetzt beschrieben 23 wird. Sei x0 = x, y0 = f (x0 ), x1 = g(y0 ), y1 = f (x1 ) und so weiter. Auf diese Weise werden xi und yi für alle i ≥ 0 definiert. Sei jetzt y−1 ein Element von Y mit x0 = g(y−1 ), wenn ein solches Element existiert. Wenn kein solches Element existiert bleibt y−1 undefiniert. Man setzt diese Prozedur fort mit den Beziehungen y−1 = f (x−1 ), x−1 = g(y−2 ) und so weiter, sofern diese Gleichungen Lösungen besitzen. Es gibt drei Möglichkeiten für einen gegeben Startwert x. Die erste ist, dass xn und yn durch diese Vorschrift für alle ganzen Zahlen n definiert werden können. Die zweite ist dass die Definition mit einem Element x−N abbricht und die dritte ist dass die Definition mit einem Element y−N abbricht. Zu jedem x ∈ X gibt es eine Folge dieser Art. Wenn zwei solche Folgen überlappen sind sie gleich. Daraus folgt, dass wenn wir für jede Folge dieser Art eine Bijektion zwischen den Elementen xn in der Folge und den Elementen yn in der Folge definieren können ist der Satz bewiesen. Wenn die Folge die zweite Möglichkeit realisiert dann können wir für diese Folge h = f wählen. Wenn die Folge die dritte Möglichkeit realisiert dann können wir h = g wählen. Im Falle der ersten Möglichkeit könnten wir h = f oder h = g wählen. Um eine eindeutige Regel zu haben wählen wir h = f . Damit ist der Beweis beendet. Dieser Beweis des Satzes soll von einem gewissen Julius König stammen. Dieser König hat auf einem internationalen Mathematikerkongress 1904 behauptet, eines der bekannten Ergebnisse von Cantor wäre fehlerhaft. Die Behauptung von König war falsch, was schon einen Tag später von einem anderen Mathematiker gezeigt wurde. Trotzdem wurde Cantor durch den Vorfall tief gekränkt und hat schon angefangen an sich zu zweifeln. Wie sieht es aus mit der Mächtigkeit von Mengen die wir gut kennen? Hat z. B. Q eine grössere Mächtigkeit als Z? Zunächst können wir beobachten, dass |Z| = |N|. Zu zeigen, dass es eine Bijektion zwischen N und einer Menge X gibt reicht es zu zeigen, dass man die Elemente von X als Folge xi , i = 1, 2, 3, . . . schreiben kann. Eine solche Menge heisst abzählbar. Für Z können wir die Folge 0, −1, 1, −2, 2, . . . wählen. Es gibt also eine Bijektion f : N → Z. Dann ist (f, f ) eine Bijektion von N × N nach Z × Z. Die Elemente der Menge N × N können als Folge geschrieben werden, z. B. als {(1, 1), (1, 2), (2, 1), (3, 1), (2, 2), (1, 3), . . .} (80) Die Menge N × N ist also abzählbar. Schreiben wir diese Folge abstrakt als {(an , bn )}. Definieren wir eine Folge von rationalen Zahlen auf der Basis der Folge von Paaren mit Hilfe der folgenden Vorschrift. Wir betrachten zunächst die Folge abnn . Dann betrachten wir nacheinander diese rationalen Zahlen. Wenn eine solche Zahl verschieden von allen Zahlen ist, die vorher in der Folge waren wird sie behalten. Wenn sie aber gleich einer früheren Zahl ist wird sie verworfen. Die reduzierte Folge enthält alle positiven rationalen Zahlen und definiert eine Bijektion von N auf die Menge der positiven rationalen Zahlen. Nennen wir diese letzte Folge cn . Die rationalen Zahlen können als die Folge {0, −c1 , c1 , −c2 , c2 , . . .} geschrieben werden und Q ist abzählbar. Eine Menge, die nicht abzählbar ist heisst überabzählbar und ein berühmter Satz von Cantor besagt, dass die reellen Zahlen überabzählbar sind. In dieser 24 Vorlesung wurde keine präzise Definition der reellen Zahlen gegeben aber es ist trotzdem möglich, die Hauptidee des Beweises von Cantor zu verstehen. Es reicht zu zeigen, dass die reellen Zahlen x die die Ungleichungen 0 ≤ x < 1 erfüllen überabzählbar sind. Diese Zahlen können durch Dezimalentwicklungen 0, a1 a2 a3 . . . (81) wobei die ai Elemente der Menge {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} sind. Es gibt eine Subtilität, die den Fall betrifft, in dem alle ai nach einem bestimmten Punkt gleich neun sind. Um diese Problematik zu vermeiden betrachten wir nur solche Folgen {an } wo dieser Umstand nicht vorkommt. Sei X die Menge von Folgen {an } von natürlichen Zahlen zwischen Null und neun mit der Eigenschaft dass es beliebig große Werte von n gibt mit an 6= 9. Es soll jetzt gezeigt werden, dass diese Menge überabzählbar ist. Dazu nehmen wir an, dass die Elemente aufgelistet werden können und produzieren einen Widerspruch. Sei amn das n-te Element der m-ten Folge in der Liste. Sei bn = ann + 1 wenn ann ≤ 7 und bn = ann − 1 sonst. Dann unterscheidet sich die Folge {bn } von jeder Folge auf der Liste, was den Widerspruch liefert. Auf diese Weise wird gezeigt, dass die reellen Zahlen überabzählbar sind. 8.3 Mengen von Teilmengen Sei X eine Menge. Die Menge aller Teilmengen von X wird oft als 2X bezeichnet. Der Grund für diese Schreibweise werden wir jetzt diskutieren. Betrachten wir den Fall, dass X eine endliche Menge ist mit n Elementen. Wie viele Teilmengen von X mit k Elementen gibt es? Wir können eine solche Menge konstruieren, in dem wir Elemente x1 , x2 , . . . xk nacheinander wählen, wobei darauf zu achten ist, dass die gewählten Elemente alle unterschiedlich sind. Für die erste Wahl gibt es n Möglichkeiten, für die zweite n − 1 Möglichkeiten, usw. Deshalb gibt es ingesamt n(n − 1) . . . (n − k + 1) (82) n! . Wenn wir uns für die Anzahl der Möglichkeiten. Diese Größe ist gleich (n−k)! Teilmengen mit k Elementen interessieren ist die Reihenfolge in der die Elemente gewählt werden unwichtig. Für eine gegebene Teilmenge gibt es k! Möglichkeiten für diese Reihenfolge. Die Anzahl der Teilmengen mit k Elementen ist also n n! /k! = (83) (n − k)! k und wir erhalten eine Interpretation für die Binomialkoeffizienten. nk ist die Anzahl der Möglichkeiten, k von n Objekten zu wählen, ohne auf die Reihenfolge zu achten. Mit diesen Informationen kommen wir auf die Frage zurück, wie viele Teilmengen einer Menge mit n Elementen es gibt. Nach den soeben gemachten Überlegungen sind es n X n n n n = + + ... . (84) k 0 1 n k=0 25 Nach der binomischen Formel ist dieser Ausdruck nichts anderes als (1 + 1)n = 2n . Deshalb ist die Anzahl der Teilmengen einer endlichen Menge X gleich 2|X| . Diese Tatsache motiviert die oben erwähnte Schreibweise 2X . 9 Graphentheorie In diesem Abschnitt geht es um Objekte, die Graphen heissen. Sie haben aber mit den Graphen, die in früheren Abschnitten eingeführt wurden nichts zu tun. Ein Graph in diesem Sinn kann folgendermassen dargestellt werden. Man hat endlich viele Punkte in der Ebene, die als Knoten bezeichnet werden und einige werden miteinander verbunden durch Geraden oder Kurven, die als Kanten bezeichnet werden. Die Knoten werden auch alternativ als Punkte, Knotenpunkte oder Ecken bezeichnet. Die Mengen der Knoten bzw. Kanten eines Graphen G werden mit V (G) bzw. E(G) bezeichnet. Ein Graph kann benutzt werden um bestimmte Beziehungen darzustellen. Betrachten wir zum Beispiel einen Wettbewerb, wo verschiedene Mannschaften aufeinander treffen. Die Spiele, die zu einem bestimmten Zeitpunkt stattgefunden haben können durch einen Graphen dargestellt werden. Nehmen wir z. B. an, dass es acht Mannschaften A, B, C, D, E, F , G und H gibt und dass die Spiele, die schon stattgefunden haben folgende sind: A gegen F , B gegen G, C gegen F , C gegen D, E gegen F , E gegen H und G gegen H. Dieser Graph kann verschieden in der Ebene dargestellt werden (mit Geraden oder Kurven, mit oder ohne Überkreuzungen der Kanten). [In der Vorlesung werden zwei Möglichkeiten gezeigt.] Eine andere Variante dieser Definition bekommt man in dem man jede Kante orientiert, so dass sie einen Anfangs- und Endknoten hat. In diesem Fall nennt man die Kanten auch Bögen und den Anfangs- bzw. Endknoten eines solchen Bogens den Kopf bzw. den Schwanz. In dem Fall spricht man von einem gerichteten Graphen. Normale Graphen (ohne Orientierung) werden manchmal als schlichte Graphen bezeichnet. In dem Fall wird nicht zugelassen, dass es mehr als eine Kante gibt, die zwei gegebene Knoten miteinander verbinden. Kanten, die einen Knoten mit sich selbst verbinden (Schlingen) sind auch nicht erlaubt. Im Folgenden bedeutet das Wort Graph, wenn es nicht weiter qualifiziert wird schlichter Graph. Allgemeinere Objekte, die Mehrfachverbindungen zwischen Knoten und Schlingen zulässen werden als Multigraphen bezeichnet, spielen aber in dieser Vorlesung kaum eine Rolle. Bei einem gerichteten Graphen sind zwei Kanten, die zwei gegebene Knoten miteinander verbinden nur dann erlaubt wenn sie entgegengesetzt orientiert sind. Schlingen sind nicht erlaubt. Jedem gerichteten Graphen kann man einen schlichten Graphen zuordnen, in dem man die Orientierung der Kanten vergisst und in jedem Fall wo zwei Kanten die gleichen zwei Knoten verbinden, diese durch eine Kante zwischen diesen zwei Knoten ersetzt. Gerichtete Graphen können benutzt werden, um Systeme von chemischen Reaktionen darzustellen. Ein Beispiel in der in der Chemie üblichen Schreibweise ist A + B → 2C. Hier sind A, B und C drei chemische Stoffe und ein 26 Molekül von A reagiert mit einem Molekül von B, um zwei Moleküle von C zu produzieren. Die Ausdrücke auf der linken und rechten Seiten der Reaktionen heissen chemische Komplexe. In diesem Beispiel sind die Stoffe (A, B, C), die Komplexe (A + B, 2C) and es gibt nur die eine Reaktion. Jetzt wird diese Beschreibung mathematisch präzisiert. Der gerichtete Graph, der ein System von chemischen Reaktionen beschreibt wird manchmal chemisches Netzwerk genannt. Ein solches Netzwerk wird durch folgende mathematische Objekte beschrieben. Es gibt endliche Mengen S, die Menge der Stoffe, C, die Menge der Komplexe, und R, die Menge der Reaktionen. Jedes Element von C ist eine Abbildung y von S nach N0 . Der Wert von y im Punkt s ∈ S wird mit ys bezeichnet. Im Beispiel sind die Komplexe (1, 1, 0) und (0, 0, 2). R = (C × C) \ (Diagonal). Anders gesagt, sind die Elemente von R geordnete Paare unterschiedlicher Elemente von C. Für ein allgemeines chemisches Netzwerk definiert man einen dazugehörigen gerichteten Graphen G in dem man V (G) = C wählt und E(G) = R. Die Kanten werden so orientiert, dass die Komplexe auf der linken bzw. rechten Seite der Reaktion den Anfangs- bzw. Endknoten entsprechen. Hier ist ein anderes Beispiel. [In der Vorlesung wird der Graph angeschrieben.] S = {A, B, C, D, E}, C = {A, 2B, A + C, D, B + E}. Die Reaktionen sind A → 2B, 2B → A, A + C → D, D → A + C, D → B + E, B + E → A + C. Wie werden Graphen mathematisch definiert? Definition Ein Graph G besteht aus zwei endlichen Mengen, der Knotenmenge V (G), die nicht leer ist und der Kantenmenge E(G), möglicherweise leer. Jedes Element von E(G) ist eine Teilmenge von V (G) mit zwei Elementen (ungeordnetes Paar von Knoten). Die Elemente von e ∈ E(G) heissen Endknoten von e. Aus der Diskussion von chemischen Reaktionen dürfte klar sein, wie man analog gerichtete Graphen definiert. Ein gerichteter Graph besteht aus einer Knotenmenge und einer Menge von geordneten Paaren von Knoten. In diesem Fall ist der Anfangsknoten das erste Element des Paares und der Endknoten das zweite. Es gibt eine Beziehung mit den Relationen, die in einem früheren Abschnitt definiert wurden. Eine Relation R heisst anti-reflexiv wenn x ∼ x nie gilt, d.h. wenn (x, x) nie zu R gehört. Deshalb ist ein gerichteter Graph G das Gleiche wie eine anti-reflexive Relation auf V (G). Wenn die Relation symmetrisch ist, dann können wir die Orientierung vergessen. Eine äquivalente Darstellung eines Graphen ist als eine Teilmenge von V (G) × V (G), die die Diagonale nicht trifft und unter Vertauschung der zwei Kopien von V (G) symmetrisch ist. Wenn es uns nutzt werden wir also E(G) als Teilmenge von V (G) × V (G) betrachten. Jetzt werden ein paar weitere Beispiele beschrieben. Das erste ist ein sogenanntes Zuteilungsproblem. Nehmen wir an, es gibt fünf Personen A, B, C, D und E, die fünf Arbeiten a, b, c, d und e ausführen sollen. Die unterschiedlichen Personen sind nur für einige der Aufgaben qualifiziert. Ist es möglich, jede Arbeit einer qualifizierten Person zu übertragen, so dass jede Person genau eine Aufgabe bekommt? Hier ist ein konkreter Fall. [Der Graph wird in der Vor- 27 lesung angeschrieben.] A ist für c und d qualifiziert, B für c, C für a, b und e, D für c und d und E für b und e. In diesem Fall ist das Problem unlösbar wie eine Betrachtung der Personen A, B und D zeigt. Diese drei Personen sind zusammen nur für die zwei Aufgaben c und d qualifiziert. Deshalb ist keine Zuordnung der gewünschten Art möglich. Im nächsten Beispiel sollen drei Häuser mit Gas, Wasser und Strom versorgt werden. Die Häuser werden durch Knoten H1 , H2 und H3 dargestellt und die drei Arten der Versorgung durch G, W und S. [Ein entsprechender Graph wird in der Vorlesung gezeigt.] Kann die Versorgung gelingen, wenn die Versorgungswege sich nicht überkreuzen dürfen? Hier ist das Problem nicht mehr als rein graphentheoretisches Problem formuliert. Es gibt eine Theorie die man darauf anwenden kann, die Theorie der planaren Graphen. Die Antwort in diesem Beispiel ist dass die gestellte Aufgabe keine Lösung zulässt. Die Anzahl der Elemente der Menge V (G) wird mit v(G) bezeichnet und heisst Ordnung von G während die Anzahl der Elemente der Menge E(G) mit e(G) bezeichnet wird und Grösse des Graphen heisst. Der triviale (oder leere) Graph mit n Knoten ist der bei dem die Menge der Kanten leer ist. Ein vollständiger Graph mit n Knoten ist einer in dem jedes Paar unterschiedlicher Kanten. Zwei Knoten durch eine Kante verbunden ist. Dieser Graph hat n(n−1) 2 Graphen G1 und G2 heissen isomorph wenn es eine bijektive Abbildung φ von V (G1 ) nach V (G2 ) gibt mit der Eigenschaft, dass (φ×φ)(E(G1 )) = E(G2 ). Zwei Graphen, die durch einen solchen Isomorphismus φ miteinander in Beziehung gesetzt werden sind im wesentlichen gleich. Zwei vollständige Graphen mit n Knoten sind isomorph und wir sprechen deshalb vom dem vollständigen Graphen mit n Knoten. Es ist nicht immer leicht zu sehen, ob zwei Graphen die durch explizite Darstellungen in der Ebene angegeben werden tatsächlich isomorph sind. Wenn G1 und G2 isomorph sind, dann müssen v(G1 ) = v(G2 ) und e(G1 ) = e(G2 ) gelten, aber nicht umgekehrt. Bei 3 Knoten gibt es nur 4 nichtisomorphe Graphen und bei 4 Knoten nur 11. Bei 7 Knoten gibt es aber schon 1044. Der Begriff des Isomorphismus ist in der Mathematik weit verbreitet, wobei die genaue Definition davon abhängt, um was für ein mathematisches Objekt es sich dabei handelt. Es sei G ein Graph. Wenn V (G) die Vereinigung zweier nichtleerer Teilmengen X und Y ist, d.h. X ∪ Y = V (G) und X ∩ Y = ∅ und jede Kante ein Ende in X und ein Ende in Y hat wird G als paarer Graph bezeichnet. Die Zerlegung heisst Zweiteilung von G. Ein vollständiger paarer Graph ist einer in dem jeder Knoten von X mit jedem Knoten von Y verbunden ist. Ein solcher Graph wird mit Km,n bezeichnet. Alle solchen Graphen mit festen Werten von m und n sind zueinander isomorph und Km,n ist isomorph zu Kn,m . 9.1 Knotengrade Ein Knoten eines Graphen G, der kein Endpunkt irgendeiner Kante ist, heisst isoliert. Eine Kante e von G heisst mit dem Knoten v inzident, wenn v ein Endknoten von e ist. In diesem Fall sagt man auch, dass v mit e inzident ist. Zwei Kanten, die mit einem gemeinsamen Knoten inzident sind heissen 28 benachbart. Zwei Knoten, die mit einem gemeinsamen Kanten inzident sind, heissen auch benachbart. Wenn v ein Knoten eines Graphen G ist, dann ist der Grad d(v) von v die Anzahl der mit v inzidenten Kanten von G. Mit diesen Definitionen hat man den Satz 9.1 Für Pn jeden Graphen mit e Kanten und n Knoten v1 . . . . , vn gilt die Beziehung i=1 d(vi ) = 2e. Beweis Jede Kante trägt zwei zu dieser Summe bei. D. h. es wird jede Kante zweimal gezählt. Ein Knoten eines Graphen heisst gerade bzw. ungerade wenn sein Grad gerade bzw. ungerade ist. Corollar In jedem Graphen G gibt es eine gerade Anzahl von ungeraden Knoten. Beweis Sei W die Menge der ungeraden Knoten von G und U die Menge P der geraden Knoten von G. für jedes u ∈ U ist d(u) gerade und deshalb ist u∈U d(u) auch gerade. Satz 1 impliziert dass X X X d(u) + d(w) = d(v) = 2e. (85) u∈U w∈W v∈V P Deshalb ist w∈W d(w) gerade. Damit dies der Fall sein kann muss die Anzahl der ungeraden Knoten gerade sein. Es muss nicht sein, dass die Anzahl der geraden Knoten ungerade ist. Ein Gegenbeispiel ist ein Quadrat, wo die Ecken die Knoten sind und die Seiten die Kanten. Ein Graph G heisst k-regulär wenn d(v) = k für jeden Knoten v. Ein Graph heisst regulär wenn er k-regulär ist für irgendeine natürliche Zahl k. Das Quadrat ist 2-regulär. Der vollständige Graph Kn is n-regulär. Der vollständiger paarer Graph Kn,n mit 2n Knoten ist n-regulär. 9.2 Untergraphen Sei H ein Graph mit der Knotenmenge V (H) und der Kantenmenge E(H) und G ein Graph mit der Knotenmenge V (G) und der Kantenmenge E(G). Dann wird H als Untergraph von G bezeichnet wenn V (H) ⊂ V (G) und E(H) ⊂ E(G). Man sagt auch, dass H ein Untergraph von G ist, wenn H isomorph zu einem Untergraphen von G ist. Wenn H ein Untergraph von G ist schreibt mann H ⊂ G. Wenn in diesem Fall H 6= G, dann heisst H ein echter Untergraph von G. Ein spannender Untergraph H von G ist einer mit den gleichen Knoten, d.h. V (H) = V (G). Jeder Graph mit n Knoten ist Untergraph des vollständigen Graphen Kn . Jetzt werden ein paar Möglichkeiten beschrieben, Untergraphen zu erzeugen. Nehmen wir an dass der Graph G so ist, dass V (G) mindestens zwei Elemente hat. Für einen Knoten v ∈ V (G) bezeichnet G − v den Untergraphen mit der Knotenmenge V (G) \ {v} und als Kanten alle Kanten von G, die nicht mit v inzident sind. Wenn wir E(G) als Teilmenge von [V (G)]2 betrachten, dann ist E(G−v) = E(G)∩[V (G−g)]2 . Um G−v von G zu erhalten entfernt man v und alle Kanten, die mit v direkt verbunden sind. G − v wird als knotengelöschter Untergraph bezeichnet. Wenn e eine Kante von G ist dann bezeichnet G − 29 e den Untergraphen von G, der die gleiche Knotenmenge hat wie G und die Kantenmenge E \ {e} hat. Um G − e von G zu erhalten entfernt man die Kante e aber nicht deren Endpunkte. G − e wird als kantengelöschter Untergraph bezeichnet. Diese Beispiele können verallgemeinert werden auf Fälle in denen mehrere Ecken oder Kanten entfernt werden. Im ersten Fall entfernt man eine Teilmenge U von V (G), zusammen mit allen Kanten, die mit Knoten aus U inzident sind. Das Ergebnis heisst dann G − U . Es gilt die Beziehung E(G − U ) = E(G) ∩ [V (G − U )]2 . Im zweiten Fall entfernt man eine Teilmenge F von E und behält alle Knoten. Das Ergebnis heisst G − F . Wenn U eine nichtleere Teilmenge der Knotenmenge V (G) ist, dann ist der durch U induzierte Untergraph G[U ] von G als der Graph G definiert, der die Knotenmenge U hat und deren Kantenmenge aus den Kanten von G besteht, die beide Enden in U haben. Es gilt die Beziehung G[U ] = G − (V (G) \ U ). Wenn F eine nichtleere Teilmenge der Kantenmenge E(G) ist, dann ist der durch F induzierte Untergraph G[F ] der Graph, dessen Knotenmenge die Menge der Kantenenden von F ist und dessen Kantenmenge F ist. In diesem Fall ist V (G[F ]) = π(F ), wo π die Projektion von [V (G)]2 auf einen der Faktoren ist. Zwei Untergraphen G1 und G2 heissen disjunkt, wenn sie keinen gemeinsamen Knoten haben. Sie heissen kantendisjunkt, wenn sie keine gemeinsame Kante haben. Disjunkt impliziert kantendisjunkt. Für zwei Untergraphen G1 und G2 von G ist die Vereinigung G1 ∪G2 der Graph mit V (G1 ∪G2 ) = V (G1 )∪ V (G2 ) und E(G1 ∪ G2 ) = E(G1 ) ∪ E(G2 ). Wenn G1 und G2 mindestens einen gemeinsamen Knoten haben ist es auch möglich, den Durchschnitt G1 ∩ G2 zu definieren durch V (G1 ∩G2 ) = V (G1 )∩V (G2 ) und E(G1 ∩G2 ) = E(G1 )∩E(G2 ). 9.3 Wege und Zyklen Eine Kantenfolge in einem Graphen ist eine endliche Folge W = v0 e1 v1 e2 v2 . . . vk−1 ek vk (86) deren Terme abwechselnd Knoten und Kanten sind, so dass, für 1 ≤ i ≤ k die Kante ei die Enden vi−1 und vi hat. Wir nennen die Kantenfolge eine Kantenfolge von v0 nach vk . Der Knoten v0 heisst Anfangsknoten von W und der Knoten vk Endknoten von W . Die Knoten v0 und vk müssen nicht voneinander verschieden sein. Die Knoten v1 , . . . , vk−1 heissen innere Knoten. Die ganze Zahl k heisst Länge der Kantenfolge W . In einer Kantenfolge darf es Wiederholungen von Knoten und Kanten geben. Die Kantenfolge ist durch die darin enthaltene Folge von Knoten bestimmt und wird entsprechend oft durch die Knotenfolge bezeichnet. Eine triviale Kantenfolge beinhaltet keine Kanten, besteht also aus einem einzigen Knoten. Eine Kantenfolge von u nach v heisst geschlossen, wenn u = v ist und offen, wenn u 6= v ist. Wenn die Kanten in W unterschiedlich sind heisst W ein Kantenzug. Wenn die Knoten in W unterschiedlich sind heisst W ein Weg. Jeder Weg ist ein Kantenzug, aber nicht umgekehrt. Wenn u und v 30 unterschiedliche Knoten sind gibt es im allgemeinen mehrere Wege von u nach v. Die Längen dieser Wege bilden eine endliche Menge von natürlichen Zahlen und diese Zahlen haben ein Minimum k. Dann haben die Wege von u nach v der Länge k die Eigenschaft, dass kein anderer Weg von u nach v kürzer ist. Wir nennen sie die kürzesten Wege von u nach v. Im allgemeinen gibt es mehrere solche Wege. Wenn W ein kürzester Weg von u nach v ist und u0 und v 0 Knoten, die zu diesem Weg gehören, dann ist der Teil von W zwischen u0 und v 0 auch ein kürzester Weg. Satz 9.2 Wenn u und v Knoten eines Graphen G sind, beinhaltet jede Kantenfolge von u nach v einen Weg von u nach v. Beweis Wenn u = v ist dann können wir den trivialen Weg nehmen. Wenn u 6= v sei die Folge von Knoten in W u = u0 , u1 , u2 , . . . , uk−1 , uk = v. (87) Wenn keiner der Knoten öfter als einmal in W vorkommt, dann ist W bereits ein Weg von u nach v. Wenn es dagegen Knoten von G gibt, die in W mindestens zweimal vorkommen dann gibt es unterschiedliche i, j mit i < j, so dass ui = uj . Wenn man die Knoten ui , . . . , uj−1 und die nachfolgenden Kanten entfernt dann erhält man eine Kantenfolge von u nach v, die weniger Knoten enthält als W . Wenn die neue Kantenfolge keine wiederholte Knoten enthält, dann haben wir schon den gesuchten Weg. Ansonsten können wir das Entfernungverfahren wiederholen. Nach endlich vielen Schritten führt diese Vorgehensweise zum Ziel. Der Knoten u wird als zusammenhängend mit einem Knoten v bezeichnet, wenn es einen Weg von u nach v gibt. Wenn u mit v zusammenhängend ist, dann ist v mit u zusammenhängend, wie man durch Umkehrung des Weges sieht. Jeder Knoten ist mit sich selbst zusammenhängend durch den trivialen Weg. Wenn u mit v zusammenhängend ist und v mit w, dann ist u mit w zusammenhängend. Man kann die Wege zusammenfügen. Dieses Verfahren heisst Verkettung der Wege. Wir können eine Relation folgendermassen definieren: u ∼ v wenn u mit v zusammenhängend ist. Die Eigenschaften, die wir gerade bewiesen haben zeigen, dass es sich dabei um eine Äquivalenzrelation handelt. Die Äquivalenzklassen heissen Komponenten oder Zusammenhangskomponenten von G. Die Äquivalenzklasse von u, C(u), besteht aus allen Knoten v mit u ∼ v. Ein Graph heisst zusammenhängend, wenn er nur eine Zusammenhangskomponente hat. Die Anzahl der Komponenten von G wird mit ω(G) bezeichnet. Bei einem gerichteten Graphen kann man ähnliche Definitionen machen. Ein gerichteter Kantenzug ist einer wo der Endpunkt jeder Kante mit dem Anfangspunkt der nächsten zusammenfällt. Ein gerichteter Weg ist dann ein gerichteter Kantenzug, der auch ein Weg ist. Der Knoten u wird als stark zusammenhängend mit einem Knoten v bezeichnet, wenn es einen gerichteten Weg von u nach v gibt und einen gerichteten Weg von v nach u. Auf diese Weise wird eine Äquivalenzrelation definiert und die entsprechenden Äquivalenzklassen heissen starke Zusammenhangskomponenten. Ein Graph heisst stark zusammenhängend, 31 wenn er nur eine starke Zusammenhangskomponente hat. Bei chemischen Netzwerken heissen die Zusammenhangskomponenten Verlinkungsklassen und die starken Zusammenhangskomponenten starke Verlinkungsklassen. Ein Netzwerk heisst reversibel wenn es zu jedem Bogen von einem Knoten u zu einem Knoten v einen Bogen von v nach u gibt. Es heisst schwach reversibel wenn es zu jedem gerichteten Weg von u nach v einen gerichteten Weg von v nach u gibt. Bei einem schwach reversiblen Netzwerk stimmen die starken Zusammenhangskomponenten mit den Zusammenhangskomponenten überein. Ein nichttrivialer geschlossener Kantenzug in einem Graphen G heisst ein Zyklus, wenn sein Anfangsknoten und seine inneren Knoten unterschiedlich sind. Ein Zyklus der Länge k, d.h. mit k Kanten, heisst ein k-Zyklus. Ein k-Zyklus heisst gerade, wenn k gerade ist und ungerade, wenn k ungerade ist. Ein 3Zyklus wird oft als Dreikreis bezeichnet. Ein n-Zyklus wird manchmal mit Cn bezeichnet. Satz 9.3 Es sei G ein nichtleerer Graph mit mindestens zwei Knoten. G ist dann und nur dann ein paarer Graph, wenn er keine ungeraden Zyklen hat. Beweis Nehmen wir an, dass G ein paarer Graph ist mit der Knotenmenge V und der Zweiteilung V = X ∪ Y . Es sei C = v0 v1 . . . vk v0 ein Zyklus von G. Nehmen wir an, dass die Notation so gewählt ist, dass v0 ∈ X. Es folgt, da G ein paarer Graph ist, dass v1 ∈ Y . Dann ist v2 ∈ X usw. Deshalb liegen die Knoten bei denen der Index gerade ist in X und die Knoten bei denen er ungerade ist in Y . Da v0 ∈ X muss vk ∈ Y . Deshalb ist k ungerade und der Zyklus ist gerade. Deshalb enthält G keine ungeraden Zyklen und die eine Richtung ist bewiesen. Um die Umkehrung zu beweisen nehmen wir an, dass G ein nichtleerer Graph ist, der keine ungeraden Zyklen enthält. Wir wollen zeigen, dass G ein paarer Graph ist. Nun wird G paar sein, wenn jede seiner Komponenten mit mehr als einem Knoten paar ist, denn wenn diese Komponenten C1 , C2 , . . . Cn sind und ihre Knotenmengen V1 , V2 , . . . Vn die Zweiteilungen V1 = X1 ∪ Y1 , C2 = X2 ∪ Y2 , . . . Cn = Xn ∪ Yn haben, dann hat die Knotenmenge V von G die Zweiteilung X ∪ Y , mit X = X0 ∪ X1 ∪ . . . ∪ Xn , Y = Y0 ∪ Y1 ∪ . . . ∪ Yn , (88) wobei X0 die Menge der isolierten Knoten in G ist. Es reicht also, um den Satz zu beweisen zu zeigen, dass jeder zusammenhängende Graph G mit mehr als einem Knoten und ohne ungerade Zyklen paar ist. Unter dieser Annahme für G definieren wir zwei Teilmengen von V (G) wie folgt. Sei u ein Knoten von G. X ist die Menge aller Knoten v ∈ G mit der Eigenschaft, dass jeder kürzeste Weg von u nach v gerade ist. Y ist die Menge aller Knoten v ∈ G mit der Eigenschaft, dass jeder kürzeste Weg von u nach v ungerade ist. Der Punkt u selbst liegt in X. Es ist klar, dass V (G) = X ∪ Y und dass X und Y kein gemeinsames Element besitzen. Wir wollen jetzt zeigen, dass X und Y eine Zweiteilung von G definieren und dazu müssen wir zeigen, dass jede Kante einen Endknoten in X hat und einen in Y . Es seien v und w zwei Knoten in X, die benachbart sind. Es sei P ein 32 kürzester Weg von u nach v und Q ein kürzester Weg von u nach w. P = v1 , v2 , . . . , v2n+1 und Q = w1 , v2 , . . . , w2m+1 (89) so dass u = v1 = w1 , v = v2n+1 , w = w2n+1 . Nehmen wir an, dass w0 ein Knoten ist, die beide Wege gemeinsam haben, und ausserdem, dass w0 der letzte derartige Knoten ist. Die Wege von u nach w0 , die durch P und Q definiert werden sind beide kürzeste Wege und haben deshalb die gleiche Länge. Die Wege P und Q sind beide gerade und deshalb sind die entsprechenden Wege von w0 nach v und w entweder beide gerade oder beide ungerade. Es gibt einen Zyklus der aus dem Teil von P von w0 nach v, eine Kante zwischen v und w und dem Teil von Q von w0 nach w besteht. Die Länge von diesem Zyklus ist die Summe von Eins mit zwei Zahlen, die entweder beide gerade sind oder beide ungerade. Der Zyklus ist also ungerade, ein Widerspruch zu den Annahmen des Satzes. Wir können schliessen, dass es keine Kanten in G gibt, die zwei Knoten in X verbinden. Es kann ganz analog gezeigt werden, dass es keine Kanten in G gibt, die zwei Knoten in Y verbinden. Deshalb ist G ein paarer Graph. 9.4 Die Matrizendarstellung eines Graphen Eine Möglichkeit, einen Graphen mit einem Computer darstellen ist die seine Nachbarschaftsmatrix. Es sei G ein Graph mit n Knoten, durchnumeriert als v1 , v2 , . . . vn . Die Nachbarschaftsmatrix von G, die von der gewählten Numerierung abhängig ist, ist die n × n Matrix A(G) = (aij ), in der aij gleich der Anzahl der die Knoten verbindenden Kanten ist. Die Einträge der Matrix aij sind alle entweder 0 oder 1. (Bei einem Multigraphen könnte man eine ähnliche Definition machen und in dem Fall würden auch andere natürliche Zahlen in der Matrix vorkommen.) Die diagonalen Elemente aii sind alle Null, weil Schlingen verboten sind. Es gilt aij = aji für alle i, j, d.h. die Matrix ist symmetrisch. Wenn eine symmetrische n × n-Matrix A mit verschwindenden Diagonaleinträgen gegeben ist können wir einen entsprechenden Graphen konstruieren. Dieser Graph hat n Knoten vi bis vn und der Knoten vi ist mit dem Knoten vj verbunden wenn und nur wenn aij = 1 ist. Betrachten wir die Matrix B = A2 mit Einträgen (bij ). Die Zahl bij ist die Anzahl von Kantenfolgen der Länge 2 von vi nach vj . Satz 9.4 Es sei G ein Graph mit n Knoten v1 , . . . vn und sei A die Nachbarschaftsmatrix von G, die sich auf diese Numerierung der Knoten bezieht. Es sei k eine positive ganze Zahl und Ak bezeichne die k-te Potenz der Matrix A. Dann entspricht der (i, j)-te Eintrag von Ak der Anzahl der unterschiedlichen Kantenfolgen der Länge k von vi nach vj . Beweis Der Beweis erfolgt durch vollständige Induktion. Für k = 1 besagt der Satz, dass der (i, j)-te Eintrag von A der Anzahl unterschiedlicher Kantenfolgen der Länge Eins von vi nach vj entspricht, was nach der Definition der Nachbarschaftsmatrix richtig ist. Eine Kantenfolge der Länge Eins ist ja nichts anderes als eine Kante, die die Knoten v1 und v2 verbindet. Damit haben wir den Induktionsanfang. 33 Um den Induktionsschritt zu vollziehen, nehmen wir an, dass das Ergebnis für Ak−1 richtig ist, wobei k eine ganze Zahl grösser Eins ist. Wir möchten beweisen, dass der Satz für Ak richtig ist. Wir schreiben Ak−1 = (bij ) und Ak = k k−1 (cij ) Dann A und, nach der Definition der Matrixmultiplikation Pn ist A = A cij = t=1 b1t atj . Nun setzt sich jede Kantenfolge der Länge k von vi nach vj aus einer Kantenfolge der Länge k − 1 von vi nach einem Knoten vt und eine Kante von vt nach vj zusammen. Für eine gegebene Wahl des Knoten vt gibt es nach der Induktionsvoraussetzung genau bij Knotenfolgen dieser Art. Um die gesante Anzahl der Knotenfolgen der Länge k von vi nach vj müssen wir diese Zahlen P über alle Knoten vt summieren, die mit vj verbunden sind. Das n Ergebnis ist t=1 b1t atj , also cij . Damit ist der Beweis vollständig. Wir können das vorherige Resultat verwenden, um zu bestimmen, ob ein Graph zusammenhängend ist oder nicht. Satz 9.5 Es sei G ein Graph mit n Knoten v1 , . . . , vn und A die Nachbarschaftsmatrix von G. Es sei B = (bij ) die Matrix B = A + A2 + . . . + An−1 . (90) G ist dann und nur dann zusammenhängend, wenn für jedes Paar von verschiedenen Indizes i, j gilt, dass bij 6= 0, dass heisst, wenn B keine Einträge Null ausserhalb der Haupdiagonalen hat. (k) Beweis Es bezeichne aij den (i, j)-ten Eintrag der Matrix Ak für k = 1, . . . , n − 1. Dann ergibt sich (1) (n−1) bij = aij + . . . aij . (91) (k) Nach dem letzten Satz ist aij die Anzahl der Kantenfolgen der Länge k von vi nach vj . Deshalb ist bij die Anzahl der Kantenfolgen deren Länge kleiner als n ist. Nehmen wir jetzt an, dass G zusammenhängend ist. Dann gibt es für jedes Paar (vi , vj ) von unterschiedlichen Knoten von G einen Weg von vi nach vj . Da G nur n Knoten hat ist die Länge des Weges nicht grösser als n − 1. Deshalb macht dieser Weg einen Beitrag zur Summe und bij > 0. Nehmen wir umgekehrt an, dass bij 6= 0 für jedes unterschiedliche Paar (i, j). Dann folgt aus der Betrachtung der obigen Summe, dass es mindestens eine Kantenfolge von vi nach vj gibt (mit einer Länge kleiner als n). Deshalb ist G zusammenhängend. Dieser Satz kann benutzt werden um zu entscheiden, ob der Graph der durch eine Nachbarschaftsmatrix definiert wird zusammenhängend ist. Betrachten wir z. B. die Matrix 0 0 1 0 0 0 0 0 1 0 A= (92) 1 0 0 0 1 . 0 1 0 0 1 0 0 1 1 0 34 In diesem Fall zeigt eine Rechnung, dass A+A +A +A = 2 3 4 3 1 3 1 4 1 3 1 3 4 3 1 7 5 4 1 3 5 7 4 4 4 4 4 8 . (93) so dass der Graph zusammenhängend ist. In diesem Fall enthält die Matrix A + A2 + A3 noch Nullen, so dass man wirklich so weit rechnen muss. 10 10.1 Bäume und Brücken Definition und einfache Eigenschaften Ein Graph G heisst azyklisch, wenn er keine Zyklen enthält. Ein Graph, der zusammenhängend und azyklisch ist heisst ein Baum. Satz 10.1 Ein Graph T ist genau dann ein Baum, wenn es zu jedem Paar (u, v) von unterschiedlichen Knoten genau einen Weg in T von u nach v gibt. Beweis Sei T ein Baum und nehmen wir an, dass es zwei unterschiedliche Wege von u nach v gibt, sagen wir P = uu1 u2 . . . um v und P 0 = uv1 v2 . . . vn v. Es sei w der erste Knoten nach u, der beiden Wegen, P und Q, gehört. Dann ist w = ui = vj für bestimmte Indizes i und j. Es folgt, dass C = uu1 . . . ui vj−1 . . . v1 ein Zyklus ist. Wir erhalten einen Widerspruch. Es folgt, dass es in der Tat nicht mehr als einen Weg von u nach v gibt und da ein Baum zusammenhängend ist, gibt es genau einen. Damit ist die eine Richtung im Satz bewiesen. Um die andere Richtung zu beweisen nehmen wir an, dass es genau einen Weg gibt zwischen jedem Paar von unterschiedlichen Knoten von T . Damit ist klar, dass T zusammenhängend ist. Es bleibt nur noch zu zeigen, dass T keine Zyklen enthält. Ein Zyklus ist von der Form C = v1 . . . vn v1 , wobei n ≥ 2 ist. Die Kante v1 vn kommt in dem Weg v1 . . . vn nicht vor und deshalb wären v1 . . . vn und v1 vn zwei verschiedene Wege von v1 nach vn , was unter der gegebenen Annahme nicht möglich ist. Damit ist der Satz bewiesen. Der nächste Satz sagt, dass jeder Baum mindestens zwei ‘Blätter’ hat. Satz 10.2 Es sei T ein Baum mit mindestens zwei Knoten und es sei P = u0 . . . un ein längster Weg in T (d.h. es gibt keinen Weg in T , der länger ist). Dann haben die beiden Knoten u0 und un den Grad 1. Beweis Nehmen wir an, dass d(u0 ) > 1. Die Kante f = u0 u1 trägt 1 zu dem Grad von u0 bei und somit muss es eine andere Kante e von u0 zu einem Knoten v von T geben. Wenn dieser Knoten v einer der Knoten des Weges P ist, dann können wir v = ui setzen und dies erzeugt einen Zyklus C = u0 u1 . . . ui u0 . Da T ein Baum ist, kann dies nicht der Fall sein. Es ist also so, dass v nicht zu P gehört. Aber dann gibt es einen Weg P1 = vu0 . . . un der Länge n + 1, was der Annahme widerspricht, dass P ein längster Weg ist. Es folgt, dass d(u0 ) = 1. Genauso kann man zeigen, dass d(un ) = 1. 35 Aus diesem Satz kann man schliessen, dass ein Baum mit mindestens zwei Knoten mehr als einen Knoten mit Grad 1 enthält. Satz 10.3 Wenn T ein Baum mit n Knoten ist, dann hat er genau n−1 Kanten. Beweis Der Beweis wird durch vollständige Induktion geführt. Wenn n = 1 dann hat T keine Kanten und die Behauptung für n = 1 stimmt. Nehmen wir jetzt an, dass die Behauptung für n = k richtig ist. Wir wollen zeigen, das die Behauptung für n = k + 1 richtig ist. Es sei T ein Baum mit k + 1 Knoten und u ein Knoten vom Grad 1 in T (was nach dem letzten Satz existiert). Sei e = uv die einzige Kante, die u als Endknoten hat. Wenn x und y zwei von u verschiedene Knoten sind, dann führt jeder Weg P , der x und y verbindet nicht durch den Knoten u. Folglich ist der Untergraph T − u zusammenhängend. Dieser Untergraph enthält keine Zyklen. Es folgt, dass T − u ein Baum ist. Durch die Induktionsvoraussetzung wissen wir, dass T − u genau k − 1 Kanten hat. Der Graph T hat genau eine Kante mehr als T − u und infolgedessen k Kanten, womit der Induktionsschritt vollzogen ist. Wenn G ein azyklischer Graph ist hat auch jeder Untergraph von G keine Zyklen. Deshalb ist jede Zusammenhangskomponente von G ein Baum. Aus diesem Grund nennt man manchmal einen azyklischen Graphen einen Wald. Aus dem Satz kann man leicht schliessen, dass ein Baum mit n Knoten und k Zusammenhangskomponenten genau n − k Kanten enthält. 10.2 Brücken Satz 10.4 Es sei e eine Kante des Graphen G. Dann gilt ω(G) ≤ ω(G − e) ≤ ω(G) + 1. Beweis Seien u und v die Endknoten von e und es sei C die Komponente zu der e, u und v gehören. e bildet einen Weg von u nach v. Nehmen wir jetzt an, dass es einen anderen Weg P von u nach v gibt. Dann gehört e nicht zu P . Also gibt es im Untergraphen G − e einen Weg von u nach v und diese zwei Knoten sind in G − e zusammenhängend. Wenn x und y zwei beliebige Knoten in C sind, gibt es einen Weg von x nach y. Immer wenn e in diesem Weg vorkommt kann er durch P ersetzt werden. Auf diese Weise bekommen wir einen Kantenzug in G − e von x nach y. Dies zeigt, dass die Knoten von C immer noch eine Komponente von G − e darstellen. Da die anderen Komponenten von G durch das Entfernen von e nicht berührt werden hat G − e in diesem Fall die gleiche Anzahl von Komponenten wie G. Es bleibt die Möglichkeit, dass e der einzige Weg von u nach v ist. Dann ist es für einen Knoten x in C entweder so (a), dass es einen Weg von x nach u gibt, der e nicht enthält oder (b), dass jeder Weg von x nach u die Kante e enthält. Im Fall a) ist x in derselben Komponente von G − e wie u. Im Fall b) muss in jedem Weg P von x nach u, da er e enthält, e die letzte Kante im Weg sein. Deshalb muss v der vorletzte Knoten sein. Dies erzeugt ein Weg von x nach v, dass e nicht enthält. Deshalb ist x in der gleichen Komponente von G − e wie v. Ausserdem sind u und v in unterschiedlichen Komponenten von G − e, da e der einzige Weg von u nach v in G ist. Deshalb zerfällt die Komponente C durch das Entfernen von e in zwei 36 Komponenten und in diesem Fall gilt ω(G − e) = ω(G) + 1. Eine Kante e eines Graphen G heisst eine Brücke wenn der Untergraph G − e mehr Komponenten besitzt als G selbst. Nach Satz 10.4 hat G − e in diesem Fall genau eine Komponente mehr als G. Satz 10.5 Eine Kante e eines Graphen ist dann und nur dann eine Brücke, wenn e nicht zu einem Zyklus von G gehört. Beweis Seien u und v die Endknoten von e. Wenn e keine Brücke ist, dann folgt aus den obigen Ausführungen, dass es einen Weg P = uu1 . . . un v gibt, in dem die Kante e nicht enthalten ist. Dann ist C = uu1 . . . un vu ein Zyklus in G. Also gehört die Kante e zu einem Zyklus, wenn sie keine Brücke ist. Anders gesagt, wenn sie nicht zu einem Zyklus gehört ist sie eine Brücke. Um die andere Hälfte des Theorems zu beweisen, nehmen wir an, dass e zu einem Zyklus C = u0 . . . um gehört. Es sei e = ui ui+1 . Dann ist P = ui ui−1 . . . u0 um−1 . . . ui+1 ein Weg von ui nach ui+1 , der nicht mit e identisch ist. Deshalb ist e keine Brücke. Satz 10.6 Es sei G ein zusammenhängender Graph. G ist dann und nur dann ein Baum, wenn jede Kante von G eine Brücke ist, d.h. wenn der Untergraph G − e für jede Kante e zwei Komponenten hat. Beweis Wenn der Graph G ein Baum ist, ist er azyklisch und keine Kante von G gehört einem Zyklus an. Mit anderen Worten ist jede Kante nach Satz 10.5 eine Brücke. Nehmen wir umgekehrt an, dass jede Kante von G eine Brücke ist. Dann kann nach Satz 10.5 G keine Zyklen enthalten. Es folgt, dass G ein Baum ist. Satz 10.7 Sei G ein Graph mit n Knoten, q Kanten und ω(G) Zusammenhangskomponenten. Dann gilt q ≥ n − ω(G). Beweis Der Beweis benutzt die vollständige Induktion, ausgehend von q = 0. Wenn ein Graph keine Kanten hat, dann hat es so viel Komponenten wie es Knoten gibt, also ist n = ω(G). Damit gilt die Aussage für q = 0, wobei in dem Fall die Gleichheit gilt. Für den Induktionsschritt nehmen wir an, dass die Aussage für einen bestimmten Wert von k gilt und es sei G ein Graph mit k + 1 Kanten. Sei e einer dieser Kanten. Dann hat der Untergraph G − e k Kanten und durch die Induktionsannahme gilt k ≥ n − ω(G − e). (94) Aus Satz 10.4 folgt ω(G−e) ≤ ω(G)+1. Wenn wir diese Ungleichung einsetzen, bekommen wir k + 1 ≥ n − ω(G). Damit ist der Induktionsschritt vollzogen. Aus diesem Satz kann man folgern, dass ein zusammenhängender Graph mit n Knoten mindestens n − 1 Kanten hat. Weil in diesem Fall ist ω(G) = 1. Satz 10.8 Es sei G ein Graph mit n Knoten. Folgende Aussagen sind äquivalent: a) G ist ein Baum b) G ist ein azyklischer Graph mit n − 1 Kanten c) G ist ein zusammenhängender Graph mit n − 1 Kanten Beweis Wir beweisen a)⇒b)⇒c)⇒a). 37 a)⇒b): Wenn G ein Baum ist, dann ist G azyklisch. Dann hat er nach Satz 10.3 n − 1 Kanten. b)⇒c): Sei G ein azyklicher Graph mit n − 1 Kanten und sei ω(G) die Anzahl von Zusammenhangskomponenten von G. Dann folgt aus der Bemerkung nach Satz 10.3, dass G n − ω(G) Kanten hat. Es folgt, dass ω(G) = 1 und dass G zusammenhängend ist. c)⇒a): Sei G ein zusammenhängender Graph mit n − 1 Kanten. Wir wollen zeigen, dass G azyklisch ist. Wenn die Aussage falsch ist, dann hat G einen Zyklus und keine Kante in diesem Zyklus ist eine Brücke. Wählen wir eine solche Kante e. Da e keine Brücke ist, ist G − e zusammenhängend. Jedoch hat G − e n − 2 Kanten und n Knoten, was unmöglich ist. Dieser Widerspruch liefert die gewünschte Aussage. 10.3 Spannende Bäume Ein spannender Baum eines Graphen G ist ein spannender Untergraph von G, der ein Baum ist. Satz 10.9 Ein Graph ist dann und nur dann zusammenhängend, wenn er einen spannenden Baum enthält. Beweis Wenn G ein zusammenhängender Graph mit n Knoten und q Kanten ist, dann folgt aus Satz 10.7, dass q ≥ n − 1. Wenn q = n − 1 dann Folgt aus Satz 10.8, dass G ein Baum ist und deshalb ein spannender Baum für sich selbst. Falls q > n − 1 dann ist G nach Satz 10.3 kein Baum und enthält deshalb mindestens einen Zyklus. Sei e1 eine Kante, die zu einem derartigen Zyklus gehört. Dann ist der Untergraph G − e1 zusammenhängend (da e1 keine Brücke ist) und hat n Knoten und q − 1 Kanten. Falls q − 1 = n − 1, dann ist T = G − e1 unter Wiederholung der obigen Beweisführung, ein spannender Baum für G. Falls q −1 > n−1, dann ist G−e1 kein Baum, so dass es wie zuvor einen Zyklus in G − e1 gibt. Das Entfernen einer Kante e2 aus einem derartigen Zyklus führt zu einem Untergraphen G − {e1 , e2 } der zusammenhängend ist und n Knoten und q − 2 Kanten hat. Wir fahren mit der Wiederholung dieses Verfahrens fort, indem wir insgesamt q − n + 1 Kanten entfernen, um schliesslich einen Untergraphen T zu erzeugen, der zusammenhängend ist und n Knoten und n − 1 Kanten hat. T ist nach Satz 10.8 ein Baum und da er dieselbe Knotenzahl hat wie G ist er ein spannender Baum für G. Wenn umgekehrt G einen spannenden Unterbaum T enthält, dann sind zwei gegebene Knoten u und v von G ebenso Knoten des zusammenhängenden Untergraphen T . Folglich sind u und v durch einen Weg in T zusammenhängend und somit auch durch einen Weg in G. Der Graph G ist also zusammenhängend. Ein spannender Baum des vollständigen Graphen Kn ist eine Art, n unterschiedliche Punkte miteinander zu Verbinden mit der minimalen Anzahl n − 1 von Kanten. Man kann fragen, wie viele solche Graphen es gibt und wie viele nicht-isomorphe. Im ersten Fall ist es so, als würde man die Punkte numerieren und bei der Zählung zwischen Kanten mit verschiedenen Nummern unterscheiden. Im zweiten Fall macht man diese Unterscheidung nicht. Bei 4 Punkten 38 gibt es 16 spannende Bäume, aber nur zwei nicht-isomorphe. Bei 6 Punkten gibt es 1296 spannende Bäume aber nur 6 nicht-isomorphe. Im Jahre 1889 hat der englische Mathematiker Arthur Cayley folgenden Satz bewiesen (den wir hier nicht beweisen) Satz 10.10 Der vollständige Graph Kn enthält nn−2 unterschiedliche spannende Bäume. Cayley, der das Wort ’tree’ (’Baum’) 1857 im Sinne der Graphentheorie eingeführt hat, interessierte sich für die Anzahl von gesättigten Kohlenwasserstoffen Cn H2n+2 . 10.4 Die Königsberger Brücken Nachdem wir uns mit Objekten der Graphentheorie beschäftigt haben, die Brücken heissen, wenden wir uns jetzt tatsächlichen Brücken, die im Zusammenhang mit den Anfängen der Graphentheorie sehr bedeutend sind. es handelt sich um Brücken in der Stadt Königsberg, der heutigen Kaliningrad. Die Lage der preussischen Stadt Königsberg an den Ufern des Flusses Pregel im 18. Jahrhundert war in etwa wir folgt. Im Fluss gab es zwei Inseln, die miteinander und mit den Ufern durch Brücken verbunden waren. [In der Vorlesung wird eine entsprechende Karte skizziert.] Die Einwohner sollen sich mit der Frage beschäftigt haben, ob es möglich sei, einen Spaziergang zu machen bei dem jede Brücke genau einmal überquert wird. Leonhard Euler hat das Problem untersucht und gezeigt, dass ein solcher Spaziergang unmöglich ist. Wir führen folgende Notation ein. Die Inseln heissen A und B und die zwei Ufer C und D. Die sieben Brücken heissen a, b, c, d, e, f und g. (Wenn man an dieser Stelle einen Multigraphen verwendet, kann man mit weniger Knoten auskommen, aber diese Alternative wollen wir vermeiden.) Ein Knoten, der eine Brücke darstellt wird mit einem Knoten, der einen Teil der Stadt darstellt genau dann wenn ein Ende der Brücke in diesem Teil der Stadt liegt. Der Knoten A ist mit a, b, d, e und f verbunden, B mit c, f und g, C mit a, b und c und D mit d, e und g. [In der Vorlesung wird der Graph gezeigt.] Die Frage ist jetzt, ob es einen Kantenzug gibt, der in L = {A, B, C, D} anfängt, alle Knoten enthält und keinen Knoten, der einer Brücke entspricht, mehr als einmal enthält. Es gibt einen Punkt von L, wo der Kantenzug startet und einen wo er endet (vielleicht den gleichen). Auf jeden Fall gibt es einen Punkt Z ∈ L, wo der Kantenzug weder startet noch endet. Wenn immer der Kantenzug in Z ankommt, muss er Z wieder verlassen und er muss alle Kanten, die von Z ausgehen genau einmal enthalten. Es folgt, dass die Anzahl von Kanten des Graphen, die von Z ausgehen, gerade sein muss. Es ist aber so, dass die Anzahl von Kanten, die von jedem Punkt von L ausgehen ungerade ist, ein Widerspruch. 11 Wahrscheinlichkeitstheorie Die Wahrscheinlichkeitstheorie ist eine mathematische Theorie, die benutzt werden kann, um Vorgänge in der Natur zu verstehen, bei denen der Zufall eine 39 wesentliche Rolle spielt. Sie ist durch Versuche entstanden, das Glücksspiel zu analysieren. Sie wird aber heutzutage sehr verbreitet in der Wissenschaft angewendet. Die Theorie wird axiomatisch aufgebaut unter Verwendung von Ideen, die in den dreissiger Jahren des letzten Jahrhunderts von Andrei Kolmogorov entwickelt wurden. Es geht darum, ein idealisiertes Zufallsexperiment zu betrachten. Beispiele solcher Experimente sind: eine Münze werfen, Känguruhs auf dem Mond zählen, ein diffundierendes Teilchen beobachten, Telefonanrufe zählen. Zunächst müssen wir uns darauf einigen, welche Ergebnisse des Experiments in Betracht gezogen werden, und welche Wahrscheinlichkeiten damit verbunden werden. Um die Wahrscheinlichkeitstheorie zu verstehen ist es wichtig, zusammen mit Kenntnissen über die mathematischen Begriffe und Theoreme ein intuitives Verständis zu entwickeln. 11.1 Empirischer Hintergrund Die Wahrscheinlichkeitstheorie bekommt ihre Bedeutung im Zusammenhang mit tatsächlichen oder gedachten Experimenten, z. B. eine Münze einmal werfen, eine Münze 100 mal werfen, drei Würfel werfen, Roulette spielen, die Lebensdauer eines radioaktiven Atoms oder eines Menschen beobachten, eine Auswahl von Personen treffen und die Anzahl der Linkshänder beobachten, zwei Pflanzenarten kreuzen und den Phänotyp der nachkommen beobachten, die übliche Qualitätskontrolle eines Produktionsprozesses, die Häufigkeit von Unfällen, usw. Diese Beschreibungen sind etwas vage und um sie zu präzisieren müssen wir entscheiden, was wir als mögliche Ergebnisse des Experiments betrachten. Wenn eine Münze geworfen wird muss sie nicht notwendigerweise Kopf oder Zahl zeigen. Sie könnte wegrollen oder auf der Kante stehen bleiben. Wir werden trotzdem annehmen, dass nur die zwei Möglichkeiten Kopf und Zahl bestehen. Diese Konvention vereinfacht die Theorie ohne ihre Anwendung einzuschränken. Es ist in der Praxis üblich, die Experimente auf diese Weise zu idealisieren. Alle Messungen sind fehlerbehaftet. Es ist aber hilfreich anzunehmen, dass die Ergebnisse präzise Zahlen sind. Z. B., welche Zahlen können als Alter eines Menschen vorkommen? Gibt es ein Maximum jenseits dessen das Leben nicht mehr möglich ist? Wir werden kaum mit der Aussage einverstanden sein, dass ein Mensch 1000 Jahre alt werden kann. Trotzdem kennt die Versicherungsmathematik keine obere Grenze für das Alter eines Menschen. Nach den entsprechenden Tabellen ist die Wahrscheinlichkeit, dass ein Mensch 36 1000 Jahre alt wird etwa Eins zu 1010 . Diese Zahl hat keine biologische oder praktische Bedeutung, widerspricht aber nicht den bekannten Beobachtungen. Es schadet nicht, diesen Fall mitzubehandeln und diese Vorgehensweise vereinfacht die Rechnungen. Die Alternative wäre ein maximales Alter festzulegen und das wäre künstlich - warum gerade diese Zahl und nicht eine etwas grössere? Um eine feste Bezeichnung zu haben werden die Alternativen, die bei einem Experiment auftreten können als Ereignisse bezeichnet. Wenn zwei Würfel geworfen werden ist ‘Summe sechs’ ein mögliches Ereignis. Es besteht aus den Fällen (1, 5), (2, 4), (3, 3), (4, 2) und (5, 1). Das Ereignis besteht aus fünf ele40 mentaren Ereignissen. Die elementaren Ereignisse werden oft auch als Ergbnisse bezeichnet und die Menge aller möglichen Ergebnisse eines bestimmten Experiments als Ergebnismenge oder Ergebnisraum. Hier sehen wir, dass ein Ereignis als Menge von Ergebnissen betrachtet werden kann. Wenn wir eine klare theoretische Definition eines Experiments formulieren wollen, müssen wir festlegen, was die Ergebnisse sind. Die einfachen Ergebnisse werden oft als Punkte bezeichnet. Ereignisse sind Mengen solcher Punkte. 11.2 Beispiele In diesem Abschnitt werden verschiedene Beispiele eingeführt. (a) Verteilung von drei Bällen in drei Zellen. Hier ist die Liste aller möglichen Zustände die bei diesem ‘Experiment’ vorkommen können. | } 10.{a | bc| } 19.{ |a | bc} 2.{ |abc| } 11.{ b |a c| } 20.{ | b |a c} 3.{ | } 21.{ | c|ab } 1.{abc| |abc} 12.{ c|ab | 4.{ab | c| } 13.{a | | bc} 22.{a | b | c} 5.{a c| b | } 14.{ b | |a c} 23.{a | c| b } 6.{ bc|a | } 15.{ c| |ab } 24.{ b |a | c} 7.{ab | | c} 16.{ |ab | c} 25.{ b | c|a } 8.{a c| |b} 17.{ |a c| b } 26.{ c|a | b } 9.{ bc| |a } 18.{ | bc|a } 27.{ c| b |a } Das Ereignis A ’eine Zelle enthält mehr als einen Ball’ wird durch die Punkte 1. bis 21. realisiert. Das Ereignis B ’die erste Zelle ist nicht leer’ wird durch die Punkte 1, 4-15 und 22-27 realisiert. Das Ergebnis ’A und B werden realisiert’ entspricht den Punkten 1 und 4-15. Jeder Punkt gehört entweder zu denen, die A entsprechen oder denen die B entsprechen oder zu beiden Klassen. Das Ereignis ’entweder A oder B oder beides werden realisiert’ entspricht der Menge aller Punkte und tritt mit Sicherheit ein. (b) zufällige Verteilung von r Bällen in n Zellen. Dieser allgemeinere Fall ist dem Spezialfall r = 3, n = 3 sehr ähnlich. Es wäre aber unpraktisch, eine explizite Tabelle aufzustellen. Für r = n = 10 gibt es 1010 Fälle und für die Tabelle bräuchte man einige hunderttausende Dicke Bände. Es ist hier unwichtig, dass wir gerade von Bällen und Zellen sprechen. In Situationen in denen diese mathematische Stuktur auftritt, kann die Realisierung dieser Elemente ganz verschieden sein. Es werden jetzt verschiedene Beispiele aufgelistet. Die Wahrscheinlichkeiten sind in diesen Beispielen nicht immer gleich. (b1) Geburtstage. Die Geburtstage von r Personen entsprechen dem Fall n = 365, wobei Schaltjahre nicht berücksichtigt werden. 41 (b2) Unfälle. Wenn r Unfälle nach dem Wochentag an dem sie passiert sind klassifiziert werden dann erhalten wir den Fall n = 7. (b3) Schiessen auf n Ziele. Die Treffer entsprechen den Bällen, die Ziele den Zellen. (b4) Bestrahlung in der Biologie. Wenn Lichtteilchen die lichtempfindlichen Zellen in der Netzhaut treffen, dann sind die Photonen die Bälle und die ’Zellen’ des abstrakten Modells sind die biologischen Zellen. Bei der Untersuchung der genetischen Auswirkung einer Bestrahlung durch α-Teilchen sind die Teilchen die Bälle und die Chromosomen die Zellen. (b5) ein Aufzug fährt mit r Personen los und hält in n verschiedenen Stockwerken und wir betrachten die verschiedenen Möglichkeiten, wie viele Personen in welchen Stockwerken aussteigen. (b6) r mal würfeln ist der Fall n = 6. Münzen werfen entspricht dem Fall n = 2. (b7) Zufallszahlen. Ein zufälliger Zahl mit r Ziffern entspricht dem Fall n = 10 des allgemeinen Modells. Die Zellen sind in diesem Fall die natürlichen Zahlen zwischen 0 und 9. c) Ununterscheidbare Bälle. Wir kehren zurück auf den Fall a) aber nehmen an, dass es nicht möglich ist, zwischen den Bällen zu unterscheiden. Dann gibt es z. B. keinen Unterschied zwischen den Fällen 4., 5. und 6. oben. Die verschiedenen möglichen Fälle sind dann nur noch 1.{∗ ∗ ∗| | 2.{ |∗∗∗| 3.{ | } 6.{∗ | ∗ ∗ | } 7.{∗ | | ∗ ∗∗} 4.{∗ ∗ | ∗ | 5.{∗ ∗ | 8.{ } 9.{ } |∗∗ } | ∗ ∗ |∗ } |∗ |∗∗ } |∗ } 10.{∗ | ∗ |∗ } (95) Ob die Bälle als unterscheidbar betrachtet werden is eine Frage der Modellierung. Die Personen in (b5) können vermutlich leicht voneinander unterschieden werden aber die Unterschiede zwischen Ihnen sind vielleicht irrelevant für das, was wir modellieren wollen. Man könnte das Experiment betrachten, wo die Bewegungen der Personen nicht direkt, sonderen nur durch einen Bewegungsmelder beobachtet werden. Die Würfel in (b6) haben vielleicht verschiedene Farben, so dass man sie unterscheiden kann, Die Farben werden aber für die meisten Spiele in denen die Würfel eingesetzt werden ohne Bedeutung sein. d) Münzen werfen. Wenn man eine Münze dreimal wirft, dann gibt es folgende acht Möglichkeiten: KKK, KKZ, KZK, ZKK, KZZ, ZKZ, ZZK, ZZZ (96) Das Ergebnis A, ’zweimal oder mehr Kopf’ is die Menge der ersten vier Möglichkeiten. Das Ergebnis B, ’nur einmal Zahl’ ist die Menge {KKZ, KZK, ZKK}. 42 11.3 Der Ergebnisraum Wenn wir hier von Wahrscheinlichkeiten sprechen, dann nur im Zusammenhang mit einem gegebenen Ergebnisraum und seinen Punkten, die als gegeben betrachtet werden. Ein Ereignis A ist eine Teilmenge des Ergebnisraums. Im Beispiel a) ist die Menge U = {1, 7, 13} ein Ereignis im Sinne dieser Definition. Es gibt verschiedene äquivalente Möglichkeiten, diese Menge zu beschreiben. Zum Beispiel ist U das Ereignis, dass folgende drei Bedingungen alle erfüllt sind: die zweite Zelle ist leer, der Ball a ist in der letzten Zelle und der Ball b erscheint nie nach c, Hier wird ein Ereignis beschrieben als Kombination von verschiedenen anderen Ereignissen. Jetzt werden Möglichkeiten eingeführt, Ereignisse zu kombinieren. 11.4 Beziehungen zwischen Ereignissen Wir nehmen jetzt an, dass ein fester Ergebnisraum S gegeben ist. Grosse Buchstaben bezeichnen Ereignisse und kleine Buchstaben Punkte von S. Die Leere Menge ist ein Ereignis und kann im Rahmen der Wahrscheinlichkeitstheorie als ein unmögliches Ereignis betrachten werden. Das Komplement S \ A der Menge A hat die Interpretation, dass das Ereignis A nicht stattfindet. Wenn A und B Ereignisse sind, dann hat das Ereignis A ∪ B die Interpretation, dass A oder B (oder beide) stattfindet. Das Ereignis A ∩ B hat die Interpretation, dass A und B stattfinden. Wenn A ∩ B = ∅ sagt man, dass die Ereignisse A und B sich gegenseitig ausschliessen. Die Vereinigungen und Durchschnitte von mehr als zwei Ereignissen haben natürlich entsprechende Interpretationen. Man sagt, dass Ereignisse A1 , A2 , A3 , . . . sich gegenseitig ausschliessen, wenn Ai ∩ Aj = ∅ für alle i 6= j. A ⊂ B bedeutet, dass B immer dann stattfindet, wenn A stattfindet. Mit anderen Worten, A impliziert B. Damit haben wir die gängigen Begriffe der Mengenlehre mit Begriffen, die sich auf Experimente beziehen, im Fall, dass die Menge ein Ereignisraum ist in Verbindung gebracht. Betrachten wir Beispiel a). Sei Ei das Ereignis, dass die Zelle i leer ist. Seien Si , Di , Ti die Ereignisse, dass die Zelle I einen, zwei oder drei Bälle enthält. Dann ist E1 ∩ E2 = T3 , S1 ∩ S2 ⊂ S3 , D1 ∩ D2 = ∅. 11.5 Diskrete Ergebnisräume Die einfachsten Ergebnisräume sind die, die nur endlich viele Punkte enthalten. Man kann sie sich relativ leicht vorstellen. Es ist aber so, dass auch unendliche Ergebnisräume nützlich sind. Betrachten wir z. B. das Experiment, dass wir eine Münze so lange werfen, bis sich ein Kopf zeigt. Die Punkte des Ergebnisraums sind dann E1 = K, E2 = ZK, E3 = ZZK, E4 = ZZZK usw. Wie können auch eventuell die Möglichkeit in Betracht ziehen das K nie auftritt. Wenn wir dass machen, dann muss diese Möglichkeit durch einen zusätzlichen Punkt E0 dargestellt werden. In diesem Fall ist der Ergebnisraum abzählbar. Ein Ergebnisraum heisst diskret, wenn sie endlich ist oder unendlich aber abzählbar. Wir wissen, dass nach dem Satz von Cantor die reellen Zahlen 43 überabzählbar sind. Es ist also durchaus möglich, Ergebnisräume zu betrachten, die nicht diskret sind. Im Folgenden betrachten wir aber nur diskrete Ergebnisräume. 11.6 Wahrscheinlichkeiten in diskreten Ergebnisräumen: Vorbereitungen In der Wahrscheinlichkeitstheorie nehmen wir an, dass die Wahrscheinlichkeiten von bestimmtem Ereignissen gegeben sind. Wir sagen aber nichts darüber wie sie in der Praxis bestimmt werden. Betrachten wir z. B. eine ideale Münze, die wenn sie sehr oft geworfen wird, ungefähr gleich oft Kopf und Zahl zeigt. Keine echte Münze hat diese Eigenschaft und es bleibt etwas unklar, wie oft man werfen muss, um diese Eigenschaft festzustellen. Die ideale Münze ist trotzdem ein nützlicher Begriff in der Wahrscheinlichkeitstheorie und lässt sich manchmal gut anwenden. Für eine ideale Münze sagen wir, dass die Wahrscheinlichkeit, dass die Münze Kopf zeigt bei einem gegebenen Wurf 12 ist, oder dass Kopf und Zahl gleich wahrscheinlich sind. Wenn die Münze n-mal geworfen wird haben alle möglichen Ergebnisse die gleiche Wahrscheinlichkeit. Betrachten wir jetzt das Beispiel von unterscheidbaren Bällen. Im Beispiel a) ist es natürlich anzunehmen, dass jeder Punkt im Ergebnisraum gleich wahrscheinlich ist. Jeder 1 mögliche Punkt hat die Wahrscheinlichkeit 27 . Ob diese Wahl angemessen ist hängt von der Anwendung ab. In den Beisnnen, scheint es vernünftig, die Wahrscheinlichkeiten aus dem letzten Beispiel zu übernehmen. Dann haben die Fälle 1.-10. die Wahrscheinlichkeiten 1 1 1 1 1 1 1 1 1 2 , , , , , , , , , (97) 27 27 27 9 9 9 9 9 9 9 In der kinetischen Theorie der Gase wurden früher solche Wahrscheinlichkeiten benutzt für die Zustände der Gasmoleküle. Dies führt auf die sogenannte Maxwell-Boltzmann-Verteilung. In Wirklichkeit werden die Moleküle durch die Quantentheorie beschrieben und verhalten sich ganz anders. Das Analogon der daraus enstehenden Bose-Einstein-Verteilung im Falle der ununterscheidbaren 1 Bälle ist dass alle zehn Möglichkeiten die gleiche Wahrscheinlichkeit 10 besizten. Diese Bemerkungen sollen darauf hinweisen, dass die Wahl von Wahrscheinlichkeiten nicht selbstverständlich ist, sondern ein wichtiger Teil des Modellierungsprozesses. 11.7 Fundamentale Definitionen und Regeln Wenn ein diskreter Ergebnisraum S gegeben ist, wird jedem Punkt Ei von S eine Zahl P (Ei ) zugeordnet, die Wahrscheinlichkeit von Ei . Für jeden Punkt Ei ist die entsprechende Wahrscheinlichkeit nicht negativ and die Summe der Wahrscheinlichkeiten aller Punkte ist Eins. Es wird zugelassen, dass P (Ei ) = 0 für einen Punkt Ei und die Bedeutung ist, dass Ei unmöglich ist. Dies mag unnatürlich erscheinen und wir könnten solche Punkte aus dem Raum entfernen. In der Praxis ist es aber nützlich, sie zu behalten. Man weiss nicht immer im 44 voraus, welche Wahrscheinlichkeiten Null sind. Die Wahrscheinlichkeit P (A) von einem Ereignis A ist die Summe der Wahrscheinlichkeiten P (Ei ) über alle Punkte Ei ∈ A. Die Wahrscheinlichkeit des ganzen Raums ist P (S) = 1 und für alle Ereignisse A gilt 0 ≤ P (A) ≤ 1. Seien jetzt A1 und A2 zwei beliebige Ergebnisse. Wir möchten P (A1 ∪ A2 ) untersuchen. Es ist klar, dass P (A1 ∪ A2 ) ≤ P (A1 ) + P (A2 ). Der Unterschied ist, dass man im Ausdruck auf der rechten Seite bestimmte Punkte zweimal zählt. Es gilt die Beziehung P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 ∩ A2 ). (98) Wenn A1 und A2 sich gegenseitig ausschliessen, dann ist P (A1 ∪ A2 ) = P (A1 ) + P (A2 ). Betrachten wir das Beispiel bei dem eine Münze zweimal geworfen wird. Der Ergebnisraum besteht aus vier Punkten KK, KZ, ZK und ZZ. Seien A1 bzw. A2 die Ereignisse ’das erste mal Kopf’ und ’das zweite mal Kopf’. Dann ist A1 = {KZ, KK} und A2 = {ZK, KK}. Dann ist P (A1 ∪ A2 ) = 3 1 1 1 + − = . 2 2 4 4 (99) Die Ungleichung für die Vereinigung von zwei Ereignissen kann auf n Ereignissen verallgemeinert werden, oder sogar auf unendlich viele P (A1 ∪ A2 ∪ . . .) ≤ P (A1 ) + P (A2 ) + . . . . (100) Wenn die Ereignisse Ai sich gegenseitig ausschliessen, dann gilt die Gleichheit in dieser Beziehung. 11.8 Bedingte Wahrscheinlichkeit Wir fangen mit einem Beispiel an. Angenommen eine Population von N Menschen enthält NA farbenblinde und NH Frauen. Seien die Ereignisse, dass eine zufällig gewählte Person farbenblind bzw. eine Frau A bzw. H. ‘Zufällig gewählt’ bedeutet, dass die Wahrscheinlichkeit gewählt zu werden für alle Personen gleich ist. Daraus folgen die Wahrscheinlichkeiten P (A) = NA , N P (H) = NH . N (101) Wir betrachten jetzt die Population von Frauen. Die Wahrscheinlichkeit, dass eine Person die aus dieser Population zufällig gewählt wird farbenblind ist ist N , wobei NH,A die Anzahl der farbenblinden Frauen ist. Hier ist kein gleich NH,A H neuer Begriff benutzt worden, aber wir brauchen eine neue Notation, um klar zu machen, von welcher Population wir reden. Man schreibt P (A|H) und nennt diese Grösse die Wahrscheinlichkeit eines Ereignisses A (Farbenblindheit) unter der Voraussetzung des Ereignisses A (die gewählte Person ist eine Frau). In Symbolen NH,A P (A ∩ H) P (A|H) = = . (102) NH P (H) 45 Diese Formel definiert die bedingte Wahrscheinlichkeit P (A|H) für ein beliebiges Ereignis A und ein beliebiges Ereignis H mit P (H) 6= 0 (Hypothese). Die bedingte Wahrscheinlichkeit eines Ereignisses A ist eine übliche Wahrscheinlichkeit, wo der Ergebnisraum durch die Hypothese gegeben wird. Deshalb gelten viele Eigenschaften von absoluten Wahrscheinlichkeiten auch für bedingte Wahrscheinlichkeiten. Z. B. P (A1 ∪ A2 |H) = P (A1 |H) + P (A2 |H) − P (A1 ∩ A2 |H). (103) Die Definition der bedingten Wahrscheinlichkeit kann umgeschrieben werden als P (A ∩ H) = P (A|H)P (H). Wenn wir A = A1 und H = A2 ∩ A3 setzen bekommen wir die Beziehung P (A1 ∩ A2 ∩ A3 ) = P (A1 |A2 ∩ A3 )P (A2 |A3 )P (A3 ). (104) Diese Formel kann ohne weiteres auf eine beliebige Anzahl von Ereignissen verallgemeinert werden. Folgende Formel ist manchmal nützlich. Seien H1 , H2 , . . . Hn Ereignisse, die sich gegenseitig ausschliessen und von denen eines stattfinden muss. (Das heisst, die Vereinigung der Hi ist der ganz Ereignisraum.) In Symbolen A = (A ∩ H1 ) ∪ (A ∩ H2 ) ∪ . . . ∪ (A ∩ Hn ). (105) In diesem Fall gilt P (A) = n X P (A|Hj )P (Hj ). (106) j=1 11.9 Urnenmodelle Manchmal werden die Wahrscheinlichkeiten in einem bestimmten Modell durch bedingte Wahrscheinlichkeiten definiert. Mit anderen Worten: wir verlangen, dass bestimmte bedingte Wahrscheinlichkeiten bestimmte Werte haben und daraus müssen die absoluten Wahrscheinlichkeiten berechnet werden. Eine bekannte Klasse von Modellen dieser Art sind die sogenannten Urnenmodelle. Betrachten wir eine Fabrik, wo Unfälle passieren können. Diese Situation können wir als eine Art übermenschliches Glücksspiel betrachten. Der Schicksal hat eine Urne in der es schwarze und rote Bälle gibt. In regelmässigen zeitlichen Abständen wird ein Ball der Urne entnommen und ein roter Ball bedeutet, dass ein Unfall passiert. Wenn die Wahrscheinlichkeit eines Unfalls konstant bleibt, dann ist die Zusammensetzung der Urne immer gleich. Es ist aber denkbar, dass der Unfall Nachwirkungen hat, wodurch die Wahrscheinlichkeit eines späteren Unfalls erhöht oder verringert wird. Diese Situation entspricht einer Urne, deren Zusammensetzung von den Ergebnissen der Ziehungen abhängt, die schon stattgefunden haben. Es gibt verschiedene Möglichkeiten, Regeln zu erfinden, die ein solches Modell definieren. Hier betrachten wir nur ein Beispiel. Eine Urne enthält b schwarze und r rote Bälle. Ein Ball wird zufällig gezogen. Er wird wieder in die Urne gelegt und dazu werden c Bälle der gezogenen Farbe und d Bälle der anderen Farbe hinzugefügt. Jetzt wird erneut aus der 46 Urne gezogen, der inzwischen r + b + c + d Bälle enthält und diese Prozedur wird wiederholt. Dabei sind c und d beliebige ganze Zahlen. Sie dürfen negativ gewählt werden, wobei es in dem Fall passieren kann, dass die Prozedur nach endlich vielen Schritten aufhört, weil nicht genug Bälle übrigbleiben. Im Fall c = −1 und d = 0 haben wir das Modell von zufälligen Ziehungen ohne Ersatz, in dem die Prozedur nach r + b Schritten aufhört. Dieses intuitive Bild soll jetzt in Mathematik übersetzt werden, wobei die Formulierung bedingte Wahrscheinlichkeiten verwendet. Ein typischer Punkt des Ergebnisraums kann man durch eine Folge von Buchstaben B und R darstellen. Das Ereignis ‘schwarz bei der b . Wenn der erste Ball schwarz ist, ersten Ziehung’ hat die Wahrscheinlichkeit b+r dann ist die bedingte Wahrscheinlichkeit eines schwarzen Balls bei der zweiten Ziehung b+c . (107) b+r+c+d Die absolute Wahrscheinlichkeit der Folge BB ist also b b+c . (108) b+r b+r+c+d Die Wahrscheinlichkeit von BBB ist die soeben genannte mal (b + 2c)/(b + r + 2c + 2d) usw. Auf diesem Weg können die Wahrscheinlichkeiten von allen Ergebnispunkten berechnet werden. Man kann durch Induktion beweisen, das die Wahrscheinlichkeit von allen Punkten sich zu Eins addieren. Es ist im allgemeinen schwer, explizite Ausdrücke für die Wahrscheinlichkeiten zu bekommen. Eine Ausnahme ist der wichtigste und bekannteste Spezialfall, das Urnenschema von Polya. Dieses Schema wird durch d = 0, c > 0 charakterisiert. Es liefert ein grobes Modell für eine Infektionskrankheit. Die Wahrscheinlichkeit, das nach n1 + n2 Ziehungen die ersten n1 Bälle schwarz und die verbleibenden n2 rot sind ist b(b + c)(b + 2c) . . . (b + n1 c − c)r(r + c) . . . (r + n2 c − c) . (109) (b + r)(b + r + c)(b + r + 2c) . . . (b + r + nc − c) Betrachten wir jetzt eine beliebige Ziehung von n1 schwarzen und n2 roten Bällen. Wenn wir die Wahrscheinlichkeit berechnen finden wir die gleichen Faktoren, nur in einer anderen Reihenfolge. Es folgt, dass alle Folgen von n1 schwarzen und n2 roten Bällen die gleiche Wahrscheinlichkeit haben. Die Einfachheit des Polya-Modells ist eine Folge dieser Eigenschaft. Um die Wahrscheinlichkeit pn1 ,n zu bekommen, dass n Ziehungen n1 schwarze und n2 rote Bälle in beliebiger Reihenfolge produzieren müssen wir die Wahrscheinlichkeit oben mit n multiplizieren, der Anzahl der möglichen Reihenfolgen. Die Benutzung von n1 allgemeinen Binomialkoeffizienten erlaubt es, das Ergebnis in folgender Form zu schreiben: b r pn1 ,n = −c −c n1 n2 − b+r c n (110) Dazu bleibt zu erklären, was unter ‘allgemeinen Binomialkoeffizienten’ zu verstehen ist. Wir haben die Grösse nk für natürliche Zahlen definiert und es gilt 47 die Beziehung n n(n − 1) . . . (n − k) = . k k(k − 1) . . . 1 (111) Wir können beobachten, dass so lange k eine natürliche Zahl ist der letzte Ausdruck für beliebige reelle Zahlen n sinnvoll ist. Er kann also benutzt werden, um die Definition der Binomialkoeffizienten zu erweitern. References [1] Clark, J. und Holton, D. A. Graphentheorie. Spektrum Akademischer Verlag, Heidelberg. [2] Feller, W. 1950 An introduction to probability theory and its applications. Wiley, New York. [3] Nowak, M. A. und May, R. M. 2000 Virus Dynamics. Oxford University Press, Oxford. [4] Singh, S. 2000 Fermats letzter Satz - die abenteuerliche Geschichte eines mathematischen Rätsels. DTV, München. 48