MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK UND WIRTSCHAFTSINFORMATIK (DISKRETE MATHEMATIK) IM WINTERSEMESTER 2015/16 STEFAN GESCHKE Inhaltsverzeichnis Einleitung 3 Literatur 3 1. Aussagen, Mengen und Boolesche Algebra 4 1.1. Mengen 4 1.2. 1.3. Elementare Logik Mengenoperationen 4 8 1.4. Abbildungen 10 1.5. Boolesche Algebra 12 2. Elementare Zahlentheorie 15 2.1. Das Summenzeichen 15 2.2. Natürliche Zahlen und vollständige Induktion 16 2.3. Ganze und rationale Zahlen 25 2.4. Die reellen Zahlen 27 2.5. Teilbarkeit, Primzahlen und der euklidische Algorithmus 29 2.6. Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches 31 2.7. Modulare Arithmetik 33 Elementare Kombinatorik 36 3. 3.1. Ziehen von Elementen einer Menge 43 3.2. Der Multinomialsatz 45 3.3. Das Schubfachprinzip (pigeonhole principle) 45 3.4. Das Prinzip der Inklusion und Exklusion (Siebformel) 46 3.5. 4. Die Abzählbarkeit von Q und die Überabzählbarkeit von R Relationen 48 51 4.1. Partitionen und Äquivalenzrelationen 52 4.2. Ordnungsrelationen 53 4.3. Hüllenbildungen 55 4.4. n-stellige Relationen 57 4.5. 58 5. Mehr über Abbildungen Graphen 61 5.1. Grundlegende Definitionen 61 5.2. Eulersche Linien und Hamiltonsche Kreise 1 68 2 STEFAN GESCHKE 5.3. Gerichtete Graphen 71 5.4. Bäume 73 Breiten- und Tiefensuche 74 5.5. 6. 6.1. 7. Elementare Zahlentheorie (Fortsetzung) RSA-Verschlüsselungsverfahren Gruppentheorie 77 83 85 7.1. Algebraische Strukturen, Halbgruppen und Monoide 85 7.2. Gruppen 87 7.3. Die Ordnung eines Gruppenelements 90 7.4. Isomorphie von Gruppen 91 7.5. Zyklische Gruppen 92 7.6. Untergruppen und Nebenklassen 94 7.7. Permutationen 99 8. Ringe, Körper und Polynome 102 8.1. Ringe 102 8.2. Der Polynomring K[X] 103 8.3. Polynomfunktionen und Nullstellen von Polynomen 110 8.4. Vektorrechnung und Matrizenringe 114 MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 3 Einleitung In der Mathematik I für Studierende der Informatik und Wirtschaftsinformatik beschäftigen wir uns neben allgemeinen mathematischen Grundlagen mit der sogenannten diskreten Mathematik. Dieses Skript orientiert sich an dem dem Skript von Thomas Andreae [2] aus dem Wintersemester 2013/2014. Die anderen Bücher in der Literaturliste stellen eine gute Ergänzung dar. Literatur [1] M. Aigner, Diskrete Mathematik, vieweg studium: Aufbaukurs Mathematik, Friedr. Vieweg & Sohn, Wiesbaden, 2004 [2] T. Andreae, Mathematik I für Studierende der Informatik und Wirtschaftsinformatik (Diskrete Mathematik), Skript zur gleichnamigen Vorlesung im Wintersemester 2013/2014, Universität Hamburg [3] R. Diestel, Graphentheorie, 4. Auflage, Springer, 2010 [4] G. Fischer, Lineare Algebra, 18. Auflage, Springer, 2014 [5] G. M. Gramlich, Lineare Algebra, 2. Auflage, Carl Hanser Verlag GmbH & Co. KG, 2009 [6] J. Matousek, J. Nesetril, An Invitation to Discrete Mathematics, Oxford University Press, second edition, 2008 [7] A. Steger, Diskrete Strukturen, Band 1, 3. Auflage, Springer, 2008 [8] G. Teschl, S. Teschl, Mathematik für Informatiker, Band 1 (Diskrete Mathematik und Lineare Algebra), 3. Auflage, Springer, 2008 [9] V. Turau, Algorithmische Graphentheorie, Oldenbourg Wissenschaftsverlag, 2009 4 STEFAN GESCHKE 1. Aussagen, Mengen und Boolesche Algebra 1.1. Mengen. Definition 1.1. Eine Menge ist eine Zusammenfassung bestimmter, wohlunterschiedener Objekte, die die Elemente der Menge genannt werden. Bei Mengen kommt es nicht auf die Reihenfolge der Elemente an. Auch können Elemente in einer Menge nicht mehrfach vorkommen. Eine Menge ist durch ihre Elemente eindeutig bestimmt. Daher schreiben wir A = B für zwei Mengen A und B, wenn A und B dieselben Elemente haben. Definition 1.2. Ist x ein Element der Menge M , so schreiben wir x ∈ M . x 6∈ M bedeutet, dass x kein Element von M ist. Sind A und B Mengen, so schreiben wir A ⊆ B, wenn A eine Teilmenge von B ist, also wenn jedes Element von A auch Element von B ist. Die (eindeutig bestimmte) Menge, die keine Elemente hat, heißt die leere Menge. Sie wird als {} oder ∅ notiert. Mengen kann man notieren, indem man ihre Elemente in geschweiften Klammern angibt. {4, 7, 13} bezeichnet zum Beispiel die Menge, deren Elemente die genau die Zahlen 4, 7 und 13 sind. Da es nur auf die Elemente selbst und nicht auf deren Reihenfolge ankommt, bezeichnen {3, 4, 5} und {4, 5, 3} dieselbe Menge. Wenn ein Element mehrfach genannt wird, so wird das ignoriert, da eine Menge jedes Element nur einmal enthält. Daher bezeichnen {1, 2, 1, 1} und {1, 2} dieselbe Menge. Z = {. . . , −1, 0, 1, 2, . . . } ist die Menge der ganzen Zahlen. N ist die Menge {1, 2, 3, . . . } der natürlichen Zahlen. (Viele Autoren lassen die natürlichen Zahlen bei 0 anfangen. Wir folgen hier jedoch Andreae [2] und den Teschls [8].) N0 sei die Menge der natürlichen Zahlen zusammen mit der 0, also N0 = {0, 1, 2, . . . }. {n : n ist eine natürliche Zahl mit 5 < n < 10} ist die Menge der natürlichen Zahlen , die echte größer als 5 und echt kleiner als 10 sind, also die Menge {6, 7, 8, 9}. Auf diese Weise kann man auch unendliche Mengen notieren. So ist {n : n ist eine durch 2 teilbare natürliche Zahl} die Menge der geraden natürlichen Zahlen. 1.2. Elementare Logik. Definition 1.3. Eine Aussage ist ein Satz, von dem man im Prinzip eindeutig feststellen kann, ob er wahr oder falsch ist. Ob eine Aussage wahr oder falsch ist, ist der Wahrheitswert der Aussage. Der Wahrheitswert „wahr“ wird dabei oft mit „w“ oder „1“ abgekürzt, der Wahrheitswert „falsch“ mit „f “ oder „0“. Der Satz „Die Straße ist nass“ ist eine Aussage. Ebenso sind „2 + 5 = 7“ und „2+5 < 3“ Aussagen, wobei die erste wahr und die zweite falsch ist. „Guten Abend!“ MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 5 ist keine Aussage. Ebenso ist „n2 = 4“ keine Aussage, da wir nicht feststellen können, ob diese Formel wahr oder falsch ist, solange wir nicht wissen, was n ist. Aussagen können mit den logischen Verknüpfungen „und“, „oder“ und „nicht“ verknüpft werden. Allerdings ist die Bedeutung dieser Wörter in der Umgangssprache nicht immer ganz eindeutig. Daher ist es sinnvoll, diese Verknüpfungen für formale Zwecke zu präzisieren. Definition 1.4. Ist a eine Aussage, so ist die Negation von a die Aussage, die genau dann wahr ist, wenn a falsch ist. Die Negation von a wird ¬a geschrieben und „nicht a“ gelesen. Sind a und b Aussagen, so ist die Konjunktion von a und b die Aussage, die genau dann wahr ist, wenn sowohl a als auch b wahr ist. Die Konjunktion von a und b wird a ∧ b geschrieben und „a und b“ gelesen. Die Disjunktion von a und b ist die Aussage, die genau dann wahr ist, wenn mindestens eine der Aussagen a und b wahr ist. Die Disjunktion von a und b wird a ∨ b geschrieben und „a oder b“ gelesen. Den Wahrheitswert einer durch logische Verknüpfungen aus anderen Aussagen gebildeten Aussage in Abhängigkeit der Wahrheitswerte der Ausgangsaussagen kann man in Form einer Wahrheitstafel beschreiben: a b a∧b a∨b a ¬a 0 0 0 0 0 1 0 1 0 1 1 0 1 0 0 1 1 1 1 1 Definition 1.5. Weitere wichtige logische Verknüpfungen sind die Implikation →, die Äquivalenz ↔ und das exklusive Oder xor. Wir definieren diese Verknüpfungen mit Hilfe einer Wahrheitstafel. a→b a↔b a b 0 0 1 1 0 0 1 1 0 1 1 0 0 0 1 1 1 1 1 0 xor Die Aussage a → b ist also immer dann wahr, wenn a falsch ist oder b wahr. Ist a → b wahr, so sagen wir „b folgt aus a“ oder „a impliziert b“. Die Aussage a ↔ b ist immer dann wahr, wenn a und b entweder beide falsch oder beide wahr sind. Ist a ↔ b wahr, so nennen wir a und b äquivalent. Die Zeichen → und ↔ werden normalerweise nur in formalen Ausdrücken verwendet, während wir im normalen mathematischen Text ⇒ und ⇔ benutzen. Ein klassisches Beispiel ist die Aussage „wenn es regnet, ist die Straße nass“, die sich mit Hilfe von ⇒ so schreiben lässt: Es regnet ⇒ Die Straße ist nass. 6 STEFAN GESCHKE (Wir ignorieren in diesem Beispiel das Problem, dass die Wahrheitswerte von „es regnet“ und „die Straße ist nass“ natürlich von Ort und Zeitpunkt abhängen. Wir können uns zum Beispiel vorstellen, dass wir Ort und Zeit schon fest gewählt haben.) Die Aussage a xor b ist genau dann wahr, wenn die Wahrheitswerte von a und b unterschiedlich sind. Mit Hilfe von Wahrheitstafeln können wir die Wahrheitswerte komplizierterer Aussagen untersuchen, die durch Verknüpfungen einfacherer Aussagen entstanden sind. Seien zum Beispiel a, b und c Aussagen und e die Aussage a ∧ (b ∨ c). Falls die Wahrheitswerte von a, b und c bekannt sind, so können wir zunächst den Wahrheitswert von b ∨ c bestimmen und dann den von a ∧ (b ∨ c). Auf diese Weise erhält man folgende Wahrheitstafel: b ∨ c a ∧ (b ∨ c) a b c 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 1 1 1 0 1 0 0 0 0 1 0 1 1 1 1 1 0 1 1 1 1 1 1 1 Wenn man eine entsprechende Wahrheitstafel für (a ∧ b) ∨ (a ∧ c) aufstellt, sieht man, dass a ∧ (b ∨ c) und (a ∧ b) ∨ (a ∧ c) äquivalent sind, unabhängig davon, welche Wahrheitswerte die Aussagen a, b und c haben. Aus diese Weise lassen sich Rechenregeln für ∨, ∧ und ¬ nachweisen. Das ist das Wahrheitstafelverfahren. Wir halten zunächst folgenden Satz fest: Satz 1.6. Sind a, b und c Aussagen, so ist a ∧ (b ∨ c) äquivalent zu (a ∧ b) ∨ (a ∧ c). Eine weitere wichtige Regel ist die sogenannte Kontraposition, die man oft in Beweisen anwenden kann. Satz 1.7. Seien a und b Aussagen. Die Aussage a → b ist äquivalent zu ¬b → ¬a. Beweis. Wir schreiben die entsprechende Wahrheitstafel auf. a b ¬a 0 0 1 ¬b a → b 1 1 ¬b → ¬a 1 0 1 1 0 1 1 1 0 0 1 0 0 1 1 0 0 1 1 Wie man leicht abliest, sind a → b und ¬b → ¬a in der Tat äquivalent. Beispiel 1.8. Der Satz „wenn es neblig ist, ist die Sicht schlecht“ ist äquivalent zu „wenn die Sicht nicht schlecht ist, dann ist es nicht neblig“. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 7 Unter dem Stichwort „Boolesche Algebra“ werden später noch weitere Rechenregeln für logische Verknüpfungen festhalten. Definition 1.9. Eine Aussageform ist eine Aussage, in der eine Konstante durch eine Variable ersetzt wurde. So erhält man aus einer Aussage a eine Aussageform a(x). „2 + 5 = 7“ ist eine Aussage. Daraus lässt sich zum Beispiel die Aussageform „2 + x = 7“ ableiten. Sei a(x) diese Aussageform. Ein Wahrheitswert von a(x) lässt sich nicht angeben, da wir nicht wissen, welchen Wert x hat. Wenn wir für x einen Wert einsetzen, dann erhalten wir wieder eine Aussage. So ist a(5), also die ursprüngliche Aussage, wahr, während a(2), also die Aussage „2 + 2 = 7“, falsch ist. Auch Aussageformen können mittels logischer Verknüpfungen verknüpft werden. Ist a(x) die Aussageform „2 + x ≤ 7“, so ist ¬a(x) die Aussageform „2 + x 6≤ 7“ oder, anders geschrieben, „2 + x > 7“. Ist a(x) die Aussageform „x = 2“ und b(x) die Aussageform „x2 = 4“, so verstehen wir, was „a(x) ⇒ b(x)“ bedeutet: Wenn x = 2 ist, so ist x2 = 4. Setzen wir für x konkrete natürliche Zahlen ein, so erhalten wir immer eine wahre Aussage. Mit anderen Worten, die Aussage Für alle natürlichen Zahlen x gilt: a(x) ⇒ b(x) ist wahr. Den Satzteil „für alle natürlichen Zahlen x“ nennen wir einen Quantor. Mit Hilfe von Quantoren können wir aus Aussageformen wieder Aussagen machen. Definition 1.10. Sei a(x) eine Aussageform und M eine Menge. Dann ist (∃x ∈ M )a(x) die Aussage, die genau dann wahr ist, wenn es mindestens ein Element x der Menge M gibt, so dass a(x) gilt. (∃x ∈ M )a(x) wird „es gibt ein x in M mit a(x)“ gelesen. Das Zeichen ∃ ist der Existenzquantor. (∀x ∈ M )a(x) ist die Aussage, die genau dann wahr ist, wenn a(x) für alle Elemente x der Menge M gilt. (∀x ∈ M )a(x) wird „für alle x in M gilt a(x)“ gelesen. Das Zeichen ∀ ist der Allquantor. Im Zusammenhang mit Quantoren, und auch sonst, werden wir Klammern immer so setzen, beziehungsweise weglassen, dass die Lesbarkeit optimal ist. Ein typisches Beispiel einer Existenzaussage, also einer Aussage, die mit einem Existenzquantor beginnt, ist die Aussage ∃x ∈ N(x2 = 4). Ein typisches Beispiel einer Allaussage, also einer Aussage, die mit einem Allquantor beginnt, ist die Aussage ∀x ∈ N(x2 > 0). Oft betrachten wir Aussageformen wie „(n + 1)2 = n2 + 2n + 1“. Bei dieser Aussageform ist klar, dass für n eine Zahl eingesetzt werden soll, und nicht anderes. 8 STEFAN GESCHKE Außerdem steht die Variable n üblicher Weise für eine natürliche Zahl. Unsere Erfahrung sagt uns also, dass wir, wenn wir „(n + 1)2 = n2 + 2n + 1“ hinschreiben, wir oft eigentlich „∀n ∈ N((n + 1)2 = n2 + 2n + 1)“ meinen. Die Negation ¬(∀x ∈ M )a(x) der Allaussage (∀x ∈ M )a(x) ist äquivalent zu der Existenzaussage (∃x ∈ M )¬a(x). Das wird an einem Beispiel schnell klar: „Alle Autos in Hamburg sind blau“ ist sicher falsch, es gilt vielmehr „nicht alle Auto in Hamburg sind blau“, was äquivalent zu der Aussage „es gibt in Hamburg (mindestens) ein Auto, das nicht blau ist“ ist. Analog ist ¬(∃x ∈ M )a(x) zu (∀x ∈ M )¬a(x) äquivalent. 1.3. Mengenoperationen. Wir definieren einige Verknüpfungen von Mengen, mit denen sich ganz ähnlich rechnen lässt wie mit den Verknüpfungen ∧, ∨ und ¬ von Aussagen. Die Rechengesetze, die für die logischen Verknüpfungen (von Aussagen) und für die entsprechenden Verknüpfungen von Mengen gelten, fasst man unter dem Begriff „Boolesche Algebra“ zusammen. Definition 1.11. Seien A und B Mengen. Dann ist die Vereinigung von A und B definiert als A ∪ B := {x : x ∈ A ∨ x ∈ B}. (Hier benutzen wir das Zeichen := um auszudrücken, dass es sich um eine Definition handelt.) Der Schnitt oder Durchschnitt von A und B ist die Menge A ∩ B := {x : x ∈ A ∧ x ∈ B}. Zwei Mengen A und B heißen disjunkt, falls A∩B = ∅. Die mengentheoretische Differenz von A und B ist die Menge A \ B := {x ∈ A : x 6∈ B}. Schon anhand der Definition von ∪ und ∩ sieht man, dass ∪ etwas mit ∨ zu tun hat und ∩ mit ∧. Und in der Tat verhalten sich ∩ und ∪ ähnlich wie ∧ und ∨. Eine Operation auf Mengen, die sich analog zur Negation verhält, ist die Komplementbildung. Definition 1.12. Für eine Menge M sei P(M ) := {x : x ⊆ M } die Potenzmenge von M . Wir fixieren M und betrachten nur Teilmengen von M . Für A ∈ P(M ) sei A := {x ∈ M : x 6∈ A} das Komplement von A in M . Wir stellen fest, das P(M ) unter ∪, ∩ und Komplementbildung abgeschlossen ist. D.h., für alle A, B ∈ P(M ) sind A ∩ B, A ∪ B und A wieder Elemente von P(M ). MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 9 Rechenregeln für die Mengenoperationen ∩, ∪ und Komplementbildung können wir wieder mit dem Wahrheitstafelverfahren herleiten. Seien zum Beispiel A, B und C Teilmengen einer Menge M . Satz 1.13. Es gilt A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). Beweis. Wir wissen schon, dass A ∩ (B ∪ C) und (A ∩ B) ∪ (A ∩ C) Teilmengen von M sind. Also müssen wir nur zeigen, dass die beiden Mengen genau dieselben Elemente von M enthalten. Es gilt A ∩ (B ∪ C) = {x ∈ M : x ∈ A ∧ (x ∈ B ∨ x ∈ C)} sowie (A ∩ B) ∪ (A ∩ C) = {x ∈ M : (x ∈ A ∧ x ∈ B) ∨ (x ∈ A ∨ x ∈ C)}. Wir fixieren nun ein beliebiges Element x von M . Sei a die Aussage x ∈ A, b die Aussage x ∈ B und c die Aussage x ∈ C. Man beachte, dass wir hier so tun, als wären a, b und c Aussagen, da wir das x vorher fixiert haben und wir es jetzt wie eine Konstante behandeln können. Nach Satz 1.6 sind a ∧ (b ∨ c) und (a ∧ b) ∨ (a ∧ c) äquivalent. Damit gilt x ∈ A ∩ (B ∪ C) ⇔ a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c) ⇔ x ∈ (A ∩ B) ∪ (A ∩ C) Also haben A ∩ (B ∪ C) und (A ∩ B) ∪ (A ∩ C) dieselben Elemente und sind damit gleich. Wir haben bisher die Frage nach der Gleichheit zweier Mengen auf die Frage zurückgeführt, ob zwei Aussagen äquivalent sind. Die letztere Frage ließ sich mit Hilfe des Wahrheitstafelverfahrens klären. Damit lässt sich das Wahrheitstafelverfahren manchmal einsetzen, um die Gleichheit zweier Mengen nachzuweisen. Im allgemeinen ist es allerdings meistens ratsam, die Gleichheit zweier Mengen A und B nachzurechnen, indem man zunächst A ⊆ B und dann B ⊆ A zeigt. Beispiel 1.14. Wir beweisen die Gleichung A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) ohne das Wahrheitstafelverfahren. Als erstes zeigen wir A ∩ (B ∪ C) ⊆ (A ∩ B) ∪ (A ∩ C). Dazu müssen wir zeigen, dass jedes Element von A ∩ (B ∪ C) auch ein Element von (A ∩ B) ∪ (A ∩ C) ist. Sei also x ∈ A ∩ (B ∪ C). Dann ist x sowohl in A als auch in B ∪ C enthalten. Also ist x in B oder in C enthalten. Ist x in B enthalten, so gilt x ∈ A ∩ B. Ist x in C enthalten, so gilt x ∈ A ∩ C. Damit ist x in A ∩ B oder in A ∩ C enthalten. Also gilt x ∈ (A ∩ B) ∪ (A ∩ C). Das zeigt A ∩ (B ∪ C) ⊆ (A ∩ B) ∪ (A ∩ C). Wir zeigen nun (A ∩ B) ∪ (A ∩ C) ⊆ A ∩ (B ∪ C). Sei x ∈ (A ∩ B) ∪ (A ∩ C). Dann ist x in A ∩ B oder in A ∩ C enthalten. Wir nehmen zunächst an, dass x ∈ A ∩ B gilt. Dann ist x in A und in B enthalten. Damit ist x aber auch in B ∪ C enthalten. Es folgt x ∈ A ∩ (B ∪ C). 10 STEFAN GESCHKE Nun nehmen wir an, dass x ∈ A∩C gilt. Wie eben sehen wir, dass x ∈ A∩(B ∪C) gilt. Also gilt x ∈ A ∩ (B ∪ C) unabhängig davon, ob x ein Element von A ∩ B oder A ∩ C ist. Das zeigt (A ∩ B) ∪ (A ∩ C) ⊆ A ∩ (B ∪ C). Insgesamt folgt nun die Gleichheit A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). Definition 1.15. Sind A und B Mengen, so bezeichnet man mit A × B die Menge {(a, b) : a ∈ A und b ∈ B} aller geordneten Paare (a, b), deren erste Komponente a ein Element von A ist und deren zweite Komponente b ein Element von B sind. A × B heißt das kartesische Produkt der Mengen A und B. Mit A2 bezeichnet man die Menge A × A. A3 ist die Menge {(a1 , a2 , a3 ) : a1 , a2 , a3 ∈ A} aller Tripel von Elementen von A. Analog ist für jede natürliche Zahl n ≥ 1 An die Menge {(a1 , . . . , an ) : a1 , . . . , an ∈ A} aller n-Tupel von Elementen von A. Zum Beispiel ist {1, 2, 3} × {4, 5} = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5)}. 1.4. Abbildungen. Definition 1.16. Eine Abbildung von einer Menge A in eine Menge B ist eine Zuordnung, die jedem Element von A ein Element von B zuordnet. Abbildungen werden oft auch Funktionen genannt. Ist f eine Abbildung von A nach B, so schreiben wir f : A → B. Dabei wird A der Definitionsbereich von f genannt und B der Wertevorrat. Auch der Begriff Vorbereich für A und Nachbereich für B ist sinnvoll. Schließlich wird B manchmal auch der Wertebereich von f genannt, wobei das zu Verwechslungen mit dem Bild von f führen kann, welches wir weiter unten definieren. Für jedes a ∈ A bezeichnen wir mit f (a) das Element von B, das die Funktion f dem Element a zuordnet. Falls f einem Element a ∈ A also b ∈ B zuordnet, so schreiben wir f (a) = b und sagen „f bildet a auf b ab“. Das Element b heißt der Wert oder der Funktionswert von f an der Stelle a. Man kann anstelle von f (a) = b auch a 7→ b schreiben, wenn klar ist, welche Funktion f gemeint ist. Das Bild von f ist die Menge {f (x) : x ∈ A}. Der Name Wertebereich wird von manchen Autoren für das Bild einer Funktion verwendet und von anderen für den Wertevorrat. Um Missverständnissen vorzubeugen, verwenden wir diesen Begriff gar nicht. Beispiel 1.17. (1) Eine Funktion f von der Menge N der natürlichen Zahlen in die natürlichen Zahlen kann zum Beispiel durch eine Formel gegeben sein: f (n) = n2 . Ein Schreibweise, die alle wesentlichen Informationen beinhaltet, wäre dann f : N → N; n 7→ n2 . MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 11 (2) Der Ausdruck g : N2 → N, (m, n) 7→ m + n beschreibt eine Funktion von der Menge der Paare natürlicher Zahlen in die Menge der natürlichen Zahlen, die der Gleichung g((m, n)) = m + n genügt. Anstelle von g((m, n)) schreiben wir auch g(m, n). (3) Funktionen mit endlichem Definitionsbereich kann man auch in Form einer Tabelle angeben. Sei zum Beispiel A = {1, 2, 3, 4, 5} und B = {q, w, e, r, t, z}. Dann definiert die folgende Tabelle die Funktion f : A → B: a 1 2 3 4 5 f(a) w q t w e Es gilt nun f (1) = w, f (2) = q und so weiter. Definition 1.18. Eine Abbildung f : A → B heißt (1) injektiv, falls für alle x, y ∈ A gilt: Ist x 6= y, so ist f (x) 6= f (y). (2) surjektiv, falls es für alle b ∈ B mindestens ein a ∈ A gibt, so dass f (a) = b gilt. (3) bijektiv, falls sie injektiv und surjektiv ist. Beispiel 1.19. (1) Sei A = {1, 2, 3} und B = {1, 2, 3}. Die Abbildung f : A → B mit f (1) = 1, f (2) = 1 und f (3) = 2 ist weder injektiv noch surjektiv. (2) Seien A und B wie in (1). Die Funktion g : A → B mit g(1) = 2, g(2) = 3 und g(3) = 1 ist sowohl injektiv als auch surjektiv, also bijektiv. (3) Sei wieder A = {1, 2, 3} aber B = {3, 7}. Die Abbildung f : A → B mit f (1) = 3, f (2) = 7 und f (3) = 3 ist surjektiv, aber nicht injektiv. (4) Sei nun A wie in (1)–(3) und B = {1, 2, 3, 4}. Die Funktion f : A → B mit f (1) = 2, f (2) = 1, f (3) = 4 ist injektiv, aber nicht surjektiv. (5) Die Abbildung h : N → N; n 7→ n2 ist nicht surjektiv, da es zum Beispiel kein a ∈ N gibt, für das h(a) = 3 gilt. Das kann man wie folgt einsehen: Angenommen, es gäbe doch ein a ∈ N √ √ √ mit h(a) = a2 = 3. Dann ist a entweder 3 oder − 3. Beide Zahlen, 3 √ und − 3, sind aber keine Elemente von N. Das widerspricht der Annahme a ∈ N. Eine andere Möglichkeit zu zeigen, dass 3 nicht im Bild von f liegt ist die folgende: Es gelten 12 = 1 < 3 und 22 = 4 > 3. Für alle n ≥ 2 ist n2 ≥ 22 und damit n2 > 3. Damit gibt es kein n ∈ N mit n2 = 3. Die Abbildung h ist aber injektiv. Seien nämlich x, y ∈ N mit x 6= y. Dann ist entweder x < y oder y < x. Wir betrachten nur den ersten Fall, der zweite Fall kann genauso behandelt werden. Wir nehmen also x < y an. (Später werden wir in so einer Situation zum Beispiel schreiben „ohne Beschränkung der Allgemeinheit (o.B.d.A.) können wir x < y annehmen“.) Sei a = y − x. Dann ist y = x + a und y 2 = x2 + 2xa + a2 . Wegen x, a > 0 gilt 2xa + a2 > 0 und damit ist y 2 > x2 . Insbesondere gilt h(x) = x2 6= y 2 = h(y). 12 STEFAN GESCHKE Das zeigt, dass h injektiv ist. Definition 1.20. Für eine natürliche Zahl n versteht man unter einer n-stelligen Verknüpfung oder einer n-stelligen Operation auf einer Menge M eine Abbildung f : M n → M . Der wichtigste Spezialfall ist der einer binären Verknüpfung f : M 2 → M . Beispiele binärer Verknüpfungen sind die Addition + : N2 → N; (m, n) 7→ m + n und die Multiplikation · : N2 → N; (m, n) 7→ m · n. 1.5. Boolesche Algebra. Wir haben schon gesehen, dass sich die Mengenoperationen ∩, ∪ und Komplementbildung ganz analog zu den logischen Verknüpfungen ∧, ∨ und ¬ verhalten. Und in der Tat kann man die Mengenoperationen und die logischen Verknüpfungen mit einem gemeinsamen Begriff beschreiben. Definition 1.21. Gegeben sei eine Menge B, die mindestens die zwei verschiedene Elemente 1 und 0 enthält, zusammen mit der einstelligen Verknüpfung ¬ : B → B und den zwei zweistelligen Verknüpfungen u, t : B 2 → B. (B, u, t, ¬, 0, 1) heißt eine Boolesche Algebra, wenn für alle a, b, c ∈ B die folgenden Gleichungen gelten: (A1) Assoziativgesetze: • a u (b u c) = (a u b) u c • a t (b t c) = (a t b) t c (A2) Kommutativgesetze: • aub=bua • atb=bta (A3) Distributivgesetze: • a u (b t c) = (a u b) t (a u c) • a t (b u c) = (a t b) u (a t c) (A4) Beschränkheit: • au1=a • at0=a (A5) Komplementierung: • a u ¬a = 0 • a t ¬a = 1 Die Aussagen (A1)–(A5) in Definition 1.21 sind die Axiome für Boolesche Algebren. Beispiel 1.22. (1) Die Schaltalgebra ist die Menge {0, 1} der Wahrheitswer- te mit den Verknüpfungen ∧, ∨ und ¬. Die Schaltalgebra ist eine Boolesche Algebra, wie man mit Hilfe des Wahrheitstafelverfahrens leicht nachrechnen kann. (2) Ist M eine Menge, so ist P(M ) mit den Verknüpfungen ∩, ∪ und Komplementbildung sowie den Konstanten 1 := M und 0 := ∅ eine Boolesche MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 13 Algebra, die Potenzmengenalgebra von M . Dass Potenzmengenalgebren wirklich Boolesche Algebren sind, folgt aus der Tatsache, dass die Schaltalgebra die Axiome einer Booleschen Algebra erfüllt, zusammen mit der Übersetzung von Fragen der Gleichheit von Mengen in Fragen der Äquivalenz von Aussagen, die wir oben schon diskutiert haben. (3) Wir betrachten noch einen speziellen Fall, nämlich eine Boolesche Algebra, die im wesentlichen genau die Potenzmengenalgebra auf einer achtelementigen Menge ist, die wir aber anders aufschreiben. Es sei B := {w, f }8 , also die Menge aller 8-Tupel der Wahrheitswerte w und f . Man kann B zum Beispiel als Menge aller möglichen Bytes interpretieren. Weiter sei 1 := (w, w, w, w, w, w, w, w) und 0 = (f, f, f, f, f, f, f, f ). Die Operationen definieren wir jetzt wie folgt: Für a, b ∈ B mit a = (a1 , . . . , a8 ) und b = (b1 , . . . , b8 ) sei a u b := (a1 ∧ b1 , . . . , a8 ∧ b8 ), a t b := (a1 ∨ b1 , . . . , a8 ∨ b8 ) und ¬a := (¬a1 , . . . , ¬a8 ). Dann ist (B, u, t, ¬, 0, 1) eine Boolesche Algebra, wie man leicht nachrechnet. Alle Aussagen, die sich aus (A1)–(A5) ableiten lassen, gelten für alle Booleschen Algebren, inbesondere also für die Schaltalgebra und alle Potenzmengenalgebren. Diese Allgemeinheit ist die Stärke der axiomatischen Methode, bei der Sätze aus Axiomen gefolgert werden und nicht nur für bestimmte Strukturen, wie zum Beispiel die natürlichen Zahlen oder eine bestimmte Boolesche Algebra, bewiesen werden. Wir geben Beispiele für die axiomatische Methode und beweisen ein paar einfache Regeln für Boolesche Algebren. Sei (B, u, t, ¬, 0, 1) eine Boolesche Algebra. Satz 1.23. Für alle a ∈ B gilt a u a = a und a t a = a. Beweis. Es gilt (A4) (A5) (A3) (A5) (A4) (A5) (A4) a u a = (a u a) t 0 = (a u a) t (a u ¬a) = a u (a t ¬a) = a u 1 = a. Auf dieselbe Weise rechnen wir a t a = a nach. (A4) (A5) (A3) a t a = (a t a) u 1 = (a t a) u (a t ¬a) = a t (a u ¬a) = a t 0 = a. Damit haben wir die beiden Gleichung aus den Axiomen (A1)–(A5) hergeleitet. 14 STEFAN GESCHKE In diesem Beweis fällt auf, dass wir den Beweis der Gleichung a u a = a in den Beweis der Gleichung a t a = a übersetzen können, indem wir u und t vertauschen und ebenso 0 und 1. Das funktioniert, da die Axiome (A1)–(A5) aus Paaren von Gleichungen bestehen, die jeweils durch diese Vertauschungen auseinander hervorgehen. Satz 1.24 (Dualitätsprinzip für Boolesche Algebren). Jede Aussage, die eine Folgerung aus den Axiomen (A1)–(A5) ist, geht in eine gültige Aussage über, wenn man in ihr überall die Zeichen u und t sowie die Zeichen 0 und 1 vertauscht. Satz 1.25. Für alle a ∈ B gilt a u 0 = 0 und a t 1 = 1. Beweis. Es gilt a u 0 = a u (a u ¬a) = (a u a) u ¬a = a u ¬a = 0. Die Behauptung a u 1 = 1 folgt aus a u 0 = 0 nach dem Dualitätsprinzip. Wir schließen diesen Abschnitt mit zwei wichtigen Regeln für Boolesche Algebren, die aus den Axiomen folgen, deren Beweis wir aber nicht angeben. Satz 1.26 (De Morgansche Regeln). Für alle a, b ∈ B gilt ¬(a u b) = ¬a t ¬b und ¬(a t b) = ¬a u ¬b. Der Beweis der de Morganschen Regeln aus den Axiomen (A1)–(A5) ist deutlich aufwendiger als die Beweise der Sätze 1.23 und 1.25. Mit Hilfe des Wahrheitstafelverfahrens lassen sich die de Morganschen Regeln für die Schaltalgebra leicht nachrechen. Man kann zeigen, dass alle Gleichungen, wie zum Beispiel die de Morganschen Regeln, die in der Schaltalgebra gelten, auch in allen anderen Booleschen Algebren gelten. Damit kann das Wahrheitstafelverfahren für Gleichungen, in denen nur die Konstanten 0 und 1 auftreten, in beliebigen Booleschen Algebren eingesetzt werden. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 15 2. Elementare Zahlentheorie 2.1. Das Summenzeichen. Bevor wir uns eingehend mit den Eigenschaften der natürliche Zahlen N befassen, führen wir eine Notation ein, die sich bald als nützlich erweisen wird. Die reellen Zahlen sind die bekannten Zahlen auf der Zahlengerade wie -1, 0, 2.5, − 10 7 , e und π, für die die üblichen Rechenregeln gelten. Definition 2.1. Für reelle Zahlen a1 , . . . , an sei n X ai = a1 + a2 + . . . + an . i=1 Dabei heißt i der Laufindex, 1 ist die untere Summationsgrenze und n die obere Summationsgrenze. Der Laufindex muss nicht mit i bezeichnet werden und die untere Summationsgrenze muss nicht 1 sein. So ist zum Beispiel 4 X 2j = 20 + 21 + 22 + 23 + 24 = 31. j=0 Summen mit wechselnden Vorzeichen, wie zum Beispiel a1 − a2 + a3 − a4 kann man bequem mit Hilfe von Potenzen von −1 schreiben. Dabei muss man aber genau aufpassen, welche Vorzeichen man erzeugt: 4 X (−1)i ai = −a1 + a2 − a3 + a4 i=1 4 X (−1)i+1 ai = a1 − a2 + a3 − a4 i=1 Falls a1 = · · · = an = a gilt, so ist Pn i=1 ai = na. Das bekannte Distributivgesetz lautet a(b + c) = ab + ac. Das Gesetz gilt auch für mehr als zwei Summanden. Für alle reellen Zahlen a, b1 , . . . , bn ist a n X bi = a(b1 + . . . + bn ) = ab1 + . . . + abn = i=1 n X abi . i=1 Mit Hilfe des Distributivgesetzes können wir Ausdrücke wie (a + b)(c + d) ausmultiplizieren und erhalten (a + b)(c + d) = ac + ad + bc + bd. Allgemein gilt (a1 + . . . + am )(b1 + . . . + bn ) = a1 b1 + . . . + a1 bn + . . . + am b1 + . . . + am bn . Mit dem Summenzeichen geschrieben erhalten wir ! n m m X n X X X ai bj = a i bj . i=1 j=1 i=1 j=1 16 STEFAN GESCHKE Da wir nach dem Kommutativgesetz für die Addition die Summanden vertauschen können ohne den Wert der Summe zu ändern, ist m X n X ai bj = i=1 j=1 n X m X ai bj . j=1 i=1 Auf der Änderung der Summationsreihenfolge beruht auch die Gleichung n n n X X X (ai + bi ) = ai + bi . i=1 i=1 i=1 Oft kann man dieselben Summen unterschiedlich aufschreiben. So ist zum Beispiel 3 X a2i+1 = a1 + a3 + a5 + a7 = i=0 4 X a2i−1 . i=1 Bemerkung 2.2. Analog zum Summenzeichen kann man auch das Produktzeichen definieren. Sind a1 , . . . , an reelle Zahlen, so setzt man n Y ai := a1 · a2 · . . . · an . i=1 2.2. Natürliche Zahlen und vollständige Induktion. Auf den natürlichen Zahlen N = {1, 2, 3, . . . } gelten die bekannten Rechengesetze: (1) Assoziativgesetze: • a + (b + c) = (a + b) + c • a · (b · c) = (a · b) · c (2) Kommutativgesetze: • a+b=b+a • a·b=b·a (3) Distributivgesetz: • a · (b + c) = a · b + a · c (4) Existenz eines neutralen Elements der Multiplikation: • a·1=a Eine weitere wichtige Eigenschaft von N ist das Funktionieren der vollständigen Induktion. Prinzip der vollständigen Induktion. Sei A(n) eine Aussageform. Dann gilt ∀n ∈ NA(n) genau dann, wenn folgende zwei Bedingungen erfüllt sind: (1) Induktionsanfang: A(1) ist wahr. (2) Induktionsschritt: Für jedes n ∈ N gilt: Falls A(n) wahr ist, so ist auch A(n + 1) wahr. Kompakt geschrieben gilt also für jede Aussageform A(n): (A(1) ∧ ∀n ∈ N(A(n) ⇒ A(n + 1))) ⇒ ∀n ∈ NA(n) Als Beispiel beweisen wir einen Satz über die Summe der ersten n natürlichen Zahlen. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 17 Satz 2.3. Für alle n ∈ N gilt: n X i= i=1 n(n + 1) 2 Pn Beweis. Sei A(n) die Aussageform i=1 i= n(n+1) . 2 Wir wollen zeigen, dass A(n) für alle n ∈ N gilt. Induktionsanfang. A(1) ist wahr. P1 A(1) ist nämlich die Aussage i=1 i = 1·(1+1) . 2 Es gilt P1 i=1 i=1= 1·(1+1) . 2 Das zeigt A(1). Induktionsschritt. Für alle n ∈ N gilt: A(n) ⇒ A(n + 1) Um das zu zeigen, nehmen wir uns ein beliebiges n ∈ N her und zeigen A(n) ⇒ A(n + 1). Wir müssen also zeigen, dass A(n + 1) wahr ist, falls A(n) wahr ist. Wenn A(n) falsch ist, ist nichts zu zeigen. Wir können also annehmen, dass A(n) wahr ist. Das ist die Induktionsannahme. Nun zeigen wir A(n + 1) unter dieser Annahme. A(n + 1) ist die Aussage n+1 X i= i=1 also n+1 X (n + 1)((n + 1) + 1) , 2 i= i=1 (n + 1)(n + 2) . 2 Es gilt n+1 X i= i=1 Nach der Induktionsannahme ist n X i + (n + 1). i=1 Pn i=1 i= n(n+1) . 2 Mit dieser Information erhalten wir n+1 X i=1 i= n(n + 1) n(n + 1) + 2(n + 1) (n + 1)(n + 2) + (n + 1) = = . 2 2 2 Das zeigt A(n + 1). Damit haben wir den Induktionsanfang und den Induktionsschritt bewiesen. Es folgt, dass A(n) für alle n ∈ N gilt. Wir geben ein weiteres Beispiel. Für ganze Zahlen a und b schreiben wir a|b, falls a ein Teiler von b ist. Satz 2.4. Für alle n ∈ N ist n3 − n durch 3 teilbar. Beweis. Sei A(n) die Aussageform „3 teilt n3 − n“. Wir wollen zeigen, dass A(n) für alle n ∈ N gilt. Induktionsanfang. A(1) ist wahr. A(1) ist nämlich die Aussage 3|13 − 1, also 3|0. Diese Aussage ist wahr. Induktionsschritt. Für alle n ∈ N gilt: A(n) ⇒ A(n + 1) Sei also n ∈ N. Wieder nehmen wir an, dass A(n) wahr ist, und zeigen A(n + 1). Die Induktionsannahme ist also 3|n3 − n. 18 STEFAN GESCHKE A(n + 1) ist die Aussage 3|(n + 1)3 − (n + 1). Wir vereinfachen: (n + 1)3 − (n + 1) = n3 + 3n2 + 3n + 1 − n − 1 = n3 + 3n2 + 2n Wir wollen zeigen, dass n3 + 3n2 + 2n durch 3 teilbar ist, und dürfen benutzen, dass n3 − n durch 3 teilbar ist. Es gilt n3 + 3n2 + 2n = (n3 − n) + 3n2 + 3n. Der erste Summand der rechten Seite dieser Gleichung, n3 − n, ist nach Induktionsannahme durch 3 teilbar. Der Rest, 3n2 + 3n, ist offenbar auch durch 3 teilbar. Das zeigt 3|(n + 1)3 − (n + 1) und damit A(n + 1). Damit ist für alle n ∈ N die Implikation A(n) ⇒ A(n + 1) bewiesen. Zusammen mit dem Induktionsanfang folgt 3|n3 − n für alle n ∈ N. Als nächstes diskutieren wir ein Beispiel, das zeigt, dass der Erfolg einer Induktion von der geschickten Wahl des Induktionsanfangs abhängen kann. Außerdem liefert der folgende Beweis einen Algorithmus, also ein Verfahren, zur Lösung des vorgelegten Problems. Problem 2.5. Ein quadratischer Hof mit der Seitenlänge 2n soll mit L-förmigen Fliesen gefliest werden. Dabei soll ein Quadrat mit der Seitenlänge 1 in der Mitte des Hofes frei bleiben, weil da eine Statue aufgestellt werden soll. Die Fliesen haben die Form von drei aneinander gesetzten Quadraten mit Seitenänge eins, so wie in der Skizze. Ist es möglich, den Hof bis auf das Quadrat in der Mitte vollständig mit den Fliesen zu überdecken, ohne dass die Fliesen sich überlappen und ohne Fliesen zu zerschneiden? Im Folgenden betrachten wir nur Quadrate, deren Seitenlängen ganzzahlig sind. Auch stellen wir uns immer vor, dass die Quadrate in der Ebene liegen, wobei die Koordinaten der Ecken der Quadrate alle ganzzahlig sind. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK Hof 19 Fliese Wir betrachten zunächst die Fälle n = 1 und n = 2 und sehen, dass wir den Hof wie gewünscht fliesen können. Schon der Fall n = 1 genügt für den Induktionsanfang. n=1 n=2 Eine naheliegende Induktionsannahme wäre die Aussageform A(n): „Jeder quadratische Hof mit der Kantenlänge 2n kann bis auf ein fehlendes Quadrat der Kantenlänge 1 in der Mitte vollständig mit L-förmigen Fliesen gefliest werden.“ Es stellt sich heraus, dass wir Schwierigkeiten haben, die gewünschte Induktion mit dieser Induktionsannahme durchzuführen. Einen Hof der Kantenlänge 2n+1 können wir in vier quadratische Teile mit der Kantenlänge 2n zerlegen, aber das fehlende Quadrat in der Mitte des Quadrats mit Kantenlänge 2n+1 liegt nun am Rand eines der Quadrate mit Kantenlänge 2n . Bei den anderen drei Qudraten mit Kantenlänge fehlt kein Quadrat. Eine Verstärkung von A(n) führt schließlich zum Erfolg. B(n) sei die Aussageform „Jeder quadratische Hof mit der Kantenlänge 2n kann bis auf ein beliebig 20 STEFAN GESCHKE vorgegebenes fehlendes Quadrat der Kantenlänge 1 vollständig mit L-förmigen Fliesen gefliest werden“. Wir zeigen, dass B(n) für alle n ∈ N gilt. Der Induktionsanfang ist einfach: B(1) gilt, da von einem Quadrat der Kantenlänge 2 nach Entfernen eines Quadrates der Kantenlänge 1 eine L-förmige Fliese übrig bleibt. Induktionsschritt: Wir zeigen, dass für alle n ∈ N die Implikation B(n) ⇒ B(n + 1) gilt. Sei also n ∈ N. Wir nehmen an, dass B(n) gilt. Sei nun ein Quadrat mit Kantenlänge 2n+1 vorgegeben, in dem ein Quadrat der Kantenlänge 1 markiert ist, welches beim Überdecken ausgelassen werden soll. Wir zerlegen dieses Quadrat in vier Quadrate der Kantenlänge 2n . Das markierte Quadrat der Kantenlänge 1 liegt in einem dieser vier Quadrate. Nun legen wir eine der L-förmigen Fliesen so in die Mitte des Quadrats mit Kantenlänge 2n+1 , dass die drei Quadrate der Fliese alle in je einem der vier Quadrate der Kantenlänge 2n zum liegen kommen, wobei dasjenige der vier Quadrate, das das markierte Quadrat enthält, nicht getroffen wird. Zerlegung des Quadrats der Kantenlänge 2n+1 und Lage der ersten Fliese Nun genügt es, jedes der vier Quadrate mit Kantenlänge 2n mit L-förmigen Fliesen zu überdecken, wobei jeweils ein Quadrat der Kantenlänge 1 ausgelassen werden muss. Das ist aber nach der Induktionsannahme B(n) möglich. Das zeigt die Implikation B(n) ⇒ B(n + 1). Also gilt B(n) für alle n ∈ N. Das löst Problem 2.5. Wir bemerken noch, dass diese Lösung des Problems auch ein Verfahren liefert, den Hof wie gewünscht zu fliesen: • Wenn der Hof die Kantenlänge 2 hat, so bleibt neben dem markierten Quadrat genau Platz für eine L-förmige Fliese. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 21 • Wenn der Hof für ein n > 1 die Kantenlänge 2n hat, so unterteile den Hof in vier Quadrate der Kantenlänge 2n−1 und lege eine Fliese so in die Mitte des Hofes, dass sie genau die drei Quadrate der Kantenlänge 2n−1 trifft, die nicht das markierte Quadrat enthalten. • Führe den Algorithmus für die vier Quadrate der Kantenlänge 2n−1 durch, wobei das ursprünglich markierte Quadrat und die drei Quadrate, die von der ersten Fliese überdeckt werden, markiert werden. Wir betrachten zwei weitere Varianten der vollständigen Induktion. So muss man zum Beispiel den Induktionsanfang nicht unbedingt bei n = 1 machen. Ein Induktionsanfang bei n = 0 kommt recht häufig vor, andere Startwerte sind aber auch möglich. Vollständige Induktion mit beliebigem Startwert. Es sei n0 eine ganze Zahl und A(n) eine Aussageform. Dann gilt A(n) genau dann für alle ganzen Zahlen n ≥ n0 , wenn A(n0 ) wahr ist und die Implikation A(n) ⇒ A(n + 1) für alle n ≥ n0 gilt. Als Beispiel beweisen wir eine einfache Ungleichung. Satz 2.6. Für alle natürlichen Zahlen n ≥ 3 gilt 2n + 1 < 2n . Beweis. A(n) sei die Aussageform 2n + 1 < 2n . Induktionsanfang. A(3) gilt. Um das zu sehen, setzen wir 3 für n ein. Es ist 2 · 3 + 1 = 7 < 8 = 23 . Induktionsschritt. Für alle n ≥ 3 gilt: A(n) → A(n + 1) Wie nehmen an, dass A(n) für ein gewisses n ≥ 3 gilt, und haben A(n + 1) nachzuweisen. Es ist n≥2 I.A. 2(n + 1) + 1 = 2n + 3 = 2n + 1 + 2 < 2n + 2 < 2n + 2n = 2n+1 . Das zeigt A(n + 1). Es folgt, dass A(n) für alle n ≥ 3 gilt. Wir beweisen noch eine Formel, die sich in der Analysis als nützlich erweisen wird. Sei q eine reelle Zahl 6= 1 und n ∈ N0 . Wir wollen einen einfachen Ausdruck Pn für die Summe i=0 q i = 1 + q + . . . + q n herleiten. Dazu formen wir die Summe um: n X i=0 qi = 1 + n X i=1 qi = 1 + q n X q i−1 = 1 + q i=1 =1+q n−1 X qi = 1 + q i=0 n−1 X i=0 n−1 X q i + q n+1 − q n+1 i=0 ! qi + qn − q n+1 = 1 + q n X i=0 q i − q n+1 22 STEFAN GESCHKE Wenn man den Term q Pn i=0 q i auf die linke Seite dieser Gleichung bringt, erhält man (1 − q) n X q i = 1 − q n+1 . i=0 Da q 6= 1 ist, können wir auf beiden Seiten durch 1 − q teilen und erhalten so die geometrische Summenformel: Satz 2.7 (Geometrische Summenformel). Sei q eine reelle Zahl 6= 1 und n ∈ N0 . Dann gilt n X i=0 qi = 1 − q n+1 . 1−q Beweis. Wir haben die geometrische Summenformel zwar korrekt hergeleitet, geben aber trotzdem noch einen Beweis mittels vollständiger Induktion an. Induktionsanfang. Für n = 0 stimmt die geometrische Summenformel, denn es gilt 0 X qi = 1 = i=0 1 − q1 . 1−q Induktionsschritt. Wir nehmen an, dass die geometrische Summenformeln für ein gewisses n ≥ 0 gilt (Induktionsannahme). Dann gilt sie auch für n + 1: n+1 X qi = i=0 n X I.A. q i + q n+1 = i=0 1 − q n+1 q n+1 (1 − q) 1 − q n+1 + q n+1 = + 1−q 1−q 1−q = 1 − q n+1 + q n+1 − q n+2 1 − q n+2 = 1−q 1−q Damit ist die geometrische Summenformel für alle n ∈ N0 bewiesen. Vollständige Induktion mit mehreren Vorgängern. Wieder sei A(n) eine Aussageform. Dann gilt A(n) genau dann für alle natürlichen Zahlen n, wenn A(1) wahr ist und für alle n ∈ N die folgende Implikation gilt: A(1)∧· · ·∧A(n) ⇒ A(n+1). Bei dieser Variante ist die Induktionsannahme die Annahme, dass A(1), . . . , A(n) wahr sind. Eng mit der vollständigen Induktion verwandt sind rekursive Definitionen. Beispiel 2.8. Wir definieren einen Folge natürlicher Zahlen an wie folgt: (1) a1 = 1 (2) an+1 = 2an + 1 Dadurch ist an für jede natürliche Zahl n eindeutig bestimmt. Nach (1) gilt a1 = 1. Wenden wir (2) auf den Fall n = 1 an, so erhalten wir a2 = 2 · 1 + 1 = 3. Wenden wir (2) auf den Fall n = 2 an, so ergibt sich a3 = 2 · 3 + 1 = 7. Ein weiteres Beispiel für eine rekursive Definition sind die bekannten FibonacciZahlen. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 23 Definition 2.9. Es sei f0 = 0 und f1 = 1. Für alle n ≥ 1 sei fn+1 = fn−1 + fn . Die Zahlen f0 , f1 , f2 , . . . heißen Fibonacci-Zahlen. Die ersten 10 Glieder der Folge f0 , f1 , f2 , . . . lauten 0, 1, 1, 2, 3, 5, 8, 13, 21, 34. Man kann für die n-te Fibonacci-Zahl fn eine geschlossene Formel angeben, also einen Ausdruck, der keine Rekursion benutzt. Satz 2.10. Für alle n ∈ N0 gilt 1 fn = √ 5 √ !n 1+ 5 − 2 √ !n ! 1− 5 . 2 Beweis. Wir beweisen den Satz durch vollständige Induktion, wobei wir Induktion mit mehreren Vorgängern anwenden. Das liegt daran, dass in der rekursiven Definition von fn+1 auch auf mehrere Vorgänger zurückgegriffen wird. Um die Rechnung übersichtlicher zu gestalten, führen wir zwei Abkürzungen ein. Es seien ϕ := √ 1+ 5 2 und ψ := √ 1− 5 2 . Sei A(n) die Aussageform fn = ϕn − ψ n √ . 5 Wir wollen also zeigen, dass A(n) für alle n ∈ N0 gilt. Als Induktionsannahme wählen wir A(n − 1) ∧ A(n). Das können wir natürlich nur annehmen, falls n mindestens 1 ist, da f−1 ja nicht definiert ist und wir nicht wissen, was A(−1) bedeutet. Im Induktionsschritt zeigen wir dann für alle n ≥ 1, dass aus A(n − 1) und A(n) zusammen A(n + 1) folgt. Wenn wir für den Induktionsanfang nur A(0) zeigen, dann haben wir aber das Problem, dass wir nicht wissen, ob A(1) überhaupt gilt, da im Induktionsschritt A(n − 1) ∧ A(n) ⇒ A(n + 1) nur für n ≥ 1 wird. Daher müssen wir beim Induktionsanfang auch noch A(1) explizit zeigen. Induktionsanfang. Es gilt 1−1 ϕ0 − ψ 0 √ = √ = 0 = f0 5 5 sowie 1 ϕ1 − ψ 1 √ =√ 5 5 √ √ ! √ 1+ 5 1− 5 1 2 5 − =√ · = 1 = f1 . 2 2 2 5 Induktionsschritt. Wir zeigen A(n − 1) ∧ A(n) ⇒ A(n + 1) für alle n ≥ 1. Dazu nehmen wir an, dass für ein gewisses n ≥ 1 die Aussage A(n − 1) ∧ A(n) gilt. Dann ist fn+1 ϕn 1 + ϕ1 − ψ n 1 + ϕn−1 − ψ n−1 + ϕn − ψ n √ √ = fn−1 + fn = = 5 5 1 ψ . 24 STEFAN GESCHKE Es gilt √ 1 2 1+ 5+2 √ √ 1+ =1+ = ϕ 1+ 5 1+ 5 √ √ √ √ (3 + 5)(1 − 5) −2 − 2 5 1+ 5 √ √ = = = =ϕ 1−5 2 (1 + 5)(1 − 5) und analog 1 + 1 ψ = ψ. Damit ergibt sich fn+1 = ϕn+1 − ψ n+1 √ , 5 also A(n + 1). Insgesamt gilt A(n) für alle n ∈ N0 . Wir haben bisher noch nicht diskutiert, warum die vollständige Induktion überhaupt funktioniert. Unsere intuitive Vorstellung von den natürlich Zahlen ist die folgende: Wenn wir bei 1 anfangen zu zählen und dann in Einerschritten immer weiter zählen, so erreichen wir schließlich jede natürliche Zahl. Oder anders gesagt, die natürlichen Zahlen sind genau die Zahlen, die wir erreichen können, wenn wir bei 1 anfangen zu zählen und dann in Einerschritten immer weiter zählen. Ist A(n) eine Aussageform und gelten A(1) und ∀n ∈ N(A(n) ⇒ A(n + 1)), so können wir die Menge S = {n ∈ N : A(n) ist wahr} betrachten und stellen Folgendes fest: (1) 1 ∈ S (2) n ∈ S ⇒ n + 1 ∈ S Eine Menge mit den Eigenschaften (1) und (2) nennen wir induktiv. Wir können also bei 1 anfangen, in Einerschritten zu zählen, ohne jemals die Menge S zu verlassen. Nach unserer Intuition über die natürlichen Zahlen erreichen wir dabei alle natürlichen Zahlen. Also gilt N ⊆ S. Andererseits ist S ⊆ N. Es folgt S = N. Also gilt A(n) für alle n ∈ N. Die folgende Axiome präzisieren unsere Intuition über die natürlichen Zahlen. Hierbei steht n0 für den Nachfolger von n in den natürlichen Zahlen, also für n + 1. Definition 2.11. Die folgenden Axiome sind die Peano-Axiome für die natürlichen Zahlen. (1) 1 ∈ N (2) n ∈ N ⇒ n0 ∈ N (3) n ∈ N ⇒ n0 6= 1 (4) m, n ∈ N ⇒ (m0 = n0 ⇒ m = n) (5) (1 ∈ S ∧ ∀n ∈ N(n ∈ S ⇒ n0 ∈ S)) ⇒ N ⊆ S Das Axiom (5) ist das Induktionsaxiom, welches garantiert, dass wir Sätze mittels vollständiger Induktion beweisen können. Normalsprachlich lauten die Axiome wie folgt: (1) 1 ist eine natürliche Zahl. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 25 (2) Der Nachfolger einer natürlichen Zahl ist wieder eine natürliche Zahl. (3) 1 ist nicht Nachfolger einer natürlichen Zahl. (4) Die Nachfolgerfunktion n 7→ n0 ist injektiv. (5) Jede induktive Menge enthält alle natürlichen Zahlen. Auf Basis dieser Axiome kann man nun die bekannte Operationen + und · sowie die Relation ≤ auf N rekursiv definieren, was wir aber nicht im einzelnen durchführen wollen. Vollständige Induktion liefert uns interessante Informationen über die Menge der natürlichen Zahlen. Satz 2.12. Jede nichtleere Menge natürlicher Zahlen hat ein kleinstes Element. Beweis. Sei A eine nichtleere Menge natürlicher Zahlen, also A ⊆ N und A 6= ∅. Falls A kein kleinstes Element hat, so betrachte B = N \ A. Wir zeigen mittels vollständiger Induktion, dass B alle natürlichen Zahlen enthält und A damit leer ist, im Widerspruch zur Annahme. Sei P (n) die Aussageform n ∈ B. 1 ist das kleinste Element von N. Also gilt 1 6∈ A, da sonst 1 das kleinste Element von A wäre. Damit ist 1 ∈ B. Das zeigt P (1). Das ist der Induktionsanfang. Nun nehmen wir an, dass die Zahlen 1, . . . , n Elemente von B sind, dass also P (1), . . . , P (n) gelten. Die Zahl n0 kann nicht in A liegen, da n0 dann das kleinste Element von A wäre. Also liegt n0 in B. Das zeigt P (n0 ). Das ist der Induktionsschritt. Damit gilt N ⊆ B. Also ist A = ∅, im Widerspruch zu A 6= ∅. Damit hat A ein kleinstes Element. Wir haben hier die Induktion mit mehreren Vorgängern durchgeführt. Um zu sehen, dass das wirklich dasselbe ist, wie die Standardform der Induktion, kann man zum Beispiel anstelle der Aussageform P (n) die folgende Aussageform Q(n) betrachten: ∀k ∈ N(k ≤ n ⇒ k ∈ B) Dann kann man an Stelle der Induktionsannahme P (1) ∧ · · · ∧ P (n) einfach Q(n) schreiben. Man beweist dann im Induktionsschritt nicht (P (1)∧· · ·∧P (n)) ⇒ P (n0 ), sondern Q(n) ⇒ Q(n0 ). Der Beweis selbst bleibt aber eigentlich derselbe. Wir haben dann gezeigt, dass Q(n) für alle n ∈ N gilt, und zwar mit der Standardform der Induktion. Aber (∀n ∈ N)Q(n) ist natürlich äquivalent zu (∀n ∈ N)P (n). 2.3. Ganze und rationale Zahlen. Im Abschnitt über Mengen hatten wir bereits die Menge Z = {. . . , −1, 0, 1, 2, . . . } der ganzen Zahlen eingeführt. Die Menge Q der rationalen Zahlen ist die Menge aller Brüche m n mit m, n ∈ Z und n 6= 0. 26 STEFAN GESCHKE Da wir jede ganzen Zahl m mit dem Bruch m 1 identifzieren können, fassen wir Z als eine Teilmenge von Q auf. Wir erinnern uns kurz daran, wie man Brüche addiert und multipliziert: m m0 m · n0 + m 0 n + 0 = n n n · n0 0 m · m0 m m · 0 = n n n · n0 Die folgenden Rechenregeln für rationale Zahlen a, b, c setzen wir als bekannt voraus: (K1) Assoziativgesetze • a + (b + c) = (a + b) + c • a · (b · c) = (a · b) · c (K2) Kommutativgesetze • a+b=b+a • a·b=b·a (K3) Distributivgesetz • a · (b + c) = a · b + a · c (K4) Existenz neutraler Elemente bezüglich der Addition und der Multiplikation • a+0=a • 1·a=a (K5) Existenz inverser Elemente bezüglich der Addition und der Multiplikation • Es gibt ein Element −a mit a + (−a) = 0. • Falls a 6= 0 ist, so gibt es ein Element a−1 mit a · a−1 = 1. Da diese Rechengesetze so wichtig sind, bekommen Strukturen, in denen diese Gesetze erfüllt sind, einen eigenen Namen. Definition 2.13. Sei K eine Menge, 0 und 1 zwei verschiedene Elemente von K und + : K × K → K und · : K × K → K Abbildungen. Dann heißt K zusammen mit 0, 1, + und · ein Körper, falls die Axiome (K1)–(K5) erfüllt sind. Wie oben schon bemerkt, erfüllt Q mit der üblichen Addition und Multiplikation und mit den bekannten Konstanten 0 und 1 die Körperaxiome (K1)–(K5). Die ganzen Zahlen Z mit den üblichen Rechenoperationen erfüllen zwar (K1)–(K4), aber sie bilden keinen Körper, da zum Beispiel 2 in Z kein multiplikatives Inverses besitzt: Es gibt keine ganze Zahl n mit 2 · n = 1. Neben der Struktur eines Körpers, haben die rationalen Zahlen noch eine weitere wichtige Eigenschaft. Sie werden durch die Kleiner-Beziehung < angeordnet. Für je zwei verschiedene rationale Zahlen a und b gilt entweder a < b („a kleiner b“) oder a > b („a größer b“). Es gelten folgende Regeln: (1) a < b ∧ b < c ⇒ a < c (2) a < b ⇒ a + c < b + c (3) a < b ⇒ a · c < b · c, falls c > 0. (4) a < b ⇒ a · c > b · c, falls c < 0. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 27 Wir schreiben a ≤ b für (a < b ∨ a = b) und lesen ≤ als „kleiner-gleich“ und ≥ als „größer-gleich“. Für ≤ gelten ähnliche Regeln wie für <. (1) a ≤ b ∧ b ≤ c ⇒ a ≤ c (2) a ≤ b ⇒ a + c ≤ b + c (3) a ≤ b ⇒ a · c ≤ b · c, falls c ≥ 0. (4) a ≤ b ⇒ a · c ≥ b · c, falls c ≤ 0. Die ganzen und die rationalen Zahlen lassen sich gut auf dem Zahlenstrahl veranschaulichen. Wir stellen uns vor, dass die Gerade horizontal von links nach rechts verläuft. Nun markieren wir einen Punkt auf der Geraden und nennen ihn 0. Rechts von der 0 markieren wir einen weiteren Punkt und nennen ihn 1. Ist nun n eine natürlich Zahl, so entspricht n dem Punkt auf der Geraden, den man erreicht, wenn man von der 0 ausgehend n-mal die Strecke von der 0 zur 1 abträgt. Sind m und n natürliche Zahlen, so erhält den Punkte auf der Geraden, der m n entspricht, in dem man die Strecke von 0 nach m in n gleiche Teile unterteilt. Damit finden wir alle rationalen Zahlen > 0 auf der Zahlengeraden. Für natürliche Zahlen m und n finden wir den Punkt auf der Geraden, der − m n entspricht, indem man von 0 ausgehend nach links die Länge der Strecke von 0 bis -1 − 12 0 1 1 2 3 2 3 Offenbar kann man zum Beispiel von 0 nach 1 halbiert, um 1 2 3 2 1 3 2 m n abträgt. 2 3 auch erreichen, indem man zuerst die Strecke zu erhalten, und dann dreimal von 0 ausgehend nach rechts die Länge der Strecke von 0 bis 1 2 abträgt. Die rationalen Zahlen liegen dicht auf der Zahlengeraden. D.h., zwischen je zwei verschiedenen Punkten auf der Geraden liegt eine rationale Zahl. Wir werden jedoch gleich sehen, dass es Punkte auf der Geraden gibt, die keiner rationalen Zahlen entsprechen, dass die rationalen Zahlen also Lücken haben. √ 2 bezeichnen wir die positive Lösung der Glei√ chung x = 2. Es stellt sich heraus, dass 2 keine rationale Zahl ist. 2.4. Die reellen Zahlen. Mit 2 Bevor wir das beweisen können, müssen stellen wir Folgendes fest. Lemma 2.14. Sei m eine ganze Zahl. Falls m2 gerade ist, so ist auch m selbst gerade. Beweis. Wir beweisen die Kontraposition dieser Aussage: Wenn m ungerade ist, so ist auch m2 ungerade. Sei m ungerade. Dann ist m − 1 gerade. Also gibt es eine ganze Zahl k mit 2k = m − 1. Es gilt also m = 2k + 1. Nun ist m2 = (2k + 1)2 = 4k 2 + 4k + 1. Da 4k 2 + 4k gerade ist, ist 4k 2 + 4k + 1 ungerade. Also ist m2 ungerade. Satz 2.15. Es gibt keine rationale Zahl a mit a2 = 2. 28 STEFAN GESCHKE Beweis. Der Beweis dieses Satzes ist ein sogenannter Widerspruchsbeweis. Wir nehmen dazu an, dass es eine rationale Zahl a mit a2 = 2 gibt und folgern daraus eine offensichtlich falsche Aussage. Sei A die Aussage „ es gibt eine rationale Zahl a mit a2 = 2“ und B eine falsche Aussage. Wenn wir A ⇒ B zeigen können und B falsch ist, so muss A falsch sein, was wir leicht der Wahrheitstafel für → entnehmen können. Wir haben also ¬A bewiesen. Zum eigentlichen Beweis. Wie eben schon angekündigt, nehmen wir an, dass es eine rationale Zahl a mit a2 = 2 gibt. Die Zahl a lässt sich als Bruch m n schreiben, 2 wobei m und n ganze Zahlen sind und n 6= 0 gilt. Gilt a = 2, so gilt auch (−a)2 = 2. Daher können wir annehmen, dass a positiv ist und dass m und n natürliche Zahlen sind. Schließlich können wir noch annehmen, dass der Bruch 2 m und n keine gemeinsame Teiler > 1 haben. Es gilt a = m n gekürzt ist, dass also m2 n2 = 2. Multiplikation mit n2 liefert m2 = 2n2 . Also ist m2 durch 2 teilbar. Nach Lemma 2.14 ist damit auch m durch 2 teilbar. Wenn aber m von 2 geteilt wird, so wird m2 von 4 geteilt. Wegen m2 = 2n2 wird dann aber auch n2 von 2 geteilt. Wie oben für m ergibt sich, dass n gerade ist. Das heißt aber, dass man den Bruch m n durch 2 kürzen kann, ein Widerspruch zur Annahme, dass der Bruch bereits gekürzt ist. m Die Aussage „der Bruch m n ist gekürzt und der Bruch n lässt sich kürzen“ ist offenbar falsch. Also haben wir aus der Aussage „es gibt eine rationale Zahl a mit a2 = 2“ eine falsche Aussage abgeleitet. Damit ist diese Aussage selbst falsch und es gilt stattdessen, was wir zeigen wollten: Es gibt keine rationale Zahl a mit a2 = 2. Trotzdem finden wir einen Punkt auf der Zahlengeraden, der der Zahl √ 2 ent- spricht, nämlich den eindeutig bestimmten Punkt, der rechts von alle Zahlen in der Menge A := {x ∈ Q : x < 0 ∨ x2 < 2} und links von alle Zahlen in der Menge B := {x ∈ Q : x > 0 ∧ x2 > 2} liegt. A 0 √ B 1 4 3 √ 2 3 2 Die Existenz eines Punktes auf der Zahlengeraden, dessen Abstand von 0 genau 2 ist, sieht man wie folgt: Auf der Strecke von 0 nach 1 errichte man ein Quadrat mit der Kantenlänge 1. Die Diagonale dieses Quadrats hat nach dem Satz von √ Pythagoras die Länge 2. Wenn wir von 0 ausgehend nach rechts die Länge der Diagonalen des Quadrats auf der Zahlengeraden abtragen, so erreichen wir den √ Punkt, der 2 entspricht. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK √ 0 29 2 1 √ 2 Es gibt viele Punkte auf der Zahlengeraden, denen keine rationale Zahl entspricht. Wir können Q aber so zur Menge R der reellen Zahlen erweitern, dass jedem Punkt auf der Zahlengeraden eine reelle Zahl entspricht und umgekehrt jede reelle Zahl einem Punkt auf der Zahlengeraden. Wir können reelle Zahlen addieren und multiplizieren, wobei wir bei Einschränkung dieser Operationen auf Q genau die bekannten Operationen auf den rationalen Zahlen erhalten. Mit diesen Operationen bilden die reellen Zahlen einen Körper, wie die rationalen Zahlen auch. Die Kleiner-Beziehung < zwischen reellen Zahlen ist so erklärt, dass für reelle Zahlen a und b die Beziehung a < b genau dann gilt, wenn der Punkt auf der Zahlengeraden, der a entspricht, links von dem Punkt liegt, der b entspricht. Es gelten dieselben Rechenregeln für < auf R wie auf Q. Es gibt verschiedene Möglichkeiten, die reellen Zahlen ausgehend von den rationalen Zahlen zu konstruieren. Wir werden allerdings nicht näher auf die Konstruktion eingehen. Alle reellen Zahlen lassen sich als (eventuell unendliche) Dezimalbrüche darstellen. Die rationalen Zahlen entsprechen den Dezimalbrüchen, die entweder nach endlich vielen Nachkommastellen abbrechen oder periodisch werden. Die reellen Zahlen, die nicht rational sind, heißen irrational. Beispiele für irra√ √ √ tionale Zahlen sind 2, 3, e, π und 3 5. 2.5. Teilbarkeit, Primzahlen und der euklidische Algorithmus. Wir haben bereits Teilbarkeit durch 2 betrachtet. Dennoch wiederholen wir die formale Definition von Teilbarkeit. Definition 2.16. Eine ganze Zahl a ist ein Teiler einer ganzen Zahl b, falls eine ganze Zahl c mit b = a · c existiert. Wenn a ein Teiler von b ist, so nennt man b ein Vielfaches von a. Ist a ein Teiler von b, so schreiben wir a | b. Ist a kein Teiler von b, so schreiben wir a 6 | b. Man beachte, dass jede ganze Zahl a die 0 teilt. Es ist nämlich 0 = 0·a. Umgekehrt teilt 0 nur sich selber und keine andere ganze Zahl. Ebenso beachte man, dass für 30 STEFAN GESCHKE alle ganzen Zahlen a und b Folgendes gilt: a | b ⇔ −a | b ⇔ −a | − b ⇔ a | − b Damit kann man die Teilbarkeitsbeziehung zwischen ganzen Zahlen immer auf die Teilbarkeitsbeziehung zwischen natürlichen Zahlen zurückführen. Satz 2.17. Die Teilbarkeitsbeziehung | hat folgende Eigenschaften: (1) Gilt a | b und b | c, so gilt auch a | c. (2) Aus a1 | b1 und a2 | b2 folgt a1 · a2 | b1 · b2 . (3) Aus a · b | a · c und a 6= 0 folgt b | c. (4) Aus a | b1 und a | b2 folgt für alle c1 , c2 ∈ Z die Beziehung a | b1 · c1 + b2 · c2 . Beweis. (1)–(4) lassen sich leicht nachrechnen. Zum Beispiel kann man (4) wie folgt nachrechnen: Wegen a | b1 und a | b2 existieren d1 , d2 ∈ Z mit b1 = a · d1 und b2 = a · d2 . Für alle c1 , c2 ∈ Z gilt nun b1 · c1 + b2 · c2 = a · d1 · c1 + a · d2 · c2 = a · (d1 · c1 + d2 · c2 ). Das zeigt a | b1 · c1 + b2 · c2 . Definition 2.18. Eine natürliche Zahl n ≥ 2 heißt Primzahl, wenn n nur durch −1, 1, n und −n teilbar ist. Die Zahlen ±1 und ±n nennt man die trivialen Teiler von n. Satz 2.19 (Euklid). Es gibt unendlich viele Primzahlen. Beweis. Wir führen wieder einen Widerspruchsbeweis. Angenommen, es gibt nur endlich viele Primzahlen p1 , . . . , pn . Betrachte das Produkt a = p1 · . . . · pn . Sei p die kleinste natürliche Zahl ≥ 2, die a + 1 teilt. Dann ist p eine Primzahl. Hat nämlich p einen Teiler q, der von −1, 1, p und −p verschieden ist, so ist q oder −q eine natürliche Zahl ≥ 2, die a + 1 teilt und kleiner als p ist. Das widerspricht aber der Wahl von p als kleinsten Teiler von a + 1 mit p ≥ 2. Da p eine Primzahl ist, existiert ein i ∈ {1, . . . , n} mit p = pi . Damit teilt p sowohl a als auch a + 1. Also teilt p auch 1 = (a + 1) − a. Das widerspricht aber der Wahl von p als einer ganzen Zahl ≥ 2. Ohne Beweis geben wir einen wichtigen Satz über die Darstellung natürlicher Zahlen als Produkte von Primzahlen an. αk 1 Satz 2.20. Jede natürliche Zahl n ≥ 2 ist ein Produkt der Form pα 1 · . . . ·pk wobei k eine natürliche Zahl ≥ 1 ist, p1 , . . . , pk paarweise verschiedene Primzahlen sind und αk 1 α1 , . . . , αk natürliche Zahlen sind. Dabei ist die Produktdarstellung n = pα 1 · . . . ·pk bis auf die Reihenfolge der Faktoren eindeutig. Zum Beispiel ist 12 = 22 · 3 und 500 = 22 · 53 . Eine wichtige Folgerung aus diesem Satz ist die Folgende: MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 31 Korollar 2.21. Teilt eine Primzahl p ein Produkt a · b natürlicher Zahlen, so teilt p eine der beiden Zahlen a und b. αn 1 Beweis. Wir schreiben a und b als Produkte von Primzahlen, a = pα 1 · . . . · pn βm und b = q1β1 · . . . · qm . Dann ist β1 αn βm 1 a · b = pα 1 · . . . · pn · q1 · . . . · qm . Gilt p | a · b, so existiert eine natürliche Zahl c mit a · b = p · c. Schreibt man nun c als Produkt von Primzahlen, so erhält man eine Darstellung von a · b als Produkt von Primzahlen, in dem der Faktor p auftritt. Wegen der Eindeutigkeit der Darstellung von a · b als Produkt von Primzahlen ist der Faktor p ein Element der Menge {p1 , . . . , pn , q1 , . . . , qm }. Damit teilt p die Zahl a oder die Zahl b. Die Aussage dieses Korollars wird falsch, wenn man die Bedingung weglässt, dass p eine Primzahl ist. Zum Beispiel teilt 6 das Produkt 4 · 9, während 6 weder 4 noch 9 teilt. 2.6. Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches. Definition 2.22. Seien a und b natürliche Zahlen. Der größte gemeinsame Teiler von a und b ist die größte natürliche Zahl c, die sowohl a als auch b teilt. Der größte gemeinsame Teiler von a und b wird mit ggT(a, b) bezeichnet. Das kleinste gemeinsame Vielfache von a und b ist die kleinste natürliche Zahl, die sowohl von a als auch von b geteilt wird. Das kleinste gemeinsame Vielfache von a und b wird mit kgV(a, b) bezeichnet. Der größte gemeinsame Teiler zweier natürlicher Zahlen a und b existiert, da es einerseits nur endliche viele gemeinsame Teiler von a und b gibt und andererseits 1 ein gemeinsamer Teiler von a und b ist. Das kleinste gemeinsame Vielfache von a und b existiert, da es mindestens ein gemeinsames Vielfaches gibt, nämlich a · b, und jede nichtleere Menge natürlicher Zahlen ein kleinstes Element hat. Ist die Zerlegung von a und b in Primfaktoren gegeben, so können wir ggT(a, b) und kgV(a, b) leicht berechnen. Sei p eine Primzahl, c ein gemeinsamer Teiler von a und b und α ∈ N, so dass pα | c gilt. Dann gilt auch pα | a und pα | b. Damit können wir den größten gemeinsamen Teiler von a und b wie folgt bestimmen: In der Primfaktorzerlegung des größten gemeinsamen Teilers von a und b treten für jede Primzahl p die höchsten Potenzen pα auf, die sowohl a als auch b teilen. Genauer: Sei {p1 , . . . , pn } die Menge der Primzahlen, die sowohl a als auch b teilen. i Für jedes i ∈ {1, . . . , n} sei αi die größte natürliche Zahl, so dass pα i sowohl a als αn 1 auch b teilt. Dann ist pα 1 · . . . · pn der größte gemeinsame Teiler von a und b. Das kleinste gemeinsame Vielfache von a und b lässt sich auf ähnliche Weise finden. Ist nämlich c ein Vielfaches von a und von b, so gilt für jede Primzahl p und jede natürliche Zahl α: Wenn pα die Zahl a oder die Zahl b teilt, so teilt pα auch c. Sei nun {p1 , . . . , pn } die Menge der Primzahlen, die a oder b teilen. Für jedes 32 STEFAN GESCHKE α1 i i ∈ {1, . . . , n} sei αi ∈ N die größte natürliche Zahl, so dass pα i | a oder pi | b gilt. αn 1 Dann ist pα 1 · . . . · pn das kleinste gemeinsame Vielfache von a und b. Man beachte, dass man ggT(a, b) aus kgV(a, b) berechnen kann und umgekehrt. Es gilt nämlich die Beziehung ggT(a, b) · kgV(a, b) = a · b. Beispiel 2.23. (1) Sei a = 60 und b = 70. Dann ist a = 22 · 3 · 5 and b = 2 · 5 · 7. Es gilt ggT(a, b) = 2 · 5 = 10 und kgV(a, b) = 22 · 3 · 5 · 7 = 420. (2) Sei a = 24 · 3 · 52 · 7 · 134 und b = 22 · 5 · 72 · 133 · 17 · 23. Dann ist ggT(a, b) = 22 · 5 · 7 · 133 und kgV(a, b) = 24 · 3 · 52 · 72 · 134 · 17 · 23. Die Zerlegung ganzer Zahlen in ihre Primfaktoren dauert bei Zahlen mit sehr großen Primfaktoren unter Umständen sehr lange. Diese Tatsache ist zum Beispiel wichtig für das weit verbreitete Verschlüsselungsverfahren RSA. Es gibt aber einen schnellen Algorithmus, mit dem den größten gemeinsamen Teiler zweier natürlicher Zahlen bestimmen kann, der auf Euklid zurückgeht und damit seit über 2000 Jahren bekannt ist. Der Algorithmus benutzt die Division mit Rest. Satz 2.24. Für alle m ∈ Z und alle n ∈ N gibt es eindeutig bestimmte Zahlen q und r mit 0 ≤ r < n und m = q · n + r. In der Darstellung m = q · n + r nennt man q den Quotienten von m und n und r den Rest. Die Funktion, die m und n den Quotienten q zuordnet wird mit div bezeichnet. Die Funktion, die m und n den Rest r zuordnet heißt mod. Es gilt also für alle m ∈ Z und alle n ∈ N die Gleichung m = (m div n) · n + (m mod n). Beispiel 2.25. (1) Sei m = 27 und n = 12. Dann ist 27 = 2 · 12 + 3. Der Quotient ist also 2 und der Rest 3. (2) Sei m = −10 und n = 3. Dann ist −10 = −4 · 3 + 2. Wir haben also q = −4 und r = 2. Es gilt zwar auch −10 = −3 · 3 − 1, aber die Zahlen q und r werden bei der Division mit Rest immer so gewählt, dass 0 ≤ r < n gilt. Wir stellen Folgendes fest: Ist a ein gemeinsamer Teiler von m und n und gilt m = q · n + r, so ist a auch ein Teiler von r = m − q · n. Umgekehrt ist jeder gemeinsame Teiler von n und r auch ein Teiler von m. Es folgt, dass die beiden Zahlen m und n dieselben gemeinsamen Teiler haben wie die beiden Zahlen n und MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 33 r. Für jede natürliche Zahl n ist ggT(n, 0) = n. Das erklärt, warum der folgende Algorithmus zur Berechnung des größten gemeinsamen Teilers zweier natürlicher Zahlen funktioniert. Der euklidische Algorithmus. Seien m, n ∈ N0 mit m > n. (1) Falls n = 0 ist, so gib m als den größten gemeinsamen Teiler aus. (2) Falls n 6= 0 ist, so bestimme ganze Zahlen q und r mit 0 ≤ r < n und m = q · n + r. (3) Setze m := n und n := r gehe zurück zu (1). Nach unserer Vorbemerkung haben m und n in jedem Durchlauf der Schleife in diesem Algorithmus denselben größten gemeinsamen Teiler. Auf der anderen Seite wird n in jedem Durchlauf der Schleife echt kleiner. Also ist nach endlich vielen Schritten n = 0 und der Algorithmus terminiert. Beispiel 2.26. (1) Wir berechnen wieder den größten gemeinsamen Teiler von 70 und 60, aber diesmal mit dem euklidischen Algorithmus. Setze zunächst m = 70 und n = 60. Wegen n 6= 0, führen wir eine Division mit Rest durch. Es gilt 70 = 1 · 60 + 10. Wir setzen m := 60 und n := 10. Immer noch gilt n 6= 0. Division mit Rest liefert 60 = 6 · 10 + 0. Wir setzen m := 10 und n := 0. Nun ist n = 0 und der größte gemeinsame Teiler von 10 und 0 ist 10. Die ursprünglichen Zahlen 70 und 60 haben denselben größten gemeinsamen Teiler und daher gilt ggT(70, 60) = 10. (2) Sei m = 816 und n = 294. Die Rechnung lautet nun wie folgt: 816 = 2 · 294 + 228 294 = 1 · 228 + 66 228 = 3 · 66 + 30 66 = 2 · 30 + 6 30 = 5·6+0 Damit ergibt sich ggT(816, 294) = 6. 2.7. Modulare Arithmetik. Definition 2.27. Es sei m eine natürliche Zahl. Zwei ganze Zahlen a und b sind kongruent modulo m, falls a und b denselben Rest bei Division durch m haben. Ist a kongruent zu b modulo m, so schreiben wir a ≡ b (mod m). Wir stellen kurz fest, dass a ≡ b (mod m) genau dann gilt, wenn a − b durch m teilbar ist. Ist a ≡ b (mod m), so existieren ganze Zahlen qa , qb und r mit a = qa ·m+ r, b = qb ·m+r und 0 ≤ r < m. Es gilt a−b = (qa ·m+r)−(qb ·m+r) = (qa −qb )·m. Also ist a − b durch m teilbar. Sei umgekehrt a − b durch m teilbar. Es gibt ganze Zahlen qa , qb , ra und rb mit a = qa · m + ra , b = qb · m + rb , 0 ≤ ra < m und 0 ≤ rb < m. Es gilt a − b = (qa · m + ra ) − (qb · m + rb ) = (qa − qb ) · m + (ra − rb ). 34 STEFAN GESCHKE Da a − b durch m teilbar ist, ist auch ra − rb durch m teilbar. Wegen 0 ≤ ra , rb < m gilt −m < ra − rb < m. Wenn aber eine ganze Zahl, die echt größer als −m und echt kleiner als m ist, durch m teilbar ist, so kann diese Zahl nur 0 sein. Damit ist ra − rb = 0. Also gilt a ≡ b (mod m). Beispiel 2.28. (1) 23 ≡ 8 (mod 5), da 23 − 8 = 15 durch 5 teilbar ist. Außer- dem ist 23 = 4 · 5 + 3 und 8 = 1 · 5 + 3, also 23 mod 5 = 3 = 8 mod 5. (2) −7 ≡ 2 (mod 3), da −7 = −3 · 3 + 2 und 2 = 0 · 3 + 2, also −7 mod 3 = 2 = 2 mod 3. (3) 8227 6≡ 11 (mod 3), da 8227 − 11 = 8216 nicht durch 3 teilbar ist. Wir betrachten die Menge aller ganzen Zahlen, die modulo m kongruent zu einer festen Zahl sind. Beispiel 2.29. Sei m = 3. Die Menge der Zahlen, deren Rest bei Division durch 3 genau 0 ist, ist die Menge K0 = {. . . , −6, −3, 0, 3, 6, 9, . . . }. Die Menge der Zahlen, bei denen der Rest genau 1 ist, ist K1 = {. . . , −5, −2, 1, 4, 7, 10, . . . }. Für den Rest 2 erhalten wir die Menge K2 = {. . . , −4, −1, 2, 5, 8, 11, . . . }. Definition 2.30. Für jede natürliche Zahl m und jede ganze Zahl a heißt die Menge [a]m := {b ∈ Z : b mod m = a mod m} die Restklasse von a modulo m. Wir stellen fest, dass es für jede natürliche Zahl m genau m verschiedene Restklassen modulo m gibt, nämlich [0]m , . . . , [m−1]m . Diese Restklassen sind paarweise disjunkt und es gilt Z = [0]m ∪ · · · ∪ [m − 1]m . Folgender Satz sammelt die wichtigsten Regeln für das Rechnen mit Kongruenzen. Satz 2.31. Für alle m ∈ N und alle a, b, c, d ∈ Z gilt: (1) a ≡ a (mod m) (2) a ≡ b (mod m) ⇒ b ≡ a (mod m) (3) a ≡ b (mod m) ∧ b ≡ c (mod m) ⇒ a ≡ c (mod m) (4) a ≡ b (mod m) ⇒ −a ≡ −b (mod m) (5) a ≡ b (mod m) ∧ c ≡ d (mod m) ⇒ a + c ≡ b + d (mod m) (6) Gilt ggT(c, m) = 1, so folgt aus c · a ≡ c · b (mod m) die Kongruenz a ≡ b (mod m). Diese Rechenregeln kann man direkt mit Hilfe der Definition von a ≡ b (mod m) nachrechnen Beispiel 2.32. In Satz 2.31 (6) muss man wirklich ggT(c, m) = 1 voraussetzen. Zum Beispiel gilt 8 · 3 ≡ 8 · 6 (mod 6) aber nicht 3 ≡ 6 (mod 6). MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 35 Nützliche Operationen auf den reellen Zahlen, mit deren Hilfe man zum Beispiel auch die Funktionen div und mod berechnen kann, sind das Auf- und Abrunden. Definition 2.33. Für eine reelle Zahl r ist dre die kleinste ganze Zahl ≥ r. Analog ist brc die größte ganze Zahl ≤ r. Man nennt d b e die obere Gaußklammer und c die untere Gaußklammer. Beispiel 2.34. Es gilt d3.14e √ d 2e = 4, 3, 2, b3.14c √ b 2c = = = 1, d5e = 5, b5c = 5, d−1.2e = -1, b−1.2c = -2. m Für alle m ∈ Z und n ∈ N gilt m div n = b m n c sowie m mod n = m − n · b n c. 36 STEFAN GESCHKE 3. Elementare Kombinatorik Definition 3.1. Für eine endliche Menge M sei |M | die Anzahl der Elemente von M. (1) (Additionsregel) M sei eine endliche Menge und M1 , . . . , Mn Satz 3.2. seien disjunkte Teilmengen von M mit M = M1 ∪ · · · ∪ Mn . Dann gilt |M | = n X |Mi |. i=1 (2) (Multiplikationsregel) Seien A1 , . . . , An endliche Mengen. Dann gilt |A1 × · · · × An | = |A1 | · . . . · |An | = n Y |Ai |. i=1 (3) (Gleichheitsregel) Seien A und B zwei endliche Mengen. Dann gilt |A| = |B| genau dann, wenn es eine Bijektion f : A → B gibt. Eine typische Anwendung der Multiplikationsregel ist die folgende: Für ein n ∈ N betrachten wir n Kästchen K1 , . . . , Kn . ... K1 K2 ... Kn In das erste Kästchen K1 legen wir ein Objekt a1 , in das zweite Kästchen K2 ein Objekt a2 und so weiter. Wenn wir k1 Möglichkeiten haben, das erste Kästchen K1 zu belegen, k2 Möglichkeiten, das zweite Kästchen K2 zu belegen und so weiter, dann gibt es insgesamt k1 · k2 · . . . · kn Möglichkeiten, die n Kästchen zu belegen. Beispiel 3.3. (1) Eine Kennziffer bestehe aus drei Buchstaben und vier dar- auffolgenden Ziffern, wie F AB3447 oder ARR5510. Wieviele derartige Kennziffern gibt es? Nach der Multiplikationsregel gibt es 26 · 26 · 26 · 10 · 10 · 10 · 10 = 263 · 104 = 175760000 Kennziffern. (2) Wieviele Kennziffern wie in (1) gibt es, in denen kein Buchstabe und keine Ziffer doppelt vorkommen? Nach der Multiplikationsregeln ergibt sich 26 · 25 · 24 · 10 · 9 · 8 · 7 = 78624000. (3) Gegeben seien 15 unterschiedliche Bücher, von denen 8 auf Englisch, 3 auf Deutsch und 4 auf Russisch sind. Auf wie viele Arten kann man zwei Bücher in verschiedenen Sprachen auswählen? Nach Additions- und Multiplikationsregel ergibt sich 8 · 3 + 8 · 4 + 3 · 4 = 68. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 37 Wir diskutieren im Folgenden fünf grundlegende Fragestellungen, die wir Grundaufgaben nennen. Vorher definieren wir noch Tupel der Länge 0. Definition 3.4. Für eine beliebige Menge M sei ∅ das eindeutig bestimmte 0-Tupel von Elementen von M . Mit anderen Worten, M 0 = {∅}. Grundaufgabe 1. Es seien n, k ∈ N0 . Wie viele k-Tupel von Elementen einer n-elementigen Menge gibt es? Antwort: nk Diese Antwort ergibt sich sofort mit Hilfe der Multiplikationsregel. Beispiel 3.5. (1) Sei M = {a, b}. Dann gibt es 23 = 8 3-Tupel von Elementen von M . Es gilt M 3 = {(a, a, a), (a, a, b), (a, b, a), (a, b, b), (b, a, a), (b, a, b), (b, b, a), (b, b, b)}. (2) Sei M = {a, b, c, d, e, f, g}. Dann gibt es 73 = 343 3-Tupel von Elementen von M . Grundaufgabe 2. Es seien n, k ∈ N0 . Wieviele k-Tupel von Elementen einer nelementigen Menge gibt es, in denen kein Element doppelt vorkommt? Antwort: Falls k ≥ 1 ist, so gibt es nach der Multiplikationsregel n · (n − 1) · . . . · (n − (k − 1)) k-Tupel von Elementen einer n-elementigen Mengen, in denen kein Element doppelt vorkommt. Ist k = 0, so gibt es genau ein k-Tupel. Diese Antwort legt folgende Definition nahe: Definition 3.6. Für n, k ∈ N0 sei n · (n − 1) · . . . · (n − k + 1), falls k ≥ 1 und nk := 1, sonst. Beispiel 3.7. (1) 70 = 1 (2) 71 = 7 (3) 72 = 7 · 6 = 42 (4) 73 = 7 · 6 · 5 = 210 Beispiel 3.8. Sei M = {a, b, c, d, e, f, g}. Dann gibt es 73 = 210 3-Tupel von Elementen von M , in denen kein Element doppelt vorkommt. Definition 3.9. Sei M eine Menge. Eine Permutation von M ist eine Bijektion π : M → M. Beispiel 3.10. Sei M = {1, 2, 3}. Wir definieren π : M → M durch π(1) = 3, π(2) = 1 und π(3) = 2. Dann ist π eine Permutation auf M . 38 STEFAN GESCHKE Ist M eine endliche Menge {m1 , . . . , mn }, wobei wir annehmen, dass die mi paarweise verschieden sind, so kann man eine Permutation π : M → M in der Form m1 m2 ... π(m1 ) π(m2 ) . . . mn ! π(mn ) darstellen. In dieser Schreibweise lautet die Permutation aus Beispiel 3.10 ! 1 2 3 π= . 3 1 2 Aus der Grundaufgabe 2 ergibt sich, dass die Anzahl der Permutationen einer n-elementigen Menge genau nn = n · (n − 1) · . . . · 1 ist. Anstelle von nn schreibt man üblicher Weise n! (gelesen „n Fakultät“). Beispiel 3.11. 0! = 00 = 1, 1! = 11 = 1, 2! = 22 = 2 · 1 = 2, 10! = 1010 = 10 · 9 · . . . · 2 · 1 = 3628800. (1) Sei M = {1, 2, 3}. Dann gibt es genau 3! = 3 · 2 · 1 = 6 Beispiel 3.12. Permutationen von M : ! 1 2 3 1 2 1 3 1 2 ! 3 1 2 3 2 1 3 1 2 3 3 1 2 1 3 2 3 ! 3 1 2 2 ! 3 2 1 2 3 1 ! ! (2) Sei M = {a, b, c, d, e, f, g}. Dann gibt es 7! = 5040 Permutationen von M . Grundaufgabe 3. Es sei n ≥ k ≥ 0. Wieviele k-elementige Teilmengen einer n-elementigen Menge gibt es? Antwort: Es gibt nk k! k-elementige Teilmengen einer n-elementigen Menge. Das kann man wie folgt sehen: Nach Grundaufgabe 2 wissen wir schon, dass es für eine n-elementige Menge M genau nk k-Tupel von Elementen von M gibt, in denen kein Element doppelt vorkommt. Für jedes k-Tupel (m1 , . . . , mk ) von Elementen von M können wir nun die k-elementige Menge {m1 , . . . , mk } betrachten. Jede k-elementige Teilmenge von M entsteht auf diese Weise. Für jede k-elementige Teilmenge Teilmenge {m1 , . . . , mk } von M gibt es genau k! k-Tupel, deren Komponenten genau die Elemente m1 , . . . , mk sind. Das liegt daran, dass jedes solche kTupel einer Permutation der Menge {m1 , . . . , mk } entspricht. Da also je k! k-Tupel k dieselbe k-elementige Teilmenge von M liefern, gibt es insgesamt nk! k-elementige Teilmengen von M . Für die Anzahl der k-elementigen Teilmengen einer n-elementigen Menge schreibt n k . Es gilt n nk nk · (n − k)! n! = = = . k k! k! · (n − k)! k! · (n − k)! man auch MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 39 Ist k ≥ 1, so können wir auch n n · (n − 1) · . . . · (n − k + 1) = k k · (k − 1) · . . . · 1 schreiben. Definition 3.13. Für n, k ∈ N0 mit n ≥ k ≥ 0 nennt man die Zahl n k = nk k! einen Binomialkoeffizienten. Beispiel 3.14. Sei M = {a, b, c, d, e, f, g}. Dann hat M genau 7 7·6·5 = = 35 3 3·2·1 3-elementige Teilmengen. Satz 3.15 (Rekursive Berechnung der Binomialkoeffizienten). Für alle n, k ∈ N mit n ≥ 2 und 1 ≤ k ≤ n − 1 gilt n n−1 n−1 = + . k k k−1 Beweis. Es gilt (n − 1)! n−1 n−1 (n − 1)! + + = k! · (n − 1 − k)! (k − 1)! · (n − k)! k k−1 (n − 1)! · (n − k) + k · (n − 1)! n! = = = k! · (n − k)! k! · (n − k)! n . k Wir ordnen die Binomialkoeffizienten wie folgt im Pascalschen Dreieck an: 0 0 1 1 1 0 2 0 3 0 . 2 2 3 1 .. 2 1 3 2 3 3 4 4 4 4 0 1 2 3 .. . 4 4 .. . Dabei ist jeder Binomialkoeffizient im Innern des (unendlichen) Dreiecks nach Satz 3.15 die Summe der beiden Binomialkoeffizienten, die sich rechts und links darüber befinden. Auf diese Weise lassen sich leicht die Werte der Binomialkoeffizienten berechnen: 40 STEFAN GESCHKE 1 1 1 1 1 . 3 4 1 1 2 1 3 6 5 10 1 4 10 1 5 1 .. . .. .. . Die Binomialkoeffizienten verdanken ihren Namen dem folgenden Satz: Satz 3.16 (Binomischer Lehrsatz). Seien a, b ∈ R. Dann gilt für alle n ∈ N0 n X n n−i i n n−1 n (a + b)n = a b = an + a b + ... + abn−1 + bn . i 1 n − 1 i=0 Pn Man beachte, dass der Ausdruck i=0 ni an−i bi auch für n = 0 definiert ist, n−1 n während an + n1 an−1 b + . . . + n−1 ab + bn nur für n ≥ 3 sinnvoll ist. Das zeigt den Vorteil der Schreibweise mit dem Summenzeichen gegenüber der unexakten Pünktchen-Schreibweise. Beweis. Wir beweisen den Satz durch Induktion über n. Induktionsanfang. Für n = 0 gilt (a + b)n = (a + b)0 = 1 = a0 b0 . Induktionsschritt. Wir nehmen an, dass (a + b)n = n X n i i=0 an−i bi für ein gewisses n ∈ N0 gilt (Induktionsannahme). Dann gilt I.A. (a + b)n+1 = (a + b)n · (a + b) = n X n i=0 i ! an−i bi · (a + b) ! ! n n X X n n−i i n n−i i = a b ·a+ a b ·b i i i=0 i=0 n n X n n+1−i i X n n−i i+1 = a b + a b i i i=0 i=0 n n+1 X n n+1−i i X n = a b + an+1−i bi i i − 1 i=0 i=1 n n+1 X X n + 1 n n n+1 n+1−i i n+1 =a + + a b +b = an+1−i bi , i i − 1 i i=1 i=0 wobei sich das letzte Gleichungszeichen aus Satz 3.15 ergibt. Beispiel 3.17. 2 (1) Für n = 2 ist Satz 3.16 die bekannte binomische Formel 2 (a + b) = a + 2ab + b2 . MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 41 (2) Für n = 3 gilt (a + b)3 = a3 + 3a2 b + 3ab2 + b3 . (3) Für n = 4 gilt (a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 . Wir bemerken noch zwei wichtige Regeln für Binomialkoeffizienten. Pn (1) Für alle n ∈ N0 gilt 2n = i=0 n . (2) Für alle n, k ∈ N0 mit n ≥ k gilt nk = n−k Korollar 3.18. n 1 . Beweis. (1) Nach Satz 3.16 gilt 2n = (1 + 1)n = n X n i=0 1 1n−i 1i = n X n i=0 1 . (2) Es gilt n n! n! n = = = . k k! · (n − k)! (n − k)! · (n − (n − k))! n−k Wir geben noch ein weiteres Argument für diese Gleichung an. Sei M eine nelementige Menge. Die Komplementbildung ist eine Bijektion zwischen der Menge der k-elementigen Teilmengen von M und der Menge der (n − k)-elementigen Teilmengen von M . Damit gibt es genausoviele k-elementige Teilmengen von M wie (n − k)-elementige. Nach Grundaufgabe 3 und der Gleichheitsregel gilt also n n k = n−k . Korollar 3.19. Sei n ∈ N0 und sei M eine n-elementige Menge. Dann hat P(M ) genau 2n Elemente. Wir geben zwei Beweise dieser wichtigen Tatsache an. Erster Beweis. Für k ∈ N0 mit 0 ≤ k ≤ n sei Pk die Menge der k-elementigen Teilmengen von M . Nach Grundaufgabe 3 wissen wir, dass |Pk | = nk gilt. Außerdem sind die Pk disjunkt und es gilt P(M ) = P0 ∪ · · · ∪ Pn . Nach der Additionsregel Pn und nach Korollar 3.18 ist damit |P(M )| = k=0 nk = 2n . Zweiter Beweis. Sei P := {f : f ist eine Funktion von M nach {0, 1}}. Da M genau n Elemente hat, können wir M als {m1 , . . . , mn } schreiben. Jeder Funktion f ∈ P ordnen wir nun das n-Tupel (f (m1 ), f (m2 ), . . . , f (mn )) zu. Das liefert eine Bijektion zwischen der Menge P und der Menge {0, 1}n . Nach der Gleichheitsregel ist also |P | = |{0, 1}n |. Nach Grundaufgabe 1 ist |{0, 1}n | = 2n . Damit ist |P | = 2n . Für jede Menge A ⊆ M betrachten wir nun die charakteristische Funktion χA : M → {0, 1} von A, die wie folgt definiert ist: Für jedes x ∈ M sei 0, falls x 6∈ A und χA (x) = 1, falls x ∈ A. 42 STEFAN GESCHKE Die Abbildung A 7→ χA ist eine Bijektion von P(M ) nach P . Wieder nach der Gleichheitsregel folgt daraus |P(M )| = |P | = 2n . Grundaufgabe 4. Sei n ∈ N und k ∈ N0 . Es seien n Gefäße K1 , . . . , Kn gegeben, auf die k ununterscheidbare Kugeln verteilt werden sollen. Wieviele Möglichkeiten gibt es, die Kugeln zu verteilen? Antwort. Es gibt n+k−1 k Möglichkeiten, die Kugeln zu verteilen. Das sehen wir wie folgt ein: Wir beschreiben die Verteilung der Kugeln durch eine Folge von Nullen und Einsen. Wir beginnen mit so vielen Nullen, wie Kugeln in P1 liegen. Dann schreiben wir eine Eins. Es folgen so viele Nullen, wie in P2 liegen. Darauf schreiben wir wieder eine Eins und so weiter. Sei zum Beispiel n = 4 und k = 5. Angenommen, in P1 liegen 2 Kugeln, in P2 eine, in P3 keine und in P4 die restlichen zwei. Das liefert die Folge 00101100. Bei n Gefäßen und k Kugeln erhalten wir eine Folge mit k Nullen und n − 1 Einsen. Umgekehrt ist klar, dass wir aus jeder Folge mit k Nullen und n − 1 Einsen eindeutig ein Belegung der n Gefäße mit k Kugeln ablesen können. Mit anderen Worten, es gibt eine Bijektion zwischen der Menge der Belegungen der n Gefäße mit k Kugeln und den Folgen der Länge n+k −1 mit n−1 Einsen und k Nullen. Die Folgen der Länge n + k − 1 mit n − 1 Einsen und k Nullen können wir als charakterische Funktionen von (n − 1)-elementigen Teilmengen einer n + k − 1 elementigen Menge interpretieren. Damit gibt es genau n+k−1 = n+k−1 mögliche n−1 k Belegungen der n Gefäße mit k Kugeln. Beispiel 3.20. Angenommen, k Abgeordnete wählen je einen von n Kandidaten. Keiner der Abgeordneten enthält sich. Dann gibt es n+k−1 mögliche Verteilungen k der k Stimmen auf die n Kandidaten. Grundaufgabe 5. Gegeben seien r verschiedene Zeichen Z1 , . . . , Zr . Wie viele verschiedene Zeichenfolgen der Länge n kann man aus den Zeichen Z1 , . . . , Zr bilden, wenn man verlangt, dass das Zeichen Z1 genau n1 -mal auftritt, das Zeichen Z2 genau n2 -mal und so weiter. Beispiel 3.21. Wie viele Wörter lassen sich aus den Buchstaben des Wortes ANAGRAMM bilden (wobei alle Buchstaben verwendet werden sollen)? Die Zeichen, die in diesem Beispiel auftreten, sind Z1 =A, Z2 =G, Z3 =M, Z4 =N und Z5 =R. Kommt A dreimal vor, darf also auch dreimal verwendet werden. n1 ist also 3. Analog sind n2 = 1, n3 = 2, n4 = 1 und n5 = 1. Eine Zeichenkette, die aus den Buchstaben in ANAGRAMM gebildet ist, wie zum Beispiel AMMAGRAN, ändert sich nicht, wenn wir die A’s untereinander vertauschen oder wenn wir die M’s vertauschen. Die drei A’s können wir auf 3!=6 Arten permutieren und die M’s auf 2!=2 Arten. Insgesamt gibt es also 3! · 2! = 12 Permutationen der Zeichen in AMMAGRAN, die genau dieselbe Zeichenfolge liefern. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 43 Das gleich Argument zeigt für jede Zeichenfolge aus den Buchstaben von ANAGRAMM, dass es genau 12! Permutationen der Zeichen gibt, die dieselbe Zeichenfolge liefern. Insgesamt gibt es 8! = Permutationen der Zeichen von ANAGRAMM Ingesamt gibt es 8! = 40320 Permutationen der acht Zeichen in dem Wort ANAGRAMM, von denen wir aber jeweils Klassen von 12 Permutationen nicht unterscheiden können. Damit gibt es 8! 3!·2! = 40320 12 = 3360 mögliche Zeichenfolgen aus den Buchstaben des Wortes ANAGRAMM. Antwort zu Grundaufgabe 5. Es gibt genau (n1 + . . . + nr )! n1 ! · . . . · nr ! Zeichenfolgen aus den Zeichen Z1 , . . . , Zr , in denen für jedes i ∈ {1, . . . , r} das Zeichen Zi genau ni -mal vorkommt. Das sieht man genauso, wie in Beispiel 3.21. Wir betrachten die Zeichenfolge W in der zunächst n1 -mal das Zeichen Z1 auftritt, dann n2 -mal das Zeichen Z2 und so weiter. Die Wörter aus den Zeichen Z1 , . . . , Zr , die in der Grundaufgabe 5 gebildet werden dürfen, entstehen durch Permutation der Zeichen in W . W hat die Länge n1 + . . . + nr . Also gibt es (n1 + . . . + nr )! solcher Permutationen. Die Menge dieser Permutationen zerfällt wieder in Klassen disjunkter Mengen, die ununterscheidbare Zeichenfolgen liefern. Die Größe einer jeden solchen Klasse ist n1 ! · . . . · nr !, nämlich die Anzahl der Permutationen der Zeichen Z1 in einem Wort, multipliziert mit der Anzahl der Permutationen der Zeichen Z2 in einem Wort und so weiter. (n1 +...+nr )! n1 !·...·nr ! Zeichenfolgen. Pr Definition 3.22. Seien n1 , . . . , nr ∈ N0 und n = i=1 ni . Dann nennt man n n! = n1 ! · . . . · nr ! n1 , . . . , n r Insgesamt erhalten wir einen Multinomialkoeffizienten. Wegen 0! = 1 sind die Multinomialkoeffizienten auch definiert, wenn für ein oder mehrere i ∈ {1, . . . , r} die Gleichung ni = 0 gilt. Auch die Lösung der Grundaufgabe 5 stimmt in dieser Situation. Extrem ist der Fall n = n1 +. . .+nr = 0. Aber auch hier geht alles glatt. Es gibt genau eine Zeichenfolge der Länge 0, die leere Zeichenfolge. Im Spezialfall r = 2 sind die Multinomialkoeffizienten genau die schon betrachteten Binomialkoeffizienten. Sei nämlich n = n1 + n2 . Dann gilt n n! n! n n! n = = = = = . n1 , n2 n1 ! · n2 ! n1 ! · (n − n1 )! n1 n2 ! · (n − n2 )! n2 3.1. Ziehen von Elementen einer Menge. Die ersten vier Grundaufgaben gehen alle auf dieselbe grundlegende Frage zurück: Wieviele Möglichkeiten gibt es, k Elemente aus einer n-elementigen Menge zu ziehen? Dabei wird auf unterschiedliche Weisen gezogen, und die Ergebnisse werden auf unterschiedliche Arten gezählt. Es gibt folgende Möglichkeiten: 44 STEFAN GESCHKE (1) Ziehen mit Zurücklegen, wobei die Reihenfolge, in der die Elemente gezogen werden, berücksichtigt wird. (2) Ziehen ohne Zurücklegen, mit Berücksichtigung der Reihenfolge. (3) Ziehen ohne Zurücklegen, ohne Berücksichtigung der Reihenfolge. (4) Ziehen mit Zurücklegen, ohne Berücksichtigung der Reihenfolge. Satz 3.23. Seien n, k ∈ N0 . Dann gibt es genau nk Möglichkeiten, k Elemente mit Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge, in der die Elemente gezogen werden, berücksichtigt wird. Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kTupeln von Elementen der n-elementigen Menge. Gemäß der Lösung von Grundaufgabe 1 gibt es also genau nk Möglichkeiten. Satz 3.24. Seien n, k ∈ N0 mit k ≤ n. Dann gibt es genau nk Möglichkeiten, k Elemente ohne Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge, in der die Elemente gezogen werden, berücksichtigt wird. Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kTupeln von Elementen der n-elementigen Menge, in denen kein Element doppelt vorkommt. Gemäß der Lösung von Grundaufgabe 2 gibt es also genau nk Möglich keiten. Satz 3.25. Seien n, k ∈ N0 mit k ≤ n. Dann gibt es genau n k Möglichkeiten, k Elemente ohne Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge, in der die Elemente gezogen werden, nicht berücksichtigt wird. Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kelementigen Teilmengen der n-elementigen Menge. Gemäß der Lösung von Grund aufgabe 3 gibt es also genau nk Möglichkeiten. Satz 3.26. Seien n, k ∈ N0 . Dann gibt es genau n+k−1 k Möglichkeiten, k Elemente mit Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge, in der die Elemente gezogen werden, nicht berücksichtigt wird. Beweis. Wir führen den Satz auf die Lösung der Grundaufgabe 4 zurück. Wenn die Reihenfolge, in der die Elemente gezogen werden, keine Rolle spielt, so müssen wir nur zählen, wie oft jedes Element der n-elementigen Menge gezogen wurde. Diese Situation können wir wie folgt kodieren: Sei M = {a1 , . . . , an } eine nelementige Menge. Für jedes Element ai der n-elementigen Menge M betrachten wir ein Gefäß Ki . Nun ziehen wir die k Elemente der n-elementigen Menge mit Zurücklegen. Immer wenn wir ein Element ai ziehen, tun wir eine Kugel in das Gefäß Ki . Jede Verteilung von k Kugeln auf die Gefäße K1 , . . . , Kn entspricht genau einer Ziehung von k Elementen der n-elementigen Menge und umgekehrt. Nach der Lö sung von Grundaufgabe 4 gibt es n+k−1 mögliche Verteilungen von k Kugeln auf k MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK die n Gefäße. Also gibt es auch n+k−1 k 45 Möglichkeiten, k Elemente ohne Zurück- legen aus einer n-elementigen Menge zu ziehen, wenn man die Reihenfolge, in der die Elemente gezogen werden, nicht berücksichtigt. 3.2. Der Multinomialsatz. Satz 3.27 (Multinomialsatz). Seien r, n ∈ N0 mit r ≥ 1. Dann gilt für alle x1 , . . . , x r ∈ R n (x1 + . . . + xr ) = X n1 +...+nr =n n xn1 · . . . · xnr r . n1 , . . . , n r 1 Diese Summe läuft über alle r-Tupel (n1 , . . . , nr ) ∈ Nr0 mit n1 + . . . + nr = n. Man beachte, dass man für r = 2 aus dem Multinomialsatz genau den Binomialsatz erhält. Beweis. Den Binomialsatz hatten wir mittels vollständiger Induktion bewiesen. Für den Multinomialsatz geben wir einen kombinatorischen Beweis an, der nur die Lösung von Grundaufgabe 5 benutzt. Wir können (x1 + . . . + xr )n = (x1 + . . . + xr ) · . . . · (x1 + . . . + xr ) {z } | n Faktoren durch Ausmultiplizieren berechnen. Für n1 , . . . , nr ∈ N0 mit n1 + . . . + nr = n zählen wir, wie oft das Produkt xn1 1 · . . . · xnr r beim Ausmultiplizieren auftritt. Beim Ausmultiplizieren wählen wir aus jedem der n Faktoren (x1 + . . . + xr ) eine Variable aus. Wir wählen also ein Wort der Länge n aus den Zeichen x1 , . . . , xr . Um das Produkt xn1 1 · . . . · xnr r zu erhalten, muss in dem Wort, das wir Auswählen, die Variable x1 genau n1 -mal auftreten, die Variable x2 n2 -mal und so weiter. Nach n der Lösung von Grundaufgabe 5 gibt es genau n1 ,...,n Wörter der Länge n, in r denen für alle i ∈ {1, . . . , r} das Zeichen xi genau ni -mal auftritt. Damit ist der Koeffizient vor dem Produkt x1n1 · . . . · xnr r , der sich beim Ausmultiplizieren von n (x1 + . . . + xr )n ergibt, die Zahl n1 ,...,n . Das zeigt den Multinomialsatz. r Beispiel 3.28. Nach Ausmultiplizieren von (x + y + z)10 ist der Koeffizient vor dem Produkt x5 y 3 z 2 die Zahl 10 · 9 · 8 · 7 · 6 10 · 9 · 8 · 7 10 10! = = = 7 · 4 · 9 · 10 = 2520. = 5! · 3! · 2! 3! · 2! 2 5, 3, 2 3.3. Das Schubfachprinzip (pigeonhole principle). Satz 3.29 (Schubfachprinzip). Seien m, n ∈ N mit m > n. Wenn m Objekte auf n Fächer verteilt werden, so gibt es mindestens ein Fach mit mindestens zwei Objekten. Eine andere Formulierung dieses Satzes ist die folgende: Sind m und n natürliche Zahlen mit m > n, so gibt es keine injektive Abbildung f : {1, . . . , m} → {1, . . . , n}. Beispiel 3.30. In einer Menge von 13 Menschen gibt es mindestens zwei, die im gleichen Monat Geburtstag haben. In einer Menge von 367 Menschen gibt es 46 STEFAN GESCHKE mindestens zwei, die am gleichen Tag Geburtstag haben. (Der 29. Februar ist ein möglicher Geburtstag.) Wir beweisen eine Verstärkung von Satz 3.29. Satz 3.31. Seien m, n ∈ N. Wenn m Objekte auf n Fächer verteilt werden, so gibt es mindestens ein Fach mit mindestens d m n e Objekte. Beweis. Angenommen, das ist nicht der Fall. Dann enthält jedes Fach höchstens dm n e − 1 Objekte. Damit enthalten die Fächer insgesamt nicht mehr als n · d m n e − 1 Objekte. Es gilt also m≤n· Umformen liefert l m m n lmm −1 . m . n n Das ist aber unmöglich, da für jede reelle Zahl a der Abstand zwischen dae und a 1≤ − echt kleiner als 1 ist. Es gibt auch Versionen des Schubfachprinzips für unendliche Mengen. Satz 3.32. Sei M eine unendliche Menge und n ∈ N. Sind M1 , . . . , Mn Teilmengen von M mit M = M1 ∪ · · · ∪ Mn , so ist eine der Mengen M1 , . . . , Mn unendlich. Beweis. Sind die Mengen M1 , . . . , Mn alle endlich, so sei m maximale Mächtigkeit einer der Mengen M1 , . . . , Mn . Dann hat M1 ∪ · · · ∪ Mn höchstens die Mächtigkeit m · n und ist damit endlich. Das widerspricht aber unserer Annahme, dass M = M1 ∪ · · · ∪ Mn unendlich ist. Aus diesem Satz folgt sofort, dass für jede Funktion f von einer unendlichen Mengen A in eine endliche Menge B ein b ∈ B existiert, so dass die Menge {a ∈ A : f (a) = b} unendlich ist. 3.4. Das Prinzip der Inklusion und Exklusion (Siebformel). Seien A1 , . . . , An endliche Mengen. Wir suchen eine Formel für die Mächtigkeit der Vereinigung der Mengen Ai , i ∈ {1, . . . , n}, also für die Mächtigkeit |A1 ∪ · · · ∪ An | der Menge A1 ∪ · · · ∪ An . Wir betrachten zunächst den Fall zweier Mengen, A1 und A2 . Eine naheliegende Vermutung ist, dass |A1 ∪ A2 | einfach die Summe von |A1 | und |A2 | ist. Das stimmt aber nur, wenn A1 und A2 disjunkt sind. Ist A1 = {1, 2, 3} und A2 = {2, 3, 4}, so ist |A1 ∪ A2 | = 4, |A1 | = 3, |A2 | = 3 und damit |A1 | + |A2 | = 6. Das Problem ist, dass die Elemente des Durchschnitts A1 ∩ A2 = {2, 3} in der Rechnung |A1 | + |A − 2| doppelt gezählt werden. Um die korrekte Mächtigkeit von A1 ∪ A2 zu berechnen, können wir |A1 | und |A2 | addieren MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 47 und dann die Mächtigkeit |A1 ∩ A2 | des Durchschnitts, der doppelt gezählt wurde, abziehen: |A1 ∪ A2 | = |A1 | + |A2 | − |A1 ∩ A2 | (1) In unserem Beispiel erhalten wir |A1 ∪ A2 | = 4 und |A1 | + |A2 | − |A1 ∩ A2 | = 3 + 3 − 2 = 4. Nun betrachten wir drei Mengen A1 , A2 und A3 . Wir wir schon gesehen haben, gilt für zwei endliche Mengen B und C die Formel |B ∪ C| = |B| + |C| − |B ∩ C|. Setzt man B := A1 ∪ A2 und C = A3 , so ergibt sich |A1 ∪ A2 ∪ A3 | = |A1 ∪ A2 | + |A3 | − |(A1 ∪ A2 ) ∩ A3 |. (2) Nun ist (A1 ∪ A2 ) ∩ A3 = (A1 ∩ A3 ) ∪ (A2 ∩ A3 ). Also gilt (3) |(A1 ∪A2 )∩A3 )| = |(A1 ∩A3 )∪(A2 ∩A3 )| = |A1 ∩A3 |+|A2 ∩A3 |−|A1 ∩A2 ∩A3 |. Einsetzen von (1) und (3) in (2) liefert |A1 ∪ A2 ∪ A3 | = |A1 | + |A2 | − |A1 ∩ A2 | + |A3 | − (|A1 ∩ A3 | + |A2 ∩ A3 | + |A1 ∩ A2 ∩ A3 |) = |A1 | + |A2 | + |A3 | − |A1 ∩ A2 | − |A1 ∩ A3 | − |A2 ∩ A3 | + |A1 ∩ A2 ∩ A3 |. An dieser Gleichung sehen wir schon das allgemeine Prinzip der Inklusion und Exklusion. Satz 3.33 (Prinzip der Inklusion und Exklusion, Siebformel). Sei n ∈ N und seien A1 , . . . , An endliche Mengen. Dann gilt n X (−1)k−1 · |A1 ∪ · · · ∪ An | = k=1 X |An1 ∩ · · · ∩ Ank | . 1≤n1 <···<nk ≤n Die innere Summe auf der rechten Seite der Gleichung läuft dabei über alle k-Tupel (n1 , . . . , nk ) natürlicher Zahlen mit 1 ≤ n1 < · · · < nk ≤ n. Für den Beweis dieses Satzes benutzen wir folgendes Lemma: Lemma 3.34. Jede nichtleere endliche Menge M hat genauso viele Teilmengen mit gerader Mächtigkeit wie mit ungerader Mächtigkeit. Beweis. Sei n die Mächtigkeit von M . Wir nehmen zunächst an, dass n ungerade ist. Dann ist die Abbildung a 7→ M \ a eine Bijektion zwischen der Menge der Teilmengen von M , die eine gerade Mächtigkeit haben, und der Menge der Teilmengen von M , deren Mächtigkeit ungerade ist. Also hat M genauso viele Teilmengen mit gerader Mächtigkeit wie mit ungerader Mächtigkeit. Sei nun n gerade. Dann hat M genau nX 2 −1 n n n + ··· + = 1 n−1 2k + 1 k=0 48 STEFAN GESCHKE Teilmengen mit ungerader Mächtigkeit. Nach Satz 3.15 gilt n 2k+1 = n−1 2k + n−1 2k+1 . Also ist n 2 −1 X k=0 n 2k + 1 n 2 −1 = X n − 1 2k k=0 n−1 + 2k + 1 = n−1 X i=0 n−1 = 2n−1 . i n Da M insgesamt 2 Teilmengen hat, hat genau die Hälfte aller Teilmengen eine gerade Mächtigkeit. Beweis von Satz 3.33. Sei a ∈ A1 ∪· · ·∪An . Auf der linken Seite der Gleichung wird a genau einmal gezählt. Wir zeigen, dass a auch auf der rechten Seite der Gleichung insgesamt genau 1 beiträgt. Sei B := {i : 1 ≤ i ≤ n ∧ a ∈ Ai } und ` := |B|. Die Zahl ` gibt also an, in wie vielen der Mengen Ai das Element a vorkommt. Die Summanden auf der rechten Seite der Siebformel haben alle die Form (−1)k · |An1 ∩ · · · ∩ Ank |, wobei k mindestens 1 ist und 0 ≤ n1 < · · · < nk ≤ n gilt. Das Element a trägt nur dann etwas zu einem solchen Summanden bei, wenn a ∈ An1 ∩ · · · ∩ Ank gilt, wenn also n1 , . . . , nk Elemente von B sind. Das heißt, a trägt genau dann zu einem Summanden (−1)k−1 · |An1 ∩ · · · ∩ Ank | bei, wenn {n1 , . . . , nk } ⊆ B gilt. Wir wissen für jedes k ≤ `, dass B genau k` Teilmengen hat. Damit kann man den Beitrag von a zu den Summanden auf der rechten Seite der Siebformel als ` X (−1) k=1 k−1 ` k schreiben. Nach Lemma 3.34 hat jede `-elementige Menge genauso viele Teilmengen mit gerader Mächtigkeit wie mit ungerader Mächtigkeit. Es gilt also X X ` ` ` k−1 ` k−1 ` − + (−1) = (−1) = 0. 0 k k k=1 k=0 Damit ist ` X (−1)k−1 k=1 ` ` = = 1. k 0 Damit ist der Beitrag von a zur rechten Seite der Siebformel ebenfalls genau 1. Da dieses Argument für jedes a ∈ A1 ∪ · · · ∪ An stimmt, sind die beiden Seiten der Siebformel tatsächlich gleich. 3.5. Die Abzählbarkeit von Q und die Überabzählbarkeit von R. Wir haben schon gesehen, dass es reelle Zahlen gibt, die nicht rational sind, wie zum √ Beispiel 2. In diesem Abschnitt werden wir sehen, dass es sogar viel mehr reelle als rationale Zahlen gibt. Definition 3.35. Zwei Mengen A und B heißen gleichmächtig, wenn es eine Bijektion f : A → B gibt. Diese Definition ist auch für unendliche Mengen sinnvoll. So ist f : Z → {a ∈ Z : a ist gerade}; a 7→ 2a MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 49 eine Bijektion zwischen den ganzen Zahlen und den (positiven sowie negativen) geraden Zahlen. Z und die Menge aller geraden Zahlen sind also gleichmächtig. Definition 3.36. Eine Menge M heißt abzählbar, wenn M entweder endlich ist oder es eine Bijektion f : N → M gibt. Eine Menge, die nicht abzählbar ist, heißt überabzählbar. Man kann leicht zeigen, dass eine Menge genau dann M abzählbar ist, wenn M entweder leer ist oder es eine surjektive Abbildung f : N → M gibt. Eine Surjektion f : N → M nennt man eine Aufzählung von M . Eine Aufzählung f von M kann man einfach in der Form f (1), f (2), . . . notieren. So ist zum Beispiel 0, 1, −1, 2, −1, . . . eine Aufzählung von Z. Die Menge der ganzen Zahlen ist also abzählbar. Etwas verblüffender ist folgender Satz, der von Cantor bewiesen wurde. Satz 3.37. Die Menge Q der rationalen Zahlen ist abzählbar. Beweis. Wir geben zunächst eine Aufzählung q1 , q2 , . . . der Menge der rationalen Zahlen > 0 an. Man erhält die Aufzählung, indem man im folgenden Bild bei den Bruch 1 1 beginnt und den Pfeilen folgt. 1 1 1 2 1 3 1 4 1 5 1 6 ··· 2 1 2 2 2 3 2 4 2 5 2 6 ··· 3 1 3 2 3 3 3 4 3 5 3 6 ··· 4 1 4 2 4 3 4 4 4 5 4 6 ··· 5 1 5 2 5 3 5 4 5 5 5 6 ··· .. . .. . .. . .. . .. . .. . Die Aufzählung lautet also 1 1 2 3 2 , q2 = , q3 = q3 = , q4 = , q5 = , . . . 1 2 1 1 2 Die Tatsache, das viele rationale Zahlen hierbei doppelt auftreten, zum Beispiel q1 = 1 als 1 1 und 2 2 spielt keine Rolle, da eine Aufzählung nicht injektiv sein muss. Es ist aber klar, das jede rationale Zahl > 0 in dieser Aufzählung irgendwann einmal auftritt. Mit dieser Aufzählung der rationalen Zahlen > 0 können wir nun aber leicht eine Aufzählung aller rationalen Zahlen angeben: 0, q1 , −q1 , q2 , −q2 , . . . leistet das Gewünschte. Satz 3.38. Die Menge R der reellen Zahlen ist überabzählbar. 50 STEFAN GESCHKE Beweis. Wir zeigen, dass die schon die Menge der reellen Zahlen, die echt größer als 0 und echt kleiner als 1 sind, überabzählbar sind. Wir führen einen Widerspruchsbeweis. Angenommen, es gibt eine Aufzählung s1 , s2 , s3 , . . . der reellen Zahlen s mit 0 < s < 1. Die Zahlen sn , n ∈ N lassen sich als Dezimalzahlen ohne Vorzeichen mit einer 0 vor dem Dezimalpunkt schreiben. Für alle i, j ∈ N sei sij die Ziffer, die in der j-ten Nachkommastelle der Dezimaldarstellung von si steht. Dann können wir die Aufzählung s1 , s2 , . . . wie folgt notieren: s1 = 0.s11 s12 s13 . . . s2 = 0.s21 s22 s23 . . . s3 .. . = 0.s31 s32 s33 . . . .. . Nun definieren wir eine weitere reelle Zahl a, die echt zwischen 0 und 1 liegt, die in der Aufzählung aber nicht auftritt. Das widerspricht der Annahme, dass s1 , s2 , s3 , . . . eine Aufzählung der reellen Zahlen ist, die echt zwischen 0 und 1 liegen. Wir geben die Nachkommastellen a1 a2 a3 . . . der Zahl a an. Für i ∈ N sei 4, falls s 6= 4 ist und ii ai := 5, sonst. Es ist klar, dass a = 0.a1 a2 a3 . . . echt zwischen 0 und 1 liegt. a ist so gewählt, dass es sich an der i-ten Nachkommastelle von si unterscheidet. Da die Nachkommastellen von a nicht irgendwann konstant 0 oder konstant 9 werden, ist a damit von allen si , i ∈ N verschieden. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 51 4. Relationen In Definition 1.15 haben wir das kartesische Produkt A × B zweier Mengen A und B als die Menge aller Paare (a, b) mit a ∈ A und b ∈ B definiert. Definition 4.1. Eine Relation von A nach B ist eine Teilmenge R von A × B. Eine Relation auf A ist eine Teilmenge von A × A. Für (a, b) ∈ R schreiben wir auch aRb. Beispiel 4.2. (1) Sei A = {1, 2, 3} und B = {0, 1}. Dann sind R1 , . . . , R4 Relationen von A nach B: (a) R1 = {(1, 0), (2, 0), (2, 1)}. (b) R2 = {(1, 1), (2, 1), (3, 0), (3, 1)} (c) R3 = A × B (d) R4 = ∅. (2) R = {(a, b) : a, b ∈ N ∧ a < b}, S = {(a, b) : a, b ∈ N ∧ a ≤ b} und T = {(a, b) : a, b ∈ N ∧ a = b} sind Relationen auf N. Üblicher Weise identifizieren wir < mit R, ≤ mit S und T mit =. Wir können Relationen ähnlich wie Funktionen mit Hilfe von Pfeildiagrammen notieren. Hier sind zwei Diagramme für die Relationen R1 und R2 . A B A 1 B 1 0 0 2 2 1 1 3 3 Eine Relation R auf einer Menge A können wir als gerichteten Graphen darstellen, wobei für jedes Element von A ein Punkt gezeichnet wird und für jedes Paar (a, b) ∈ R ein Pfeil von dem Punkt, der a entspricht zu dem, der b entspricht. Sei zum Beispiel A = {1, 2, 3, 4, 5} und R = {(1, 1), (1, 2), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (4, 5), (5, 1), (5, 3)}. Dann sieht der entsprechende gerichtete Graph wie folgt aus: 2 1 5 4 3 52 STEFAN GESCHKE Die Punkte 1, 2, 3, 4 und 5 nennt man die Knoten des Graphen. Einen Pfeil von einem Knoten zu einem Knoten nennt man auch eine gerichtete Kante Eine Kante von einem Knoten auf sicher selber nennt man auch eine Schlinge. Definition 4.3. Sei A eine Menge und sei R eine Relation auf A. (1) R heißt reflexiv, falls für alle a ∈ A das Paar (a, a) in R ist. (2) R heißt irreflexiv, falls R kein Paar der Form (a, a) enthält. (3) R heißt symmetrisch, falls für alle (a, b) ∈ R auch (b, a) ∈ R gilt. (4) R heißt antisymmetrisch, falls aus (a, b) ∈ R und a 6= b stets (b, a) 6∈ R folgt. (5) R heißt transitiv, falls aus (a, b) ∈ R und (b, c) ∈ R stets (a, c) ∈ R folgt. Wir diskutieren die Bedeutung dieser Begriffe anhand der gerichteten Graphen, mit denen wir Relationen veranschaulichen. Beispiel 4.4. Sei R eine Relation auf der Menge A. (1) R ist reflexiv, falls jeder Knoten im zugehörigen gerichteten Graphen eine Schlinge hat. (2) R ist irreflexiv, falls kein Knoten im zugehörigen gerichteten Graphen eine Schlinge hat. (3) R ist symmetrisch, wenn im gerichteten Graphen für jeden Pfeil von a nach b auch der Pfeil zurück von b nach a vorhanden ist. (4) R ist antisymmetrisch, wenn für je zwei verschiedene Knoten im gerichteten Graphen höchstens ein Pfeil zwischen den beiden Knoten a und b vorhanden ist. (5) R ist transitiv, wenn für den gerichteten Graphen folgendes gilt: Immer wenn man entlang der Pfeile (in Pfeilrichtung) von einem Knoten a zu einem Knoten b laufen kann, dann ist bereits ein direkter Pfeil von a nach b vorhanden. Man beachte, dass irreflexiv nicht dasselbe ist wie nicht reflexiv. Ebenso ist antisymmetrisch nicht dasselbe wie nicht symmetrisch. 4.1. Partitionen und Äquivalenzrelationen. Definition 4.5. Eine Relation R auf einer Menge A heißt Äquivalenzrelation, falls R reflexiv, transitiv und symmetrisch ist. Ist R eine Äquivalenzrelation auf A so bezeichnen wir für jedes a ∈ A mit [a]R die Menge {b ∈ A : (a, b) ∈ R} und nennen diese Menge die Äquivalenzklasse von a. Satz 4.6. Sei A eine Menge und R eine Äquivalenzrelation auf A. Dann gilt für alle a, b ∈ A entweder [a]R ∩ [b]R = ∅ oder [a]R = [b]R . Der zweite Fall tritt genau dann ein, wenn aRb gilt. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 53 Beweis. Seien a, b ∈ A mit [a]R ∩ [b]R 6= ∅. Sei c ∈ [a]R ∩ [b]R . Dann gilt aRc und bRc. Wegen Symmetrie und Transitivität von R folgt daraus aRb. Wieder wegen Symmetrie und Transitivität von R ist jedes Element von A, das zu a äquivalent ist, auch zu b äquivalent und umgekehrt. Damit sind [a]R und [b]R gleich. Für eine Äquivalenzrelation R auf einer Menge A ist {[a]R : a ∈ A} eine Partition von A. Definition 4.7. Sei A eine Menge, I eine Indexmenge und für alle i ∈ I sei Ki ⊆ A. P = {Ki : i ∈ I} ist eine Partition von A, falls gilt: (1) Für alle i, j ∈ I mit i 6= j ist Ki ∩ Kj = ∅. S (2) Es gilt i∈I Ki = A. S Dabei ist i∈I Ki die Menge {x : ∃i ∈ I(x ∈ Ki )}. Umgekehrt kann man einer Partition P = {Ki : i ∈ I} von A eine Äquivalenzrelation auf A zuordnen, deren Äquivalenzklassen genau die Mengen Ki sind. Sei nämlich P = {Ki : i ∈ I} eine Partition von A. Sei R := {(a, b) ∈ A × A : ∃i ∈ I(a, b ∈ Ki )}. Wir nennen also zwei Elemente a und b von A äquivalent, wenn sie in derselben Menge Ki liegen. S Wegen i∈I Ki = A gibt es für jedes a ∈ A ein i ∈ I mit a ∈ Ki . Damit steht jedes a ∈ A zu sich selbst in Relation. R ist also reflexiv. Gilt a, b ∈ Ki , so gilt auch b, a ∈ Ki . Damit ist R symmetrisch. Seien schließlich a, b, c ∈ A mit aRb und bRc. Dann gibt es i, j ∈ I mit a, b ∈ Ki und b, c ∈ Kj . Nun gilt b ∈ Ki ∩ Kj . Da die Mengen in der Partition paarweise disjunkt sind, muss Ki = Kj gelten. Also gilt a, c ∈ Ki . Damit ist aRc. Das zeigt die Transitivität von R. Korollar 4.8. Es sei A eine Menge. Für jede Äquivalenzrelation auf A bilden die Äquivalenzklassen eine Partition von A. Umgekehrt gibt es für jede Partition von A eine Äquivalenzrelation, deren Äquivalenzklassen genau die Mengen in der Partition sind. Beispiel 4.9. Sei m ∈ N und R = {(a, b) ∈ Z × Z : a ≡ b(mod m)}. Dann ist R eine Äquivalenzrelation auf Z, deren Äquivalenzklassen genau die Restklassen modulo m sind. Die Anzahl der Restklassen modulo m ist genau m. Die verschiedenen Restklassen sind die Mengen {m · q + 0 : q ∈ Z}, {m · q + 1 : q ∈ Z}, ..., {m · q + (m − 1) : q ∈ Z}. 4.2. Ordnungsrelationen. Definition 4.10. Sei A eine Menge und R eine Relation auf A. Dann ist R eine Ordnungsrelation, falls R reflexiv, antisymmetrisch und transitiv ist. Ordnungsrelationen nennt man auch Halbordnungen oder partielle Ordnungen. Das Paar (A, R) ist eine halbgeordnete oder partiell geordnete Menge. 54 STEFAN GESCHKE Ordnungsrelationen werden oft mit ≤ oder einem ähnlichen Zeichen bezeichnet. Man schreibt dann praktisch immer a ≤ b anstelle von (a, b) ∈ ≤. Man beachte, dass dabei nicht unbedingt die bekannte ≤-Relation auf den reellen Zahlen gemeint ist. Beispiel 4.11. Sei A := {a, b, c, d} und R := {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, d), (c, d)}. Der entsprechende gerichtete Graph sieht dann wie folgt aus: d c b a Wie man an dem gerichteten Graphen leicht sieht, ist R reflexiv, transitiv und antisymmetrisch. Beispiel 4.12. Sei A := {a, b, c, d} und R := {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}. Der entsprechende gerichtete Graph sieht dann wie folgt aus: d c b a Wieder sieht man leicht, dass R reflexiv, transitiv und antisymmetrisch ist. Beispiel 4.13. (1) Die Relation ≤ ist eine Ordnungsrelation of N, Z, Q und R. (2) Für jede Menge M ist ⊆ eine Ordnungsrelation auf P(M ). (3) Die Teilbarkeitsrelation | ist eine Ordnungsrelation auf N. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 55 Definition 4.14. Ein Ordnungsrelation R auf einer Menge R heißt lineare Ordnung, falls für alle a, b ∈ A mit a 6= b entweder aRb oder bRa gilt. Lineare Ordnungen nennt man auch totale Ordnungen. Beispiel 4.15. Die Relation ≤ auf N, Z, Q und R ist jeweils eine lineare Ordnung. Die Relation R aus Beispiel 4.12 ist ebenfalls eine lineare Ordnung, während die Relation aus Beispiel 4.11 keine lineare Ordnung ist, da die Element b und c nicht vergleichbar sind, also da weder (b, c) noch (c, b) in R ist. Ebenso ist ⊆ keine lineare Ordnung auf P(M ), falls M mindestens zwei Elemente hat. Wir betrachten noch einmal die Beispiele 4.11 und 4.12. Wenn man von einer Relation R auf einer Menge A schon weiß, dass es sich um eine Ordnungsrelation handelt, dann kann man in dem gerichteten Graphen die Schlingen an den einzelnen Knoten weglassen sowie gerichtete Kanten, deren Existenz aus der Transitivität der Relation folgt. Schließlich können wir noch vereinbaren, dass Kanten immer nach oben zeigen, so dass wir die Pfeilspitzen weglassen können. Diese Darstellung nennt man ein Hassediagramm einer geordneten Menge. Folgende Diagramme sind Hassediagramme der Relationen in Beispiel 4.11 und 4.12. d d c c b b a a 4.3. Hüllenbildungen. Sei R eine Relation auf einer Menge A. Falls R nicht bereits reflexiv ist, so kann man R zu einer reflexiven Relation R0 machen, indem man für jedes a ∈ A das Paar (a, a) zu R hinzufügt. Definition 4.16. Für eine Relation R auf einer Menge A sei R0 := R ∪ {(a, a) : a ∈ A}. R0 ist die kleinste reflexive Relation, die R umfasst, und wird die reflexive Hülle von R genannt. Sei zum Beispiel < die übliche <-Relation auf N, Z, Q oder R. Dann ist die Relation ≤ auf derselben Menge die reflexive Hülle von <. Auf ähnliche Weise können wir aus einer Relation R eine transitive Relation machen. Sei A = {a, b, c} und R = {(a, b), (b, c)}. a b c 56 STEFAN GESCHKE Damit R transitiv wird, müssen wir das Paar (a, c) zu R hinzufügen. Wir betrachten noch die folgende, etwas kompliziertere Situation. Sei A = {a, b, c, d} und R = {(a, b), (b, c), (c, d)}. a c b d Hier müssen wir zunächst (a, c) und (b, d) zu R hinzufügen. Aber die Relation R ∪ {(a, c), (b, d)} ist immer noch nicht transitiv, denn obwohl (a, b), (b, d) ∈ R ∪ {(a, c), (b, d)} gilt, ist das Paar (a, d) nicht in der Relation R ∪ {(a, c), (b, d)} enthalten. Wenn wir jedoch auch noch (a, d) hinzufügen, so erhalten wir eine transitive Relation. Im Allgemeinen gilt für eine transitive Relation R: Falls (a1 , a2 ), . . . , (an−1 , an ) ∈ R gilt, so ist auch (a1 , an ) ∈ R. Das erklärt die folgende Definition: Definition 4.17. Sei R eine Relation auf einer Menge A. Dann ist R+ := {(a, b) : es gibt n ≥ 2 und a1 , . . . , an ∈ A mit a = a1 , b = an und (a1 , a2 ), . . . , (an−1 , an ) ∈ R} die kleinste transitive Relation mit R ⊆ R+ . R+ ist die transitive Hülle von R. Man sieht schnell, dass R+ transitiv ist. Man beachte, dass es durchaus vorkommen kann, dass (a1 , a2 ), . . . , (an−1 , an ) ∈ R gilt und dabei a1 = an ist. So ist die transitive Hülle der Relation R = {(a, b), (b, c), (c, a)} auf der Menge A die Relation R+ = A × A. c a b Schließlich kombinieren wir noch die transitive und die reflexive Hülle. Definition 4.18. Sei R eine Relation auf einer Menge A. Dann ist R∗ = R+ ∪ R0 die reflexive, transitive Hülle von R. R∗ ist die kleinste reflexive, transitive Relation, die R umfasst. Beispiel 4.19. Sei A = {a, b, c, d} und R = {(a, b), (b, c), (c, d), (b, d)}. Wir geben die reflexive Hülle, die transitive Hülle und die reflexive, transitive Hülle von R an. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 57 R = {(a, b), (b, c), (c, d), (b, d)} a b c d R0 = {(a, a), (b, b), (c, c), (d, d), (a, b), (b, c), (c, d), (b, d)} a b c d c d R+ = {(a, b), (a, c), (a, d), (b, c), (b, d), (c, d)} a b R∗ = {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d) a b c d Die reflexive, transitive Hülle R∗ einer Relation R ist immer reflexiv und transitiv. Aber R∗ muss natürlich nicht antisymmetrisch sein. Da reflexive, transitive Relationen aber relativ häufig vorkommen, bekommen sie einen eigenen Namen. Definition 4.20. Eine reflexive, transitive Relation heißt Quasiordnung. Die reflexive, transitive Hülle einer Relation ist also immer eine Quasiordnung, aber nicht unbedingt eine Ordnungrelation. Es stellt sich heraus, dass R∗ genau dann eine Ordnungsrelation ist, wenn es in R keine Kreise der Form a1 a2 an−1 an mit n ≥ 2 gibt. 4.4. n-stellige Relationen. In Definition 1.15 hatten wir schon kartesische Produkte der Form An betrachtet. Analog können wir auch kartesische Produkte zwischen verschiedenen Mengen definieren. 58 STEFAN GESCHKE Definition 4.21. Sei n ≥ 1 und seien A1 . . . , An Mengen. Dann ist A1 × . . . × An = {(a1 , . . . , an ) : a1 ∈ A1 ∧ · · · ∧ an ∈ An } das kartesische Produkt der Mengen A1 , . . . , An . Eine n-stellige Relation über A1 , . . . , An ist eine Teilmenge R des Produkts A1 × . . . × An . Eine n-stellige Relation auf einer Menge A ist eine Teilmenge R von An . Im vorigen Abschnitt haben wir nur binäre, also zweistellige Relationen diskutiert. Einstellige Relationen auf einer Menge A sind einfach Teilmengen der Menge A. Beispiel 4.22. Seien A = {1, 2, 3}, B = {0, 1} und C = {2, 3}. Dann sind R1 = ∅, R2 = {(2, 0, 2)}, R3 = {(1, 0, 2), (1, 1, 2), (2, 1, 3)} und R4 = A × B × C Relationen über A, B und C. 4.5. Mehr über Abbildungen. Definition 4.23. Seien A und B Mengen und f : A → B eine Abbildung. Für A0 ⊆ A ist die Menge f [A0 ] = {b ∈ B : ∃a ∈ A0 (f (a) = b)} = {f (a) : a ∈ A0 } das Bild von A0 unter f . Anstelle von f [A0 ] schreibt man auch f (A0 ). Für B 0 ⊆ B ist die Menge f −1 [B 0 ] = {a ∈ A : f (a) ∈ B 0 } das Urbild von B 0 unter f . Beispiel 4.24. Sei A = {1, 2, 3, 4, 5} und B = {0, 1, 2}. Weiter sei f : A → B definiert durch f (1) = f (2) = 0, f (3) = f (5) = 1 und f (4) = 2. Schließlich seien A0 = {3, 4, 5} und B 0 = {0, 2}. Dann gilt f [A0 ] = {1, 2} und f −1 [B 0 ] = {1, 2, 4}. Satz 4.25. Es seien A und B Mengen und f : A → B eine Funktion. Für alle A1 , A2 ⊆ A und B1 , B2 ⊆ B gelten die folgenden Aussagen: (1) f [A1 ∩ A2 ] ⊆ f [A1 ] ∩ f [A2 ] (2) f [A1 ∪ A2 ] = f [A1 ] ∪ f [A2 ] (3) f −1 [B1 ∩ B2 ] = f −1 [B1 ] ∩ f −1 [B2 ] (4) f −1 [B1 ∪ B2 ] = f −1 [B1 ] ∪ f −1 [B2 ] (5) f −1 [f [A1 ]] ⊇ A1 (6) f [f −1 [B1 ]] ⊆ B1 Beweis. Wir zeigen (1), (3) und (5) und lassen (2), (4) und (6) als Übungen. (1) Sei b ∈ f [A1 ∩A2 ]. Dann existiert a ∈ A1 ∩A2 mit f (a) = b. Wegen a ∈ A1 gilt b = f (a) ∈ f [A1 ]. Wegen a ∈ A2 gilt b = f (a) ∈ f [A2 ]. Also ist b ∈ f [A1 ] ∩ f [A2 ]. Damit gilt f [A1 ∩ A2 ] ⊆ f [A1 ] ∩ f [A2 ]. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 59 (3) Sei a ∈ f −1 [B1 ∩ B2 ]. Dann gilt f (a) ∈ B1 ∩ B2 . Also ist f (a) ∈ B1 und f (a) ∈ B2 . Damit ist a ∈ f −1 [B1 ] und a ∈ f −1 [B2 ]. Es folgt a ∈ f −1 [B1 ] ∩ f −1 [B2 ]. Das zeigt f −1 [B1 ∩ B2 ] ⊆ f −1 [B1 ] ∩ f −1 [B2 ]. Sei nun a ∈ f −1 [B1 ] ∩ f −1 [B2 ]. Dann ist a ∈ f −1 [B1 ] und a ∈ f −1 [B2 ]. Also gilt f (a) ∈ B1 und f (a) ∈ B2 . Damit ist f (a) ∈ B1 ∩ B2 . Es folgt a ∈ f −1 [B1 ∩ B2 ]. Das zeigt f −1 [B1 ] ∩ f −1 [B2 ] ⊆ f −1 [B1 ∩ B2 ]. (5) Sei a ∈ A1 . Dann ist f (a) ∈ f [A1 ]. Also gilt a ∈ f −1 [f [A1 ]]. Das zeigt A1 ⊆ f −1 [f [A1 ]]. Definition 4.26. Sind f : A → B und g : B → C Funktionen, so definieren wir die Komposition von f und g als die Funktion g ◦ f : A → C; a 7→ g(f (a)). Die Komposition g ◦ f wird „g nach f “ gelesen. Beispiel 4.27. Es seien A = {1, 2, 3}, B = {2, 3, 4, 5} und C = {0, 1}. Die Funktionen f : A → B und g : B → C seien definiert durch f (1) = f (2) = 2, f (3) = 4, g(2) = g(5) = 0 und g(3) = g(4) = 1. Dann gilt (g ◦ f )(1) = (g ◦ f )(2) = 0 sowie (g ◦ f )(3) = 1. Die Komposition g ◦ f kann man sich leicht vorstellen, wenn man die entsprechenden Pfeildiagramme betrachtet. 2 1 3 2 0 4 1 3 5 A f g B C Die Komposition von Abbildungen erfüllt das Assoziativgesetz. Satz 4.28. Seien f : A → B, g : B → C und h : C → D Abbildungen. Dann gilt h ◦ (g ◦ f ) = (h ◦ g) ◦ f . Beweis. Wir müssen zeigen, dass für alle a ∈ A die Gleichung (h ◦ (g ◦ f ))(a) = ((h ◦ g) ◦ f )(a) gilt. Sei also a ∈ A. Dann ist (h ◦ (g ◦ f ))(a) = h((g ◦ f )(a)) = h(g(f (a))) = (h ◦ g)(f (a)) = ((h ◦ g) ◦ f )(a). Das zeigt den Satz. 60 STEFAN GESCHKE Definition 4.29. Sei f : A → B eine Funktion und A0 ⊆ A. Unter der Einschränkung oder Restriktion von f auf A0 versteht man die Funktion g : A0 → B; a 7→ f (a). Für die Einschränkung von f auf A0 schreibt man f A0 oder f |A0 . Definition 4.30. Sei f : A → B eine injektive Funktion. Dann kann man eine Funktion g : f [A] → A so definieren, dass für alle b ∈ f [A] und a ∈ A die Gleichung g(b) = a genau dann gilt, wenn f (a) = b ist. Die Funktion g ist die Umkehrfunktion von f . Für die Umkehrfunktion von f schreibt man f −1 . Bemerkung 4.31. Sei f : A → B eine Bijektion und sei B1 ⊆ B. Die Schreibweise f −1 [B1 ] erscheint zunächst mehrdeutig, da entweder das Urbild von B1 unter f oder das Bild von B1 unter der Abbildung f −1 gemeint sein könnte. Allerdings sind diese Mengen identisch. Es gilt {a ∈ A : f (a) ∈ B1 } = {f −1 (b) : b ∈ B1 }. Also ist diese Mehrdeutigkeit unproblematisch. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 61 5. Graphen Graphen gehören zu den wichtigsten mathematischen Strukturen für die Informatik. In diesem Kapitel werden die wichtigsten Grundbegriffe der Graphentheorie diskutiert. 5.1. Grundlegende Definitionen. Definition 5.1. Ein ungerichteter Graph G ist ein Paar (V, E), wobei V eine beliebige Menge ist und E eine Menge von zweielementigen Teilmengen von V . Die Elemente von V heißen Ecken oder Knoten (im Englischen vertices, Singular vertex) von G, die Elemente von E Kanten (im Englischen edges). Ist ein Graph G gegeben, so schreiben wir V (G) für die Menge der Ecken von G und E(G) für die Menge der Kanten. In der Mathematik werden auch unendliche Graphen betrachtet, aber für das vorliegende Skript vereinbaren wir, dass alle Graphen endlich sind, also nur endlich viele Ecken haben. Anstelle von „ungerichteter Graph“ sagen wir meistens einfach nur „Graph“. Graphen lassen sich veranschaulichen, in dem man für jede Ecke einen Punkt zeichnet und zwei Punkte genau dann durch eine Linie verbindet, wenn die beiden entsprechende Ecken eine Kante bilden. Beispiel 5.2. Sei G = (V, E) mit V = {1, 2, 3, 4, 5} und E = {{1, 2}, {1, 3}, {1, 5}, {2, 3}, {3, 4}, {4, 5}}. Diesen Graphen veranschaulichen wir durch folgendes Bild: 1 2 3 4 5 Diese Darstellung ist aber nicht eindeutig. Man kann G auch wie folgt darstellen: 2 1 3 5 4 Beispiel 5.3. Sei G = (V, E) mit V = {1, 2, 3, 4} und E = {{1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}}. 62 STEFAN GESCHKE 3 4 1 2 Dieser Graph hat die Eigenschaft, dass je zwei verschiedene Ecken eine Kante bilden. So einen Graphen nennt man vollständig. Für jedes n ∈ N gibt es genau einen vollständigen Graphen mit der Eckenmenge {1, 2, . . . , n}. Dieser Graph wird mit Kn bezeichnet. Der abgebildete Graph ist also K4 . Beispiel 5.4. Sei G = (V, E) mit V = {v0 , . . . , v4 }, wobei die vi paarweise verschieden sind, und sei E = {{v0 , v1 }, {v1 , v2 }, {v2 , v3 }, {v3 , v4 }}. v0 v1 v2 v3 v4 Dann nennt man G einen Weg der Länge 4. Allgemein nennt man für alle n ∈ N einen Graphen mit einer Eckenmenge von n + 1 verschiedenen Knoten v0 , . . . , vn , dessen Kanten genau die Mengen {vi , vi+1 }, 0 ≤ i < n, sind, einen Weg der Länge n. Beispiel 5.5. Sei G = (V, E) mit V = {v1 , v2 , v3 , v4 }, wobei die vi paarweise verschieden sind, und sei E = {{v1 , v2 }, {v2 , v3 }, {v3 , v4 }, {v4 , v1 }}. v4 v3 v1 v2 Dann nennt man G einen Kreis der Länge 4. Allgemein nennt man für alle n ∈ N\{1, 2} einen Graphen mit einer Eckenmenge von n verschiedenen Knoten v1 , . . . , vn , dessen Kanten genau die Mengen {vi , vi+1 }, 1 ≤ i < n, und {vn , v1 } sind, einen Kreis der Länge n. Definition 5.6. Sei seien G und G0 Graphen. G0 heißt Teilgraph von G, falls V (G0 ) ⊆ V (G) und E(G0 ) ⊆ E(G) gelten. Ist G0 ein Teilgraph von G, so schreiben wir G0 ⊆ G. Beispiel 5.7. Sei G der folgende Graph: MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK v4 63 v3 v5 v1 v2 Die folgenden Graphen sind Teilgraphen von G: v4 v3 v4 v3 v1 v2 v5 v1 v2 Definition 5.8. Ein Graph G heißt zusammenhängend, wenn für je zwei Knoten v, w ∈ V (G) ein Weg in G existiert, der v und w verbindet. Ein Weg, der v und w verbindet, ist dabei ein Teilgraph W von G, der ein Weg ist, so dass v und w unter den Ecken von W sind. Beispiel 5.9. Der Graph G aus Beispiel 5.7 ist zusammenhängend. Der folgende Teilgraph H von G ist nicht zusammenhängend: v4 v3 v5 v1 v2 Definition 5.10. Ein Teilgraph G0 eines Graphen G heißt Zusammenhangskomponente von G, falls G0 selbst zusammenhängend ist und es keinen zusammenhängenden Teilgraphen F von G gibt, so dass G0 ⊆ F und G0 6= F gilt. Beispiel 5.11. Der Graph H aus Beispiel 5.9 hat zwei Zusammenhangskomponenten, eine mit der Eckenmenge {v3 , v5 } und eine mit der Eckenmenge {v1 , v2 , v4 }. Definition 5.12. Ein Graph G ist ein Baum, wenn G zusammenhängend ist und keine Kreise enthält, also keine Teilgraphen hat, die Kreise sind. Beispiel 5.13. Der linke Graph ist ein Baum, der rechte nicht: 64 STEFAN GESCHKE v4 v3 v4 v3 v5 v1 v5 v2 v1 v2 In der Informatik betrachtet man oft Bäume mit einer Wurzel, d.h., man legt fest, dass ein bestimmter Knoten des Baumes die Wurzel ist. Beispiel 5.14. Wir legen den Knoten v3 als Wurzel des Baumes aus Beispiel 5.13 fest. Eine naheliegende Darstellung dieses Graphen ist dann die folgende: v1 v4 v2 v5 v3 (Wurzel) Allerdings ist es in der Informatik relativ üblich, dass Bäume von oben nach unten wachsen. Das führt zum Beispiel zu der folgenden Darstellung: v3 (Wurzel) v2 v5 v1 v4 Wählen wir v2 als Wurzel, so ist zum Beispiel die folgende Darstellung naheliegend: v2 (Wurzel) v1 v4 v3 v5 Definition 5.15. Sei G ein Graph und v ∈ V (G). Der Grad der Ecke v ist die Anzahl der Kanten, an denen v beteiligt ist. Den Grad von v bezeichnen wir mit d(v). Beispiel 5.16. Wir betrachten wieder den Baum aus Beispiel 5.13. Es gilt d(v1 ) = d(v4 ) = d(v5 ) = 1, MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 65 d(v2 ) = 3 und d(v3 ) = 2. Wenn wir die Grade der Ecken in diesem Graphen addieren, erhalten wir 1 + 1 + 1 + 2 + 3 = 8. Das ist genau das Doppelte der Kantenzahl dieses Graphen. Das liegt daran, dass wir beim Addieren der Grade jede Kante zweimal zählen, nämlich je einmal für jede der beiden Ecken, die an der Kante beteiligt sind. Satz 5.17. Sei G ein Graph mit V (G) = {v1 , . . . , vn }, wobei die Ecken vi paarweise verschieden sind. Dann gilt n X d(vi ) = 2 · |E(G)|. i=1 Korollar 5.18. In einem Graphen ist die Zahl der Knoten von ungeradem Grad immer gerade. Beweis. Sei G ein Graph. Sei A die Menge der Ecken von G, deren Grad gerade ist, und sei B die Menge der Ecken, deren Grad ungerade ist. Nach Satz 5.17 ist X X d(v) + d(v) = 2 · |E(G)|. v∈A Da P v∈A v∈B d(v) und 2 · |E(G)| beide gerade sind, ist auch P v∈B d(v) gerade. Wie man mittels vollständiger Induktion leicht sieht, ist eine Summe ungerader Zahlen genau dann gerade, wenn die Summe eine gerade Anzahl von Summanden hat. Also hat B eine gerade Anzahl von Elementen, was zu zeigen war. Definition 5.19. Sei G ein Graph und v ∈ V (G) ein Knoten vom Grad 1. Dann heißt v ein Endknoten von G. Lemma 5.20. Ist B ein Baum mit mindestens zwei Knoten, so hat B auch mindestens zwei Endknoten. Beweis. Sei W ein Weg in B von maximaler Länge. Seien a1 , . . . , an die Ecken dieses Weges, wobei a1 mit a2 verbunden ist, a2 mit a3 und so weiter. Dann ist an ein Endknoten von W . Das sieht man wie folgt: Angenommen an hat mehr als einen Nachbarn. Dann hat an einen Nachbarn b, der von an−1 verschieden ist. Da a1 , . . . , an ein Weg maximaler Länge ist, ist a1 , . . . , an , b kein Weg in B. Das heißt aber, dass b einer der Knoten a1 , . . . , an − 2 ist. Damit gibt es in B einen Kreis. Das widerspricht aber der Annahme, dass B ein Baum ist. Das zeigt, dass an ein Endknoten von B ist. Genauso sieht man, dass a1 ein Endknoten von B ist. Mit Hilfe dieses Lemmas können wir schnell die Anzahl der Kanten eines Baumes mit n Knoten bestimmen. Satz 5.21. Sei B ein Baum mit n Knoten. Dann hat B genau n − 1 Kanten. Beweis. Wir zeigen den Satz durch vollständige Induktion über n. Induktionsanfang: Falls B genau einen Knoten hat, so gilt |E(G)| = 0. 66 STEFAN GESCHKE Induktionsschritt: Sei n ∈ N. Angenommen, jeder Baum mit n Knoten hat n − 1 Kanten. Sei B ein Baum mit n+1 Knoten. Nach Lemma 5.20 hat B einen Endknoten v. Sei B 0 der Graph, den wir erhalten, wenn wir v und die eine Kante, die v enthält, aus B entfernen. Da B keine Kreise enthält, enthält B 0 auch keine. Außerdem ist B 0 zusammenhängend. Sind nämlich a und b verschiedene Knoten in B 0 , so existiert ein Weg W in B, der in a beginnt und in b endet, da B zusammenhängend ist. Aber alle Knoten in W , die nicht Endknoten des Weges sind, haben mindestens den Grad 2 in B. Damit sind alle diese Knoten von v verschieden. Also ist der Weg auch ein Weg in B 0 . Insgesamt sehen wir, dass B 0 ebenfalls ein Baum ist. Da B 0 n Knoten hat, wissen wir nach der Induktionsannahme, dass B 0 n − 1 Kanten hat. Also hat B genau n Kanten. Das beendet den Induktionsschritt und zeigt den Satz. Für die Eigenschaften eines Graphen ist es normaler Weise egal, wie die Ecken des Graphen heißen. Daher führen wir einen Begriff ein, der beschreibt, dass zwei Graphen im wesentlichen gleich sind. Definition 5.22. Zwei Graphen G und H heißen isomorph, falls es eine Bijektion f : V (G) → V (H) gibt, so dass für alle x, y ∈ V (G) mit x 6= y gilt: {x, y} ∈ E(G) ⇔ {f (x), f (y)} ∈ E(H) Solch eine Bijektion f heißt Isomorphismus zwischen G und H. Zum Beispiel sind je zwei vollständige Graphen mit der gleichen Eckenzahl isomorph. Ebenso sind je zwei Wege der gleichen Länge isomorph. Auch je zwei Kreise der gleichen Länge sind isomorph. Definition 5.23. Für einen Graphen G definiert man den Komplementgraphen (oder einfach das Komplement) von G als den Graphen mit derselben Eckenmenge, dessen Kanten genau die zweielementigen Teilmengen von V (G) sind, die nicht Kanten von G sind. Beispiel 5.24. Hier ein Beispiel für einen Graphen und sein Komplement: Sind zwei Graphen isomorph, so sind es auch ihre Komplemente. Definition 5.25. Sei G ein Graph mit n Ecken und sei {v1 , . . . , vn } die Menge der Ecken von G, so dass d(v1 ) ≥ d(v2 ) ≥ · · · ≥ d(vn ) gilt. Dann heißt (d(v1 ), d(v2 ), . . . , d(vn )) die Gradfolge von G. Bei manchen Autoren wird die Gradfolge auch in aufsteigender Reihenfolge angegeben. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 67 Beispiel 5.26. Der folgende Graph hat die Gradfolge (4, 3, 3, 2, 2). Die Knoten sind so bezeichnet, dass d(v1 ) ≥ d(v2 ) ≥ · · · ≥ d(v5 ) gilt. v2 v3 v5 v4 v1 Bemerkung 5.27. Wenn zwei Graphen G und H isomorph sind, so haben sie dieselbe Gradfolge. Die Umkehrung gilt nicht unbedingt. Die folgenden zwei Graphen haben beide die Gradfolge (2, 2, 2, 1, 1), sind aber nicht isomorph. Manchmal ist es nützlich, in Graphen Mehrfachkanten und Schlingen zu erlauben. Definition 5.28. Ein Multigraph ist ein Tripel (V, E, f ), wobei V eine Menge von Ecken ist, E eine Menge von Kanten und f eine Abbildung, die jedem Element von E eine ein- oder zweielementige Teilmenge von V zuordnet. Für eine Kante e ∈ E ist f (e) die Menge der Endknoten von e. Die Elemente von E, denen durch f eine einelementige Teilmenge von V zugeordnet wird, heißen Schlingen. Wird zwei verschiedenen Kanten e1 und e2 dieselbe Menge von Endknoten zugeordnet, gilt also f (e1 ) = f (e2 ), so spricht man von einer Mehrfachkante. Beispiel 5.29. Ähnlich wie Graphen lassen sich auch Multigraphen durch Punkte, die durch Linien verbunden werden, graphisch darstellen. Der unten dargestellte Multigraph hat die Eckenmenge V = {v1 , . . . , v5 } und die Kantenmenge E = {e1 , . . . , e10 }. Die Funktion f bildet jede Kante auf die Menge ihrer Endpunkte ab. Zum Beispiel gilt f (e10 ) = {v5 } und f (e2 ) = f (e3 ) = {v1 , v2 }. 68 STEFAN GESCHKE v4 e5 v3 e9 e7 e1 e4 e6 e3 v1 e2 v5 e10 e8 v2 5.2. Eulersche Linien und Hamiltonsche Kreise. Definition 5.30. Gegeben sei ein Multigraph G mit der Knotenmenge V , der Kantenmenge E und einer Folge v0 , e1 , v1 , . . . , v`−1 , e` , v` mit vi ∈ V (i = 0, . . . , `) und ei ∈ E (i = 1, . . . , `). (1) Die Folge heißt Kantenfolge, falls jedes ei eine Kante ist, deren Endpunkte die Ecken vi−1 und vi sind. (2) Ist die Folge eine Kantenfolge, in der alle Kanten verschieden sind, so spricht man von einem Kantenzug. (3) Ist die Folge ein Kantenzug, in dem alle Ecken verschieden sind, so handelt es sich um einen Weg von v0 nach v` . (4) Die Zahl ` ist die Länge der Kantenfolge. (5) Die Kantenfolge ist geschlossen, falls v0 = v` gilt. Wir nennen einen Multigraphen wieder zusammenhängend, wenn es zwischen je zwei Ecken des Graphen einen Weg gibt, der die beiden Ecken verbindet. Das Königsberger Brückenproblem ist die aus dem 18. Jahrhundert stammende Frage, ob es in der Stadt Königsberg einen Spaziergang machen kann, bei dem man jede der 7 Brücken der Stadt genau einmal überquert und am Schluss wieder auf demselben der vier Landstücke ankommt, auf dem man gestartet ist. Graphentheoretisch kann man dieses Problem wie folgt formulieren: Gibt es in dem folgenden Multigraphen einen geschlossenen Kantenzug, der alle Kanten durchläuft? Dabei entsprechen die Kanten den Brücken und die Ecken den Landstücken. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 69 Der Mathematiker Leonhard Euler konnte diese Frage negativ beantworten. Definition 5.31. Sei G ein Multigraph. Einen Kantenzug in G nennt man eine Eulersche Linie bzw. einen Eulerschen Kreis, falls er geschlossen ist und sämtliche Kanten von G durchläuft. In Multigraphen definieren wir den Grad einer Ecke als die Anzahl der Kanten, die an der Ecke anstoßen. Schlingen werden dabei doppelt gezählt, da sie mit zwei Enden an demselben Knoten anstoßen. Wir stellen folgendes fest: Sei G ein zusammenhängender Multigraph und v0 , e1 , v1 , . . . , v`−1 , e` , v` eine Eulersche Linie in G. Da G zusammenhängend ist, liegt jede Ecke an einer Kante. Also ist jede Ecke des Graphen unter den Ecken v0 , . . . , v` . Da die Eulersche Linie geschlossen ist, gilt v0 = v` . Da die Eulersche Linie jede Kante des Multigraphen genau einmal enthält, ist der Grad jeder Ecke v von G genau das doppelte der Anzahl der Vorkommen der Ecke v unter den Ecken v0 , . . . , v` . Also ist der Grad jeder Ecke in G gerade. Das zeigt, dass der Spaziergang über die Königsberger Brücken unmöglich ist. In dem zum Brückenproblem gehörendem Multigraphen gibt es nämlich Ecken von ungeradem Grad. Eine notwendige Bedingung für die Existenz einer Eulerschen Linie in einem Multigraphen ist also, dass jede Ecke einen geraden Grad hat. Im nächsten Satz stellen wir fest, dass Zusammenhang und gerade Grade sogar hinreichende Bedingungen für die Existenz einer Eulersche Linie sind. Satz 5.32. Ein zusammenhängender Multigraph G besitzt genau dann eine Eulersche Linie, wenn alle Ecken einen geraden Grad haben. Beweis. Wir haben schon gezeigt, dass die Existenz einer Eulerschen Linie impliziert, dass jede Ecke des Multigraphen einen geraden Grad hat. Sei nun G ein zusammenhängender Multigraph, in dem jede Ecke einen geraden Grad hat. Wir zeigen die Existenz einer Eulerschen Linie mittelsvollständiger Induktion über die Anzahl m der Kanten des Multigraphen G. Induktionsanfang: Ist m = 0, hat also G keine Kanten, so kann G auch nur einen Knoten v haben, da G zusammenhängend ist. In diesem Fall ist aber der Kantenzug, der nur aus der einen Ecke v besteht, eine Eulersche Linie. Induktionsschritt: Sei m > 0. Wir nehmen an, dass jeder zusammenhängende Multigraph mit weniger als m Kanten, in dem jeder Knoten einen geraden Grad hat, eine Eulersche Linie besitzt und zeigen, dass auch G eine Eulersche Linie hat. Dazu wählen wir zunächst in G einen Kantenzug v0 , e1 , v1 , . . . , v`−1 , e` , v` , der sich nicht mehr verlängern lässt. Dieser Kantenzug muss geschlossen sein. Falls nämlich v0 6= v` ist, so benutzt der Kantenzug nur ungerade viele Kanten, die an 70 STEFAN GESCHKE v` anstoßen, wobei wir Schleifen wieder doppelt zählen. Also stößt an v` eine Kante an, die in dem Kantenzug noch nicht vorkommt. Damit lässt sich der Kantenzug verlängern, was aber unserer Wahl des Kantenzugs widerspricht. Nun entfernen wir alle Kanten e1 , . . . , e` , die in dem gewählten Kantenzug vorkommen, aus dem Multigraphen G. Übrig bleibt ein Multigraph G0 , der zwar nicht mehr unbedingt zusammenhängend ist, in dem aber immer noch jede Ecke einen geraden Grad hat. Jede Zusammenhangskomponente von G0 hat weniger als m Kanten. Nach Induktionsannahme hat also jede Zusammenhangskomponente von G0 eine Eulersche Linie. Wenn wir nun unseren Kantenzug v0 , e1 , v1 , . . . , v`−1 , e` , v` durchlaufen und dabei nach Möglichkeit die Eulerschen Linien in den Zusammenhangskomponenten von G0 einfügen, so erhalten wir eine Eulersche Linie des Multigraphen G. Definition 5.33. Sei G ein Graph und C ein Kreis in G. Dann heißt C ein Hamiltonscher Kreis, wenn C alle Knoten von G enthält. Der folgende Satz liefert eine notwendige Bedingung für die Existenz eines Hamiltonschen Kreises. Dabei sei c(G) die Anzahl der Zusammenhangskomponenten eines Graphen G. Satz 5.34. Hat ein Graph G einen Hamiltonschen Kreis, so gilt für jede nicht leere Teilmenge A von V (G) die Ungleichung c(G − A) ≤ |A|. Dabei bezeichnet G − A den Graphen, den man erhält, wenn die Ecken in A und die mit diesen Ecken inzidenten Kanten aus G entfernt. Beweis. Für jeden Kreis C gilt folgendes: Ist A eine Menge von k Knoten in C, so hat C − A höchstens k Zusammenhangskomponenten. Hat also G einen Hamiltonschen Kreis H, so gilt demnach für jede nicht leere Teilmenge A von V (G) die Ungleichung c(H − A) ≤ |A|. Da H ein Teilgraph von G ist, der alle Ecken von G enthält, gilt c(G − A) ≤ c(H − A) und somit auch c(G − A) ≤ |A|. Beispiel 5.35. Der folgende Graph erfüllt die Bedingung aus Satz 5.34, hat aber keinen Hamiltonschen Kreis. Während wir mit Satz 5.32 ein einfach Werkzeug in der Hand haben, um zu entscheiden, ob ein gegebener Graph oder Multigraph eine Eulersche Linie besitzt, MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 71 ist kein entsprechendes Kriterium für die Existenz eines Hamiltonschen in einem Graphen bekannt. Es gibt auch effiziente Algorithmen, mit den man Eulersche Linien in Multigraphen finden kann. Zum Finden von Hamiltonschen Kreisen in beliebigen Graphen sind keine effizienten Algorithmen bekannt. 5.3. Gerichtete Graphen. Bisher haben wir gerichtete Graphen nur im Zusammenhang mit binären Relationen kennengelernt. Und in der Tat ist ein gerichteter Graph auch im wesentlichen das gleiche wie eine zweistellige Relation. Definition 5.36. Ein gerichteter Graph (oder Digraph) G ist ein Paar (V, E), wobei V eine beliebige Menge ist und E eine zweistellige Relation auf V , also E ⊆ V 2 . Wieder bezeichnen wir die Elemente von V als Ecken oder Knoten und die Elemente von E als (gerichtete) Kanten. Eine Kante der Form (v, v) nennen wir Schlinge. Ist G ein gerichteter Graph, so schreiben wir V (G) für die Menge der Ecken von G und E(G) für die Menge der Kanten. Viele Begriffe lassen sich leicht von Graphen auf gerichtete Graphen übertragen. Zum Beispiel ist klar, was ein (gerichteter) Teilgraph eines gerichteten Graphen ist, oder wann zwei gerichtete Graphen isomorph sind. Einen gerichteten Graphen G kann man in Form einer Adjazenzmatrix darstellen. Sei V (G) = {v1 , . . . , vn }. Die Adjazenzmatrix von G ist dann ein quadratisches Zahlenschema mit n Zeilen und n Spalten. Der Eintrag in der i-ten Zeile und der j-ten Spalte ist genau dann 1, wenn das Paar (vi , vj ) in E(G) ist. Man beachte, dass die Adjazenzmatrix von G von der gewählten Aufzählung v1 , . . . , vn von V (G) abhängt. Man kann einen gerichteten Graphen auch in Form von Nachbarschaftslisten angeben. Dabei notiert man für jeden Knoten v diejenigen Knoten, zu denen eine Kante von v aus hinführt. Beispiel 5.37. Sei G der folgende gerichtete Graph: 3 4 1 2 5 Die Adjazenzmatrix dieses gerichteten Graphen mit der Eckenaufzählung 1, . . . , 5 und Nachbarschaftslisten sehen wie folgt aus: 72 STEFAN GESCHKE 1 2 3 4 5 1 0 1 1 1 0 2 0 0 0 1 3 1 0 0 4 0 0 0 5 0 0 0 2 4 3 0 1 2 1 0 3 1 4 0 1 4 5 0 0 4 Man beachte, dass in der Adjazenzmatrix die Ecken 1, . . . , 5 nur der Übersichtlichkeit halber angegeben sind. Die eigentliche Adjazenzmatrix ist nur die Matrix mit fünf Zeilen und Spalten, die nur Nullen und Einsen enthält. Natürlich kann man auch Adjazenzmatrizen für ungerichtete Graphen angeben, wobei jede Kante zweimal auftaucht, nämlich je einmal für jede mögliche Richtung. Adjanzenzmatrizen ungerichteter Graphen sind symmetrisch: Spiegelung an der Diagonalen von links oben nach rechts unten führt die Matrix wieder in sich selbst über. Man kann einen ungerichteten Graphen auch als einen gerichteten Graphen auffassen, indem man für jede ungerichtete Kante {v, w} die beiden gerichteten Kanten (v, w) und (w, v) betrachtet. Bemerkung 5.38. Für manche Anwendungen, insbesondere algorithmischer Art, ist es nützlich, für einen gerichteten Graphen zwei Nachbarschaftslisten zu führen: eine mit den Nachbarn, die sich von jedem Knoten aus erreichen lassen, und eine mit den Nachbarn, von denen aus man einen Knoten erreichen kann. Definition 5.39. Ist G ein gerichteter Graph und v eine Ecke von G, so definiertman den Außengrad d+ (v) von v als die Anzahl der Kanten, die von v wegführen, und den Innengrad d− (v) als die Anzahl der Kanten, die zu v hinführen. Definition 5.40. Gegeben sei ein gerichteter Graph G = (V, E) sowie eine Folge v0 , e1 , v1 , . . . , v`−1 , e` , v` mit vi ∈ V für alle i ∈ {0, . . . , `} und ei ∈ E für alle i ∈ {1, . . . , `}. (1) Diese Folge heißt gerichtete Kantenfolge von v0 nach v` , falls für alle i ∈ {1, . . . , `} die Kante ei eine Kante von vi−1 nach vi ist. (2) Sind die Kanten in dieser Kantenfolge paarweise verschieden, so spricht man von einem gerichteten Kantenzug. (3) Sind außerdem die Knoten paarweise verschieden, so spricht man von einem gerichteten Weg. (4) Eine gerichtete Kantenfolge von v0 nach v` heißt geschlossen, falls v0 = v` gilt. Für die Definition von Zusammenhangskomponenten gerichteter Graphen gibt es zwei Möglichkeiten. Definition 5.41. Sei G = (V, E) ein gerichteter Graph. Unter dem G zugrunde liegendem ungerichteten Graphen verstehen wir den Graphen Gu mit der MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 73 Eckenmenge V , dessen Kantenmenge die Menge E(Gu ) = {{v, w} : (v, w) ∈ E ∧ v 6= w} ist. Definition 5.42. Sei G eingerichteter Graph. (1) G heißt schwach zusammenhängend, falls Gu zusammenhängend ist (2) G heißt stark zusammenhängend, falls für je zwei verschiedene Ecken v und w von G ein gerichteter Weg von v nach w existiert. (3) Ein gerichteter Teilgraph G0 ⊆ G ist eine schwache Zusammenhangskomponente von G, falls G0 schwach zusammenhängend ist und kein Teilgraph, der G0 umfasst und echt größer ist, schwach zusammenhängend ist. (4) Ein gerichteter Teilgraph G0 ⊆ G ist eine starke Zusammenhangskomponente von G, falls G0 stark zusammenhängend ist und kein Teilgraph, der G0 umfasst und echt größer ist, stark zusammenhängend ist. 5.4. Bäume. Wir erinnern uns daran, dass Bäume zusammenhängende Graphen ohne Kreise sind. Sei B ein Baum. Nach Wahl einer Wurzel w von B können wir B als gerichteten Graphen auffassen, wobei jede Kante von der Wurzel weg gerichtet ist. Geht bei dieser Orientierung eine Kante von einem Knoten v zu einem Knoten w, so bezeichnen wir v als den Vater von w und w als das Kind von v. Ein Knoten, der keine Kinder hat, heißt Blatt. Ein Knoten, der kein Blatt ist, heißt innerer Knoten des Baumes. Die Höhe von B ist die maximale Länge eines Weges von der Wurzel von B zu einem Blatt. Unter dem Grad von B verstehen wir die maximale Zahl von Kindern eines Knotens in B. B ist ein binärer Baum, falls B den Grad 2 hat. Hat B den Grad 3, so heißt B ternär. B heißt regulär, falls jeder innere Knoten von B dieselbe Anzahl von Kindern hat. Wir betrachten reguläre Bäume etwas genauer. Ist B ein regulärer binärer Baum mit mehr als einem Knoten, so hat die Wurzel von B den Grad 2, jeder innere Knoten außer der Wurzel den Grad 3 und jedes Blatt den Grad 1. Wir wissen bereits, dass ein Baum mit n Knoten genau n − 1 Kanten hat und dass die Summe der Grade in einem Graphen genau die zweifache Kantenzahl ist. Ist p die Zahl der Blätter von B, so gilt 2 + (n − 1 − p) · 3 + p = 2(n − 1). Es folgt p = n+1 2 . Die Zahl der inneren Knoten von B ist damit n − p = n−1 2 . Das zeigt den folgenden Satz: Satz 5.43. Ein regulärer binärer Baum mit n Knoten hat n+1 2 Blätter und n−1 2 innere Knoten. Abschließend beweisen wir noch einen Satz über die Anzahl der Knoten in einem Baum in Abhängigkeit von Höhe und Grad. 74 STEFAN GESCHKE Satz 5.44. Ein Baum der Höhe h vom Grad s hat höchstens sh+1 −1 s−1 Knoten. Beweis. Sei B ein Baum der Höhe h, wobei die Höhe in Bezug auf eine Wurzel w berechnet wurde. Für ` ∈ N0 mit ` ≤ h sei die `-te Stufe des Baumes die Menge der Knoten, für die der kürzeste Weg zur Wurzel die Länge ` hat. Die 0-te Stufe des Baumes besteht also nur aus der Wurzel, die erste Stufe aus den Kindern der Wurzel, die zweite Stufe aus den Kindern der Kinder der Wurzel und so weiter. Die 0-te Stufe enthält also einen Knoten, die 1-te Stufe höchstens s Knoten, die 2-te Stufe höchstens s2 Knoten und so weiter. Für ` ≤ h enthält die `-te Stufe höchPh stens s` Knoten. Also hat B höchstens `=0 s` Knoten. Nach der geometrischen Summenformel gilt h X s` = `=0 sh+1 − 1 . s−1 Das zeigt den Satz. 5.5. Breiten- und Tiefensuche. Wir betrachten zwei Algorithmen mit denen man in einem Graphen die Menge der Knoten berechnen lässt, die man von einem gegebenen Startknoten aus erreichen kann. Es wird also für ungerichtete Graphen die Zusammenhangskomponente eines Knotens berechnet. Wir stellen die Algorithmen für gerichtete Graphen vor. Im Falle von ungerichteten Graphen kann man die Algorithmen anwenden, indem man jede ungerichtete Kante {v, w} die zwei gerichteten Kanten (v, w) und (w, v) einführt. Man beachte, dass im Falle eines gerichteten Graphen die Menge der von einem Knoten v aus mit gerichteten Wegen erreichbaren Knoten weder die starke noch die schwache Zusammenhangskomponente von v sein muss. 5.5.1. Tiefensuche. Sei G = (V, E) ein gerichteter Graph und sei v ∈ V . Wir konstruieren schrittweise einen gerichteten Baum B mit der Wurzel v. Dabei ist ein gerichteter Baum mit einer Wurzel v ein gerichteter Graph, dessen zugrunde liegender ungerichtete Graph ein Baum ist und bei dem alle Kanten von der Wurzel weg zeigen. Dieser gerichtete Baum B ist ein gerichteter Teilgraph von G. Im Laufe des Algorithmus markieren wir mehr und mehr Knoten von G und versuchen unmarkierte Nachbarn eines aktuellen Knoten a zu finden. Genau läuft die Tiefensuche wie folgt ab: (1) Markiere den Knoten v und setze a := v. In diesem Schritt sei B der Baum, dessen einziger Knoten die Wurzel v ist. (2) Falls es einen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt, so wählte ein solches u, füge u und die Kante (a, u) zu dem Baum B hinzu, markiere u und setze a := u. Diesen Schritt bezeichnet man als den Vorwärtsschritt (advance step). (3) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt, und falls a nicht die Wurzel von B ist, so geht man zurück zum Vater w von a in B und setzt a := w. Diesen Schritt bezeichnet man als den Rückwärtsschritt (back-tracking step). Nun fährt man mit Schritt (2) fort. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 75 (4) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt, und falls a die Wurzel von B ist, so endet der Algorithmus. Die von v aus erreichbaren Knoten sind genau die markierten Knoten. Das sind auch genau die Knoten von B. Die aktuellen Knoten verwaltet man bei der Tiefensuche am besten mit Hilfe eines Stapels (stack). In den Schritten (1) und (2) tut man jeweils den neuen aktuellen Knoten a oben auf den Stapel. Im Schritt (3) entfernt man den obersten Knoten vom Stapel. Der neue aktuelle Knoten ist der Knoten darunter, der jetzt der oberste Knoten des Stapels ist. Die Tiefensuche wird auf Englisch depth first search (DFS) genannt. Dementsprechend heißt der Baum, der bei der Tiefensuche gewählt wird, DFS-Baum. Man beachte, dass der Baum, der bei der Tiefensuche entsteht, von Wahlen abhängt, die während des Ablaufs des Algorithmus getroffen werden. Im allgemeinen ist ein DFS-Baum also nicht durch v und G eindeutig bestimmt. Satz 5.45. Sei G ein gerichteter Graph und v ∈ V (G). Weiter sei B der Baum der markierten Knoten, der entsteht, wenn man die Tiefensuche in G ausgehend von v durchführt. Dann ist ein Knoten w ∈ V (G) genau dann in B, wenn es einen gerichteten Weg v0 , v1 , . . . , v` von v nach w in G gibt. Beweis. Es ist klar, dass B ein Baum ist, der ein gerichteter Teilgraph von G ist, und dass jeder Knoten von B durch einen gerichteten Weg in B, und damit auch in G, erreichbar ist. Sei umgekehrt w ein Knoten in G, der sich von v aus auf einem gerichteten Weg in G erreichen lässt. Wir zeigen durch vollständige Induktion über die Länge eines solchen Weges, dass w in B liegt. Der Induktionsanfang ist sehr einfach: Lässt sich w von v aus in 0 Schritten erreichen, so ist w = v und liegt damit in B. Für den Induktionsschritt sei w ein Knoten, der sich von v aus in ` Schritten erreichen lässt. Die Induktionsannahme ist, dass alle Knoten von G, die sich von v aus in weniger als ` Schritten erreichen lassen, in B liegen. Sei v0 , . . . , v` ein gerichteter Weg von v nach w in G. Nach Induktionsannahme ist v`−1 ein Knoten in B. Da der Algorithmus in endlichen gerichteten Graphen immer terminiert, muss es in der Tiefensuche einen Moment gegeben haben, in dem v`−1 der aktuellen Knoten war und es keinen unmarkierten Nachbarn von v`−1 mehr gab. Das heißt aber, dass w irgendwann markiert wurde. Also ist w ein Knoten in B. 5.5.2. Breitensuche. Sei G = (V, E) ein gerichteter Graph und sei v ∈ V . Wieder konstruieren wir einen gerichteten Baum B mit der Wurzel v. Wenn der Algorithmus endet, so enthält B wieder alle Knoten, die von v aus erreichbar sind. Der Unterschied zur Tiefensuche liegt darin, dass wir länger beim aktuellen Knoten bleiben und die Suche entsprechend anders organisieren. (1) Markiere den Knoten v und setze a := v. In diesem Schritt sei B der Baum, dessen einziger Knoten die Wurzel v ist. 76 STEFAN GESCHKE (2) Falls es einen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt, so wähle ein solches u, füge u und die Kante (a, u) zu dem Baum B hinzu und markiere u. Im Unterschied zur Tiefensuche bleibt in diesem Schritt der ursprüngliche Knoten a der aktuelle Knoten. (3) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt, und falls es einen Knoten b in B gibt, von dem aus es eine Kante (b, u) zu einem unmarkierten Knoten u gibt, so wähle aus allen solchen Knoten b denjenigen aus, der schon am längsten in dem Baum B ist und setze a := b. Der Knoten b wird also der neue aktuelle Knoten und der Algorithmus fährt mit Schritt (2) fort. (4) Falls es keine Kante (a, u) vom aktuellen Knoten zu einem unmarkierten Knoten gibt und auch kein Knoten b in B existiert, der zu einem unmarkierten Knoten benachbart ist, so stoppt der Algorithmus. Die markierten Knoten verwaltet man bei der Breitensuche am besten mit Hilfe einer Warteschlange (queue). In den Schritten (1) und (2) tut man jeweils den neu markierten Knoten, v in Schritt (1) und u in Schritt (2), hinten in die Warteschlange. Im Schritt (3) betrachtet man den vordersten Knoten in der Warteschlange und testet, ob dieser Knoten noch unmarkierte Nachbarn hat. Falls nicht, so wird dieser Knoten aus der Warteschlange entfernt und der nächste Knoten in der Warteschlange getestet. Die Breitensuche wird auf Englisch breadth first search (BFS) genannt. Dementsprechend heißt der Baum, der bei der Breitensuche gewählt wird, BFSBaum. Man beachte, dass der Baum, der bei der Breitensuche entsteht, von Wahlen abhängt, die während des Ablaufs des Algorithmus getroffen werden. Im allgemeinen ist ein BFS-Baum also nicht durch v und G eindeutig bestimmt. Satz 5.46. Sei G ein gerichteter Graph und v ∈ V (G). Weiter sei B der Baum der markierten Knoten, der entsteht, wenn man die Breitensuche in G ausgehend von v durchführt. Dann ist ein Knoten w ∈ V (G) genau dann in B, wenn es einen gerichteten Weg v0 , v1 , . . . , v` von v nach w in G gibt. Beweis. Der Beweis ist praktisch identisch mit dem Beweis von Satz 5.45. Es ist klar, dass B ein Baum ist, der ein gerichteter Teilgraph von G ist, und dass jeder Knoten von B durch einen gerichteten Weg in B, und damit auch in G, erreichbar ist. Sei umgekehrt w ein Knoten in G, der sich von v aus auf einem gerichteten Weg in G erreichen lässt. Wir zeigen durch vollständige Induktion über die Länge eines solchen Weges, dass w in B liegt. Der Induktionsanfang ist sehr einfach: Lässt sich w von v aus in 0 Schritten erreichen, so ist w = v und liegt damit in B. Für den Induktionsschritt sei w ein Knoten, der sich von v aus in ` Schritten erreichen lässt. Die Induktionsannahme ist, dass alle Knoten von G, die sich von v aus in weniger als ` Schritten erreichen lassen, in B liegen. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 77 Sei v0 , . . . , v` ein gerichteter Weg von v nach w in G. Nach Induktionsannahme ist v`−1 ein Knoten in B. Da der Algorithmus in endlichen gerichteten Graphen immer terminiert, muss es in der Breitensuche einen Moment gegeben haben, in dem v`−1 der aktuellen Knoten war und es keinen unmarkierten Nachbarn von v`−1 mehr gab. Das heißt aber, dass w irgendwann markiert wurde. Also ist w ein Knoten in B. 6. Elementare Zahlentheorie (Fortsetzung) Sei m ∈ N. Wir erinnern uns an die Definition der Kongruenz modulo m. Zwei Zahlen a, b ∈ Z sind kongruent modulo m, a ≡ b (mod m), falls a und b bei Division durch m denselben Rest haben. Die Kongruenz a ≡ b (mod m) gilt genau dann, wenn a − b durch m teilbar ist. Die folgenden drei Eigenschaften aus Satz 2.31 zeigen, dass die Kongruenz modulo m eine Äquivalenzrelation ist: (1) a ≡ a (mod m) (Reflexivität) (2) a ≡ b (mod m) ⇒ b ≡ a (mod m) (Symmetrie) (3) a ≡ b (mod m) ∧ b ≡ c (mod m) ⇒ a ≡ c (mod m) (Transitivität) Die Äquivalenzklassen dieser Äquivalenzrelation haben wir Restklassen genannt und die Restklasse einer Zahl a mit [a]m bezeichnet. Es ist also [a]m = {b ∈ Z : a ≡ b (mod m)} = {. . . , a − m, a, a + m, a + 2m, . . . }. Es gibt genau m verschiedene Restklassen modulo m, nämlich [0]m , [1]m , . . . , [m − 1]m . Definition 6.1. Es sei Zm := {[0]m , [1]m , . . . , [m − 1]m } die Menge der Restklassen modulo m. Für eine gegebene Restklasse K modulo m nennen wir ein Element a ∈ K einen Repräsentanten oder Vertreter der Restklasse K. Ist a ein Repräsentant von K, so gilt K = [a]m . Wählen wir aus jeder Restklasse genau einen Repräsentanten, so spricht man von einem Repräsentanten- oder Vertretersystem. Das Standardrepräsentantensystem für die Restklassen in Zm sind die Zahlen 0, 1, . . . , m−1. Wir definieren Rechenoperationen ⊕ und zwischen Restklassen modulo m. Definition 6.2. Für a, b ∈ Z sei [a]m ⊕ [b]m := [a + b]m und [a]m [b]m := [a · b]m . 78 STEFAN GESCHKE Man beachte, dass diese Definition nur dann sinnvoll ist, wenn die Definition unabhängig von der Wahl der Repräsentanten a und b der Restklassen [a]m und [b]m ist, wenn also für alle c, d ∈ Z mit [a]m = [c]m und [b]m = [d]m gilt: [a + b]m = [c + d]m und [a · b]m = [c · d]m An dieser Stelle erinnern wir uns wieder an Satz 2.31. Es gilt: (5) a ≡ b (mod m) ∧ c ≡ d (mod m) ⇒ a + c ≡ b + d (mod m) Mit anderen Worten, wenn [a]m = [c]m und [b]m = [d]m gilt, dann gilt auch [a + c]m = [b + d]m . Das heißt, dass unsere Definition von [a]m ⊕[b]m tatsächlich nur von den Restklassen [a]m und [b]m abhängt, und nicht von der Wahl der Repräsentanten a und b. Man sagt, dass ⊕ wohldefiniert ist. Beispiel 6.3. Sei m = 7, a = 5 und b = 8. Dann ist [a]m ⊕ [b]m = [5]7 ⊕ [8]7 = [5 + 8]7 = [13]7 = [6]7 . Wählt man nun c = −2 und d = 1, so gilt a − c = 7 und b − d = 7. Es gilt also a ≡ c (mod m) und c ≡ d (mod m) und damit [a]m = [c]m und [b]m = [d]m . Nun ist [c]m ⊕ [d]m = [−2]7 ⊕ [1]7 = [−2 + 1]7 = [−1]7 = [6]7 . Also ist [a + b]m = [c + d]m , wie erwartet. Wir müssen noch zeigen, dass auch wohldefiniert ist. Seien a, b, c, d ∈ Z mit a ≡ c (mod m) und c ≡ d (mod m). Dann existieren r1 , r2 , qa , qb , qc , qd ∈ Z mit a = qa · m + r1 , b = qb · m + r2 , c = qc · m + r1 , d = qd · m + r2 sowie 0 ≤ r1 , r2 < m. Wir betrachten a · c und b · d. Es gilt a · b = (qa · m + r1 ) · (qb · m + r2 ) = qa · qb · m2 + r1 · qb · m + r2 · qa · m + r1 · r2 und c · d = (qc · m + r1 ) · (qd · m + r2 ) = qc · qd · m2 + r1 · qd · m + r2 · qc · m + r1 · r2 . Also ist a · b ≡ c · d (mod m). Das zeigt, dass [a · b]m unabhängig von der Wahl der Repräsentanten a und b der Restklassen [a]m und [b]m ist. Damit ist auch wohldefiniert. Satz 6.4. Für alle a, b, c ∈ Z gilt: (1) Kommutativgesetz: • [a]m ⊕ [b]m = [b]m ⊕ [a]m • [a]m [b]m = [b]m [a]m (2) Assoziativgesetz: • ([a]m ⊕ [b]m ) ⊕ [c]m = [b]m ⊕ ([a]m ⊕ [c]m ) • ([a]m [b]m ) [c]m = [b]m ([a]m [c]m ) (3) Existenz neutraler Elemente: MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 79 • [a]m ⊕ [0]m = [a]m • [a]m [1]m = [a]m (4) Distributivgesetz: • [a]m ([b]m ⊕ [c]m ) = ([a]m [b]m ) ⊕ ([a]m [b]m ) (5) Existenz additiver Inverser. • [a]m ⊕ [−a]m = [0]m Beweis. Alle diese Eigenschaften folgen leicht aus den entsprechenden Eigenschaften von Z. Als Beispiel rechnen wir (4) nach. Es gilt [a]m ([b]m ⊕ [c]m ) = [a]m [b + c]m = [a · (b + c)]m = [a · b + a · c]m = [a · b]m ⊕ [a · c]m = ([a]m [b]m ) ⊕ ([a]m [b]m ). Das zeigt (4). Wir geben für m = 2, 3, 4, 5 Additionstabellen und Multiplikationstabellen an, wobei wir anstelle von [r]m zur Abkürzung r schreiben. m=2: m=3: m=4: m=5: ⊕ 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 1 ⊕ 0 1 2 0 1 2 0 0 1 2 0 0 0 0 1 1 2 0 1 0 1 2 2 2 0 1 2 0 2 1 ⊕ 0 1 2 3 0 1 2 3 0 0 1 2 3 0 0 0 0 0 1 1 2 3 0 1 0 1 2 3 2 2 3 0 1 2 0 2 0 2 3 3 0 1 2 3 0 3 2 1 ⊕ 0 1 2 3 4 0 1 2 3 4 0 0 1 2 3 4 0 0 0 0 0 0 1 1 2 3 4 0 1 0 1 2 3 4 2 2 3 4 0 1 2 0 2 4 1 3 3 3 4 0 1 2 3 0 3 1 4 2 4 4 0 1 2 3 4 0 4 3 2 1 Wir schreiben von nun an einfach + und · für ⊕ und und stellen fest, dass sich nicht jede Rechenregel von Z auf Zm überträgt. Die Kürzungsregel, dass also für a 6= 0 aus ab = ac immer b = c folgt, gilt zum Beispiel im Allgemeinen nicht in Zm . Zum Beispiel gilt [2]4 · [1]4 = [2]4 = [6]4 = [2]4 · [3]4 und [2]4 6= [0]4 , aber 80 STEFAN GESCHKE [1]4 6= [3]4 . Dieses Beispiel hängt damit zusammen, dass [2]4 · [2]4 = [4]4 = [0]4 gilt, dass es also in Z4 von 0 verschiedene Elemente gibt, deren Produkt 0 ist. Definition 6.5. Sei [a]m ∈ Zm . Ein Element [b]m ∈ Zm heißt multiplikatives Inverses von [a]m , falls [a]m · [b]m = [1]m gilt. Besitzt [a]m ein multiplikatives Inverses, so nennt man [a]m invertierbar. Beispiel 6.6. [3]4 ist invertierbar. Es gilt nämlich [3]4 · [3]4 = [9]4 = [1]4 . [2]4 ist nicht invertierbar, da in Z4 kein Element [b]4 existiert, so dass [2]4 · [b]4 = [1]4 gilt. Das liest man an der entsprechenden Multiplikationstabelle ab. [2]5 ist invertierbar. Es gilt [2]5 · [3]5 = [6]5 = [1]5 . Satz 6.7. Ein Element von Zm hat höchstens ein multiplikatives Inverses. Beweis. Angenommen, [b]m und [c]m sind beide multiplikative Inverse von [a]m . Dann gilt [b]m = [b]m · [1]m = [b]m · ([a]m · [c]m ) = ([b]m · [a]m ) · [c]m = [1]m · [c]m = [c]m . Also gibt es keine zwei verschiedenen multiplikativen Invsersen von [a]m . Satz 6.8. Ein Element [a]m ∈ Zm ist genau dann invertierbar, wenn a und m teilerfremd sind. Insbesondere ist jedes Element [a]p ∈ Zp \ {[0]p } invertierbar, wenn p eine Primzahl ist. Beweis. Sei zunächst [a]m ∈ Zm invertierbar. Dann existiert [b]m ∈ Zm mit [a]m · [b]m = [1]m . Es gilt also ab ≡ 1 (mod m. Damit existiert ein k ∈ Z mit ab − 1 = km. Es folgt ab − km = 1. Ist g ∈ Z ein Teiler von a und m, so teilt g auch ab − km = 1. Damit ist g entweder 1 oder −1. Also sind a und m Teilerfremd. Nun nehmen wir an, dass a und m teilerfremd sind. Wir betrachten die Restklassen [0 · a]m , [1 · a]m , . . . , [(m − 1) · a]m und zeigen zunächst, dass sie paarweise verschieden sind. Seien nämlich r, s ∈ Z. Angenommen [ra]m = [sa]m . Dann ist ra − sa = (r − s)a durch m teilbar. Da a und m teilerfremd sind, folgt daraus, dass r−s durch m teilbar ist. Also gilt [r]m = [s]m . Es folgt, dass für r, s ∈ Z mit r 6= s und 0 ≤ r, s < m die beiden Restklassen [ra]m und [sa]m verschieden sind. Da die m Restklassen [0 · a]m , [1 · a]m , . . . , [(m − 1) · a]m paarweise verschieden sind, muss die Restklasse [1]m unter ihnen sein. Also gibt es ein b ∈ Z mit 0 ≤ b < m und [b · a]m = [1]m . Es gilt also [b]m · [a]m = [b · a]m = [1]m und damit ist [a]m invertierbar. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 81 Aus den Sätzen 6.4 und 6.8 folgt sofort das nächste Korollar. Korollar 6.9. Ist p eine Primzahl, so ist Zp ein Körper. Der Beweis des nächsten Satzes zeigt, wie man multiplikative Inverse von invertierbaren Elementen von Zm berechnen kann. Satz 6.10. Seien a, b ∈ N und d = ggT(a, b). Dann gibt es λ, µ ∈ Z mit d = λa+µb. Beweis. Wir können annehmen, dass a ≤ b gilt und beweisen den Satz durch vollständige Induktion über die Anzahl der Schritte, die im euklidischen Algorithmus durchgeführt werden, um ggT(a, b) zu berechnen. Induktionsanfang: Wenn der euklidische Algorithmus bereits nach dem ersten Schritt terminiert, so ist a ein Teiler von b. In diesem Falle ist ggT(a, b) = a und es gilt a = 1 · a + 0 · b. Induktionsschritt: Sei n ∈ N so gewählt, dass der euklidische Algorithmus zur Berechnung von ggT(a, b) nach n Schritten terminiert und gelte n > 1. Angenommen der Satz gilt für alle a0 , b0 ∈ N, bei denen der euklidische Algorithmus nach weniger als n Schritten terminiert. Wir führen den ersten Schritt des euklidischen Algorithmus für a und b durch und wählen r, q ∈ Z mit b = q · a + r und 0 ≤ r < a. Es gilt d = ggT(a, b) = ggT(r, a). Nun lässt sich ggT(r, a) in weniger als n Schritten berechnen und nach Induktionsannahme existieren λ0 , µ0 ∈ Z mit d = λ0 r + µ0 a. Es gilt r = b − qa und damit d = λ0 (b − qa) + µ0 a = λ0 b + (µ0 − λ0 q)a. Setzt man also µ := λ0 und λ := µ0 − λ0 q, so ergibt sich d = λa + µb. Man beachte, dass für teilerfremde a, m ∈ N aus Satz 6.10 folgt, dass es b, k ∈ Z gibt, so dass 1 = ab + km gilt. Es folgt auf etwas andere Weise als im Satz 6.8, dass [a]m invertierbar ist, nämlich mit dem multiplikativen Inversen [b]m . Man kann den euklidischen Algorithmus also auch einsetzen, um Elemente von Zm zu invertieren. Beispiel 6.11. a) Sei a = 228 und b = 294. Wir berechnen den größten gemeinsamen Teiler von a und b mit dem euklidischen Algorithmus. Es gilt: 294 = 1 · 228 + 66 228 = 3 · 66 + 30 66 = 2 · 30 + 6 30 = 5·6+0 Der größte gemeinsame Teiler von 228 und 66 ist also 6. Aus der vorletzten Gleichung erhalten wir 6 = 66 − 2 · 30. Aus der zweiten Gleichung ergibt sich 30 = 228 − 3 · 66. Einsetzen liefert 6 = 66 − 2 · (228 − 3 · 66) = 7 · 66 − 2 · 228. Die erste Gleichung liefert 66 = 294 − 1 · 228. Durch Einsetzen in 6 = 7 · 66 − 2 · 228 folgt 6 = 7 · (294 − 1 · 228) − 2 · 228 = 7 · 294 − 9 · 228. 82 STEFAN GESCHKE b) Sei a = 15 und m = 28. Wir wollen [a]m invertieren. Der euklidische Algorithmus liefert 28 = 1 · 15 + 13 15 = 1 · 13 + 2 13 = 6·2+1 2 = 2 · 1 + 0. Der größte gemeinsame Teiler von 15 und 28 ist also 1. Auflösen der Gleichung in diesem Durchlauf des euklidischen Algorithmus und Rückwärtseinsetzen liefert 1 = 13 − 6 · 2 = 13 − 6 · (15 − 1 · 13) = 7 · 13 − 6 · 15 = 7 · (28 − 1 · 15) − 6 · 15 = 7 · 28 − 13 · 15 Es gilt also 1 ≡ −13 · 15 (mod 28). Damit ist [−13]28 = [15]28 das multiplikative Inverse von [15]28 in Z28 . Auf ähnliche Weise wie Satz 6.8 können wir auch den folgenden Satz beweisen, der wichtige Anwendungen in der Kryptographie hat. Für n ∈ N sei ϕ(n) die Anzahl der zu n teilerfremden natürlichen Zahlen ≤ n. Beispiel 6.12. a) Es gilt ϕ(1) = 1, da ggT(1, 1) = 1 gilt und damit 1 und 1 teilerfremd sind. b) Für eine Primzahl p ist ϕ(p) = p − 1, da alle kleineren natürlichen Zahlen zu p teilerfremd ist. c) Die Zahlen 1, 5, 7, 11 sind zu 12 teilerfremd, während 2, 3, 4, 6, 8, 9, 10 nichttriviale gemeinsame Teiler mit 12 haben. Also ist ϕ(12) = 4. d) Sind p und q verschiedene Primzahlen, so gilt ϕ(p · q) = (p − 1) · (q − 1) = pq − p − q + 1. Eine Zahl a ≤ p · q hat nämlich genau dann einen nichttrivialen gemeinsamen Teiler mit p · q, wenn a ein Vielfaches von p oder q ist. Das kleinste gemeinsame Vielfache von p und q ist p · q. Es gibt also p Vielfache von q und q Vielfache von p, die nicht größer als p · q sind. Dabei wird das gemeinsame Vielfache p · q doppelt gezählt. Insgesamt gibt es also p+q −1 natürliche Zahlen ≤ p·q, die nicht zu p·q teilerfremd sind. Das zeigt ϕ(p · q) = (p − 1) · (q − 1). Satz 6.13 (Der Satz von Fermat-Euler). Sei m, n ∈ N teilerfremd. Dann gilt nϕ(m) ≡ 1 (mod m). Beweis. Seien r1 , . . . , rϕ(n) die natürlichen Zahlen ≤ m, die zu m teilerfremd sind. Wie im Beweis von Satz 6.8 sind die Restklassen [r1 · n]m , [r2 · n]m , . . . , [rϕ(m) · n]m MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 83 paarweise verschieden. Für jedes i ∈ {1, . . . , ϕ(m)} sind ri und n beide zu m teilerfremd. Es folgt, dass auch ri · n zu m teilerfremd ist. Also gilt {[r1 · n]m , [r2 · n]m , . . . , [rϕ(m) · n]m } = {[r1 ]m , [r2 ]m , . . . , [rϕ(m) ]m } und damit auch [r1 · n]m · [r2 · n]m · . . . · [rϕ(m) · n]m = [r1 ]m · [r2 ]m · . . . · [rϕ(m) ]m . Daher gilt für v = r1 · r2 · . . . · rϕ(m) die Kongruenz v ≡ (r1 · n) · (r2 · n) · . . . · (rϕ(m) · n) ≡ v · nϕ(m) (mod m). Da v ein Produkt von zu m teilerfremden Zahlen ist, ist auch v selbst zu m teilerfremd. Also ist [v]m nach Satz 6.8 invertierbar und es existiert [b]m ∈ Zm mit [b]m · [v]m = [1]m . Multiplikation der Gleichung [v]m = [v · nϕ(m) ]m mit [b]m liefert [1]m = [nϕ(m) ]m , also nϕ(m) ≡ 1 (mod m). Korollar 6.14 (Der kleine Satz von Fermat). Sei n ∈ N und p eine Primzahl, die n nicht teilt. Dann gilt np−1 ≡ 1 (mod p). 6.1. RSA-Verschlüsselungsverfahren. Die RSA-Verschlüsselung wurde 1977 von den Mathematikern Rivest, Shamir und Adleman entwickelt und ist immer noch wichtiger Bestandteil heute gängiger Verschlüsselungsmethoden. Dabei wird ein Nachrichtentext vom Sender zunächst auf irgendeine sinnvolle Weise als natürliche Zahl m kodiert, so dass sich die Nachricht vom Empfänger aus m leicht wieder dekodieren lässt. Uns interessiert nur, wie wir nun die Zahl m verschlüsseln und an den Empfänger versenden können, ohne dass Dritte die Nachricht entschlüsseln können. Es gibt beim RSA-Verfahren zwei Schlüssel, einen öffentlichen Schlüssel (public key) und einen privaten Schlüssel (private key). Die beiden Schlüssel werden vom Empfänger der Nachricht erzeugt. Nur der öffentliche Schlüssel wird an den Sender weitergeleitet. Der private Schlüssel ist nur dem Empfänger bekannt. Es ist dabei unwichtig, ob der öffentliche Schlüssel Dritten bekannt wird. Der öffentliche Schlüssel ist ein Zahlenpaar (e, N ) und der private Schlüssel ein Zahlenpaar (d, N ), wobei N in beiden Fällen dieselbe Zahl ist. Man nennt N den RSA-Modul, e den Verschlüsselungsexponenten und d den Entschlüsselungsexponenten. Die Schlüssel werde wie folgt erzeugt: (1) Wähle zufällig zwei verschiedene Primzahlen p und q. (2) Berechne den RSA-Modul N = p · q. (3) Berechne ϕ(N ) = (p − 1) · (q − 1). (4) Wähle eine zu ϕ(N ) teilerfremde Zahl e mit 1 < e < ϕ(N ). (5) Berechne das multiplikative Inverse [d]ϕ(N ) von [e]ϕ(N ) . 84 STEFAN GESCHKE Die Zahlen p, q und ϕ(N ) werden nun nicht mehr benötigt und können gelöscht werden. Die Zahl m, die verschlüsselt werden soll, muss kleiner als das RSA-Modul N sein. Verschlüsselt wird nun wie folgt: Der Sender benutzt den öffentlichen Schlüssel (e, N ) und berechnet [me ]N . Die Restklasse [me ]N wird dann in Form eines Repräsentanten zwischen 0 und N angegeben und an den Empfänger übermittelt. Ohne Kenntnis des privaten Schlüssels (d, N ) lässt sich m nicht in sinnvoller Zeit aus [me ]N rekonstruieren, obwohl man ja eigentlich nur in ZN die e-te Wurzel aus [me ]N ziehen muss. Aber das geht eben nicht innerhalb eines sinnvollen Zeitrahmens. Der Empfänger benutzt den privaten Schlüssel (d, N ) und berechnet [(me )d ]N . Das geht wiederum schnell, da Potenzieren auch in ZN einfach ist. Wegen e · d ≡ 1 (mod ϕ(N )) existiert ein q ∈ Z mit e · d = q · ϕ(N ) + 1. Nach Satz 6.13 gilt (me )d ≡ me·d ≡ mq·ϕ(N )+1 ≡ (mϕ(N ) )q · m ≡ 1q · m ≡ m (mod N ) und damit [(me )d ]N = [m]N . Damit ist die Nachricht entschlüsselt. In der Praxis werden noch diverse weitere Forderungen an p, q und e gestellt, damit das Verfahren effizient und sicher durchgeführt werden kann. Man beachte, dass man den privaten Schlüssel (d, N ) aus (e, N ) berechnen kann, indem man N in seine Primfaktoren p und q zerlegt. Das dauert aber zu lange, wenn p und q ausreichend groß sind. Im September 2009 wurde eine 232-stellige Zahl (768 Bits) mit einem Rechenaufwand von mehreren Jahren auf hunderten von Rechnern in ihre Primfaktoren zerlegt. Eine gängige Größe für RSA-Moduln sind 1024 Bit, also etwa 300 Dezimalstellen. Selbst diese Schlüsselgröße wird aber inzwischen nicht mehr für absolut sicher gehalten. Beispiel 6.15. Wir wählen die zwei Primzahlen p = 11 und q = 13. Das liefert den RSA-Modul N = 143. Es gilt ϕ(N ) = (p−1)·(q−1) = 10·12 = 120. Die Zahl e = 23 ist zu 120 teilerfremd. Wir wählen (23, 143) als den öffentlichen Schlüssel. Mit dem euklidischen Algorithmus bestimmen wir das multiplikative Inverse von [23]120 in Z120 . Es gilt ggT(23, 120) = 1 = 23 · 47 − 9 · 120. Damit ist 23 · 47 ≡ 1 (mod 120) und wir setzen d = 47. Der private Schlüssel ist also (47, 143). Angenommen, die Zahl 7 soll verschlüsselt werden. Es gilt 723 mod 143 = 27368747340080916343 mod 143 = 2. Die verschlüsselte Nachricht ist also 2. Zum Entschlüsseln müssen wir mit d = 47 potenzieren. Es gilt 247 mod 143 = 140737488355328 mod 143 = 7. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 85 7. Gruppentheorie 7.1. Algebraische Strukturen, Halbgruppen und Monoide. Definition 7.1. Eine algebraische Struktur ist eine Menge M zusammen mit endlich vielen endlichstelligen Operationen f1 , . . . , fk auf M . Formal schreibt man für die algebraische Struktur M = (M, f1 , . . . , fk ). Dabei heißt M die M unterliegende Menge. Oft wird jedoch nicht zwischen einer algebraischen Struktur und ihrer unterliegenden Menge unterschieden. So bezeichnet R sowohl die Menge der reellen Zahlen als auch die algebraische Struktur (R, +, ·). Beispiel 7.2. Wir haben schon einiger Beispiele algebraischer Strukturen kennengelernt. a) Ein Körper ist eine Menge K zusammen mit zwei zweistelligen Operationen + und ·, so dass die Axiome (K1)–(K5) erfüllt sind. Damit sind Körper algebraische Strukturen. Das gilt insbesondere für (Q, +, ·) und (R, +, ·). b) (Z, +, ·) und (N, +, ·) sind ebenfalls algebraische Strukturen. c) Konstanten in einer Menge M kann man als 0-stellige Operationen auf M interpretieren. Damit können algebraische Strukturen auch Konstanten enthalten. So sind Boolesche Algebren algebraische Strukturen mit zwei zweistelligen Operationen t und u sowie einer einstelligen Operation ¬ und zwei Konstanten 0 und 1. c) Für eine Menge A sei F (A) die Menge der Funktionen von A nach A. Dann ist (F (A), ◦) eine algebraische Struktur. Ist S(A) die Menge der Bijektionen von A nach A, so ist (S(A), ◦) eine algebraische Struktur. Man beachte, dass die Komposition ◦ von Abbildungen tatsächlich eine zweistellige Operation auf S(A) ist, da die Komposition zweier Bijektionen wieder eine Bijektion ist. Definition 7.3. Ist (M, ∗) eine algebraische Struktur mit einem zweistellingen Operator ∗. Ein Element e ∈ M wird neutrales Element (bezüglich ∗) genannt, falls für alle a ∈ M gilt: e∗a=a∗e=a Beispiel 7.4. a) Die 0 ist ein neutrales Element bezüglich + in R, Q und Z. In denselben Strukturen ist 1 ein neutrales Element bezüglich ·. b) In einer Booleschen Algebra ist 1 neutral bezüglich u und 0 ist neutral bezüglich t. c) In F (A) und S(A) ist die identische Abbildung idA : A → A; x 7→ x ein neutrales Element bezüglich ◦. d) Es gibt nicht in jeder algebraischen Struktur mit einer zweistelligen Operation ein neutrales Element. Ein Beispiel ist (N, +). 86 STEFAN GESCHKE Lemma 7.5. Ist ∗ eine zweistellige Operation auf M , so gibt es höchstens ein neutrales Element bezüglich ∗. Beweis. Seien c und d neutrale Elemente bezüglich ∗. Dann gilt c = c ∗ d = d. Definition 7.6. Sei ∗ eine zweistellige Operation auf M mit einem neutralen Element e. Für a ∈ M heißt b ∈ M invers zu a (bezüglich ∗), falls a ∗ b = b ∗ a = e gilt. Falls für a ∈ M ein b ∈ M existiert, das zu a invers ist, so heißt a invertierbar. Beispiel 7.7. a) Für jedes a in Z, Q oder R ist −a das zu a inverse Element bezüglich +. b) Für jedes a in Z, Q oder R mit a 6= 0 ist a−1 das zu a inverse Element bezüglich ·. c) Es gibt nicht in jeder algebraischen Struktur mit einer zweistelligen Operation ein neutrales Element. Sei nämlich A = {a ∈ N : a ≥ 2}. Dann ist (A, +) eine algebraische Struktur ohne ein neutrales Element bzgl. +. d) Wenn ein neutrales Element existiert, muss nicht jedes Element Inverse besitzen. So besitzt 0 in R kein Inverses bezüglich ·. Das Element [2]4 hat in Z4 kein Inverses bezüglich ·, wie wir bereits gesehen haben. Andererseits ist [3]4 in Z4 invertierbar bezüglich · und zu sich selbst invers. Bezüglich + sind alle Elemente [a]m von Zm invertierbar, wobei [−a]m zu [a]m invers ist. Definition 7.8. Es sei (M, ∗) eine algebraische Struktur mit einer zweistelligen Verknüpfung ∗. Gilt für alle a, b, c ∈ M das Assoziativgesetz a ∗ (b ∗ c) = (a ∗ b) ∗ c, so ist (M, ∗) eine Halbgruppe. Hat (M, ∗) außerdem ein neutrales Element, so nennt man (M, ∗) ein Monoid. Beispiel 7.9. a) Die Strukturen (N, ·), (R, +), (R, ·) und (F (A), ◦) sind Monoide. (N, +) ist jedoch kein Monoid, da es in N bezüglich + kein neutrales Element gibt. b) Für eine Menge A, die wir in diesem Zusammenhang Alphabet nennen. sei ∗ A die Menge aller endlichen Folgen von Zeichen aus A. Die Elemente von A∗ nennen wir Wörter über A. Für zwei Wörter v = a1 . . . an und w = b1 . . . bm definieren wir die Verkettung v _ w von v und w als das Wort a1 . . . an b1 . . . bm . Dann ist (A∗ , _ ) ein Monoid. Dabei ist das leere Wort das neutrale Element. c) Ist (K, +, ·) ein Körper, so ist sowohl (K \ {0}, ·) als auch (K, ·) ein Monoid. d) Für m ≥ 2 ist (Zm , ·) ein Monoid. Nach c) ist (Zm \ {[0]m }, ·) ein Monoid, falls m eine Primzahl ist. Ist m keine Primzahl, so ist (Zm \ {[0]m }, ·) nichtmal eine algebraische Struktur. Seien nämlich k, ` ∈ N mit m = k · ` und k, ` 6= 1. Dann gilt [k]m · [`]m = [k · `]m = [m]m = [0]m . Damit sind [k]m und [`]m in Zm \ {[0]m }, während [k]m · [`]m kein Element von Zm \ {[0]m } ist. In diesem Falle ist · also gar keine Operation auf Zm \ {[0]m }. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 87 Satz 7.10. Ist (M, ∗) ein Monoid, so besitzt jedes Element a von M höchstens ein Inverses. Beweis. Der Beweis ist eine allgemeine Fassung des Beweises von Satz 6.7. Seien b, c ∈ M Inverse von a ∈ M . Dann gilt b = b∗e = b∗(a∗c) = (b∗a)∗c = e∗c = c. 7.2. Gruppen. Definition 7.11. Eine Gruppe ist ein Monoid, in dem jedes Element invertierbar ist. Der Übersichtlichkeit halber geben wir die Axiome für Gruppen noch einmal gesammelt an. Sei (G, ∗) eine algebraische Struktur mit einer zweistelligen Verknüpfung ∗. Dann heißt (G, ∗) eine Gruppe, falls gilt: (G1) Für alle a, b, c ∈ G gilt: a ∗ (b ∗ c) = (a ∗ b) ∗ c (Assoziativgesetz) (G2) Es gibt ein Element e ∈ G, so dass für alle a ∈ G gilt: a ∗ e = e ∗ a = a (Existenz eines neutralen Elements) (G3) Für alle a ∈ G existiert ein b ∈ G, so dass für das eindeutig bestimmte neutrale Element e ∈ G gilt: a ∗ b = b ∗ a = e (Existenz inverser Elemente) Nachdem wir die entsprechenden Tatsachen für Monoide bewiesen haben, wissen wir, dass das neutrale Element einer Gruppe eindeutig bestimmt ist. Ebenso ist für jedes Element einer Gruppe das Inverse eindeutig bestimmt. Beispiel 7.12. a) Wir haben schon zahlreiche Beispiele für Gruppen gesehen. So sind (Z, +), (Q, +) und (R, +) Gruppen. Ebenso ist für jedes m ≥ 2 die Struktur (Zm , +) eine Gruppe. b) Auch (Q \ {0}, ·) und (R \ {0}, ·) sind Gruppen. Ist m eine Primzahl, so ist (Zm \ {[0]m }, ·) eine Gruppe. c) Sei A eine Menge und sei S(A) wieder die Menge der Bijektionen von A nach A. Dann ist (S(A), ◦) eine Gruppe. Für jede Funktion f ∈ S(A) ist die Umkehrfunktion f −1 das zu f inverse Element. Die Gruppe (S(A), ◦) heißt die symmetrische Gruppe auf A. Besonders wichtig sind die Gruppen Sn = (S({1, . . . , n}), ◦) für n ∈ N. Im Gegensatz zu den Gruppen, die wir bisher diskutiert haben, erfüllt (S(A), ◦) nicht das Kommutativgesetz, falls A mindestens drei Elemente hat. Seien nämlich a, b, c ∈ A verschieden und seien f, g : A → A Permutationen, die alle x ∈ A \ {a, b, c} wieder auf x abbilden. Weiter sei f (a) = b, f (b) = a, f (c) = c, g(a) = b, g(b) = c und g(c) = a. Dann gilt (f ◦ g)(a) = f (g(a)) = f (b) = a und (g ◦ f )(a) = g(f (a)) = g(b) = c. Also ist f ◦ g 6= g ◦ f . d) Sei m ≥ 2 und E(Zm ) = {[a]m : a und m sind teilerfremd}. E(Zm ) ist also genau die Menge der invertierbaren Elemente von Zm . Dann ist (E(Zm ), ·) eine Gruppe, die Einheitengruppe von Zm . Die Elemente von E(Zm ) nennt man Einheiten von Zm . Anstelle von E(Zm ) schreibt man auch Z∗m . Dass die Einheiten eine Gruppe bilden sieht man wie folgt: Zunächst müssen wir zeigen, dass · überhaupt eine Operation auf E(Zm ) ist, d.h., dass das Produkt zweier Einheiten wieder eine Einheit ist. 88 STEFAN GESCHKE Seien a, b ∈ Z teilerfremd zu m. Dann gibt es c, d ∈ Z, so dass [c]m und [d]m zu [a]m und [b]m invers sind. Damit ist aber [c]m · [d]m zu [a]m · [b]m invers. Also ist [a]m · [b]m ∈ E(Zm ). Dass · das Assoziativgesetz erfüllt wissen wir schon. [1]m ist das neutrale Element von E(Zm ). Auch wissen wir, das alle Elemente von E(Zm ) in Zm invertierbar sind. Wir müssen noch zeigen, dass das Inverse einer Einheit auch wieder eine Einheit ist. Das ist aber klar: Ist [b]m zu [a]m invers, so ist [a]m zu [b]m zu invers. Also ist für jedes Element von E(Zm ) auch sein Inverses eine Einheit. e) Wir betrachten nun noch ein geometrisches Beispiel, die Gruppe G4 der Symmetrien eines gleichseitigen Dreiecks, also der Transformationen der Ebene, die das Dreieck auf das Dreieck abbilden. Die zweistellige Operation auf der Menge dieser Symmetrien ist die Komposition von Abbildungen. Diese Gruppe nennen wir kurz die Dreiecksgruppe. C A B Diese Transformationen sind zunächst die Identität, die jeden Punkt der Ebene wieder auf sich selbst abbildet. Die Identität bezeichnen wir mit i. Weiter sei r die Drehung um 120◦ entgegen dem Uhrzeigersinn, also im mathematisch positiven Drehsinn. Es sei s die Drehung um 240◦ entgegen dem Uhrzeigersinn. Schließlich seien x, y und z die Spiegelungen entlang der in der Zeichnung angegebenen Achsen. y x z Diese Symmetrien sind jeweils eindeutig dadurch bestimmt, auf welche Ecken die Ecken des Dreiecks abgebildet werden. Damit entspricht jede Symmetrie einer Permutation der Menge {A, B, C}. Wir listen die Entsprechungen auf. i r A B C A B C ! s A B C B C A ! A B C C A B ! MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK x y A B C B A C ! 89 z A B C A C B ! A B C C B A ! Wir wissen, dass die Komposition von Abbildungen das Assoziativgesetz erfüllt. Auch wissen wir, dass die Identität ein neutrales Element bezüglich der Komposition ist. Um zu zeigen, dass die Menge G = {i, r, s, x, y, z} mit der Komposition von Abbildungen tatsächlich eine Gruppe ist, müssen wir noch zeigen, dass die Komposition je zwei der Abbildungen in G wieder in G ist und dass jede Abbildung in G eine Umkehrfunktion in G hat. Dazu berechnen wir alle Kompositionen von Elementen von G und stellen das Ergebnis in einer Multiplikationstabelle dar. Multiplikationstabellen werden in diesem Zusammenhang auch Gruppentafeln genannt. In der Zeile rechts neben dem Element a und der Spalte unter dem Element b steht das Produkt a ◦ b. ◦ i r s x y z i i r s x y z r r s i z x y s s i r y z x x x y z i r s y z y z z x x y s r i s r i Dieser Gruppentafel entnehmen wir, dass für je zwei Elemente a, b ∈ G die Komposition a ◦ b wieder in G liegt und dass jedes Element von G invertierbar ist. So sind i, x, y und z zu sich selbst invers, während r zu s invers ist. Wir stellen fest, dass in der Gruppentafel in Beispiel 7.12 e) in jeder Zeile und Spalte jedes Element genau einmal auftaucht. Das folgende Lemma zeigt, dass das kein Zufall ist. Im folgenden schreiben wir für a ∗ b kurz ab. Außerdem schreiben wir e für das neutrale Element einer Gruppe und a−1 für das Inverse eines Elements a. Lemma 7.13. Sei G eine Gruppe. a) Seien a, b, c ∈ G. Gilt ab = ac, so ist b = c. Genauso folgt aus ba = ca, dass b = c gilt. b) Die Gleichungen ax = b und xa = b, wobei x eine Unbekannte ist, sind eindeutig lösbar. Beweis. a) Es gelte ab = ac. Wir multiplizieren diese Gleichung von links mit a−1 und erhalten a−1 ab = a−1 ac, also eb = ec und damit b = c, wie behauptet. Man beachte, dass wir aufpassen müssen, von welcher Seite wir mit a−1 multiplizieren, da in G nicht unbedingt das Kommutativgesetz gilt. Es könnte also sein, dass b = a−1 ab und aba−1 verschieden sind. Falls ba = ca gilt, so multiplizieren wir diese Gleichung von rechts mit a−1 und erhalten b = c. 90 STEFAN GESCHKE b) Ist die Gleichung ax = b gegeben, so multiplizieren wir wieder von links mit −1 a . Das liefert x = a−1 b. Die Gleichung wird also von dem Gruppenelement a−1 b gelöst. Mit Hilfe einer Multiplikation von rechts sehen wir, dass xa = b die Lösung x = ba−1 hat. Teil a) dieses Lemmas zeigt, dass in einer Gruppentafel in jeder Zeile und Spalte jedes Element höchstens einmal auftritt. Teil b) zeigt, dass in jeder Zeile und in jeder Spalte einer Gruppentafel jedes Element mindestens einmal auftritt. Beispiel 7.14. Wir betrachten wieder die Dreiecksgruppe G4 . Wir benutzen X als Unbekannte, um die Unbekannte von dem Gruppenelement x zu unterscheiden. Angenommen, wir wollen die Gleichung Xs = y lösen. Multiplikation von rechts mit s−1 liefert X = ys−1 . In der Gruppentafel von G4 lesen wir ab, dass s−1 = r gilt und dass yr = z ist. Damit löst X = z die Gleichung Xs = y. 7.3. Die Ordnung eines Gruppenelements. Gegeben sei eine Gruppe (G, ∗). Dann definiert man die Potenzen an eines Gruppenelements a wie folgt: Es sei a0 := e. Für n ∈ N0 sei an+1 := an ∗ a. Potenzen mit negativen Exponenten definiert man durch a−n := (a−1 )n Wie für Potenzen reeller Zahlen rechnet man schnell für alle a ∈ G und alle m, n ∈ Z die folgenden Rechenregeln nach: am an = am+n und (am )n = amn . Definition 7.15. Sei G eine Gruppe und a ∈ G. Falls ein m > 1 existiert, so dass am = 1 gilt, so definiert man die Ordnung von a als das kleinste m ∈ Z mit m > 0 und am = 1. Falls kein solches m exisitiert, so sagen wir, dass a die Ordnung ∞ hat. Die Ordnung einer Gruppe G ist einfach ihre Mächtigkeit. Den Zusammenhang zwischen der Ordnung einer Gruppe und der Ordnung eines Gruppenelements werden wir später noch näher betrachten. Satz 7.16. In einer endlichen Gruppe hat jedes Element eine endliche Ordnung. Beweis. In einer endlichen Gruppe G gibt es nur endlich viele Möglichkeiten für die Potenzen eines Elements. Ist also a ∈ G und G endlich, so gibt es m, n ∈ N mit m < n und am = an . Nun gilt an−m am = an = am = eam . Da man in Gruppen kürzen kann, folgt an−m = e. Damit existiert eine natürliche Zahl k mit ak = e. Also hat a eine endliche Ordnung. Beispiel 7.17. a) Zunächst beachte man, dass mit unserer Schreibweise das neutrale Element e von (Z, +) einfach 0 ist. Auch steht unsere allgemeine Schreibweise an im Fall von (Z, +) für die Zahl n · a. Die ganze Zahl 1 hat in (Z, +) unendliche Ordnung. b) In G4 haben r und s die Ordnung 3, x, y und z die Ordnung 2 und i die Ordnung 1. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 91 c) In (Z15 , +) hat [3]15 die Ordnung 5. Das Element [4]15 hat die Ordnung 15. d) Wir betrachten die Gruppe (E(Z10 ), ·). Die Zahl 7 ist zu 10 teilerfremd, und damit gilt [7]10 ∈ E(Z10 ). Wir berechnen die Potenzen von [7]10 in Z10 . Es gilt 72 ≡ 49 ≡ 9 (mod 10), 73 ≡ 9 · 7 ≡ 63 ≡ 3 (mod 10) und 74 ≡ 49 · 49 ≡ 9 · 9 ≡ 81 ≡ 1 (mod 10). Also ist 4 die kleinste natürliche Zahl m mit [7]m 10 = [1]10 . Damit ist 4 die Ordnung von [7]10 in E(Z10 ). e) Die Permutation 1 2 2 3 3 4 4 1 5 5 ! hat in Sn die Ordnung 4. Satz 7.18. Sei G eine Gruppe und sei a ∈ G ein Element von endlicher Ordnung m. Dann gilt für alle n ∈ Z genau dann an = e, wenn m ein Teiler von n ist. Beweis. Sei zunächst m ein Teiler von n. Dann existiert q ∈ Z mit n = qm. Nun ist an = aqm = (am )q = eq = e. Sei umgekehrt an = e. Wähle q, r ∈ Z mit 0 ≤ r < m und n = qm + r. Dann gilt e = an = aqm+r = (am )q ar = eq ar = ear = ar . Da nun m die kleinste natürliche Zahl mit am = e ist und da r < m ist, muss r = 0 gelten. Damit ist n = qm und m|n. 7.4. Isomorphie von Gruppen. Definition 7.19. Seien (G, ∗G ) und (H, ∗H ) zwei Gruppen. Eine Bijektion f :G→H heißt ein Isomorphismus von Gruppen (oder Gruppenisomorphismus), falls für alle a, b ∈ G gilt: f (a ∗G b) = f (a) ∗H f (b) Falls ein Isomorphismus zwischen zwei Gruppen G und H existiert, so nennt man ∼ H. die Gruppen isomorph und schreibt G = Wir haben die Operationen ∗G und ∗H nur der Deutlichkeit halber unterschieden. In unserer normalen Schreibweise lautet die Gleichung f (a ∗G b) = f (a) ∗H f (b) einfach f (ab) = f (a)f (b). Lemma 7.20. a) Ist f : G → H ein Isomorphismus von Gruppen, so auch f −1 : H → G. b) Sind f : F → G und g : G → H Gruppenisomorphismen, so ist auch g◦f :F →H ein Isomorphismus. 92 STEFAN GESCHKE c) Ist f : G → H ein Gruppenisomorphismus und sind eG und eH die neutralen Elemente von G bzw. H, so gilt f (eG ) = eH . Für jedes a ∈ G gilt f (a−1 ) = (f (a))−1 . Beweis. a) Es ist klar, dass f −1 eine Bijektion ist. Seien x, y ∈ H. Dann existieren a, b ∈ G mit f (a) = x und f (b) = y. Es gilt f −1 (x) = a und f −1 (y) = b. Da f ein Isomorphismus ist, gilt f (ab) = f (a)f (b) = xy. Also ist f −1 (xy) = ab = f −1 (x)f −1 (y). Damit ist f −1 ein Isomorphismus. b) Wir wissen schon, dass die Komposition von Bijektionen wieder eine Bijektion ist. Seien a, b ∈ F . Dann gilt (g ◦ f )(ab) = g(f (ab)) = g(f (a)f (b)) = g(f (a))g(f (a)) = (g ◦ f )(a)(g ◦ f )(b) damit ist g ◦ f ein Isomorphismus. c) Wir erinnern uns zunächst daran, dass neutrale und inverse Elemente in Gruppen eindeutig bestimmt sind. Sei x ∈ H. Dann existiert ein a ∈ A mit f (a) = x. Es gilt f (a) = f (eG a) = f (eG )f (a) = f (eG )x. Genauso sieht man, dass xf (eG ) = x gilt. Das zeigt f (eG ) = eH . Für die Inversen sei wieder x ∈ H und a ∈ G mit f (a) = x. Dann gilt xf (a−1 ) = f (a)f (a−1 ) = f (aa−1 ) = f (eG ) = eH . Genauso sieht man f (a−1 )x = eH . Das zeigt f (a−1 ) = x−1 = (f (a))−1 . Dieses Lemma zeigt unter anderem, dass die Relation ∼ = zwischen Gruppen symmetrisch und transitiv ist. Da für jede Gruppe G die identische Abbildung idG : G → G; a 7→ a ein Isomorphismus ist, ist ∼ = auch reflexiv. Beispiel 7.21. Die Gruppen G4 und S3 sind isomorph. In Beispiel 7.12 e) hatten wir bereits jeder Transformation in G4 eine Permutation der Menge {A, B, C} zugeordnet. Man rechnet leicht nach, dass es sich bei dieser Zuordnung um einen Isomorphismus handelt. Es ist klar, dass die Gruppen S3 und S({A, B, C}) isomorph sind. 7.5. Zyklische Gruppen. Definition 7.22. Eine Gruppe G heißt zyklisch, wenn es ein Element a ∈ G mit G = {an : n ∈ Z} gibt, wenn G also aus den Potenzen eines einzigen Elements besteht. Gilt G = {an : n ∈ Z}, MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 93 so sagt man, dass G von a erzeugt wird. Beispiel 7.23. a) Die Gruppe (Z, +) ist zyklisch. Alle ganzen Zahlen sind Vielfache von 1. Das Element a = 1 erzeugt also die Gruppe Z. Man erinnere sich daran, dass aus dem Vielfachen n · 1 in der multiplikativen Schreibweise, die wir für allgemeine Gruppen benutzen, die Potenz an wird. Das Element −1 erzeugt ebenfalls die Gruppe Z. b) Für alle m ∈ N ist die Gruppe (Zm , +) zyklisch. Diese Gruppe wird von [1]m erzeugt. c) Die Gruppe G4 ist nicht zyklisch. Wir weisen diese Behauptung nach, indem wir zeigen, das kein Element von G4 die ganze Gruppe erzeugt. Für a = x, y, z gilt a2 = i, a3 = a, a4 = i und so weiter. Mittels vollständiger Induktion weist man leicht nach, dass für alle geraden n ∈ Z an = i gilt, während für alle ungeraden n an = a ist. Also sind nur zwei verschiedene Element von G Potenzen von a. Für a = i ist jede Potenz von a das Element i. Also erzeugt auch i nicht die ganze Gruppe. Für a = r, s gilt a0 = i, a1 = a, a2 = a−1 und a3 = i. Mittels vollständiger Induktion rechnet man schnell nach, dass an = an mod 3 gilt. Damit sind nur drei verschiedene Gruppenelemente Potenzen von a. Wir haben also gesehen, dass es kein a ∈ G4 gibt, das sechs verschiedene Potenzen hat. Also ist G4 nicht zyklisch. Satz 7.24. Eine zyklische Gruppe G ist entweder zu (Z, +) isomorph oder es gibt ein m ∈ N mit G ∼ = (Zm , +). Beweis. Da G zyklisch ist, existiert ein a ∈ G mit G = {an : n ∈ Z}. Sei f : Z → G definiert durch f (n) = an . Ist a von unendlicher Ordnung, so ist f injektiv: Sonst gäbe es nämlich m, n ∈ Z mit m 6= n. Wir können annehmen, dass m < n gilt. Es ist an−m = an a−m = an (am )−1 = an a−n = e. Also hat a doch eine endliche Ordnung. Ein Widerspruch. Das G von a erzeugt wird, ist f auch surjektiv. Nun zeigen wir, dass f ein Isomorphismus ist. Das ist aber einfach. Für alle m, n ∈ Z gilt nämlich f (m + n) = am+n = am an = f (m)f (n). Damit sind G und Z isomorph. Sei nun a von der endlichen Ordnung m. Seien n, n0 ∈ Z, so dass f (n) = f (n0 ) 0 0 gilt. Dann ist an = an . Damit gilt an−n = e. Nach Satz 7.18 folgt daraus, dass n − n0 ein Vielfaches von m ist. Es gilt also n ≡ n0 (mod m). 0 0 Ist umgekehrt n ≡ n0 (mod m), so ist an−n = e, also an = an und damit f (n) = f (n0 ). Das zeigt, dass die Abbildung g : Zm → G; [n]m 7→ an wohldefiniert und injektiv ist. Da a die Gruppe G erzeugt, ist g auch surjektiv. 94 STEFAN GESCHKE Für alle n, n0 ∈ Z gilt außerdem 0 0 g([n]m + [n0 ]m ) = g([n + n0 ]m ) = an+n = an an = g([n]m )g([n0 ]m ). Damit ist g ein Isomorphismus. Wir haben schon festgestellt, dass die Gruppen (Z, +), (Q, +), (R, +), (Q\{0}, ·) und (R\{0}, ·) das Kommutativgesetz erfüllen, während zum Beispiel G4 nicht das Kommutativgesetz erfüllt. Definition 7.25. Eine Gruppe G heißt kommutativ oder abelsch, wenn für je zwei Elemente a, b ∈ G gilt: ab = ba Korollar 7.26. Alle zyklischen Gruppen sind abelsch. Beweis. Ist G zyklisch, so ist G isomorph zu (Z, +) oder zu einer der Gruppen (Zm , +) für ein m ∈ N. In jedem Falle ist G zu einer abelschen Gruppen isomorph. Damit ist G auch selbst abelsch. Die Umkehrung dieses Korollars stimmt nicht. So ist (Q, +) abelsch, aber nicht zyklisch. Ist nämlich a ∈ Q und a 6= 0, so ist a 2 ∈ Q, aber a 2 ist kein Vielfaches von a. 7.6. Untergruppen und Nebenklassen. Definition 7.27. Sei (G, ∗) eine Gruppe. Dann heißt U ⊆ G eine Untergruppe, von G, falls U zusammen mit der Einschränkung der Operation ∗ auf U × U wieder eine Gruppe ist. Beispiel 7.28. a) Für m ∈ N sei mZ = {m · a : a ∈ Z} die Menge aller Vielfachen von m. Dann ist mZ eine Untergruppe von (Z, +). Um das nachzuweisen, müssen wir zunächst zeigen, dass + überhaupt eine zweistellige Operation auf mZ ist. Seien also a, b ∈ mZ. Dann existieren c, d ∈ Z mit a = mc und b = md. Wegen a + b = mc + md = m(c + d) ist a + b wieder ein Element von mZ. Damit ist die Einschränkung von + auf mZ × mZ tatsächlich eine Operation auf mZ. Wegen 0 ∈ mZ hat mZ ein neutrales Element. Für jedes ma ∈ mZ ist −ma = m(−a) ∈ mZ. Damit existiert in mZ zu jedem Element ein Inverses. Also ist mZ eine Untergruppe von Z. b) Für jede Gruppe G sind {e} und G selbst Untergruppen von G. c) Wir betrachten Untergruppen von G4 . Die kleinste Untergruppe ist {i}, die grösste ist G4 selbst. Weiter sind {i, x}, {i, y} und {i, z} Untergruppen, da die Transformationen x, y und z jeweils zu sich selbst invers sind. Schließlich {i, r, s} eine Untergruppe von G4 . Das sind alle Untergruppen von G4 , wie wir demnächst sehen werden. Satz 7.29. Sei G eine Gruppe und U ⊆ G. a) U ist genau dann eine Untergruppe von G, wenn für alle a, b ∈ U gilt: e, a−1 , ab ∈ U MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 95 b) U ist genau dann eine Untergruppe von G, wenn U nicht leer ist und für alle a, b ∈ U gilt: ab−1 ∈ U c) Ist U endlich, so ist U bereits dann eine Untergruppe von G, wenn U nicht leer ist und für alle a, b ∈ U gilt: ab ∈ U Beweis. a) Sei U eine Untergruppe von G. Da die Operation von G auf U eingeschränkt immer noch eine zweistellige Operation auf U ist, gilt für alle a, b ∈ U auch ab ∈ U . Sei eU das neutrale Element der Gruppe U . Dann gilt in U die Gleichung eU eU = eU . Damit gilt in G die Gleichung eU eU = eU e, wobei e das neutrale Element von G ist. Nach Lemma 7.13 a) folgt aus der Gleichung eU eU = eU e, dass eU = e gilt. Also ist e ∈ U und die neutralen Elemente von U und G stimmen überein. Für a ∈ U existiert b ∈ U mit ab = e. Bezeichne a−1 das Inverse von a in G. Dann ist ab = aa−1 . Aus Lemma 7.13 a) folgt a−1 = b. Insbesondere gilt a−1 ∈ U . Gelte umgekehrt für alle a, b ∈ U e, a−1 , ab ∈ U. Dann ist die Operation von G eingeschränkt auf U eine zweistellige Operation auf U . Außerdem enthält U das neutrale Element von G, welches auch ein neutrales Element von U ist. Für jedes a ∈ U ethält U auch das Inverse a−1 . Da aa−1 = e in G gilt, gilt die Gleichung auch in U . Also ist a−1 auch in U zu a invers. Das zeigt, dass U eine Untergruppe von G ist. b) Ist U eine Untergruppe von G und sind a und b in U , so gilt nach a) b−1 ∈ U . Ebenfalls nach a) gilt: ab−1 ∈ U Gelte nun für alle a, b ∈ U auch ab−1 ∈ U und sei U 6= ∅. Sei a ∈ U . Dann gilt e = aa−1 ∈ U . Also gilt für alle a ∈ U auch a−1 = ea−1 ∈ U . Seien nun a, b ∈ U . Dann ist b−1 ∈ U . Es folgt ab = a(b−1 )−1 ∈ U . Damit ist U eine Untergruppe von G. c) Sei a ∈ U . Nach Lemma 7.13 sind die Elemente ab, b ∈ U , paarweise verschieden. Da sie auch Elemente von U sind, muss es ein b ∈ U mit ab = a geben. Wieder nach Lemma 7.13 gilt b = e. Damit ist e ∈ U . Also gibt es ein b ∈ U mit ab = e. Es gilt b = a−1 . Nach a) ist U eine Untergruppe von G. Definition 7.30. Sei G eine Gruppe und U ⊆ G eine Untergruppe. Für a ∈ G schreiben wir aU für die Menge {ag : g ∈ U } sowie U a für die Menge {ga : g ∈ U }. Wir nennen die Mengen der Form aU Linksnebenklassen von U und die Mengen der Form U a Rechtsnebenklassen. Beispiel 7.31. a) Sei G = (Z, +), und U = 6Z. Dann ist die Rechtsnebenklasse von 4 von U die Menge 6Z + 4 = {. . . , −2, 4, 10, . . . } = [4]6 . Hierbei beachte man, dass die Operation die Gruppe G die Addition ist, auch wenn wir die Operation auf einer Gruppe im Allgemeinen multiplikativ schreiben. Die Linksnebenklasse 96 STEFAN GESCHKE von 4 von U ist die Menge 4 + 6Z, die aber mit 6Z + 4 übereinstimmt, da + das Kommutativgesetz erfüllt. b) Wir betrachten die Gruppe G4 und die Untergruppe U = {i, y}. Dann gilt iU = {i, y}, xU = {x, r}, yU = {y, i}, zU = {z, s}, rU = {r, x} und sU = {s, z}, wie man leicht an der Gruppentafel von G4 abliest. Die verschiedenen Linksnebenklassen von U in G4 sind also die Mengen iU = yU = U = {i, y}, xU = rU = {r, x} und zU = sU = {z, s}. Die entsprechende Rechnung liefert die Rechtsnebenklassen U i = U y = U = {i, y}, U x = U s = {x, s} und U z = U r = {z, r}. Satz 7.32. Sei G eine Gruppe und U ⊆ G eine Untergruppe. a) Für jedes a ∈ G ist a ∈ aU und a ∈ U a. b) Für alle c ∈ U ist cU = U = U c. c) Für a, b ∈ G mit b ∈ aU gilt aU = bU . Für a, b ∈ G mit b ∈ U a gilt U a = U b. d) Für a, b ∈ G sind die Linksnebenklassen aU und bU entweder disjunkt oder gleich. Auch die Rechtsnebenklassen U a und U b sind entweder disjunkt oder gleich. e) Für alle a ∈ G sind aU , U und U a gleichmächtig. Beweis. a) Wegen e ∈ U gilt a = ae ∈ aU und a = ea ∈ U a. b) Es ist klar, dass cU, U c ⊆ U gilt. Sei nun d ∈ U . Dann ist c−1 d ∈ U . Also ist d = cc−1 d ∈ U . Das zeigt U ⊆ cU . Auf ähnliche Weise sieht man U ⊆ U c. c) Ist b ∈ aU , so existiert c ∈ U mit b = ac. Es gilt bU = acU = aU . Auf ähnliche Weise sieht man U = U b, falls b ∈ U a gilt. d) Falls aU ∩bU nicht leer ist, so existiert c ∈ aU ∩bU . Nach c) gilt aU = cU = bU . Auf ähnliche Weise sieht man, dass U a und U b entweder gleich oder disjunkt sind. e) Wir zeigen nur, dass U und aU gleichmächtig sind, indem wir eine Bijektion zwischen beiden Mengen angeben. Die Gleichmächtigkeit von U und U a kann auch ähnliche Weise nachgerechnet werden. Sei f : U → aU ; b 7→ ab. Aus der Definition von aU folgt sofort, dass f surjektiv ist. Seien nun b, c ∈ U mit ab = f (b) = f (c) = ac. Nach Lemma 7.13 a) folgt daraus b = c. Damit ist f injektiv. Also sind U und aU in der Tat gleichmächtig. Beispiel 7.33. Sei G eine Gruppe und a ∈ G. Dann ist hai := {an : n ∈ Z} eine Untergruppe von G, die von a erzeugte Untergruppe von G. Die Ordnung von U ist genau die Ordnung von a. Korollar 7.34 (Satz von Lagrange). Ist G eine endliche Gruppe und U eine Untergruppe von G, so ist die Ordnung von U ein Teiler der Ordnung von G. Insbesondere ist die Ordnung von jedem Element von G ein Teiler von |G|. Beweis. Nach Satz 7.32 bilden die Rechtsnebenklassen von U eine Partition von G in Klassen der Mächtigkeit |U |. Ist m die Anzahl der verschiedenen Rechtsnebenklassen, so gilt |G| = m · |U |. Die Ordnung eines Elements a von G ist die Ordnung der von a erzeugten Untergruppe und damit ein Teiler der Ordnung von G. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 97 Definition 7.35. Sei G eine Gruppe und G eine Untergruppe von G. Die Zahl der Rechtsnebenklassen von U in G (die identisch ist mit der Zahl der Linksnebenklassen) nennt man den Index von U in G. Man schreibt [G : U ] für den Index von U in G. Der Beweis des Satzes von Lagrange zeigt also für jede endliche Gruppe G und jede Untergruppe U die Gleichung |G| = [G : U ] · |U |, was auch die Notation [G : U ] erklärt. Beispiel 7.36. Wir betrachten wieder die Dreiecksgruppe G4 . Die Gruppe hat 6 Elemente. Also sind die möglichen Ordnungen von Untergruppen von G die Zahlen 1, 2, 3 und 6. Die einzige Untergruppe der Ordnung 1 ist {i}. Diese Untergruppe hat den Index 6. Ist U ⊆ G4 eine Untergruppe der Ordnung 2, so enthält U das Element i und ein weiteres Element, dass die Ordnung 2 haben muss. Damit sind die Untergruppen der Ordnung 2 genau {i, x}, {i, y} und {i, z}. Diese Untergruppen haben den Index 3. Sei nun U eine Untergruppe von G der Ordnung 3. Nach Korollar 7.34 hat jedes Element von U eine Ordnung, die die Zahl 3 teilt. Also hat U nur Elemente der Ordnung 1 und 3. Damit ist U = {i, r, s}. Diese Untergruppe hat den Index 2. Die einzige Untergruppe von G4 mit 6 Elementen ist G4 selbst. Diese Untergruppe hat den Index 1. Wir bestimmen die Nebenklassen der Untergruppen von G4 . Für jede Untergruppe U ist U = iU = U i sowohl eine Rechts- als auch Linksnebenklasse. U = G4 hat nur die Nebenklasse U , und hierbei ist es egal, ob wir Rechts- oder Linksnebenklassen betrachten. U = {i, r, s} hat die Rechts und Linksnebenklasse U . Da die Nebenklassen alle dieselbe Mächtigkeit haben wie U und eine Partition von G4 bilden, gibt es genau eine weitere Nebenklasse, nämlich {x, y, z}. Diese Menge ist wieder sowohl Rechtsals auch Linksnebenklasse. Nun betrachten wir eine Untergruppe der Ordnung 2, zum Beispiel U = {i, x}. Es gibt insgesamt 3 Rechts- und 3 Linksnebenklassen. Eine Nebenklasse, die sowohl Rechts- als auch Linksnebenklasse ist, ist U selbst. Es gilt yU = {y, s}, wie wir der Gruppentafel von G4 entnehmen. {y, s} ist also eine Linksnebenklasse von U . Da die Linksnebenklassen von U eine Partition von G4 bilden und alle dieselbe Mächtigkeit haben, hat U noch eine dritte Linksnebenklasse, nämlich {z, r}. Auf dieselbe Weise rechnet man nach, dass die Rechtsnebenklassen von U genau die Mengen U , U y = {y, r} und {z, s} sind. Insbesondere sind die Linksnebenklassen von U in G4 nicht identisch mit den Rechtsnebenklassen. 98 STEFAN GESCHKE Die Nebenklassen von U = {i} sind die Einermengen U = {i}, {x}, {y}, {z}, {r} und {s}. Hierbei stimmen wieder die Links- und Rechtsnebenklassen überein, auch wenn G4 nicht abelsch ist. Beispiel 7.37. Auch wenn die Gruppe G und ihre Untergruppe U unendlich sind, kann es sein, dass der Index von U in G endlich ist. Für jedes m ∈ N ist mZ eine Untergruppe von Z und es gilt [Z : mZ] = m, da die Mengen [0]m , . . . , [m − 1]m genau die verschiedenen Nebenklassen von mZ in Z sind. In Z ist es nicht nötig, zwischen Links- und Rechtsnebenklassen zu unterscheiden, da die Gruppe abelsch ist. Beispiel 7.38. Aus dem Satz von Lagrange (Korollar 7.34) können wir sehr einfach den Satz von Fermat und Euler (Satz 6.13) folgern. Sei m ≥ 2 und n ∈ Z zu m teilerfremd. Dann ist [n]m ∈ E(Zm ) und E(Zm ) hat die Ordnung ϕ(m). Nach dem Satz von Lagrange ist die Ordnung von [n]m in E(Zm ) ein Teiler der Ordnung ϕ(m) von E(Zm ). Damit gilt aber ([n]m )ϕ(m) = [1]m , also nϕ(m) ≡ 1 (mod m). Satz 7.39. Sei G eine zyklische Gruppe. Ist U eine Untergruppe von G, so ist auch U zyklisch. Beweis. Sei a das erzeugende Element von G, also G = {an : n ∈ Z}. Ist U = {e}, so ist U zyklisch. Wir können also annehmen, dass U ein von e verschiedenes Element enthält. Also gibt es ein n ∈ Z mit n 6= 0 und an ∈ U . Mit an ist auch a−n = (an )−1 in U . Damit existiert ein n > 0 mit an ∈ U . Sei nun m die kleinste natürliche Zahl mit am ∈ U . Wir zeigen, dass alle Elemente von U Potenzen von am sind. Sei an ∈ U . Wir zeigen, dass n ein Vielfaches von m ist. Wieder können wir annehmen, dass n > 0 ist. Seien q, r ∈ Z mit n = qm + r und 0 ≤ r < m. Dann gilt an a−qm = ar ∈ U . Aus r < m und der Wahl von m als kleinste natürliche Zahl mit am ∈ U folgt r = 0. Damit ist n = qm und an = (am )q . Das zeigt, dass U zyklisch ist. Beispiel 7.40. Wir betrachten die Untergruppen der Gruppe Z12 . Die möglichen Ordnungen sind 1, 2, 3, 4, 6 und 12 und alle Untergruppen sind zyklisch. Für alle m ∈ {1, . . . , 11} die zu 12 teilerfremd sind, erzeugt [m]12 die ganze Gruppe Z12 . [2]12 und [10]12 erzeugen jeweils die Untergruppe {[0]12 , [2]12 , [4]12 , [6]12 , [8]12 , [10]12 }. [3]12 und [9]12 erzeugen jeweils die Untergruppe {[0]12 , [3]12 , [6]12 , [9]12 }. [4]12 und [8]12 erzeugen jeweils die Untergruppe {[0]12 , [4]12 , [8]12 }. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 99 [6]12 erzeugt die Untergruppe {[0]12 , [6]12 }. [0]12 erzeugt schließlich die Untergruppe {[0]12 }. Das sind alle Untergruppen von Z12 . Satz 7.41. Ist G eine Gruppe, deren Ordnung eine Primzahl p ist. Dann ist G zyklisch und die einzigen Untergruppen von G sind G und {e}. Beweis. Sei a ∈ G. Nach dem Satz von Lagrange ist die Ordnung von a ein Teiler von p. Damit hat a entweder die Ordnung 1 oder p. Im ersten Fall gilt a = e. Im zweiten Fall ist G = {an : n ∈ Z}. 7.7. Permutationen. Man kann zeigen, dass jede Gruppe zu einer Menge von Permutationen isomorph ist. Daher ist das Studium von Permutationen in der Gruppentheorie von besonderem Interesse. Zur Erinnerung: Eine Permutation einer Menge A ist eine Bijektion von A nach A. Die Komposition g ◦ f zweier Permutationen einer Menge A ist wieder eine Permutation von A. Die Menge aller Permutationen einer Menge A zusammen mit der Komposition ◦ ist eine Gruppe S(A). Das neutrale Element ist die Identität idA : A → A; x 7→ x. Für jede Permutation π ∈ S(A) ist die Umkehrfunktion π −1 das zu π inverse Element von S(A). Ist A endlich, also zum Beispiel A = {a1 , . . . , an }, so können wir eine Permutation π : A → A als a1 ... an π(a1 ) . . . ! π(an ) aufschreiben. Beispiel 7.42. Es gilt 1 2 3 4 5 3 2 5 1 4 ! ◦ 1 2 3 4 5 4 2 1 5 3 ! = 1 2 3 4 5 1 2 3 4 5 ! . Die Permutation auf der rechten Seite der Gleichung ist id{1,2,3,4,5} . Damit sind die beiden Permutationen auf der linken Seite der Gleichung in S5 = S({1, 2, 3, 4, 5}) invers zueinander. Wir betrachten die Permutation π := 1 2 3 4 5 ! etwas eingehender. Es 3 2 5 1 4 gilt π(2) = 2. Die 2 wird also durch π auf sich selbst abgebildet. Die 1 wird durch π auf 3 abgebildet, die 3 auf die 5, die 5 auf die 4 und die 4 wieder auf die 1. Iteriert man also die Anwendung von π auf 1 so landet man zunächst bei 3, dann bei 5, bei 4 und schließlich wieder bei 1. Lemma 7.43. Ist A eine endliche Menge und π ∈ S(A), so existiert für jedes a ∈ A ein n ∈ N mit π n (a) = a. 100 STEFAN GESCHKE Beweis. Da A endlich ist, gibt es k, ` ∈ N mit k < ` und π k (a) = π ` (a). Nun gilt a = (π −k ◦ π k )(a) = (π −k ◦ π ` (a) = π `−k (a). Setzt man n := ` − k, so ergibt sich π n (a) = a. Definition 7.44. Sei A eine Menge, n ≥ 2 und a1 , . . . , an paarweise verschiedene Elemente von A. Dann bezeichen wir mit (a1 a2 . . . an ) die Permutation π von A, die wie folgt definiert ist: a, falls a ∈ A \ {a1 , . . . , an }, π(a) = ai+1 , falls a = ai für ein i ∈ {1, . . . , n − 1} und a , falls a = a . 1 n Die Permutation (a1 a2 . . . an ) nennen wir einen Zyklus der Länge n. Zwei Zyklen (a1 . . . an ) und (b1 . . . bm ) heißen disjunkt, falls die Mengen {a1 , . . . , an } und {b1 , . . . , bm } disjunkt sind. Zyklen der Länge 2 heißen Transpositionen. Satz 7.45. Sei A eine endliche Menge. a) Jede Permutation π von A ist ein Produkt von paarweise disjunkten Zyklen. Eine Darstellung von π als Produkt disjunkter Zyklen heißt Zyklenzerlegung von π. Die Zyklenzerlegung von π ist bis auf die Reihenfolge eindeutig. b) Jeder Zyklus ist ein Produkt von Transpositionen. c) Jede Permutation von A ist ein Produkt von Transpositionen. Beweis. a) Für a, b ∈ A schreiben wir a ∼ b, falls es ein n ∈ Z mit π n (a) = b gibt. Die Relation ∼ ist eine Äquivalenzrelation auf A. Sei nun a ∈ A. Nach Lemma 7.43 existiert ein m ∈ N mit π m (a) = a. Sei nun b ∼ a. Dann existiert ein n ∈ Z mit π n (a) = b. Wähle q, r ∈ Z mit n = q · m + r und 0 ≤ r < m. Dann gilt b = π n (a) = π q·m+r (a) = π r ((π m )q (a)) = π r (a). Das zeigt, dass die ∼-Äquivalenzklasse von a genau die Menge {π 0 (a), . . . , π m−1 (a)} ist. Ist m = 1, so besteht diese Äquivalenzklasse nur aus dem Element a und a wird von π nicht bewegt. Ist m > 1, so ist π auf der Äquivalenzklasse von a genau der Zyklus (π 0 (a), . . . , π m−1 (a)). Für jede ∼-Äquivalenzklasse mit mindestens zwei Elementen erhalten wir also einen Zyklus, dessen Einträge genau die Elemente dieser Äquivalenzklasse sind. Da die Äquivalenzklassen paarweise disjunkt sind, sind diese Zyklen disjunkt. Die Permutation π ist das Produkt dieser Zyklen. b) Es gilt (a1 , . . . , an ) = (a1 a2 ) ◦ · · · ◦ (an−1 an ). c) Die Behauptung folgt sofort aus a) und b). MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 101 Beispiel 7.46. Sei A = {1, 2, 3, 4, 5, 6} und π= 1 2 3 4 5 6 4 5 1 3 6 2 ! . Dann gilt π = (143) ◦ (256). Weiter gilt (143) = (14) ◦ (43) und (256) = (25) ◦ (56). Damit ist π = (14) ◦ (43) ◦ (25) ◦ (56). Satz 7.47. Sei π eine Permutation einer endlichen Menge A. Ist π ein Produkt von gerade vielen Transpositionen, so hat jede Darstellung von π als Produkt von Transpositionen eine gerade Anzahl von Faktoren. In diesem Falle nennen wir π eine gerade Permutation. Permutationen, die nicht gerade sind, nennen wir ungerade. Korollar 7.48. Sei A eine endliche Menge. Die geraden Permutationen bilden eine Untergruppe der Gruppe aller Permutationen von A vom Index 2. Beweis. Es ist klar, dass das Produkt zweier gerader Permutationen wieder gerade ist. Man sieht auch schnell, dass das Inverse einer geraden Permutation wieder gerade ist. Die Untergruppe U von S(A) der geraden Permutationen hat genau zwei Nebenklassen, nämlich U selbst und die Menge der ungeraden Permutationen. Beispiel 7.49. Die Gruppe S3 hat 3! = 6 Elemente. Damit gibt es 3 gerade Permutationen und 3 ungerade Permutationen. Die die geraden Permutationen sind die Identität, (123) = (12)(23) und (321) = (32)(21). Die ungeraden Permutationen sind (12), (13) und (23). Man beachte, dass die Darstellungen von Permutationen als Produkt von Transpositionen nicht eindeutig ist. Es gilt zum Beispiel (123) = (12)(23) = (231) = (23)(31) = (312) = (31)(12). Auch die Anzahl der Transpositionen ist nicht eindeutig: (321) = (32)(21) = (123)2 = (12)(23)(31)(12) Was aber nach Satz 7.47 eindeutig ist, ist die Anzahl der Transpositionen modulo 2. 102 STEFAN GESCHKE 8. Ringe, Körper und Polynome 8.1. Ringe. Definition 8.1. Eine Menge R zusammen mit zwei binären Operationen + und · und zwei verschiedenen Konstanten 0 und 1 heißt ein Ring (mit 1), falls für alle a, b, c ∈ R die folgenden Axiome gelten: (R1) Assoziativgesetze • a + (b + c) = (a + b) + c • a · (b · c) = (a · b) · c (R2) Kommutativgesetz der Addition: • a+b=b+a (R3) Distributivgesetze • a · (b + c) = a · b + a · c • (b + c) · a = b · a + c · a (R4) Existenz neutraler Elemente bezüglich der Addition und der Multiplikation • a+0=a • 1·a=a (R5) Existenz inverser Elemente bezüglich der Addition • Es gibt ein Element −a mit a + (−a) = 0. Man beachte, dass der offizielle Name für hier definierten Strukturen „Ring mit 1“ lautet. Wir werden aber keine Ringe ohne 1 betrachten und sagen daher abkürzend einfach „Ring“, obwohl wir eigentlich „Ring mit 1“ meinen. Unter Verwendung der Begriffe Gruppe und Monoid können wir Ringe auch in der folgenden kompakten Form definieren. Definition 8.2. Eine Menge R mit zwei binären Operationen + und · ist ein Ring (mit 1) falls gilt: (RI) (R, +) ist eine kommutative Gruppe. (RII) (R \ {0}, ·) ist ein Monoid. (RIII) Es gelten die Distributivgesetze, d.h., für alle a, b, c ∈ R gilt: • a · (b + c) = a · b + a · c • (b + c) · a = b · a + c · a Bei dieser Definition definieren wir 0 als das neutrale Element der Addition und 1 als das neutrale Element der Multiplikation. Wie üblich schreiben wir −a für das additive Inverse eines Ringelements a und −1 a für das multiplikative Inverse, falls es denn existiert. Beispiel 8.3. a) Jeder Körper ist ein Ring. Umgekehrt ist ein Ring (R, +, ·) ein Körper, wenn das Kommutativgesetz für · gilt und jedes von 0 verschiedene Element ein multiplikatives Inverses besitzt. b) Die ganzen Zahlen mit Addition, Multiplikation und den üblichen Konstanten 0 und 1 bilden einen Ring, aber bekanntlich keinen Körper. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 103 c) Für jedes m ≥ 2 ist (Zm , +, ·) ein Ring. Definition 8.4. Sei (R, +, ·) ein Ring. Die Einheitengruppe E(R) von R ist die Menge derjenigen Elemente von R, die ein mutliplikatives Inverses besitzen, zusammen mit der Multiplikation. Wir hatten schon gesehen, dass die Einheitengruppe eines Ringes der Form Zm , m ≥ 2, tatsächlich eine Gruppe ist. Das gleiche Argument liefert die entsprechende Aussage für beliebige Ringe: Satz 8.5. Für jeden Ring R ist E(R) eine Gruppe. Beweis. Zunächst müssen wir zeigen, dass · überhaupt eine Operation auf E(R) ist, dass also das Produkt zweier invertierbarer Elemente von R wieder invertierbar ist. Seien also a, b ∈ E(R). Dann ist (ab)(b−1 a−1 ) = aa−1 = 1 = b−1 b = (b−1 a−1 )(ab). Also ist ab invertierbar und es gilt (ab)−1 = b−1 a−1 . 1 ist zu sich selbst invers und damit gilt 1 ∈ E(R). Es ist auch klar, dass mit a ∈ R auch a−1 invertierbar ist. Das Inverse von a−1 ist nämlich einfach a. Damit ist E(R) tatsächlich eine Gruppe. Beispiel 8.6. a) Für jeden Körper K ist E(K) = K \{0}. Insbesondere ist E(R) = R \ {0}, E(Q) = Q \ {0} und E(Zp ) = Zp \ {[0]p } für jede Primzahl p. b) Es gilt E(Z) = {−1, 1}. c) Es gilt E(Z8 ) = {[1]8 , [3]8 , [5]8 , [7]8 } und E(Z12 ) = {[1]12 , [5]12 , [7]12 , [11]12 }. 8.2. Der Polynomring K[X]. Definition 8.7. Ist K ein Körper, so bezeichnen wir einen Ausdruck der Form a0 X 0 +a1 X 1 +a2 X 2 +· · ·+an X n , wobei die Koeffizienten a0 , . . . , an aus K stammen und X eine Unbekannte ist, als Polynom (in der Unbestimmten X) über K. Die Menge aller Polynome über K bezeichnen wir mit K[X]. Polynome der Form a0 nennen wir konstant. Die Elemente von K identifizieren wir mit den konstanten Polynomen und fassen so K als Teilmenge von K[X] auf. Bemerkung 8.8. In unserer Definition von Polynomen haben wir die verschiedenen Potenzen von X in aufsteigender Reihenfolge angegeben. Meistens werden die Potenzen jedoch in absteigender Reihenfolge angegeben. Statt a0 X 0 + a1 X 1 + a2 X 2 + · · · + an X n schreibt man also an X n + an−1 X n−1 + · · · + a0 X 0 . Die Potenz X 0 hat für alle X den Wert 1. Deshalb lässt man den Term X 0 normalerweise weg. Anstelle von X 1 schreibt man einfach X. Mit diesen Konventionen lautet das Polynom also an X n + · · · + a1 X + a0 . 104 STEFAN GESCHKE Ist für ein i der Koeffizient ai gleich 0, so lässt man den Term ai X i weg. Bei negativen Koeffizienten zieht man das Minuszeichen mit dem vorhergehenden Pluszeichen zu einem Minuszeichen zusammen. Koeffizienten, die den Wert 1 haben lässt man weg, falls es sich nicht um den Koeffizienten vor X 0 handelt. Anstelle von 1X 0 + (−5)X 1 + 0X 2 + 1X 3 schreibt man also X 3 − 5X + 1. Beispiel 8.9. a) Aus der Schule sind Polynome mit reellen oder rationalen Koeffizienten bekannt, also Polynome über R oder Q, wie das oben genannte Beispiel X 3 − 5X + 1. Streng genommen sind die Koeffizienten dieses Polynoms sogar ganzzahlig, so dass man von einem Polynom über Z sprechen könnte. Wir werden jedoch nur Polynome über Körpern betrachten. b) Wir kennen auch schon weitere Körper außer R und Q, nämlich die endlichen Körper Zp für Primzahlen p. So ist zum Beispiel X 2 − X + 1 ein Polynom über Z2 , wobei wir 1 für das neutrale Element der Multiplikation schreiben. Wir könnten dieses Polynom auch X 2 − X + [1]2 oder [1]2 X 2 + [−1]2 X 1 + [1]2 schreiben. Man beachte, dass für alle a ∈ Z2 die Gleichung a = −a gilt. Damit ist dieses Polynom identisch mit X 2 + X + 1. Man sieht, dass es in diesem Falle wichtig ist, festzulegen, über welchem Körper man das Polynom betrachtet. c) Wenn man Polynome über Zp betrachtet, wird es schnell lästig, die Koeffizienten in der Form [n]p zu schreiben. Deshalb schreiben wir in diesem Zusammenhang anstelle der Restklassen einfach die Standardrepräsentanten der Restklassen. Für das Polynom X 3 + [2]3 X 2 + [−2]3 X + [1]3 über Z3 schreiben wir also einfach X 3 + 2X 2 + X + 1. Die Schreibweise X 3 + 2X 2 − 2X + 1 ist aber auch akzeptabel. d) Spezielle Polynome sind die sogenannten Monome X n , n ∈ N0 . Wir haben schon intuitiv zwei Polynome gleich genannt, wenn sie dieselben Koeffizienten haben. An dieser Stelle müssen wir jedoch vorsichtig sein. Was ist zu Beispiel mit den Polynomen 0X 2 + X − 1 und X − 1? Definition 8.10. Sei p = a0 X 0 + · · · + an X n ein Polynom über einem Körper K. Der Grad grad(p) von p ist das größte i ∈ {0, . . . , n} mit ai 6= 0, falls solch ein i existiert. EXistiert kein i mit ai 6= 0, so nennt man p das Nullpolynom und setzt grad(p) := −∞. Polynome vom Grad ≤ 0 nennen wir konstant. Ist grad(p) ≥ 0, so nennt man den Koeffizienten agrad(p) den Leitkoeffizienten von p. Das Polynom p heißt normiert, falls der Leitkoeffizient 1 ist. Wir nennen zwei Polynome p = a0 X 0 + · · · + an X n und q = b0 X 0 + · · · + bm X m über demselben Körper K gleich, wenn sie denselben Grad k haben und für alle i ∈ {0, . . . , k} die Koeffizienten ai und bi gleich sind. Insbesondere sind also die Polynome 0X 2 + X − 1 und X − 1 gleich. Beide Polynome haben den Grad 1 und die Koeffizienten vor X 1 und X 0 sind jeweils MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 105 dieselben. Man beachte, dass es in diesem Beispiel egal ist, über welchem Körper man die Polynome betrachtet, solange es für beide Polynome derselbe Körper ist. Als nächstes definieren wir Summen und Produkte von Polynomen. Definition 8.11. Seien p = a0 X 0 + · · · + an X n und q = b0 X 0 + · · · + bm X m Polynome über demselben Körper K. Sei k = max(m, n). Für alle i ∈ Z mit n < i ≤ k sei ai := 0. Für alle j ∈ Z mit m < j ≤ k sei bj := 0. Dann gilt p = a0 X 0 + · · · + ak X k und q = b0 X 0 + · · · + bk X k . Nun sei p + q := (a0 + b0 ) + · · · + (ak + bk )X k . Wir definieren die Summe zweier Polynome also „koeffizientenweise“. Das Produkt von p und q definieren wir durch Ausmultiplizieren. Das Produkt p · q sei das Polynom c0 + · · · + cn+m X n+m mit ci = a0 bi + a1 bi−1 + · · · + ai b0 . Beispiel 8.12. Addition und Multiplikation von Polynomen über Q und R setzen wir als bekannt voraus. a) Wir betrachten Polynome über Z5 . Sei p = X 3 +3X 2 +2 und q = 2X 2 −X +4. Dann ist p + q = X 3 + (3 + 2)X 2 − X + (2 + 4) = X 3 + 4X + 1 und p · q = (X 3 + 3X 2 + 2) · (2X 2 − X + 4) = 2X 5 + (−1 + 3 · 2)X 4 + (4 − 3)X 3 + (3 · 4 + 2 · 2)X 2 − 2X + 2 · 4 = 2X 5 + X 3 + X 2 + 3X + 3. Insbesondere ist grad(p · q) = grad(p) + grad(q). Wie man leicht nachrechnet, gilt diese Gleichung für je zwei Polynome über demselben Körper. b) Wir betrachten wieder Polynome über Z5 . Sei p = X 3 + 3X 2 + 2 wie oben und q = −X 3 + X 2 − 3. Dann gilt p + q = (1 − 1)X 3 + (3 + 1)X 2 + (2 − 3) = 4X 2 − 1 = 4X 2 + 4. Insbesondere ist grad(p + q) < grad(p), grad(q). Das ist aber ein Spezialfall. Sind p und q Polynome von verschiedenem Grad, so ist grad(p + q) = max(grad(p), grad(q)). Sind p und q Polynome vom selben Grad und ist der Leitkoeffizient von p nicht genau das additive Inverse des Leitkoeffizienten von q, so ist grad(p + q) = grad(p) = grad(q). Satz 8.13. Die Menge K[X] zusammen mit den eben definierten Operationen + und · für Polynome bildet einen Ring, in dem das Kommutativgesetz für · gilt. (Damit ist K[X] ein kommutativer Ring.) Diesen Ring nennt man den Polynomring (in der Unbestimmten X) über K. 106 STEFAN GESCHKE Beweis. Die Axiome für Ringe und das Kommutativgesetz der Multiplikation rechnet man leicht nach. Für Polynome können wir die Teilbarkeitsrelation wie für ganze Zahlen definieren. Definition 8.14. Seien p und q Polynome über einem Körper K. Wir sagen, dass p das Polynom q teilt, wenn es ein Polynom r über K gibt, so dass q = p · r gilt. In diesem Falle heißt q ein Vielfaches von p und wir schreiben p|q. Ein Polynom r ist ein gemeinsamer Teiler von p und q, wenn r sowohl p als auch q teilt. Das Polynom r ist ein größter gemeinsamer Teiler von p und q, wenn r ein gemeinsamer Teiler von p und q von maximalem Grad ist. Beispiel 8.15. a) Wir rechnen wieder über Z5 . Die Gleichung (X 3 + 3X 2 + 2) · (2X 2 − X + 4) = 2X 5 + X 3 + X 2 + 3X + 3, zeigt, dass X 3 + 3X 2 + 2 und 2X 2 − X + 4 Teiler von 2X 5 + X 3 + X 2 + 3X + 3 sind. b) Wir rechnen über R. Die Zahlen 2.5 und π, aufgefasst als konstante Polynome werden beide von allen reellen Zahlen 6= 0 geteilt. Für jedes a ∈ R \ {0} gilt nämlich 2.5 = a · 2.5 a und π = a · πa . Für jedes Polynom p ∈ R[X] vom Grad ≥ 1 und jedes r ∈ R[X] mit r 6= 0 ist grad(p·r) ≥ 1 und damit p·r 6= 2.5. Die Zahl 2.5 wird also nur von konstanten Polynomen geteilt, aber von allen von 0 verschiedenen konstanten Polynomen. Dasselbe gilt für π. Damit sind genau die konstanten Polynome 6= 0 größte gemeinsame Teiler von 2.5 und π. Insbesondere sind größte gemeinsame Teiler in Polynomringen in allgemeinen nicht eindeutig bestimmt. Wie im Falle von Z lassen sich größte gemeinsame Teiler in K[X] mit dem euklidischen Algorithmus bestimmen. Dazu müssen wir zunächst die Division mit Rest von Polynomen einführen, die sogenannte Polynomdivision. Satz 8.16. Seien p und m Polynome über einem Körper K. Ist m 6= 0, so existieren Polynome q und r über K mit p = q · m + r und grad(r) < grad(m). Beweis. Ist m konstant, also zum Beispiel m = b0 ∈ K so setzen wir a0 an n X + ··· + q := b0 b0 und r := 0. Dann gilt p = q · m + r und die Gradbedingung ist erfüllt. Ist grad(m) ≥ 1, so beweisen wir den Satz durch vollständige Induktion über den Grad von p. Induktionsanfang: Ist grad(p) < grad(m), so setzen wir q := 0 und r := p. Dann gilt p = q · m + r, wobei r die gewünschte Gradbedingung erfüllt. Induktionsschritt: Sei nun der Grad von p ist mindestens so hoch wie der Grad von m. Wir nehmen an, dass für alle Polynome p0 mit grad(p0 ) < grad(p) Polynome q 0 und r0 mit p0 = q 0 · m + r0 und grad(r0 ) < grad(m) existieren (Induktionsannahme). MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 107 Wir suchen Polynome q und r mit p = q · m + r und grad(r) < grad(m). Sei n = grad(p), k = grad(m), p = an X n + · · · + a0 und m = bk X k + · · · + b0 . Wir setzen an · X n−k · m bk und berechnen den Koeffizienten cn von X n in p0 . X n−k · m ist ein Polynom vom p0 := p − Grad n − k + k = n mit dem Leitkoeffizienten bk . Damit ist cn = an − 0 an bk · bk = 0. 0 Also ist p ein Polynom mit grad(p ) < n = grad(p). Nach Induktionsannahme existieren Polynome q 0 und r0 mit p0 = q 0 · m + r0 und grad(r0 ) < grad(m). Nach Wahl von p0 gilt an p= · X n−k · m + p0 . bk Setzt man nun für p0 den Ausdruck q 0 · m + r0 ein, so ergibt sich an an n−k 0 0 n−k 0 ·X ·m+q ·m+r = ·X + q · m + r0 . p= bk bk Wir setzen r := r0 und q := abkn · X n−k + q 0 . Nun gilt p = q · m + r, wobei die Gradbedingung grad(r) < grad(m) erfüllt ist. Das beendet den Induktionsschritt. Der Beweis von Satz 8.16 liefert ein rekursives Verfahren, mit dem sich der Quotient q und damit auch der Rest r bei Division von p durch m berechnen lässt. Wesentlicher Punkt dieser Polynomdivision ist die folgende Bemerkung. Bemerkung 8.17. Sei grad(p) ≥ grad(m) ≥ 1. Im Beweis von Satz 8.16 haben wir gesehen, dass es Polynome q und r mit grad(r) < grad(m) und p = q · m + r gibt, wobei q die Form an bk · X n−k + q 0 hat. Dabei gilt p0 = q 0 · m + r0 für ein Polynom p0 mit grad(p0 ) < grad(p). Also ist der Grad von q 0 kleiner als n − k, wobei n der Grad von p und k der Grad von m ist. Damit ist an bk der Leitkoeffizient von q. Außerdem ist der Rest r bei der Division von p durch m einfach das Polynom r0 , also der Rest bei der Division von p0 durch m. Wir beschreiben den Algorithmus zur Division von Polynomen, der sich aus dem Beweis von Satz 8.16 ergibt. Polynomdivision. Seien zwei Polynome p = an X n + · · · + a0 und m = bk X k + · · · + b0 über einem festen Körper K gegeben. Das Polynom m habe den Grad k ≥ 0. Wir wollen Polynome q und r wie in Satz 8.16 bestimmen. Ist k = 0, so ist p durch m teilbar und man erhält den Quotienten q, indem man jeden Koeffizienten von p durch m ∈ K teilt. Der Rest ist in diesem Fall r = 0. Nun nehmen wir an, dass k ≥ 1 gilt. Wir halten p und m im Laufe der Berechnung fest und verändern die Variablen p̄ und n̄. Dabei seien ān̄ , . . . , ā0 immer 108 STEFAN GESCHKE die Koeffizienten des Polynoms p̄. Die Koeffizienten cn−k , . . . , c0 des Quotienten q werden nach und nach berechnet, falls n ≥ k ist. (1) Setze n̄ := n und p̄ := p. (2) Ist n̄ < k, so ist r = p̄ der Rest bei der Division von p durch m. Ist n ≥ k, so ist q = cn−k X n−k + · · · + c0 der Quotient bei der Division von p durch m. Ist n < k, so ist lautet der Quotient q = 0 und es wurden auch keine ci berechnet. Die Berechnung endet hier. (3) Ist n̄ ≥ k, so speichere den Koeffizienten cn̄−k := ān̄ bk und setze p̄ := p̄ − cn̄−k · X n̄−k · m. (4) Ist p̄ das Nullpolynom, so setze n̄ := −∞ und fahre mit Schritt (2) fort. (5) Ist p̄ 6= 0, so setze n̄ := n̄ − 1 und fahre mit Schritt (2) fort. Bemerkung 8.18. Seien p und m wie im Algorithmus zur Polynomdivision. Wir nehmen an, dass n ≥ k ≥ 1 ist. Dann kann man die Berechnung des Algorithmus wie folgt aufschreiben: Wir starten mit der Zeile (an X n + · · · + a0 ) : (bk X k + · · · + b0 ) = Zunächst berechnen wir den Koeffizienten cn−k = mit der passenden Potenz X an bk und tragen ihn zusammen n−k auf der rechten Seite ein. Das liefert an n−k n k (an X + · · · + a0 ) : (bk X + · · · + b0 ) = X + ... bk Als nächstes multiplizieren wir m mit an n−k . bk X Das liefert ein Polynom vom Grad n, das wir unter das Polynom p schreiben. Als nächstes ziehen wir an n−k bk X · m von p ab und schreiben das Ergebnis ebenfalls darunter. Die dritte Zeile lautet nun an 0 + an−1 − bk−1 X n−1 + . . . bk Wir setzen dann die Polynomdivision mit dem Polynom in der dritten Zeile fort, und zwar solange bis der Grad der letzten Differenz kleiner als der Grad von m geworden ist. Dabei schreiben wir die neu berechneten Terme ci X i von q oben rechts hinter den Ausdruck an n−k . bk X Am Schluss steht das gesamte Polynom q auf der rechten Seite der Gleichung und die Differenz in der letzten Zeile ist der Rest bei der Division von p durch m. Damit das Gleichheitszeichen gerechtfertigt ist, tragen wir am Schluss der obersten Zeile noch den Summanden r m. Es ist übrigens nicht nötig, die Differenzen immer vollständig aufzuschreiben, da alle bis auf die ersten k − 1 Summanden mit den entsprechenden Summanden von p übereinstimmen. Beispiel 8.19. Wir rechnen über Q. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 109 a) Sei p = X 3 − 2X 2 + 4X + 7 und m = X + 1. Die Polynomdivision sieht dann wie folgt aus: X 3 − 2X 2 + 4X + 7 : X + 1 = X 2 − 3X + 7 − X3 − X2 − 3X 2 + 4X 3X 2 + 3X 7X + 7 − 7X − 7 0 In diesem Fall ergibt sich der Rest 0. Insbesondere ist p durch m teilbar. b) Sei p = X 3 − 2X 2 + 5X + 6 und m = X 2 − X + 1. Die Polynomdivision sieht dann wie folgt aus: X 3 − 2X 2 + 5X + 6 : X 2 − X + 1 = X − 1 + − X3 + X2 − X 3X + 7 −X +1 X2 − X 2 + 4X + 6 X2 − X + 1 3X + 7 Hier ist der Quotient X − 1 und der Rest 3X + 7. Wie bei ganzen Zahlen kann man größte gemeinsame Teiler von Polynomen mit Hilfe des euklidischen Algorithmus berechnen. Dabei spielt der Grad die Rolle des Betrages bei den ganzen Zahlen. Ein Unterschied zur Situation bei den ganzen Zahlen besteht darin, dass es durchaus passieren kann, dass zwei Polynomen denselben Grad haben, ohne dass die beiden Polynomen einander teilen. In diesem Falle ist es egal, ob man zunächst das eine Polynom durch das andere teilt oder umgekehrt. Beispiel 8.20. Wir wollen einen größten gemeinsamen Teiler der Polynome p = X 3 − 3X 2 + 5X − 3 und q = X3 − 1 bestimmen. Eigentlich müssten wir beim euklidischen Algorithmus zunächst das Polynom vom höheren Grad durch das vom niedrigeren Grad teilen. Die beiden Grade sind aber gleich. Deshalb ist es egal, ob wir zunächst p durch q teilen oder umgekehrt. Wir starten mit der Division von p durch q. −3X 2 + 5X − 2 X 3 − 3X 2 + 5X − 3 : X 3 − 1 = 1 + X3 − 1 − X3 +1 − 3X 2 + 5X − 2 110 STEFAN GESCHKE Der Rest ist also −3X 2 + 5X − 2. Also dividieren wir im nächsten Schritt q durch −3X 2 + 5X − 2. − 1 : − 3X 2 + 5X − 2 = − 13 X − X3 5 9 + − X 3 + 35 X 2 − 23 X − 5 2 3X 5 2 3X 19 19 9 X − 9 −3X 2 + 5X − 2 − 23 X − 1 + 25 9 X − 10 9 19 9 X − 19 9 Das liefert den Rest 19 9 (X − 1). Man beachte, dass das Polynom 19 9 (X − 1) genau dieselben Teiler wie X − 1 hat und auch genau dieselben Polynome teilt. Damit können wir im nächsten Schritt der Einfachheit halber durch X − 1 anstelle von 19 9 (X − 1) teilen. − 3X 2 + 5X − 2 : X − 1 = − 3X + 2 3X 2 − 3X 2X − 2 − 2X + 2 0 Der Rest ist dabei 0. Also ist X − 1 ein größter gemeinsamer Teiler von p und q. 8.3. Polynomfunktionen und Nullstellen von Polynomen. Definition 8.21. Sei K ein Körper und p = a0 + · · · + an X n ∈ K[X]. Dann ist die Funktion fp : K → K; x 7→ a0 + · · · + an xn die zu p gehörige Polynomfunktion. Man berechnet also fp in dem man ein gegebenes Körperelement x (nicht zu verwechseln mit der Unbestimmten X) für X in das Polynom einsetzt. Beispiel 8.22. a) Sei p = 2X 2 − 3X + 7 ∈ Q[X]. Dann ist fp (3) = 2 · 32 − 3 · 3 + 7 = 18 − 9 + 7 = 16. b) Sei p = X 3 − 2X + 1 ∈ Z3 [X]. Dann ist fp (2) = 23 − 2 · 2 + 1 = 2 − 1 + 1 = 2. (Wir schreiben wieder Standardvertreter anstelle von Restklassen und rechnen modulo 3.) Der Grund, weshalb wir zwischen Polynomen und den zugerörigen Polynomfunktionen unterscheiden ist, dass es über einem endlichen Körper K zwar unendlich viele Polynome gibt, aber nur endlich viele Polynomfunktionen. Es gibt also verschiedene Polynome p und q über K, deren Polynomfunktionen übereinstimmen. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 111 Beispiel 8.23. Sei p = X 4 + X + 2 und q = X 3 + X 2 + 2, wobei wir p und q als Polynome über Z3 auffassen. Dann ist p 6= q, und zwar schon deshalb, weil p und q unterschiedlichen Grad haben. Es gilt aber fp (0) = 2 = fq (0), fp (1) = 1 + 1 + 2 = 1 = fq (1) und fp (2) = 1 + 2 + 2 = 2 = 2 + 1 + 2 = fq (2). Damit sind die Polynomfunktionen fp und fq gleich. Ist p ∈ K[X] und x ∈ K, so schreibt man in der Praxis anstelle von fp (x) eher p(x). Für ein Körperelement x steht p(x) also für das Körperelement, das man erhält, wenn man für die Unbestimmte X das Körperelement x in das Polynom einsetzt. Definition 8.24. Sei K ein Körper und p ∈ K[X]. Dann heißt a ∈ K eine NullstelleÊvon p, falls p(a) = 0 ist. Satz 8.25. Ein Körperelement a ∈ K ist genau dann eine Nullstelle von p ∈ K[X], wenn X − a ein Teiler von p ist. Beweis. Angenommen, X − a teilt p. Dann existiert q ∈ K[X] mit p = q · (X − a). Es gilt p(a) = q(a) · (a − a) = q(a) · 0 = 0. Also ist X − a eine Nulsstelle von p. Sei umgekehrt p(a) = 0. Nach Satz 8.16 existieren Polynome q, r ∈ K[X] mit p = q · (X − a) + r und grad(r) < grad(X − a) = 1. Das Polynom r ist also konstant. Es gilt 0 = p(a) = q(a) · (a − a) + r = r und damit p = q · (X − a). Damit teilt (X − a) das Polynom p. Korollar 8.26. Ein Polynom p ∈ K[X] vom Grad n > 0 hat höchstens n verschiedene Nullstellen. Beweis. Wir zeigen das Korollar durch Induktion über n. Induktionsanfang: Sei n = 1. Dann ist p von der Form a1 X + a0 mit a0 , a1 ∈ K und a1 6= 0. Sei x ∈ K mit p(x) = 0. Dann gilt a1 x+a0 = 0 und damit x = −a0 ·a−1 1 . Insbesondere hat p genau eine Nullstelle, nämlich −a0 a−1 1 . Induktionsschritt: Sei n ∈ N. Angenommen, jedes Polynom vom Grad n hat höchstens n verschiedene Nullstellen. Sei p ∈ K[X] ein Polynom vom Grad n+1 und a ∈ K eine Nullstelle von p. Nach Satz 8.25 existiert q ∈ K[X] mit p = q · (X − a). Sei b ∈ K eine weitere, also von a verschiedene, Nullstelle von p. Dann gilt 0 = p(b) = q(b) · (b − a). Wegen b 6= a ist b − a 6= 0. Also ist q(b) = 0. Jede von a verschiedene Nullstelle von p ist also eine Nullstelle von q. Das Polynom q hat den Grad n. Nach Induktionsannahme hat q aber höchstens n verschiedene Nullstellen. Damit hat p höchstens n verschiedene Nullstellen, die von a verschieden sind. Also hat p höchstens n + 1 verschiedene Nullstellen. 112 STEFAN GESCHKE Der Beweis dieses Korollars liefert ein rekursives Verfahren, alle Nullstellen eines Polynoms zu bestimmen, wenn man in der Lage ist, einzelne Nullstellen zu bestimmen: Sei p ∈ K[X] ein Polynom vom Grad n > 0. Bestimme eine Nullstelle a1 von p und teile p durch (X − a1 ). Wiederhole das Verfahren mit p/(X − a1 ). Iteriere das Verfahren solange, wie der Grad des Polynom > 0 ist. Um Nullstellen von Polynomen zweiten Grades über R zu bestimmen, gibt es die bekannte p-q-Formel: Das Polynom X 2 + pX + q hat die Nullstellen r p p2 x1 = − + −q 2 4 und r p2 p x2 = − − − q, 2 4 falls die Diskriminante p2 4 − q nicht negativ ist. Ist p2 4 − q < 0, so hat X 2 + pX + q keine reellen Nullstellen. Herleitung der p-q-Formel: Gegeben sei eine quadratische Gleichung der Form X 2 + pX + q = 0. Diese Gleichung lässt sich nicht einfach nach X auflösen. Eine Gleichung der Form (X + a)2 = b lässt sich allerdings einfach nach X auflösen: √ Aus (X + a)2 = b folgt b ≥ 0 und X + a = ± b. Ist (X + a)2 = b genau dann √ lösbar, wenn b ≥ 0 gilt, und die Lösungen sind die Zahlen x1,2 = −a ± b. Die Gleichung X 2 + pX + q = 0 können wir aber auf die Form (X + a)2 = b bringen: X 2 + pX + q p p 2 p 2 X2 + 2 X + − +q 2 2 2 p p 2 X2 + 2 X + 2 2 p 2 X+ 2 2 p 2 p Setzt man also a := 2 und b = 2 − q = p4 = 0 = 0 p 2 −q 2 p 2 = −q 2 = − q, so hat man die Gleichung X 2 + pX + q = 0 in die Form (X + a)2 = b überführt. Damit ist X 2 + pX + q = 0 genau dann lösbar, wenn p 2 −q 2 Falle lauten die Lösungen x1,2 = −a ± √ p b=− ± 2 Das erklärt die Gültigkeit der p-q-Formel. r p 2 − q. 2 ≥ 0 gilt. In diesem MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 113 Indem man ein von 0 verschiedenes Polynom durch seinen Leitkoeffizienten teilt, kann man es normieren, ohne die Nullstellen zu verändern. Damit löst die p-qFormel das Problem des Findens von Nullstellen von Polynomen vom Grad 2 über R. Nullstellen von Polynomen vom Grad 1 lassen sich direkt durch Auflösen einer Gleichung mittels Äquivalenzumformungen finden. Für Polynome 3. und 4. Grades über R gibt es auch Formeln, die aber zu umfangreich sind, um sie hier zu präsentieren. Man kann beweisen, dass es zur Berechnung von Nullstellen von Polynomen 5. Grades über R keine allgemeinen Formeln mehr gibt. Allerdings kann man mit Hilfe numerischer Verfahren immer noch Näherungslösungen für Gleichungen der Form p(x) = 0 finden. Hilfreich ist allerdings folgender Satz: Satz 8.27. Sei p = X n + an−1 X n−1 + · · · + a0 ein normiertes Polynom vom Grad n > 0 mit ganzzahligen Koeffizienten. Dann ist jede Nullstelle a ∈ Q von p eine ganze Zahl, die a0 teilt. Der Beweis dieses Satzes übersteigt den Rahmen dieser Vorlesung. Der Satz zeigt aber, dass man die rationalen Nullstellen eines normierten Polynoms mit ganzzahligen Koeffizienten einfach durch Ausprobieren der Teiler des konstanten Summanden des Polynoms finden kann. Beispiel 8.28. Sei p = X 3 − 6X 2 + 11X − 6 ∈ Q[X]. Wir wollen die rationalen Nullstellen von p finden. Nach Satz 8.27 sind die rationalen Nullstellen in Wirklichkeit ganze Zahlen, die −6 teilen. Die Kandidaten sind also −6, −3, −2, −1, 1, 2, 3, 6. Als erstes probieren wir 1 aus, weil in diesem Fall die Rechnung am einfachsten ist. Es gilt p(1) = 1 − 6 + 11 − 6 = 0. Damit haben wir die erste Nullstelle a1 = 1 von p gefunden. Nun teilen wir p durch X − 1. X 3 − 6X 2 + 11X − 6 : X − 1 = X 2 − 5X + 6 − X3 + X2 − 5X 2 + 11X 5X 2 − 5X 6X − 6 − 6X + 6 0 Die weiteren Nullstellen von p sind Nullstellen des Quotienten q = X 2 − 5X + 6. Da q ein Polynom zweiten Grades ist, können wir die p-q-Formel benutzen, um die Nullstellen zu finden. Die Diskriminante ist in diesem Falle 2 25 25 24 1 1 D= −6= − = = . 4 4 4 4 2 Es gilt a2 = − −5 √ 5 1 + D= + =3 2 2 2 114 STEFAN GESCHKE und −5 √ 5 1 − D = − = 2. 2 2 2 Damit haben wir alle Nullstellen von p gefunden. a3 = − 8.4. Vektorrechnung und Matrizenringe. In diesem Abschnitt führen wir noch einen Ring ein, bei dem das Kommutativgesetz für die Multiplikation nicht gilt. Dieser Ring wird im nächsten Semester in eine wichtige Rolle spielen. Erinnerung: Für einen Körper K und n ∈ N ist K n die Menge aller n-Tupel mit Einträgen aus K. Wir definieren eine Addition auf K n . Definition 8.29. Wir nennen die Elemente von K n Vektoren. Die Summe zweier Vektoren (a1 , . . . , an ), (b1 , . . . , bn ) ∈ K n definieren wir komponentenweise. Es sei (a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ). Außerdem definieren wir die Multiplikation von Vektoren mit Elementen des Körpers K. Sei α ∈ K und v = (a1 , . . . , an ) ∈ K n . Dann sei αv := (αa1 , . . . , αan ). In diesem Zusammenhang nennt man α einen Skalar mit dem der Vektor v skaliert wird. Beispiel 8.30. Wir stellen uns Vektoren in R2 als Punkte in der Anschauungsebene oder als Pfeile vom Nullpunkt zu einem Punkt in der Ebene vor. Die Summe von Vektoren lässt sich dann geometrisch als Aneinanderreihung von Pfeilen interpretieren. Entsprechendes gilt in R3 oder ganz allgemein in Rn , wobei unsere Anschauung im Falle n > 3 natürlich sehr herausgefordert wird. Sei v := (−1, 3) und w := (2, −1). y-Achse w (um v verschoben) v v+w w x-Achse Sei α = 2.5. Dann ist αv = (−2.5, 7.5). Die Multiplikation mit dem Skalar α entspricht einer Streckung um den Faktor α. Satz 8.31. Sei K ein Körper und n ∈ N. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 115 a) (K n , +) ist eine abelsche Gruppe. Das neutrale Element der Addition ist der Vektor (0, . . . , 0), den wir den Nullpunkt nennen. b) Für alle v, w ∈ K n und alle α, β ∈ K gilt (1) α(v + w) = αv + αw (2) (α + β)v = αv + βv (3) (α · β)v = α(βv) (4) 1v = v. Beweis. a) Die Axiome für abelsche Gruppen rechnet man schnell nach. Dabei wird nur verwendet, dass (K, +) eine abelsche Gruppe ist. b) Die Eigenschaften der Multiplikation von Vektoren mit Skalaren rechnet man schnell nach. Eine Struktur der Form K n mit der Operation + und der Multiplikation mit Skalaren ist ein Vektorraum. Wir werden Vektorräume im zweiten Teil der Vorlesung studieren. Beispiel 8.32. Wir betrachten wieder R2 und v = (−1, 3). Sei U = {αv : α ∈ R}. Dann ist U eine Untergruppe von (R2 , +). Für α, β ∈ R gilt nämlich nach Satz 8.31 αv − βv = (α + (−β))v ∈ U . Nach unserem Kriterium für Untergruppen folgt nun, dass U tatsächlich eine Untergruppe von (R2 , +) ist. Die Menge U der skalaren Vielfachen von v ist einfach die Gerade durch den 0-Punkt, die den Vektor v enthält. Die Nebenklassen von U in R2 sind die Geraden in R2 , die zu der Geraden U parallel sind. Wir definieren noch eine weitere Operation zwischen Vektoren in K n . Definition 8.33. Seien (a1 , . . . , an ), (b1 , . . . , bn ) ∈ K n . Dann ist das (Standard-) Skalarprodukt von v = (a1 , . . . , an ) und w = (b1 , . . . , bn ) das Körperelement hv, wi := a1 b1 + · · · + an bn . Die Bezeichnungen „Skalarprodukt“ und „Multiplikation mit einem Skalar“ geben leicht Anlass zur Verwirrung. Es handelt sich um die Standardbezeichnungen und man muss aufpassen, dass man sich immer genau klarmacht, worum es geht. Beispiel 8.34. Wir rechnen wieder über dem Körper R. Sei v = (1, 2, 3) und w = (−1, 2, 1). Dann gilt hv, wi = 1 · (−1) + 2 · 2 + 3 · 1 = −1 + 4 + 3 = 6. Man erinnere sich an den Satz von Pythagoras: In einem rechtwinkligen Dreieck, in dem die Längen der Katheten, also der Seiten, die am rechten Winkel anliegen, a und b sind, gilt für die Länge c der Hypothenuse, also der Seite, die dem rechten 116 STEFAN GESCHKE Winkel genüber liegt, die Gleichung a2 + b2 = c2 . Insbesondere ist der Abstand des Punktes (a, b) ∈ R2 vom Nullpunkt genau p p a2 + b2 = h(a, b), (a, b)i. y-Achse √ (a, b) a2 + b2 b a x-Achse In höheren Dimensionen gilt das Entsprechende. Daher nennen wir für einen p hv, vi den Betrag von v. Der Betrag von v ist Vektor v ∈ Rn die Zahl |v| = nichts anderes als der Abstand von v vom 0-Punkt. Der Betrag |λ| einer reellen Zahl λ ist der Wert den man erhält, wenn man das Vorzeichen von λ weglässt. So ist | − 5| = 5, |2.5| = 2.5 und |0| = 0. Der folgende Satz fasst die Eigenschaften des Standardsskalarprodukts und des Betrages zusammen. Satz 8.35. a) Sei K ein Körper und n ∈ N. Dann gelten folgende Aussagen für alle α ∈ K und alle u, v, w ∈ K n : (1) hv, wi = hw, vi (2) hαv, wi = αhv, wi (3) hu + v, wi = hu, wi + hv, wi b) Für alle n ∈ N, alle v, w ∈ Rn und alle λ ∈ R gelten die folgenden Aussagen: (1) |v| ≥ 0 (2) |v| = 0 ⇔ v = (0, . . . , 0) (3) |λv| = |λ|v (4) |v + w| ≤ |v| + |w| (Dreiecksungleichung) Auf den Beweis dieses Satzes gehen wir hier aus Zeitgründen noch nicht ein. MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK 117 Definition 8.36. Seien m, n ∈ N und sei K ein Körper. Eine m × n-Matrix über K ist ein rechteckiges Zahlenschema der Form a11 a12 . . . a1n a21 a22 . . . a2n . .. .. . , . . . am1 am2 ... amn wobei die aij Elemente von K sind. Wir schreiben eine solche Matrix kürzer als (aij )1≤i≤m∧1≤j≤n oder auch einfach als (aij ), wenn die Dimension m×n der Matrix klar ist. In einer solchen Matrix nennen wir (ai1 , . . . , ain ) die i-te Zeile und a1j . . . amj die j-te Spalte. Die Menge der m × n-Matrizen über dem Körper K bezeichnen wir mit K m×n . Man beachte, dass eine m × n-Matrix im wesentlichen denselben Informationsgehalt wie ein Vektor in K m·n hat, nur dass die Matrix graphisch anders dargestellt wird. Entsprechend definieren wir auch die Summe von zwei m × n-Matrizen. Definition 8.37. Für zwei m × n-Matrizen A = (aij ) und B = (bij ) über einem Körper K sei A + B die Matrix (aij + bij ). Der Eintrag in der i-ten Zeile und der j-ten Spalte der Matrix A+B lautet also aij +bij . Die m×n-Matrix, deren Einträge alle 0 sind, nennen wir die Nullmatrix (im Format m × n). Für α ∈ K und A = (aij ) ∈ K m×n sei αA := (αaij )1≤i≤m∧1≤j≤n . Wie im Falle von K n sieht man schnell, dass (K m×n , +) eine abelsche Gruppe ist. Neben der Addition von Matrizen und der Multiplikation von Matrizen mit Skalaren gibt es eine weitere Verknüpfung von Matrizen, die fast noch wichtiger ist als die beiden schon genannten Operationen, nämlich die Matrizenmultiplikation. Definition 8.38. Sei K ein Körper und seien `, m, n ∈ N. Weiter sei A = (aij ) ∈ K `×m und B = (bjk ) ∈ K m×n . Dann ist AB = A · B die ` × n-Matrix C = (cik ), deren Eintrag cik das Körperelement ai1 b1k + · · · + aim bmk , also das Skalarprodukt der i-ten Zeile von A mit der k-ten Spalte von B, ist. Es gilt also AB = m X j=1 aij bjk . 1≤i≤`∧1≤k≤n 118 STEFAN GESCHKE Eine wichtige, nichttriviale Eigenschaft der Matrizenmultiplikation ist die Assoziativität. Satz 8.39. Sei K ein Körper und seien k, `, m, n ∈ N. Sind A ∈ K k×` , B ∈ K `×m und C ∈ K m×n , so gilt (A · B) · C = A · (B · C). Betrachtet man n × n-Matrizen für ein festes n, so kann man die Matrizen in beliebiger Reihenfolge multiplizieren und erhält wieder n × n-Matrizen. Satz 8.40. Sei n ∈ N und sei K ein Körper. Dann ist (K n×n , +, ·) ein Ring, der Ring der n × n-Matrizen über K. Das neutrale Element bezüglich der Multiplikation in K n×n ist die Einheitsmatrix 1 0 0 1 En = .. .. . . 0 0 ... 0 ... 0 .. , . ... 1 bei der auf der Diagonalen Einsen stehen und sonst nur Nullen. Die Einheitengruppe des Matrizenringes K n×n sind die invertierbaren Matrizen. Der Matrizenring K n×n ist für n > 1 nicht kommutativ. Matrizen und ihre Multiplikation spielen eine wesentliche Rolle im Page-Rank-Algorithmus mit dem zum Beispiel Google die Reihenfolge der Suchergebnisse festlegt.