DISKRETE MATHEMATIK

MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK UND
WIRTSCHAFTSINFORMATIK (DISKRETE MATHEMATIK) IM
WINTERSEMESTER 2015/16
STEFAN GESCHKE
Inhaltsverzeichnis
Einleitung
3
Literatur
3
1.
Aussagen, Mengen und Boolesche Algebra
4
1.1.
Mengen
4
1.2.
1.3.
Elementare Logik
Mengenoperationen
4
8
1.4.
Abbildungen
10
1.5.
Boolesche Algebra
12
2.
Elementare Zahlentheorie
15
2.1.
Das Summenzeichen
15
2.2.
Natürliche Zahlen und vollständige Induktion
16
2.3.
Ganze und rationale Zahlen
25
2.4.
Die reellen Zahlen
27
2.5.
Teilbarkeit, Primzahlen und der euklidische Algorithmus
29
2.6.
Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches
31
2.7.
Modulare Arithmetik
33
Elementare Kombinatorik
36
3.
3.1.
Ziehen von Elementen einer Menge
43
3.2.
Der Multinomialsatz
45
3.3.
Das Schubfachprinzip (pigeonhole principle)
45
3.4.
Das Prinzip der Inklusion und Exklusion (Siebformel)
46
3.5.
4.
Die Abzählbarkeit von Q und die Überabzählbarkeit von R
Relationen
48
51
4.1.
Partitionen und Äquivalenzrelationen
52
4.2.
Ordnungsrelationen
53
4.3.
Hüllenbildungen
55
4.4. n-stellige Relationen
57
4.5.
58
5.
Mehr über Abbildungen
Graphen
61
5.1.
Grundlegende Definitionen
61
5.2.
Eulersche Linien und Hamiltonsche Kreise
1
68
2
STEFAN GESCHKE
5.3.
Gerichtete Graphen
71
5.4.
Bäume
73
Breiten- und Tiefensuche
74
5.5.
6.
6.1.
7.
Elementare Zahlentheorie (Fortsetzung)
RSA-Verschlüsselungsverfahren
Gruppentheorie
77
83
85
7.1.
Algebraische Strukturen, Halbgruppen und Monoide
85
7.2.
Gruppen
87
7.3.
Die Ordnung eines Gruppenelements
90
7.4.
Isomorphie von Gruppen
91
7.5.
Zyklische Gruppen
92
7.6.
Untergruppen und Nebenklassen
94
7.7.
Permutationen
99
8.
Ringe, Körper und Polynome
102
8.1.
Ringe
102
8.2.
Der Polynomring K[X]
103
8.3.
Polynomfunktionen und Nullstellen von Polynomen
110
8.4.
Vektorrechnung und Matrizenringe
114
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
3
Einleitung
In der Mathematik I für Studierende der Informatik und Wirtschaftsinformatik beschäftigen wir uns neben allgemeinen mathematischen Grundlagen mit der
sogenannten diskreten Mathematik.
Dieses Skript orientiert sich an dem dem Skript von Thomas Andreae [2] aus
dem Wintersemester 2013/2014. Die anderen Bücher in der Literaturliste stellen
eine gute Ergänzung dar.
Literatur
[1] M. Aigner, Diskrete Mathematik, vieweg studium: Aufbaukurs Mathematik, Friedr. Vieweg
& Sohn, Wiesbaden, 2004
[2] T. Andreae, Mathematik I für Studierende der Informatik und Wirtschaftsinformatik (Diskrete Mathematik), Skript zur gleichnamigen Vorlesung im Wintersemester
2013/2014, Universität Hamburg
[3] R. Diestel, Graphentheorie, 4. Auflage, Springer, 2010
[4] G. Fischer, Lineare Algebra, 18. Auflage, Springer, 2014
[5] G. M. Gramlich, Lineare Algebra, 2. Auflage, Carl Hanser Verlag GmbH & Co. KG, 2009
[6] J. Matousek, J. Nesetril, An Invitation to Discrete Mathematics, Oxford University
Press, second edition, 2008
[7] A. Steger, Diskrete Strukturen, Band 1, 3. Auflage, Springer, 2008
[8] G. Teschl, S. Teschl, Mathematik für Informatiker, Band 1 (Diskrete Mathematik und
Lineare Algebra), 3. Auflage, Springer, 2008
[9] V. Turau, Algorithmische Graphentheorie, Oldenbourg Wissenschaftsverlag, 2009
4
STEFAN GESCHKE
1. Aussagen, Mengen und Boolesche Algebra
1.1. Mengen.
Definition 1.1. Eine Menge ist eine Zusammenfassung bestimmter, wohlunterschiedener Objekte, die die Elemente der Menge genannt werden.
Bei Mengen kommt es nicht auf die Reihenfolge der Elemente an. Auch können
Elemente in einer Menge nicht mehrfach vorkommen. Eine Menge ist durch ihre
Elemente eindeutig bestimmt. Daher schreiben wir A = B für zwei Mengen A und
B, wenn A und B dieselben Elemente haben.
Definition 1.2. Ist x ein Element der Menge M , so schreiben wir x ∈ M . x 6∈ M
bedeutet, dass x kein Element von M ist. Sind A und B Mengen, so schreiben wir
A ⊆ B, wenn A eine Teilmenge von B ist, also wenn jedes Element von A auch
Element von B ist. Die (eindeutig bestimmte) Menge, die keine Elemente hat, heißt
die leere Menge. Sie wird als {} oder ∅ notiert.
Mengen kann man notieren, indem man ihre Elemente in geschweiften Klammern
angibt. {4, 7, 13} bezeichnet zum Beispiel die Menge, deren Elemente die genau die
Zahlen 4, 7 und 13 sind. Da es nur auf die Elemente selbst und nicht auf deren
Reihenfolge ankommt, bezeichnen {3, 4, 5} und {4, 5, 3} dieselbe Menge. Wenn ein
Element mehrfach genannt wird, so wird das ignoriert, da eine Menge jedes Element
nur einmal enthält. Daher bezeichnen {1, 2, 1, 1} und {1, 2} dieselbe Menge. Z =
{. . . , −1, 0, 1, 2, . . . } ist die Menge der ganzen Zahlen. N ist die Menge {1, 2, 3, . . . }
der natürlichen Zahlen. (Viele Autoren lassen die natürlichen Zahlen bei 0 anfangen.
Wir folgen hier jedoch Andreae [2] und den Teschls [8].) N0 sei die Menge der
natürlichen Zahlen zusammen mit der 0, also N0 = {0, 1, 2, . . . }.
{n : n ist eine natürliche Zahl mit 5 < n < 10}
ist die Menge der natürlichen Zahlen , die echte größer als 5 und echt kleiner als 10
sind, also die Menge {6, 7, 8, 9}. Auf diese Weise kann man auch unendliche Mengen
notieren. So ist
{n : n ist eine durch 2 teilbare natürliche Zahl}
die Menge der geraden natürlichen Zahlen.
1.2. Elementare Logik.
Definition 1.3. Eine Aussage ist ein Satz, von dem man im Prinzip eindeutig
feststellen kann, ob er wahr oder falsch ist. Ob eine Aussage wahr oder falsch ist,
ist der Wahrheitswert der Aussage. Der Wahrheitswert „wahr“ wird dabei oft mit
„w“ oder „1“ abgekürzt, der Wahrheitswert „falsch“ mit „f “ oder „0“.
Der Satz „Die Straße ist nass“ ist eine Aussage. Ebenso sind „2 + 5 = 7“ und
„2+5 < 3“ Aussagen, wobei die erste wahr und die zweite falsch ist. „Guten Abend!“
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
5
ist keine Aussage. Ebenso ist „n2 = 4“ keine Aussage, da wir nicht feststellen
können, ob diese Formel wahr oder falsch ist, solange wir nicht wissen, was n ist.
Aussagen können mit den logischen Verknüpfungen „und“, „oder“ und „nicht“ verknüpft werden. Allerdings ist die Bedeutung dieser Wörter in der Umgangssprache
nicht immer ganz eindeutig. Daher ist es sinnvoll, diese Verknüpfungen für formale
Zwecke zu präzisieren.
Definition 1.4. Ist a eine Aussage, so ist die Negation von a die Aussage, die
genau dann wahr ist, wenn a falsch ist. Die Negation von a wird ¬a geschrieben und
„nicht a“ gelesen. Sind a und b Aussagen, so ist die Konjunktion von a und b die
Aussage, die genau dann wahr ist, wenn sowohl a als auch b wahr ist. Die Konjunktion von a und b wird a ∧ b geschrieben und „a und b“ gelesen. Die Disjunktion
von a und b ist die Aussage, die genau dann wahr ist, wenn mindestens eine der
Aussagen a und b wahr ist. Die Disjunktion von a und b wird a ∨ b geschrieben und
„a oder b“ gelesen.
Den Wahrheitswert einer durch logische Verknüpfungen aus anderen Aussagen gebildeten Aussage in Abhängigkeit der Wahrheitswerte der Ausgangsaussagen
kann man in Form einer Wahrheitstafel beschreiben:
a
b
a∧b
a∨b
a
¬a
0
0
0
0
0
1
0
1
0
1
1
0
1
0
0
1
1
1
1
1
Definition 1.5. Weitere wichtige logische Verknüpfungen sind die Implikation →,
die Äquivalenz ↔ und das exklusive Oder xor. Wir definieren diese Verknüpfungen
mit Hilfe einer Wahrheitstafel.
a→b a↔b
a
b
0
0
1
1
0
0
1
1
0
1
1
0
0
0
1
1
1
1
1
0
xor
Die Aussage a → b ist also immer dann wahr, wenn a falsch ist oder b wahr. Ist
a → b wahr, so sagen wir „b folgt aus a“ oder „a impliziert b“. Die Aussage a ↔ b
ist immer dann wahr, wenn a und b entweder beide falsch oder beide wahr sind.
Ist a ↔ b wahr, so nennen wir a und b äquivalent. Die Zeichen → und ↔ werden
normalerweise nur in formalen Ausdrücken verwendet, während wir im normalen
mathematischen Text ⇒ und ⇔ benutzen. Ein klassisches Beispiel ist die Aussage
„wenn es regnet, ist die Straße nass“, die sich mit Hilfe von ⇒ so schreiben lässt:
Es regnet ⇒ Die Straße ist nass.
6
STEFAN GESCHKE
(Wir ignorieren in diesem Beispiel das Problem, dass die Wahrheitswerte von „es
regnet“ und „die Straße ist nass“ natürlich von Ort und Zeitpunkt abhängen. Wir
können uns zum Beispiel vorstellen, dass wir Ort und Zeit schon fest gewählt haben.)
Die Aussage a xor b ist genau dann wahr, wenn die Wahrheitswerte von a und b
unterschiedlich sind.
Mit Hilfe von Wahrheitstafeln können wir die Wahrheitswerte komplizierterer
Aussagen untersuchen, die durch Verknüpfungen einfacherer Aussagen entstanden
sind. Seien zum Beispiel a, b und c Aussagen und e die Aussage a ∧ (b ∨ c). Falls
die Wahrheitswerte von a, b und c bekannt sind, so können wir zunächst den Wahrheitswert von b ∨ c bestimmen und dann den von a ∧ (b ∨ c). Auf diese Weise erhält
man folgende Wahrheitstafel:
b ∨ c a ∧ (b ∨ c)
a
b
c
0
0
0
0
0
0
0
1
1
0
0
1
0
1
0
0
1
1
1
0
1
0
0
0
0
1
0
1
1
1
1
1
0
1
1
1
1
1
1
1
Wenn man eine entsprechende Wahrheitstafel für (a ∧ b) ∨ (a ∧ c) aufstellt, sieht
man, dass a ∧ (b ∨ c) und (a ∧ b) ∨ (a ∧ c) äquivalent sind, unabhängig davon,
welche Wahrheitswerte die Aussagen a, b und c haben. Aus diese Weise lassen sich
Rechenregeln für ∨, ∧ und ¬ nachweisen. Das ist das Wahrheitstafelverfahren.
Wir halten zunächst folgenden Satz fest:
Satz 1.6. Sind a, b und c Aussagen, so ist a ∧ (b ∨ c) äquivalent zu (a ∧ b) ∨ (a ∧ c).
Eine weitere wichtige Regel ist die sogenannte Kontraposition, die man oft in
Beweisen anwenden kann.
Satz 1.7. Seien a und b Aussagen. Die Aussage a → b ist äquivalent zu ¬b → ¬a.
Beweis. Wir schreiben die entsprechende Wahrheitstafel auf.
a
b
¬a
0
0
1
¬b a → b
1
1
¬b → ¬a
1
0
1
1
0
1
1
1
0
0
1
0
0
1
1
0
0
1
1
Wie man leicht abliest, sind a → b und ¬b → ¬a in der Tat äquivalent.
Beispiel 1.8. Der Satz „wenn es neblig ist, ist die Sicht schlecht“ ist äquivalent zu
„wenn die Sicht nicht schlecht ist, dann ist es nicht neblig“.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
7
Unter dem Stichwort „Boolesche Algebra“ werden später noch weitere Rechenregeln für logische Verknüpfungen festhalten.
Definition 1.9. Eine Aussageform ist eine Aussage, in der eine Konstante durch
eine Variable ersetzt wurde. So erhält man aus einer Aussage a eine Aussageform
a(x).
„2 + 5 = 7“ ist eine Aussage. Daraus lässt sich zum Beispiel die Aussageform
„2 + x = 7“ ableiten. Sei a(x) diese Aussageform. Ein Wahrheitswert von a(x)
lässt sich nicht angeben, da wir nicht wissen, welchen Wert x hat. Wenn wir für x
einen Wert einsetzen, dann erhalten wir wieder eine Aussage. So ist a(5), also die
ursprüngliche Aussage, wahr, während a(2), also die Aussage „2 + 2 = 7“, falsch ist.
Auch Aussageformen können mittels logischer Verknüpfungen verknüpft werden.
Ist a(x) die Aussageform „2 + x ≤ 7“, so ist ¬a(x) die Aussageform „2 + x 6≤ 7“
oder, anders geschrieben, „2 + x > 7“. Ist a(x) die Aussageform „x = 2“ und b(x)
die Aussageform „x2 = 4“, so verstehen wir, was „a(x) ⇒ b(x)“ bedeutet:
Wenn x = 2 ist, so ist x2 = 4.
Setzen wir für x konkrete natürliche Zahlen ein, so erhalten wir immer eine wahre
Aussage. Mit anderen Worten, die Aussage
Für alle natürlichen Zahlen x gilt: a(x) ⇒ b(x)
ist wahr. Den Satzteil „für alle natürlichen Zahlen x“ nennen wir einen Quantor.
Mit Hilfe von Quantoren können wir aus Aussageformen wieder Aussagen machen.
Definition 1.10. Sei a(x) eine Aussageform und M eine Menge. Dann ist
(∃x ∈ M )a(x)
die Aussage, die genau dann wahr ist, wenn es mindestens ein Element x der Menge
M gibt, so dass a(x) gilt. (∃x ∈ M )a(x) wird „es gibt ein x in M mit a(x)“ gelesen.
Das Zeichen ∃ ist der Existenzquantor.
(∀x ∈ M )a(x)
ist die Aussage, die genau dann wahr ist, wenn a(x) für alle Elemente x der Menge
M gilt. (∀x ∈ M )a(x) wird „für alle x in M gilt a(x)“ gelesen. Das Zeichen ∀ ist
der Allquantor.
Im Zusammenhang mit Quantoren, und auch sonst, werden wir Klammern immer
so setzen, beziehungsweise weglassen, dass die Lesbarkeit optimal ist.
Ein typisches Beispiel einer Existenzaussage, also einer Aussage, die mit einem
Existenzquantor beginnt, ist die Aussage ∃x ∈ N(x2 = 4). Ein typisches Beispiel
einer Allaussage, also einer Aussage, die mit einem Allquantor beginnt, ist die
Aussage ∀x ∈ N(x2 > 0).
Oft betrachten wir Aussageformen wie „(n + 1)2 = n2 + 2n + 1“. Bei dieser
Aussageform ist klar, dass für n eine Zahl eingesetzt werden soll, und nicht anderes.
8
STEFAN GESCHKE
Außerdem steht die Variable n üblicher Weise für eine natürliche Zahl. Unsere
Erfahrung sagt uns also, dass wir, wenn wir „(n + 1)2 = n2 + 2n + 1“ hinschreiben,
wir oft eigentlich „∀n ∈ N((n + 1)2 = n2 + 2n + 1)“ meinen.
Die Negation ¬(∀x ∈ M )a(x) der Allaussage (∀x ∈ M )a(x) ist äquivalent zu
der Existenzaussage (∃x ∈ M )¬a(x). Das wird an einem Beispiel schnell klar: „Alle
Autos in Hamburg sind blau“ ist sicher falsch, es gilt vielmehr „nicht alle Auto in
Hamburg sind blau“, was äquivalent zu der Aussage „es gibt in Hamburg (mindestens) ein Auto, das nicht blau ist“ ist. Analog ist ¬(∃x ∈ M )a(x) zu (∀x ∈ M )¬a(x)
äquivalent.
1.3. Mengenoperationen. Wir definieren einige Verknüpfungen von Mengen, mit
denen sich ganz ähnlich rechnen lässt wie mit den Verknüpfungen ∧, ∨ und ¬ von
Aussagen. Die Rechengesetze, die für die logischen Verknüpfungen (von Aussagen)
und für die entsprechenden Verknüpfungen von Mengen gelten, fasst man unter
dem Begriff „Boolesche Algebra“ zusammen.
Definition 1.11. Seien A und B Mengen. Dann ist die Vereinigung von A und
B definiert als
A ∪ B := {x : x ∈ A ∨ x ∈ B}.
(Hier benutzen wir das Zeichen := um auszudrücken, dass es sich um eine Definition
handelt.) Der Schnitt oder Durchschnitt von A und B ist die Menge
A ∩ B := {x : x ∈ A ∧ x ∈ B}.
Zwei Mengen A und B heißen disjunkt, falls A∩B = ∅. Die mengentheoretische
Differenz von A und B ist die Menge
A \ B := {x ∈ A : x 6∈ B}.
Schon anhand der Definition von ∪ und ∩ sieht man, dass ∪ etwas mit ∨ zu tun
hat und ∩ mit ∧. Und in der Tat verhalten sich ∩ und ∪ ähnlich wie ∧ und ∨. Eine
Operation auf Mengen, die sich analog zur Negation verhält, ist die Komplementbildung.
Definition 1.12. Für eine Menge M sei
P(M ) := {x : x ⊆ M }
die Potenzmenge von M . Wir fixieren M und betrachten nur Teilmengen von M .
Für A ∈ P(M ) sei
A := {x ∈ M : x 6∈ A}
das Komplement von A in M .
Wir stellen fest, das P(M ) unter ∪, ∩ und Komplementbildung abgeschlossen
ist. D.h., für alle A, B ∈ P(M ) sind A ∩ B, A ∪ B und A wieder Elemente von
P(M ).
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
9
Rechenregeln für die Mengenoperationen ∩, ∪ und Komplementbildung können
wir wieder mit dem Wahrheitstafelverfahren herleiten. Seien zum Beispiel A, B und
C Teilmengen einer Menge M .
Satz 1.13. Es gilt A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
Beweis. Wir wissen schon, dass A ∩ (B ∪ C) und (A ∩ B) ∪ (A ∩ C) Teilmengen
von M sind. Also müssen wir nur zeigen, dass die beiden Mengen genau dieselben
Elemente von M enthalten.
Es gilt
A ∩ (B ∪ C) = {x ∈ M : x ∈ A ∧ (x ∈ B ∨ x ∈ C)}
sowie
(A ∩ B) ∪ (A ∩ C) = {x ∈ M : (x ∈ A ∧ x ∈ B) ∨ (x ∈ A ∨ x ∈ C)}.
Wir fixieren nun ein beliebiges Element x von M . Sei a die Aussage x ∈ A, b die
Aussage x ∈ B und c die Aussage x ∈ C. Man beachte, dass wir hier so tun, als
wären a, b und c Aussagen, da wir das x vorher fixiert haben und wir es jetzt wie
eine Konstante behandeln können.
Nach Satz 1.6 sind a ∧ (b ∨ c) und (a ∧ b) ∨ (a ∧ c) äquivalent. Damit gilt
x ∈ A ∩ (B ∪ C) ⇔ a ∧ (b ∨ c) ⇔ (a ∧ b) ∨ (a ∧ c) ⇔ x ∈ (A ∩ B) ∪ (A ∩ C)
Also haben A ∩ (B ∪ C) und (A ∩ B) ∪ (A ∩ C) dieselben Elemente und sind damit
gleich.
Wir haben bisher die Frage nach der Gleichheit zweier Mengen auf die Frage
zurückgeführt, ob zwei Aussagen äquivalent sind. Die letztere Frage ließ sich mit
Hilfe des Wahrheitstafelverfahrens klären. Damit lässt sich das Wahrheitstafelverfahren manchmal einsetzen, um die Gleichheit zweier Mengen nachzuweisen. Im
allgemeinen ist es allerdings meistens ratsam, die Gleichheit zweier Mengen A und
B nachzurechnen, indem man zunächst A ⊆ B und dann B ⊆ A zeigt.
Beispiel 1.14. Wir beweisen die Gleichung A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) ohne
das Wahrheitstafelverfahren. Als erstes zeigen wir A ∩ (B ∪ C) ⊆ (A ∩ B) ∪ (A ∩ C).
Dazu müssen wir zeigen, dass jedes Element von A ∩ (B ∪ C) auch ein Element von
(A ∩ B) ∪ (A ∩ C) ist.
Sei also x ∈ A ∩ (B ∪ C). Dann ist x sowohl in A als auch in B ∪ C enthalten.
Also ist x in B oder in C enthalten. Ist x in B enthalten, so gilt x ∈ A ∩ B. Ist x
in C enthalten, so gilt x ∈ A ∩ C. Damit ist x in A ∩ B oder in A ∩ C enthalten.
Also gilt x ∈ (A ∩ B) ∪ (A ∩ C).
Das zeigt A ∩ (B ∪ C) ⊆ (A ∩ B) ∪ (A ∩ C). Wir zeigen nun (A ∩ B) ∪ (A ∩ C) ⊆
A ∩ (B ∪ C).
Sei x ∈ (A ∩ B) ∪ (A ∩ C). Dann ist x in A ∩ B oder in A ∩ C enthalten. Wir
nehmen zunächst an, dass x ∈ A ∩ B gilt. Dann ist x in A und in B enthalten.
Damit ist x aber auch in B ∪ C enthalten. Es folgt x ∈ A ∩ (B ∪ C).
10
STEFAN GESCHKE
Nun nehmen wir an, dass x ∈ A∩C gilt. Wie eben sehen wir, dass x ∈ A∩(B ∪C)
gilt.
Also gilt x ∈ A ∩ (B ∪ C) unabhängig davon, ob x ein Element von A ∩ B oder
A ∩ C ist.
Das zeigt (A ∩ B) ∪ (A ∩ C) ⊆ A ∩ (B ∪ C). Insgesamt folgt nun die Gleichheit
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
Definition 1.15. Sind A und B Mengen, so bezeichnet man mit A × B die Menge
{(a, b) : a ∈ A und b ∈ B} aller geordneten Paare (a, b), deren erste Komponente
a ein Element von A ist und deren zweite Komponente b ein Element von B sind.
A × B heißt das kartesische Produkt der Mengen A und B. Mit A2 bezeichnet
man die Menge A × A.
A3 ist die Menge {(a1 , a2 , a3 ) : a1 , a2 , a3 ∈ A} aller Tripel von Elementen von A.
Analog ist für jede natürliche Zahl n ≥ 1 An die Menge {(a1 , . . . , an ) : a1 , . . . , an ∈
A} aller n-Tupel von Elementen von A.
Zum Beispiel ist
{1, 2, 3} × {4, 5} = {(1, 4), (1, 5), (2, 4), (2, 5), (3, 4), (3, 5)}.
1.4. Abbildungen.
Definition 1.16. Eine Abbildung von einer Menge A in eine Menge B ist eine
Zuordnung, die jedem Element von A ein Element von B zuordnet. Abbildungen
werden oft auch Funktionen genannt. Ist f eine Abbildung von A nach B, so
schreiben wir f : A → B. Dabei wird A der Definitionsbereich von f genannt
und B der Wertevorrat. Auch der Begriff Vorbereich für A und Nachbereich
für B ist sinnvoll. Schließlich wird B manchmal auch der Wertebereich von f
genannt, wobei das zu Verwechslungen mit dem Bild von f führen kann, welches
wir weiter unten definieren.
Für jedes a ∈ A bezeichnen wir mit f (a) das Element von B, das die Funktion
f dem Element a zuordnet. Falls f einem Element a ∈ A also b ∈ B zuordnet,
so schreiben wir f (a) = b und sagen „f bildet a auf b ab“. Das Element b heißt
der Wert oder der Funktionswert von f an der Stelle a. Man kann anstelle von
f (a) = b auch a 7→ b schreiben, wenn klar ist, welche Funktion f gemeint ist.
Das Bild von f ist die Menge {f (x) : x ∈ A}.
Der Name Wertebereich wird von manchen Autoren für das Bild einer Funktion verwendet und von anderen für den Wertevorrat. Um Missverständnissen vorzubeugen, verwenden wir diesen Begriff gar nicht.
Beispiel 1.17.
(1) Eine Funktion f von der Menge N der natürlichen Zahlen
in die natürlichen Zahlen kann zum Beispiel durch eine Formel gegeben sein:
f (n) = n2 . Ein Schreibweise, die alle wesentlichen Informationen beinhaltet,
wäre dann
f : N → N; n 7→ n2 .
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
11
(2) Der Ausdruck g : N2 → N, (m, n) 7→ m + n beschreibt eine Funktion von
der Menge der Paare natürlicher Zahlen in die Menge der natürlichen Zahlen, die der Gleichung g((m, n)) = m + n genügt. Anstelle von g((m, n))
schreiben wir auch g(m, n).
(3) Funktionen mit endlichem Definitionsbereich kann man auch in Form einer
Tabelle angeben. Sei zum Beispiel A = {1, 2, 3, 4, 5} und B = {q, w, e, r, t, z}.
Dann definiert die folgende Tabelle die Funktion f : A → B:
a
1
2
3
4
5
f(a) w
q
t
w
e
Es gilt nun f (1) = w, f (2) = q und so weiter.
Definition 1.18. Eine Abbildung f : A → B heißt
(1) injektiv, falls für alle x, y ∈ A gilt: Ist x 6= y, so ist f (x) 6= f (y).
(2) surjektiv, falls es für alle b ∈ B mindestens ein a ∈ A gibt, so dass f (a) = b
gilt.
(3) bijektiv, falls sie injektiv und surjektiv ist.
Beispiel 1.19.
(1) Sei A = {1, 2, 3} und B = {1, 2, 3}. Die Abbildung f : A →
B mit f (1) = 1, f (2) = 1 und f (3) = 2 ist weder injektiv noch surjektiv.
(2) Seien A und B wie in (1). Die Funktion g : A → B mit g(1) = 2, g(2) = 3
und g(3) = 1 ist sowohl injektiv als auch surjektiv, also bijektiv.
(3) Sei wieder A = {1, 2, 3} aber B = {3, 7}. Die Abbildung f : A → B mit
f (1) = 3, f (2) = 7 und f (3) = 3 ist surjektiv, aber nicht injektiv.
(4) Sei nun A wie in (1)–(3) und B = {1, 2, 3, 4}. Die Funktion f : A → B mit
f (1) = 2, f (2) = 1, f (3) = 4 ist injektiv, aber nicht surjektiv.
(5) Die Abbildung h : N → N; n 7→ n2 ist nicht surjektiv, da es zum Beispiel
kein a ∈ N gibt, für das h(a) = 3 gilt.
Das kann man wie folgt einsehen: Angenommen, es gäbe doch ein a ∈ N
√
√
√
mit h(a) = a2 = 3. Dann ist a entweder 3 oder − 3. Beide Zahlen, 3
√
und − 3, sind aber keine Elemente von N. Das widerspricht der Annahme
a ∈ N.
Eine andere Möglichkeit zu zeigen, dass 3 nicht im Bild von f liegt ist
die folgende: Es gelten 12 = 1 < 3 und 22 = 4 > 3. Für alle n ≥ 2 ist
n2 ≥ 22 und damit n2 > 3. Damit gibt es kein n ∈ N mit n2 = 3.
Die Abbildung h ist aber injektiv. Seien nämlich x, y ∈ N mit x 6= y.
Dann ist entweder x < y oder y < x. Wir betrachten nur den ersten Fall,
der zweite Fall kann genauso behandelt werden. Wir nehmen also x < y
an. (Später werden wir in so einer Situation zum Beispiel schreiben „ohne
Beschränkung der Allgemeinheit (o.B.d.A.) können wir x < y annehmen“.)
Sei a = y − x. Dann ist y = x + a und y 2 = x2 + 2xa + a2 . Wegen x, a > 0
gilt 2xa + a2 > 0 und damit ist y 2 > x2 . Insbesondere gilt
h(x) = x2 6= y 2 = h(y).
12
STEFAN GESCHKE
Das zeigt, dass h injektiv ist.
Definition 1.20. Für eine natürliche Zahl n versteht man unter einer n-stelligen
Verknüpfung oder einer n-stelligen Operation auf einer Menge M eine Abbildung f : M n → M .
Der wichtigste Spezialfall ist der einer binären Verknüpfung f : M 2 → M .
Beispiele binärer Verknüpfungen sind die Addition + : N2 → N; (m, n) 7→ m + n
und die Multiplikation · : N2 → N; (m, n) 7→ m · n.
1.5. Boolesche Algebra. Wir haben schon gesehen, dass sich die Mengenoperationen ∩, ∪ und Komplementbildung ganz analog zu den logischen Verknüpfungen
∧, ∨ und ¬ verhalten. Und in der Tat kann man die Mengenoperationen und die
logischen Verknüpfungen mit einem gemeinsamen Begriff beschreiben.
Definition 1.21. Gegeben sei eine Menge B, die mindestens die zwei verschiedene
Elemente 1 und 0 enthält, zusammen mit der einstelligen Verknüpfung ¬ : B → B
und den zwei zweistelligen Verknüpfungen u, t : B 2 → B. (B, u, t, ¬, 0, 1) heißt
eine Boolesche Algebra, wenn für alle a, b, c ∈ B die folgenden Gleichungen
gelten:
(A1) Assoziativgesetze:
• a u (b u c) = (a u b) u c
• a t (b t c) = (a t b) t c
(A2) Kommutativgesetze:
• aub=bua
• atb=bta
(A3) Distributivgesetze:
• a u (b t c) = (a u b) t (a u c)
• a t (b u c) = (a t b) u (a t c)
(A4) Beschränkheit:
• au1=a
• at0=a
(A5) Komplementierung:
• a u ¬a = 0
• a t ¬a = 1
Die Aussagen (A1)–(A5) in Definition 1.21 sind die Axiome für Boolesche Algebren.
Beispiel 1.22.
(1) Die Schaltalgebra ist die Menge {0, 1} der Wahrheitswer-
te mit den Verknüpfungen ∧, ∨ und ¬. Die Schaltalgebra ist eine Boolesche
Algebra, wie man mit Hilfe des Wahrheitstafelverfahrens leicht nachrechnen
kann.
(2) Ist M eine Menge, so ist P(M ) mit den Verknüpfungen ∩, ∪ und Komplementbildung sowie den Konstanten 1 := M und 0 := ∅ eine Boolesche
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
13
Algebra, die Potenzmengenalgebra von M . Dass Potenzmengenalgebren
wirklich Boolesche Algebren sind, folgt aus der Tatsache, dass die Schaltalgebra die Axiome einer Booleschen Algebra erfüllt, zusammen mit der
Übersetzung von Fragen der Gleichheit von Mengen in Fragen der Äquivalenz von Aussagen, die wir oben schon diskutiert haben.
(3) Wir betrachten noch einen speziellen Fall, nämlich eine Boolesche Algebra,
die im wesentlichen genau die Potenzmengenalgebra auf einer achtelementigen Menge ist, die wir aber anders aufschreiben. Es sei B := {w, f }8 , also
die Menge aller 8-Tupel der Wahrheitswerte w und f . Man kann B zum
Beispiel als Menge aller möglichen Bytes interpretieren. Weiter sei
1 := (w, w, w, w, w, w, w, w)
und
0 = (f, f, f, f, f, f, f, f ).
Die Operationen definieren wir jetzt wie folgt:
Für a, b ∈ B mit a = (a1 , . . . , a8 ) und b = (b1 , . . . , b8 ) sei
a u b := (a1 ∧ b1 , . . . , a8 ∧ b8 ),
a t b := (a1 ∨ b1 , . . . , a8 ∨ b8 )
und
¬a := (¬a1 , . . . , ¬a8 ).
Dann ist (B, u, t, ¬, 0, 1) eine Boolesche Algebra, wie man leicht nachrechnet.
Alle Aussagen, die sich aus (A1)–(A5) ableiten lassen, gelten für alle Booleschen
Algebren, inbesondere also für die Schaltalgebra und alle Potenzmengenalgebren.
Diese Allgemeinheit ist die Stärke der axiomatischen Methode, bei der Sätze
aus Axiomen gefolgert werden und nicht nur für bestimmte Strukturen, wie zum
Beispiel die natürlichen Zahlen oder eine bestimmte Boolesche Algebra, bewiesen
werden.
Wir geben Beispiele für die axiomatische Methode und beweisen ein paar einfache
Regeln für Boolesche Algebren. Sei (B, u, t, ¬, 0, 1) eine Boolesche Algebra.
Satz 1.23. Für alle a ∈ B gilt a u a = a und a t a = a.
Beweis. Es gilt
(A4)
(A5)
(A3)
(A5)
(A4)
(A5)
(A4)
a u a = (a u a) t 0 = (a u a) t (a u ¬a) = a u (a t ¬a) = a u 1 = a.
Auf dieselbe Weise rechnen wir a t a = a nach.
(A4)
(A5)
(A3)
a t a = (a t a) u 1 = (a t a) u (a t ¬a) = a t (a u ¬a) = a t 0 = a.
Damit haben wir die beiden Gleichung aus den Axiomen (A1)–(A5) hergeleitet.
14
STEFAN GESCHKE
In diesem Beweis fällt auf, dass wir den Beweis der Gleichung a u a = a in den
Beweis der Gleichung a t a = a übersetzen können, indem wir u und t vertauschen
und ebenso 0 und 1. Das funktioniert, da die Axiome (A1)–(A5) aus Paaren von
Gleichungen bestehen, die jeweils durch diese Vertauschungen auseinander hervorgehen.
Satz 1.24 (Dualitätsprinzip für Boolesche Algebren). Jede Aussage, die eine Folgerung aus den Axiomen (A1)–(A5) ist, geht in eine gültige Aussage über, wenn
man in ihr überall die Zeichen u und t sowie die Zeichen 0 und 1 vertauscht.
Satz 1.25. Für alle a ∈ B gilt a u 0 = 0 und a t 1 = 1.
Beweis. Es gilt
a u 0 = a u (a u ¬a) = (a u a) u ¬a = a u ¬a = 0.
Die Behauptung a u 1 = 1 folgt aus a u 0 = 0 nach dem Dualitätsprinzip.
Wir schließen diesen Abschnitt mit zwei wichtigen Regeln für Boolesche Algebren, die aus den Axiomen folgen, deren Beweis wir aber nicht angeben.
Satz 1.26 (De Morgansche Regeln). Für alle a, b ∈ B gilt ¬(a u b) = ¬a t ¬b und
¬(a t b) = ¬a u ¬b.
Der Beweis der de Morganschen Regeln aus den Axiomen (A1)–(A5) ist deutlich aufwendiger als die Beweise der Sätze 1.23 und 1.25. Mit Hilfe des Wahrheitstafelverfahrens lassen sich die de Morganschen Regeln für die Schaltalgebra
leicht nachrechen. Man kann zeigen, dass alle Gleichungen, wie zum Beispiel die de
Morganschen Regeln, die in der Schaltalgebra gelten, auch in allen anderen Booleschen Algebren gelten. Damit kann das Wahrheitstafelverfahren für Gleichungen,
in denen nur die Konstanten 0 und 1 auftreten, in beliebigen Booleschen Algebren
eingesetzt werden.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
15
2. Elementare Zahlentheorie
2.1. Das Summenzeichen. Bevor wir uns eingehend mit den Eigenschaften der
natürliche Zahlen N befassen, führen wir eine Notation ein, die sich bald als nützlich
erweisen wird. Die reellen Zahlen sind die bekannten Zahlen auf der Zahlengerade
wie -1, 0, 2.5, − 10
7 , e und π, für die die üblichen Rechenregeln gelten.
Definition 2.1. Für reelle Zahlen a1 , . . . , an sei
n
X
ai = a1 + a2 + . . . + an .
i=1
Dabei heißt i der Laufindex, 1 ist die untere Summationsgrenze und n die
obere Summationsgrenze.
Der Laufindex muss nicht mit i bezeichnet werden und die untere Summationsgrenze muss nicht 1 sein. So ist zum Beispiel
4
X
2j = 20 + 21 + 22 + 23 + 24 = 31.
j=0
Summen mit wechselnden Vorzeichen, wie zum Beispiel a1 − a2 + a3 − a4 kann man
bequem mit Hilfe von Potenzen von −1 schreiben. Dabei muss man aber genau
aufpassen, welche Vorzeichen man erzeugt:
4
X
(−1)i ai = −a1 + a2 − a3 + a4
i=1
4
X
(−1)i+1 ai = a1 − a2 + a3 − a4
i=1
Falls a1 = · · · = an = a gilt, so ist
Pn
i=1
ai = na.
Das bekannte Distributivgesetz lautet a(b + c) = ab + ac. Das Gesetz gilt auch
für mehr als zwei Summanden. Für alle reellen Zahlen a, b1 , . . . , bn ist
a
n
X
bi = a(b1 + . . . + bn ) = ab1 + . . . + abn =
i=1
n
X
abi .
i=1
Mit Hilfe des Distributivgesetzes können wir Ausdrücke wie (a + b)(c + d) ausmultiplizieren und erhalten
(a + b)(c + d) = ac + ad + bc + bd.
Allgemein gilt
(a1 + . . . + am )(b1 + . . . + bn ) = a1 b1 + . . . + a1 bn + . . . + am b1 + . . . + am bn .
Mit dem Summenzeichen geschrieben erhalten wir
! n 
m
m X
n
X
X
X
ai 
bj  =
a i bj .
i=1
j=1
i=1 j=1
16
STEFAN GESCHKE
Da wir nach dem Kommutativgesetz für die Addition die Summanden vertauschen
können ohne den Wert der Summe zu ändern, ist
m X
n
X
ai bj =
i=1 j=1
n X
m
X
ai bj .
j=1 i=1
Auf der Änderung der Summationsreihenfolge beruht auch die Gleichung
n
n
n
X
X
X
(ai + bi ) =
ai +
bi .
i=1
i=1
i=1
Oft kann man dieselben Summen unterschiedlich aufschreiben. So ist zum Beispiel
3
X
a2i+1 = a1 + a3 + a5 + a7 =
i=0
4
X
a2i−1 .
i=1
Bemerkung 2.2. Analog zum Summenzeichen kann man auch das Produktzeichen
definieren. Sind a1 , . . . , an reelle Zahlen, so setzt man
n
Y
ai := a1 · a2 · . . . · an .
i=1
2.2. Natürliche Zahlen und vollständige Induktion. Auf den natürlichen
Zahlen N = {1, 2, 3, . . . } gelten die bekannten Rechengesetze:
(1) Assoziativgesetze:
• a + (b + c) = (a + b) + c
• a · (b · c) = (a · b) · c
(2) Kommutativgesetze:
• a+b=b+a
• a·b=b·a
(3) Distributivgesetz:
• a · (b + c) = a · b + a · c
(4) Existenz eines neutralen Elements der Multiplikation:
• a·1=a
Eine weitere wichtige Eigenschaft von N ist das Funktionieren der vollständigen
Induktion.
Prinzip der vollständigen Induktion. Sei A(n) eine Aussageform. Dann gilt
∀n ∈ NA(n) genau dann, wenn folgende zwei Bedingungen erfüllt sind:
(1) Induktionsanfang: A(1) ist wahr.
(2) Induktionsschritt: Für jedes n ∈ N gilt: Falls A(n) wahr ist, so ist auch
A(n + 1) wahr.
Kompakt geschrieben gilt also für jede Aussageform A(n):
(A(1) ∧ ∀n ∈ N(A(n) ⇒ A(n + 1))) ⇒ ∀n ∈ NA(n)
Als Beispiel beweisen wir einen Satz über die Summe der ersten n natürlichen
Zahlen.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
17
Satz 2.3. Für alle n ∈ N gilt:
n
X
i=
i=1
n(n + 1)
2
Pn
Beweis. Sei A(n) die Aussageform
i=1
i=
n(n+1)
.
2
Wir wollen zeigen, dass A(n)
für alle n ∈ N gilt.
Induktionsanfang. A(1) ist wahr.
P1
A(1) ist nämlich die Aussage i=1 i =
1·(1+1)
.
2
Es gilt
P1
i=1
i=1=
1·(1+1)
.
2
Das
zeigt A(1).
Induktionsschritt. Für alle n ∈ N gilt: A(n) ⇒ A(n + 1)
Um das zu zeigen, nehmen wir uns ein beliebiges n ∈ N her und zeigen A(n) ⇒
A(n + 1). Wir müssen also zeigen, dass A(n + 1) wahr ist, falls A(n) wahr ist. Wenn
A(n) falsch ist, ist nichts zu zeigen.
Wir können also annehmen, dass A(n) wahr ist. Das ist die Induktionsannahme. Nun zeigen wir A(n + 1) unter dieser Annahme. A(n + 1) ist die Aussage
n+1
X
i=
i=1
also
n+1
X
(n + 1)((n + 1) + 1)
,
2
i=
i=1
(n + 1)(n + 2)
.
2
Es gilt
n+1
X
i=
i=1
Nach der Induktionsannahme ist
n
X
i + (n + 1).
i=1
Pn
i=1
i=
n(n+1)
.
2
Mit dieser Information erhalten
wir
n+1
X
i=1
i=
n(n + 1)
n(n + 1) + 2(n + 1)
(n + 1)(n + 2)
+ (n + 1) =
=
.
2
2
2
Das zeigt A(n + 1).
Damit haben wir den Induktionsanfang und den Induktionsschritt bewiesen. Es
folgt, dass A(n) für alle n ∈ N gilt.
Wir geben ein weiteres Beispiel. Für ganze Zahlen a und b schreiben wir a|b, falls
a ein Teiler von b ist.
Satz 2.4. Für alle n ∈ N ist n3 − n durch 3 teilbar.
Beweis. Sei A(n) die Aussageform „3 teilt n3 − n“. Wir wollen zeigen, dass A(n)
für alle n ∈ N gilt.
Induktionsanfang. A(1) ist wahr.
A(1) ist nämlich die Aussage 3|13 − 1, also 3|0. Diese Aussage ist wahr.
Induktionsschritt. Für alle n ∈ N gilt: A(n) ⇒ A(n + 1)
Sei also n ∈ N. Wieder nehmen wir an, dass A(n) wahr ist, und zeigen A(n + 1).
Die Induktionsannahme ist also 3|n3 − n.
18
STEFAN GESCHKE
A(n + 1) ist die Aussage 3|(n + 1)3 − (n + 1). Wir vereinfachen:
(n + 1)3 − (n + 1) = n3 + 3n2 + 3n + 1 − n − 1 = n3 + 3n2 + 2n
Wir wollen zeigen, dass n3 + 3n2 + 2n durch 3 teilbar ist, und dürfen benutzen, dass
n3 − n durch 3 teilbar ist. Es gilt
n3 + 3n2 + 2n = (n3 − n) + 3n2 + 3n.
Der erste Summand der rechten Seite dieser Gleichung, n3 − n, ist nach Induktionsannahme durch 3 teilbar. Der Rest, 3n2 + 3n, ist offenbar auch durch 3 teilbar.
Das zeigt 3|(n + 1)3 − (n + 1) und damit A(n + 1).
Damit ist für alle n ∈ N die Implikation A(n) ⇒ A(n + 1) bewiesen. Zusammen
mit dem Induktionsanfang folgt 3|n3 − n für alle n ∈ N.
Als nächstes diskutieren wir ein Beispiel, das zeigt, dass der Erfolg einer Induktion von der geschickten Wahl des Induktionsanfangs abhängen kann. Außerdem
liefert der folgende Beweis einen Algorithmus, also ein Verfahren, zur Lösung des
vorgelegten Problems.
Problem 2.5. Ein quadratischer Hof mit der Seitenlänge 2n soll mit L-förmigen
Fliesen gefliest werden. Dabei soll ein Quadrat mit der Seitenlänge 1 in der Mitte
des Hofes frei bleiben, weil da eine Statue aufgestellt werden soll. Die Fliesen haben
die Form von drei aneinander gesetzten Quadraten mit Seitenänge eins, so wie in
der Skizze. Ist es möglich, den Hof bis auf das Quadrat in der Mitte vollständig mit
den Fliesen zu überdecken, ohne dass die Fliesen sich überlappen und ohne Fliesen
zu zerschneiden?
Im Folgenden betrachten wir nur Quadrate, deren Seitenlängen ganzzahlig sind.
Auch stellen wir uns immer vor, dass die Quadrate in der Ebene liegen, wobei die
Koordinaten der Ecken der Quadrate alle ganzzahlig sind.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
Hof
19
Fliese
Wir betrachten zunächst die Fälle n = 1 und n = 2 und sehen, dass wir den Hof
wie gewünscht fliesen können. Schon der Fall n = 1 genügt für den Induktionsanfang.
n=1
n=2
Eine naheliegende Induktionsannahme wäre die Aussageform A(n): „Jeder quadratische Hof mit der Kantenlänge 2n kann bis auf ein fehlendes Quadrat der Kantenlänge 1 in der Mitte vollständig mit L-förmigen Fliesen gefliest werden.“
Es stellt sich heraus, dass wir Schwierigkeiten haben, die gewünschte Induktion
mit dieser Induktionsannahme durchzuführen. Einen Hof der Kantenlänge 2n+1
können wir in vier quadratische Teile mit der Kantenlänge 2n zerlegen, aber das
fehlende Quadrat in der Mitte des Quadrats mit Kantenlänge 2n+1 liegt nun am
Rand eines der Quadrate mit Kantenlänge 2n . Bei den anderen drei Qudraten mit
Kantenlänge fehlt kein Quadrat.
Eine Verstärkung von A(n) führt schließlich zum Erfolg. B(n) sei die Aussageform „Jeder quadratische Hof mit der Kantenlänge 2n kann bis auf ein beliebig
20
STEFAN GESCHKE
vorgegebenes fehlendes Quadrat der Kantenlänge 1 vollständig mit L-förmigen Fliesen gefliest werden“.
Wir zeigen, dass B(n) für alle n ∈ N gilt. Der Induktionsanfang ist einfach: B(1)
gilt, da von einem Quadrat der Kantenlänge 2 nach Entfernen eines Quadrates der
Kantenlänge 1 eine L-förmige Fliese übrig bleibt.
Induktionsschritt: Wir zeigen, dass für alle n ∈ N die Implikation B(n) ⇒ B(n +
1) gilt. Sei also n ∈ N. Wir nehmen an, dass B(n) gilt. Sei nun ein Quadrat mit
Kantenlänge 2n+1 vorgegeben, in dem ein Quadrat der Kantenlänge 1 markiert ist,
welches beim Überdecken ausgelassen werden soll.
Wir zerlegen dieses Quadrat in vier Quadrate der Kantenlänge 2n . Das markierte
Quadrat der Kantenlänge 1 liegt in einem dieser vier Quadrate. Nun legen wir eine
der L-förmigen Fliesen so in die Mitte des Quadrats mit Kantenlänge 2n+1 , dass
die drei Quadrate der Fliese alle in je einem der vier Quadrate der Kantenlänge 2n
zum liegen kommen, wobei dasjenige der vier Quadrate, das das markierte Quadrat
enthält, nicht getroffen wird.
Zerlegung des Quadrats der Kantenlänge 2n+1 und Lage der ersten Fliese
Nun genügt es, jedes der vier Quadrate mit Kantenlänge 2n mit L-förmigen
Fliesen zu überdecken, wobei jeweils ein Quadrat der Kantenlänge 1 ausgelassen
werden muss. Das ist aber nach der Induktionsannahme B(n) möglich. Das zeigt
die Implikation B(n) ⇒ B(n + 1). Also gilt B(n) für alle n ∈ N. Das löst Problem
2.5.
Wir bemerken noch, dass diese Lösung des Problems auch ein Verfahren liefert,
den Hof wie gewünscht zu fliesen:
• Wenn der Hof die Kantenlänge 2 hat, so bleibt neben dem markierten Quadrat genau Platz für eine L-förmige Fliese.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
21
• Wenn der Hof für ein n > 1 die Kantenlänge 2n hat, so unterteile den Hof
in vier Quadrate der Kantenlänge 2n−1 und lege eine Fliese so in die Mitte
des Hofes, dass sie genau die drei Quadrate der Kantenlänge 2n−1 trifft, die
nicht das markierte Quadrat enthalten.
• Führe den Algorithmus für die vier Quadrate der Kantenlänge 2n−1 durch,
wobei das ursprünglich markierte Quadrat und die drei Quadrate, die von
der ersten Fliese überdeckt werden, markiert werden.
Wir betrachten zwei weitere Varianten der vollständigen Induktion. So muss
man zum Beispiel den Induktionsanfang nicht unbedingt bei n = 1 machen. Ein
Induktionsanfang bei n = 0 kommt recht häufig vor, andere Startwerte sind aber
auch möglich.
Vollständige Induktion mit beliebigem Startwert. Es sei n0 eine ganze Zahl
und A(n) eine Aussageform. Dann gilt A(n) genau dann für alle ganzen Zahlen
n ≥ n0 , wenn A(n0 ) wahr ist und die Implikation A(n) ⇒ A(n + 1) für alle n ≥ n0
gilt.
Als Beispiel beweisen wir eine einfache Ungleichung.
Satz 2.6. Für alle natürlichen Zahlen n ≥ 3 gilt 2n + 1 < 2n .
Beweis. A(n) sei die Aussageform 2n + 1 < 2n .
Induktionsanfang. A(3) gilt.
Um das zu sehen, setzen wir 3 für n ein. Es ist 2 · 3 + 1 = 7 < 8 = 23 .
Induktionsschritt. Für alle n ≥ 3 gilt: A(n) → A(n + 1)
Wie nehmen an, dass A(n) für ein gewisses n ≥ 3 gilt, und haben A(n + 1)
nachzuweisen. Es ist
n≥2
I.A.
2(n + 1) + 1 = 2n + 3 = 2n + 1 + 2 < 2n + 2 < 2n + 2n = 2n+1 .
Das zeigt A(n + 1).
Es folgt, dass A(n) für alle n ≥ 3 gilt.
Wir beweisen noch eine Formel, die sich in der Analysis als nützlich erweisen
wird. Sei q eine reelle Zahl 6= 1 und n ∈ N0 . Wir wollen einen einfachen Ausdruck
Pn
für die Summe i=0 q i = 1 + q + . . . + q n herleiten. Dazu formen wir die Summe
um:
n
X
i=0
qi = 1 +
n
X
i=1
qi = 1 + q
n
X
q i−1 = 1 + q
i=1
=1+q
n−1
X
qi = 1 + q
i=0
n−1
X
i=0
n−1
X
q i + q n+1 − q n+1
i=0
!
qi + qn
− q n+1 = 1 + q
n
X
i=0
q i − q n+1
22
STEFAN GESCHKE
Wenn man den Term q
Pn
i=0
q i auf die linke Seite dieser Gleichung bringt, erhält
man
(1 − q)
n
X
q i = 1 − q n+1 .
i=0
Da q 6= 1 ist, können wir auf beiden Seiten durch 1 − q teilen und erhalten so die
geometrische Summenformel:
Satz 2.7 (Geometrische Summenformel). Sei q eine reelle Zahl 6= 1 und n ∈ N0 .
Dann gilt
n
X
i=0
qi =
1 − q n+1
.
1−q
Beweis. Wir haben die geometrische Summenformel zwar korrekt hergeleitet, geben
aber trotzdem noch einen Beweis mittels vollständiger Induktion an.
Induktionsanfang. Für n = 0 stimmt die geometrische Summenformel, denn es gilt
0
X
qi = 1 =
i=0
1 − q1
.
1−q
Induktionsschritt. Wir nehmen an, dass die geometrische Summenformeln für ein
gewisses n ≥ 0 gilt (Induktionsannahme). Dann gilt sie auch für n + 1:
n+1
X
qi =
i=0
n
X
I.A.
q i + q n+1 =
i=0
1 − q n+1
q n+1 (1 − q)
1 − q n+1
+ q n+1 =
+
1−q
1−q
1−q
=
1 − q n+1 + q n+1 − q n+2
1 − q n+2
=
1−q
1−q
Damit ist die geometrische Summenformel für alle n ∈ N0 bewiesen.
Vollständige Induktion mit mehreren Vorgängern. Wieder sei A(n) eine
Aussageform. Dann gilt A(n) genau dann für alle natürlichen Zahlen n, wenn A(1)
wahr ist und für alle n ∈ N die folgende Implikation gilt: A(1)∧· · ·∧A(n) ⇒ A(n+1).
Bei dieser Variante ist die Induktionsannahme die Annahme, dass A(1), . . . , A(n)
wahr sind.
Eng mit der vollständigen Induktion verwandt sind rekursive Definitionen.
Beispiel 2.8. Wir definieren einen Folge natürlicher Zahlen an wie folgt:
(1) a1 = 1
(2) an+1 = 2an + 1
Dadurch ist an für jede natürliche Zahl n eindeutig bestimmt. Nach (1) gilt
a1 = 1. Wenden wir (2) auf den Fall n = 1 an, so erhalten wir a2 = 2 · 1 + 1 = 3.
Wenden wir (2) auf den Fall n = 2 an, so ergibt sich a3 = 2 · 3 + 1 = 7.
Ein weiteres Beispiel für eine rekursive Definition sind die bekannten FibonacciZahlen.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
23
Definition 2.9. Es sei f0 = 0 und f1 = 1. Für alle n ≥ 1 sei fn+1 = fn−1 + fn .
Die Zahlen f0 , f1 , f2 , . . . heißen Fibonacci-Zahlen. Die ersten 10 Glieder der
Folge f0 , f1 , f2 , . . . lauten 0, 1, 1, 2, 3, 5, 8, 13, 21, 34.
Man kann für die n-te Fibonacci-Zahl fn eine geschlossene Formel angeben, also
einen Ausdruck, der keine Rekursion benutzt.
Satz 2.10. Für alle n ∈ N0 gilt
1
fn = √
5
√ !n
1+ 5
−
2
√ !n !
1− 5
.
2
Beweis. Wir beweisen den Satz durch vollständige Induktion, wobei wir Induktion mit mehreren Vorgängern anwenden. Das liegt daran, dass in der rekursiven
Definition von fn+1 auch auf mehrere Vorgänger zurückgegriffen wird.
Um die Rechnung übersichtlicher zu gestalten, führen wir zwei Abkürzungen ein.
Es seien ϕ :=
√
1+ 5
2
und ψ :=
√
1− 5
2 .
Sei A(n) die Aussageform
fn =
ϕn − ψ n
√
.
5
Wir wollen also zeigen, dass A(n) für alle n ∈ N0 gilt.
Als Induktionsannahme wählen wir A(n − 1) ∧ A(n). Das können wir natürlich
nur annehmen, falls n mindestens 1 ist, da f−1 ja nicht definiert ist und wir nicht
wissen, was A(−1) bedeutet. Im Induktionsschritt zeigen wir dann für alle n ≥ 1,
dass aus A(n − 1) und A(n) zusammen A(n + 1) folgt.
Wenn wir für den Induktionsanfang nur A(0) zeigen, dann haben wir aber das
Problem, dass wir nicht wissen, ob A(1) überhaupt gilt, da im Induktionsschritt
A(n − 1) ∧ A(n) ⇒ A(n + 1) nur für n ≥ 1 wird. Daher müssen wir beim Induktionsanfang auch noch A(1) explizit zeigen.
Induktionsanfang. Es gilt
1−1
ϕ0 − ψ 0
√
= √ = 0 = f0
5
5
sowie
1
ϕ1 − ψ 1
√
=√
5
5
√
√ !
√
1+ 5 1− 5
1 2 5
−
=√ ·
= 1 = f1 .
2
2
2
5
Induktionsschritt. Wir zeigen A(n − 1) ∧ A(n) ⇒ A(n + 1) für alle n ≥ 1. Dazu
nehmen wir an, dass für ein gewisses n ≥ 1 die Aussage A(n − 1) ∧ A(n) gilt. Dann
ist
fn+1
ϕn 1 + ϕ1 − ψ n 1 +
ϕn−1 − ψ n−1 + ϕn − ψ n
√
√
= fn−1 + fn =
=
5
5
1
ψ
.
24
STEFAN GESCHKE
Es gilt
√
1
2
1+ 5+2
√
√
1+ =1+
=
ϕ
1+ 5
1+ 5
√
√
√
√
(3 + 5)(1 − 5)
−2 − 2 5
1+ 5
√
√ =
=
=
=ϕ
1−5
2
(1 + 5)(1 − 5)
und analog 1 +
1
ψ
= ψ. Damit ergibt sich
fn+1 =
ϕn+1 − ψ n+1
√
,
5
also A(n + 1).
Insgesamt gilt A(n) für alle n ∈ N0 .
Wir haben bisher noch nicht diskutiert, warum die vollständige Induktion überhaupt funktioniert. Unsere intuitive Vorstellung von den natürlich Zahlen ist die
folgende: Wenn wir bei 1 anfangen zu zählen und dann in Einerschritten immer
weiter zählen, so erreichen wir schließlich jede natürliche Zahl. Oder anders gesagt,
die natürlichen Zahlen sind genau die Zahlen, die wir erreichen können, wenn wir
bei 1 anfangen zu zählen und dann in Einerschritten immer weiter zählen.
Ist A(n) eine Aussageform und gelten A(1) und ∀n ∈ N(A(n) ⇒ A(n + 1)),
so können wir die Menge S = {n ∈ N : A(n) ist wahr} betrachten und stellen
Folgendes fest:
(1) 1 ∈ S
(2) n ∈ S ⇒ n + 1 ∈ S
Eine Menge mit den Eigenschaften (1) und (2) nennen wir induktiv. Wir können
also bei 1 anfangen, in Einerschritten zu zählen, ohne jemals die Menge S zu verlassen. Nach unserer Intuition über die natürlichen Zahlen erreichen wir dabei alle
natürlichen Zahlen. Also gilt N ⊆ S. Andererseits ist S ⊆ N. Es folgt S = N. Also
gilt A(n) für alle n ∈ N.
Die folgende Axiome präzisieren unsere Intuition über die natürlichen Zahlen.
Hierbei steht n0 für den Nachfolger von n in den natürlichen Zahlen, also für n + 1.
Definition 2.11. Die folgenden Axiome sind die Peano-Axiome für die natürlichen Zahlen.
(1) 1 ∈ N
(2) n ∈ N ⇒ n0 ∈ N
(3) n ∈ N ⇒ n0 6= 1
(4) m, n ∈ N ⇒ (m0 = n0 ⇒ m = n)
(5) (1 ∈ S ∧ ∀n ∈ N(n ∈ S ⇒ n0 ∈ S)) ⇒ N ⊆ S
Das Axiom (5) ist das Induktionsaxiom, welches garantiert, dass wir Sätze mittels vollständiger Induktion beweisen können. Normalsprachlich lauten die Axiome
wie folgt:
(1) 1 ist eine natürliche Zahl.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
25
(2) Der Nachfolger einer natürlichen Zahl ist wieder eine natürliche Zahl.
(3) 1 ist nicht Nachfolger einer natürlichen Zahl.
(4) Die Nachfolgerfunktion n 7→ n0 ist injektiv.
(5) Jede induktive Menge enthält alle natürlichen Zahlen.
Auf Basis dieser Axiome kann man nun die bekannte Operationen + und · sowie
die Relation ≤ auf N rekursiv definieren, was wir aber nicht im einzelnen durchführen wollen.
Vollständige Induktion liefert uns interessante Informationen über die Menge der
natürlichen Zahlen.
Satz 2.12. Jede nichtleere Menge natürlicher Zahlen hat ein kleinstes Element.
Beweis. Sei A eine nichtleere Menge natürlicher Zahlen, also A ⊆ N und A 6= ∅.
Falls A kein kleinstes Element hat, so betrachte B = N \ A. Wir zeigen mittels
vollständiger Induktion, dass B alle natürlichen Zahlen enthält und A damit leer
ist, im Widerspruch zur Annahme.
Sei P (n) die Aussageform n ∈ B. 1 ist das kleinste Element von N. Also gilt
1 6∈ A, da sonst 1 das kleinste Element von A wäre. Damit ist 1 ∈ B. Das zeigt
P (1). Das ist der Induktionsanfang.
Nun nehmen wir an, dass die Zahlen 1, . . . , n Elemente von B sind, dass also
P (1), . . . , P (n) gelten. Die Zahl n0 kann nicht in A liegen, da n0 dann das kleinste
Element von A wäre. Also liegt n0 in B. Das zeigt P (n0 ). Das ist der Induktionsschritt.
Damit gilt N ⊆ B. Also ist A = ∅, im Widerspruch zu A 6= ∅. Damit hat A ein
kleinstes Element.
Wir haben hier die Induktion mit mehreren Vorgängern durchgeführt. Um zu
sehen, dass das wirklich dasselbe ist, wie die Standardform der Induktion, kann
man zum Beispiel anstelle der Aussageform P (n) die folgende Aussageform Q(n)
betrachten: ∀k ∈ N(k ≤ n ⇒ k ∈ B)
Dann kann man an Stelle der Induktionsannahme P (1) ∧ · · · ∧ P (n) einfach Q(n)
schreiben. Man beweist dann im Induktionsschritt nicht (P (1)∧· · ·∧P (n)) ⇒ P (n0 ),
sondern Q(n) ⇒ Q(n0 ). Der Beweis selbst bleibt aber eigentlich derselbe.
Wir haben dann gezeigt, dass Q(n) für alle n ∈ N gilt, und zwar mit der Standardform der Induktion. Aber (∀n ∈ N)Q(n) ist natürlich äquivalent zu (∀n ∈
N)P (n).
2.3. Ganze und rationale Zahlen. Im Abschnitt über Mengen hatten wir bereits
die Menge
Z = {. . . , −1, 0, 1, 2, . . . }
der ganzen Zahlen eingeführt. Die Menge Q der rationalen Zahlen ist die Menge
aller Brüche m
n mit m, n ∈ Z und n 6= 0.
26
STEFAN GESCHKE
Da wir jede ganzen Zahl m mit dem Bruch
m
1
identifzieren können, fassen wir Z
als eine Teilmenge von Q auf. Wir erinnern uns kurz daran, wie man Brüche addiert
und multipliziert:
m m0
m · n0 + m 0 n
+ 0 =
n
n
n · n0
0
m · m0
m m
· 0 =
n n
n · n0
Die folgenden Rechenregeln für rationale Zahlen a, b, c setzen wir als bekannt
voraus:
(K1) Assoziativgesetze
• a + (b + c) = (a + b) + c
• a · (b · c) = (a · b) · c
(K2) Kommutativgesetze
• a+b=b+a
• a·b=b·a
(K3) Distributivgesetz
• a · (b + c) = a · b + a · c
(K4) Existenz neutraler Elemente bezüglich der Addition und der Multiplikation
• a+0=a
• 1·a=a
(K5) Existenz inverser Elemente bezüglich der Addition und der Multiplikation
• Es gibt ein Element −a mit a + (−a) = 0.
• Falls a 6= 0 ist, so gibt es ein Element a−1 mit a · a−1 = 1.
Da diese Rechengesetze so wichtig sind, bekommen Strukturen, in denen diese
Gesetze erfüllt sind, einen eigenen Namen.
Definition 2.13. Sei K eine Menge, 0 und 1 zwei verschiedene Elemente von K
und + : K × K → K und · : K × K → K Abbildungen. Dann heißt K zusammen
mit 0, 1, + und · ein Körper, falls die Axiome (K1)–(K5) erfüllt sind.
Wie oben schon bemerkt, erfüllt Q mit der üblichen Addition und Multiplikation
und mit den bekannten Konstanten 0 und 1 die Körperaxiome (K1)–(K5). Die
ganzen Zahlen Z mit den üblichen Rechenoperationen erfüllen zwar (K1)–(K4),
aber sie bilden keinen Körper, da zum Beispiel 2 in Z kein multiplikatives Inverses
besitzt: Es gibt keine ganze Zahl n mit 2 · n = 1.
Neben der Struktur eines Körpers, haben die rationalen Zahlen noch eine weitere
wichtige Eigenschaft. Sie werden durch die Kleiner-Beziehung < angeordnet. Für
je zwei verschiedene rationale Zahlen a und b gilt entweder a < b („a kleiner b“)
oder a > b („a größer b“). Es gelten folgende Regeln:
(1) a < b ∧ b < c ⇒ a < c
(2) a < b ⇒ a + c < b + c
(3) a < b ⇒ a · c < b · c, falls c > 0.
(4) a < b ⇒ a · c > b · c, falls c < 0.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
27
Wir schreiben a ≤ b für (a < b ∨ a = b) und lesen ≤ als „kleiner-gleich“ und ≥ als
„größer-gleich“.
Für ≤ gelten ähnliche Regeln wie für <.
(1) a ≤ b ∧ b ≤ c ⇒ a ≤ c
(2) a ≤ b ⇒ a + c ≤ b + c
(3) a ≤ b ⇒ a · c ≤ b · c, falls c ≥ 0.
(4) a ≤ b ⇒ a · c ≥ b · c, falls c ≤ 0.
Die ganzen und die rationalen Zahlen lassen sich gut auf dem Zahlenstrahl veranschaulichen. Wir stellen uns vor, dass die Gerade horizontal von links nach rechts
verläuft. Nun markieren wir einen Punkt auf der Geraden und nennen ihn 0. Rechts
von der 0 markieren wir einen weiteren Punkt und nennen ihn 1. Ist nun n eine
natürlich Zahl, so entspricht n dem Punkt auf der Geraden, den man erreicht, wenn
man von der 0 ausgehend n-mal die Strecke von der 0 zur 1 abträgt. Sind m und
n natürliche Zahlen, so erhält den Punkte auf der Geraden, der
m
n
entspricht, in
dem man die Strecke von 0 nach m in n gleiche Teile unterteilt. Damit finden wir
alle rationalen Zahlen > 0 auf der Zahlengeraden. Für natürliche Zahlen m und
n finden wir den Punkt auf der Geraden, der − m
n entspricht, indem man von 0
ausgehend nach links die Länge der Strecke von 0 bis
-1
− 12
0
1 1 2
3 2 3
Offenbar kann man zum Beispiel
von 0 nach 1 halbiert, um
1
2
3
2
1
3
2
m
n
abträgt.
2
3
auch erreichen, indem man zuerst die Strecke
zu erhalten, und dann dreimal von 0 ausgehend nach
rechts die Länge der Strecke von 0 bis
1
2
abträgt.
Die rationalen Zahlen liegen dicht auf der Zahlengeraden. D.h., zwischen je
zwei verschiedenen Punkten auf der Geraden liegt eine rationale Zahl. Wir werden
jedoch gleich sehen, dass es Punkte auf der Geraden gibt, die keiner rationalen
Zahlen entsprechen, dass die rationalen Zahlen also Lücken haben.
√
2 bezeichnen wir die positive Lösung der Glei√
chung x = 2. Es stellt sich heraus, dass 2 keine rationale Zahl ist.
2.4. Die reellen Zahlen. Mit
2
Bevor wir das beweisen können, müssen stellen wir Folgendes fest.
Lemma 2.14. Sei m eine ganze Zahl. Falls m2 gerade ist, so ist auch m selbst
gerade.
Beweis. Wir beweisen die Kontraposition dieser Aussage: Wenn m ungerade ist, so
ist auch m2 ungerade.
Sei m ungerade. Dann ist m − 1 gerade. Also gibt es eine ganze Zahl k mit
2k = m − 1. Es gilt also m = 2k + 1. Nun ist m2 = (2k + 1)2 = 4k 2 + 4k + 1. Da
4k 2 + 4k gerade ist, ist 4k 2 + 4k + 1 ungerade. Also ist m2 ungerade.
Satz 2.15. Es gibt keine rationale Zahl a mit a2 = 2.
28
STEFAN GESCHKE
Beweis. Der Beweis dieses Satzes ist ein sogenannter Widerspruchsbeweis. Wir
nehmen dazu an, dass es eine rationale Zahl a mit a2 = 2 gibt und folgern daraus
eine offensichtlich falsche Aussage. Sei A die Aussage „ es gibt eine rationale Zahl
a mit a2 = 2“ und B eine falsche Aussage. Wenn wir A ⇒ B zeigen können und B
falsch ist, so muss A falsch sein, was wir leicht der Wahrheitstafel für → entnehmen
können. Wir haben also ¬A bewiesen.
Zum eigentlichen Beweis. Wie eben schon angekündigt, nehmen wir an, dass es
eine rationale Zahl a mit a2 = 2 gibt. Die Zahl a lässt sich als Bruch
m
n
schreiben,
2
wobei m und n ganze Zahlen sind und n 6= 0 gilt. Gilt a = 2, so gilt auch (−a)2 = 2.
Daher können wir annehmen, dass a positiv ist und dass m und n natürliche Zahlen
sind. Schließlich können wir noch annehmen, dass der Bruch
2
m und n keine gemeinsame Teiler > 1 haben. Es gilt a =
m
n gekürzt ist, dass also
m2
n2 = 2. Multiplikation
mit n2 liefert m2 = 2n2 . Also ist m2 durch 2 teilbar. Nach Lemma 2.14 ist damit
auch m durch 2 teilbar.
Wenn aber m von 2 geteilt wird, so wird m2 von 4 geteilt. Wegen m2 = 2n2
wird dann aber auch n2 von 2 geteilt. Wie oben für m ergibt sich, dass n gerade
ist. Das heißt aber, dass man den Bruch
m
n
durch 2 kürzen kann, ein Widerspruch
zur Annahme, dass der Bruch bereits gekürzt ist.
m
Die Aussage „der Bruch m
n ist gekürzt und der Bruch n lässt sich kürzen“ ist
offenbar falsch. Also haben wir aus der Aussage „es gibt eine rationale Zahl a mit
a2 = 2“ eine falsche Aussage abgeleitet. Damit ist diese Aussage selbst falsch und
es gilt stattdessen, was wir zeigen wollten: Es gibt keine rationale Zahl a mit a2 =
2.
Trotzdem finden wir einen Punkt auf der Zahlengeraden, der der Zahl
√
2 ent-
spricht, nämlich den eindeutig bestimmten Punkt, der rechts von alle Zahlen in der
Menge A := {x ∈ Q : x < 0 ∨ x2 < 2} und links von alle Zahlen in der Menge
B := {x ∈ Q : x > 0 ∧ x2 > 2} liegt.
A
0
√
B
1
4
3
√
2
3
2
Die Existenz eines Punktes auf der Zahlengeraden, dessen Abstand von 0 genau
2 ist, sieht man wie folgt: Auf der Strecke von 0 nach 1 errichte man ein Quadrat
mit der Kantenlänge 1. Die Diagonale dieses Quadrats hat nach dem Satz von
√
Pythagoras die Länge 2. Wenn wir von 0 ausgehend nach rechts die Länge der
Diagonalen des Quadrats auf der Zahlengeraden abtragen, so erreichen wir den
√
Punkt, der 2 entspricht.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
√
0
29
2
1
√
2
Es gibt viele Punkte auf der Zahlengeraden, denen keine rationale Zahl entspricht. Wir können Q aber so zur Menge R der reellen Zahlen erweitern, dass
jedem Punkt auf der Zahlengeraden eine reelle Zahl entspricht und umgekehrt jede
reelle Zahl einem Punkt auf der Zahlengeraden. Wir können reelle Zahlen addieren
und multiplizieren, wobei wir bei Einschränkung dieser Operationen auf Q genau
die bekannten Operationen auf den rationalen Zahlen erhalten. Mit diesen Operationen bilden die reellen Zahlen einen Körper, wie die rationalen Zahlen auch.
Die Kleiner-Beziehung < zwischen reellen Zahlen ist so erklärt, dass für reelle
Zahlen a und b die Beziehung a < b genau dann gilt, wenn der Punkt auf der
Zahlengeraden, der a entspricht, links von dem Punkt liegt, der b entspricht. Es
gelten dieselben Rechenregeln für < auf R wie auf Q.
Es gibt verschiedene Möglichkeiten, die reellen Zahlen ausgehend von den rationalen Zahlen zu konstruieren. Wir werden allerdings nicht näher auf die Konstruktion eingehen. Alle reellen Zahlen lassen sich als (eventuell unendliche) Dezimalbrüche darstellen. Die rationalen Zahlen entsprechen den Dezimalbrüchen, die
entweder nach endlich vielen Nachkommastellen abbrechen oder periodisch werden.
Die reellen Zahlen, die nicht rational sind, heißen irrational. Beispiele für irra√
√ √
tionale Zahlen sind 2, 3, e, π und 3 5.
2.5. Teilbarkeit, Primzahlen und der euklidische Algorithmus. Wir haben
bereits Teilbarkeit durch 2 betrachtet. Dennoch wiederholen wir die formale Definition von Teilbarkeit.
Definition 2.16. Eine ganze Zahl a ist ein Teiler einer ganzen Zahl b, falls eine
ganze Zahl c mit b = a · c existiert. Wenn a ein Teiler von b ist, so nennt man b ein
Vielfaches von a. Ist a ein Teiler von b, so schreiben wir a | b. Ist a kein Teiler von
b, so schreiben wir a 6 | b.
Man beachte, dass jede ganze Zahl a die 0 teilt. Es ist nämlich 0 = 0·a. Umgekehrt
teilt 0 nur sich selber und keine andere ganze Zahl. Ebenso beachte man, dass für
30
STEFAN GESCHKE
alle ganzen Zahlen a und b Folgendes gilt:
a | b ⇔ −a | b ⇔ −a | − b ⇔ a | − b
Damit kann man die Teilbarkeitsbeziehung zwischen ganzen Zahlen immer auf die
Teilbarkeitsbeziehung zwischen natürlichen Zahlen zurückführen.
Satz 2.17. Die Teilbarkeitsbeziehung | hat folgende Eigenschaften:
(1) Gilt a | b und b | c, so gilt auch a | c.
(2) Aus a1 | b1 und a2 | b2 folgt a1 · a2 | b1 · b2 .
(3) Aus a · b | a · c und a 6= 0 folgt b | c.
(4) Aus a | b1 und a | b2 folgt für alle c1 , c2 ∈ Z die Beziehung a | b1 · c1 + b2 · c2 .
Beweis. (1)–(4) lassen sich leicht nachrechnen. Zum Beispiel kann man (4) wie folgt
nachrechnen:
Wegen a | b1 und a | b2 existieren d1 , d2 ∈ Z mit b1 = a · d1 und b2 = a · d2 . Für
alle c1 , c2 ∈ Z gilt nun
b1 · c1 + b2 · c2 = a · d1 · c1 + a · d2 · c2 = a · (d1 · c1 + d2 · c2 ).
Das zeigt a | b1 · c1 + b2 · c2 .
Definition 2.18. Eine natürliche Zahl n ≥ 2 heißt Primzahl, wenn n nur durch
−1, 1, n und −n teilbar ist. Die Zahlen ±1 und ±n nennt man die trivialen Teiler
von n.
Satz 2.19 (Euklid). Es gibt unendlich viele Primzahlen.
Beweis. Wir führen wieder einen Widerspruchsbeweis. Angenommen, es gibt nur
endlich viele Primzahlen p1 , . . . , pn . Betrachte das Produkt a = p1 · . . . · pn .
Sei p die kleinste natürliche Zahl ≥ 2, die a + 1 teilt. Dann ist p eine Primzahl.
Hat nämlich p einen Teiler q, der von −1, 1, p und −p verschieden ist, so ist q oder
−q eine natürliche Zahl ≥ 2, die a + 1 teilt und kleiner als p ist. Das widerspricht
aber der Wahl von p als kleinsten Teiler von a + 1 mit p ≥ 2.
Da p eine Primzahl ist, existiert ein i ∈ {1, . . . , n} mit p = pi . Damit teilt p
sowohl a als auch a + 1. Also teilt p auch 1 = (a + 1) − a. Das widerspricht aber
der Wahl von p als einer ganzen Zahl ≥ 2.
Ohne Beweis geben wir einen wichtigen Satz über die Darstellung natürlicher
Zahlen als Produkte von Primzahlen an.
αk
1
Satz 2.20. Jede natürliche Zahl n ≥ 2 ist ein Produkt der Form pα
1 · . . . ·pk wobei k
eine natürliche Zahl ≥ 1 ist, p1 , . . . , pk paarweise verschiedene Primzahlen sind und
αk
1
α1 , . . . , αk natürliche Zahlen sind. Dabei ist die Produktdarstellung n = pα
1 · . . . ·pk
bis auf die Reihenfolge der Faktoren eindeutig.
Zum Beispiel ist 12 = 22 · 3 und 500 = 22 · 53 .
Eine wichtige Folgerung aus diesem Satz ist die Folgende:
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
31
Korollar 2.21. Teilt eine Primzahl p ein Produkt a · b natürlicher Zahlen, so teilt
p eine der beiden Zahlen a und b.
αn
1
Beweis. Wir schreiben a und b als Produkte von Primzahlen, a = pα
1 · . . . · pn
βm
und b = q1β1 · . . . · qm
. Dann ist
β1
αn
βm
1
a · b = pα
1 · . . . · pn · q1 · . . . · qm .
Gilt p | a · b, so existiert eine natürliche Zahl c mit a · b = p · c. Schreibt man nun c als
Produkt von Primzahlen, so erhält man eine Darstellung von a · b als Produkt von
Primzahlen, in dem der Faktor p auftritt. Wegen der Eindeutigkeit der Darstellung
von a · b als Produkt von Primzahlen ist der Faktor p ein Element der Menge
{p1 , . . . , pn , q1 , . . . , qm }. Damit teilt p die Zahl a oder die Zahl b.
Die Aussage dieses Korollars wird falsch, wenn man die Bedingung weglässt, dass
p eine Primzahl ist. Zum Beispiel teilt 6 das Produkt 4 · 9, während 6 weder 4 noch
9 teilt.
2.6. Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches.
Definition 2.22. Seien a und b natürliche Zahlen. Der größte gemeinsame Teiler von a und b ist die größte natürliche Zahl c, die sowohl a als auch b teilt. Der
größte gemeinsame Teiler von a und b wird mit ggT(a, b) bezeichnet. Das kleinste
gemeinsame Vielfache von a und b ist die kleinste natürliche Zahl, die sowohl
von a als auch von b geteilt wird. Das kleinste gemeinsame Vielfache von a und b
wird mit kgV(a, b) bezeichnet.
Der größte gemeinsame Teiler zweier natürlicher Zahlen a und b existiert, da es
einerseits nur endliche viele gemeinsame Teiler von a und b gibt und andererseits
1 ein gemeinsamer Teiler von a und b ist. Das kleinste gemeinsame Vielfache von
a und b existiert, da es mindestens ein gemeinsames Vielfaches gibt, nämlich a · b,
und jede nichtleere Menge natürlicher Zahlen ein kleinstes Element hat.
Ist die Zerlegung von a und b in Primfaktoren gegeben, so können wir ggT(a, b)
und kgV(a, b) leicht berechnen. Sei p eine Primzahl, c ein gemeinsamer Teiler von a
und b und α ∈ N, so dass pα | c gilt. Dann gilt auch pα | a und pα | b. Damit können
wir den größten gemeinsamen Teiler von a und b wie folgt bestimmen:
In der Primfaktorzerlegung des größten gemeinsamen Teilers von a und b treten
für jede Primzahl p die höchsten Potenzen pα auf, die sowohl a als auch b teilen.
Genauer: Sei {p1 , . . . , pn } die Menge der Primzahlen, die sowohl a als auch b teilen.
i
Für jedes i ∈ {1, . . . , n} sei αi die größte natürliche Zahl, so dass pα
i sowohl a als
αn
1
auch b teilt. Dann ist pα
1 · . . . · pn der größte gemeinsame Teiler von a und b.
Das kleinste gemeinsame Vielfache von a und b lässt sich auf ähnliche Weise
finden. Ist nämlich c ein Vielfaches von a und von b, so gilt für jede Primzahl p und
jede natürliche Zahl α: Wenn pα die Zahl a oder die Zahl b teilt, so teilt pα auch
c. Sei nun {p1 , . . . , pn } die Menge der Primzahlen, die a oder b teilen. Für jedes
32
STEFAN GESCHKE
α1
i
i ∈ {1, . . . , n} sei αi ∈ N die größte natürliche Zahl, so dass pα
i | a oder pi | b gilt.
αn
1
Dann ist pα
1 · . . . · pn das kleinste gemeinsame Vielfache von a und b.
Man beachte, dass man ggT(a, b) aus kgV(a, b) berechnen kann und umgekehrt.
Es gilt nämlich die Beziehung
ggT(a, b) · kgV(a, b) = a · b.
Beispiel 2.23.
(1) Sei a = 60 und b = 70. Dann ist a = 22 · 3 · 5 and b = 2 · 5 · 7.
Es gilt ggT(a, b) = 2 · 5 = 10 und kgV(a, b) = 22 · 3 · 5 · 7 = 420.
(2) Sei
a = 24 · 3 · 52 · 7 · 134
und
b = 22 · 5 · 72 · 133 · 17 · 23.
Dann ist
ggT(a, b) = 22 · 5 · 7 · 133
und
kgV(a, b) = 24 · 3 · 52 · 72 · 134 · 17 · 23.
Die Zerlegung ganzer Zahlen in ihre Primfaktoren dauert bei Zahlen mit sehr
großen Primfaktoren unter Umständen sehr lange. Diese Tatsache ist zum Beispiel
wichtig für das weit verbreitete Verschlüsselungsverfahren RSA.
Es gibt aber einen schnellen Algorithmus, mit dem den größten gemeinsamen
Teiler zweier natürlicher Zahlen bestimmen kann, der auf Euklid zurückgeht und
damit seit über 2000 Jahren bekannt ist. Der Algorithmus benutzt die Division mit
Rest.
Satz 2.24. Für alle m ∈ Z und alle n ∈ N gibt es eindeutig bestimmte Zahlen q
und r mit 0 ≤ r < n und m = q · n + r.
In der Darstellung m = q · n + r nennt man q den Quotienten von m und n
und r den Rest. Die Funktion, die m und n den Quotienten q zuordnet wird mit
div bezeichnet. Die Funktion, die m und n den Rest r zuordnet heißt mod. Es gilt
also für alle m ∈ Z und alle n ∈ N die Gleichung
m = (m div n) · n + (m mod n).
Beispiel 2.25.
(1) Sei m = 27 und n = 12. Dann ist 27 = 2 · 12 + 3. Der
Quotient ist also 2 und der Rest 3.
(2) Sei m = −10 und n = 3. Dann ist −10 = −4 · 3 + 2. Wir haben also q = −4
und r = 2. Es gilt zwar auch −10 = −3 · 3 − 1, aber die Zahlen q und r
werden bei der Division mit Rest immer so gewählt, dass 0 ≤ r < n gilt.
Wir stellen Folgendes fest: Ist a ein gemeinsamer Teiler von m und n und gilt
m = q · n + r, so ist a auch ein Teiler von r = m − q · n. Umgekehrt ist jeder
gemeinsame Teiler von n und r auch ein Teiler von m. Es folgt, dass die beiden
Zahlen m und n dieselben gemeinsamen Teiler haben wie die beiden Zahlen n und
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
33
r. Für jede natürliche Zahl n ist ggT(n, 0) = n. Das erklärt, warum der folgende
Algorithmus zur Berechnung des größten gemeinsamen Teilers zweier natürlicher
Zahlen funktioniert.
Der euklidische Algorithmus. Seien m, n ∈ N0 mit m > n.
(1) Falls n = 0 ist, so gib m als den größten gemeinsamen Teiler aus.
(2) Falls n 6= 0 ist, so bestimme ganze Zahlen q und r mit 0 ≤ r < n und
m = q · n + r.
(3) Setze m := n und n := r gehe zurück zu (1).
Nach unserer Vorbemerkung haben m und n in jedem Durchlauf der Schleife in
diesem Algorithmus denselben größten gemeinsamen Teiler. Auf der anderen Seite
wird n in jedem Durchlauf der Schleife echt kleiner. Also ist nach endlich vielen
Schritten n = 0 und der Algorithmus terminiert.
Beispiel 2.26.
(1) Wir berechnen wieder den größten gemeinsamen Teiler von
70 und 60, aber diesmal mit dem euklidischen Algorithmus. Setze zunächst
m = 70 und n = 60. Wegen n 6= 0, führen wir eine Division mit Rest durch.
Es gilt 70 = 1 · 60 + 10. Wir setzen m := 60 und n := 10. Immer noch
gilt n 6= 0. Division mit Rest liefert 60 = 6 · 10 + 0. Wir setzen m := 10
und n := 0. Nun ist n = 0 und der größte gemeinsame Teiler von 10 und
0 ist 10. Die ursprünglichen Zahlen 70 und 60 haben denselben größten
gemeinsamen Teiler und daher gilt ggT(70, 60) = 10.
(2) Sei m = 816 und n = 294. Die Rechnung lautet nun wie folgt:
816
= 2 · 294 + 228
294
= 1 · 228 + 66
228
= 3 · 66 + 30
66
=
2 · 30 + 6
30
=
5·6+0
Damit ergibt sich ggT(816, 294) = 6.
2.7. Modulare Arithmetik.
Definition 2.27. Es sei m eine natürliche Zahl. Zwei ganze Zahlen a und b sind
kongruent modulo m, falls a und b denselben Rest bei Division durch m haben.
Ist a kongruent zu b modulo m, so schreiben wir a ≡ b (mod m).
Wir stellen kurz fest, dass a ≡ b (mod m) genau dann gilt, wenn a − b durch m
teilbar ist. Ist a ≡ b (mod m), so existieren ganze Zahlen qa , qb und r mit a = qa ·m+
r, b = qb ·m+r und 0 ≤ r < m. Es gilt a−b = (qa ·m+r)−(qb ·m+r) = (qa −qb )·m.
Also ist a − b durch m teilbar.
Sei umgekehrt a − b durch m teilbar. Es gibt ganze Zahlen qa , qb , ra und rb mit
a = qa · m + ra , b = qb · m + rb , 0 ≤ ra < m und 0 ≤ rb < m. Es gilt
a − b = (qa · m + ra ) − (qb · m + rb ) = (qa − qb ) · m + (ra − rb ).
34
STEFAN GESCHKE
Da a − b durch m teilbar ist, ist auch ra − rb durch m teilbar. Wegen 0 ≤ ra , rb < m
gilt −m < ra − rb < m. Wenn aber eine ganze Zahl, die echt größer als −m und
echt kleiner als m ist, durch m teilbar ist, so kann diese Zahl nur 0 sein. Damit ist
ra − rb = 0. Also gilt a ≡ b (mod m).
Beispiel 2.28.
(1) 23 ≡ 8 (mod 5), da 23 − 8 = 15 durch 5 teilbar ist. Außer-
dem ist 23 = 4 · 5 + 3 und 8 = 1 · 5 + 3, also 23 mod 5 = 3 = 8 mod 5.
(2) −7 ≡ 2 (mod 3), da −7 = −3 · 3 + 2 und 2 = 0 · 3 + 2, also −7 mod 3 = 2 =
2 mod 3.
(3) 8227 6≡ 11 (mod 3), da 8227 − 11 = 8216 nicht durch 3 teilbar ist.
Wir betrachten die Menge aller ganzen Zahlen, die modulo m kongruent zu einer
festen Zahl sind.
Beispiel 2.29. Sei m = 3. Die Menge der Zahlen, deren Rest bei Division durch 3
genau 0 ist, ist die Menge
K0 = {. . . , −6, −3, 0, 3, 6, 9, . . . }.
Die Menge der Zahlen, bei denen der Rest genau 1 ist, ist
K1 = {. . . , −5, −2, 1, 4, 7, 10, . . . }.
Für den Rest 2 erhalten wir die Menge
K2 = {. . . , −4, −1, 2, 5, 8, 11, . . . }.
Definition 2.30. Für jede natürliche Zahl m und jede ganze Zahl a heißt die
Menge [a]m := {b ∈ Z : b mod m = a mod m} die Restklasse von a modulo m.
Wir stellen fest, dass es für jede natürliche Zahl m genau m verschiedene Restklassen modulo m gibt, nämlich [0]m , . . . , [m−1]m . Diese Restklassen sind paarweise
disjunkt und es gilt Z = [0]m ∪ · · · ∪ [m − 1]m .
Folgender Satz sammelt die wichtigsten Regeln für das Rechnen mit Kongruenzen.
Satz 2.31. Für alle m ∈ N und alle a, b, c, d ∈ Z gilt:
(1) a ≡ a (mod m)
(2) a ≡ b (mod m) ⇒ b ≡ a (mod m)
(3) a ≡ b (mod m) ∧ b ≡ c (mod m) ⇒ a ≡ c (mod m)
(4) a ≡ b (mod m) ⇒ −a ≡ −b (mod m)
(5) a ≡ b (mod m) ∧ c ≡ d (mod m) ⇒ a + c ≡ b + d (mod m)
(6) Gilt ggT(c, m) = 1, so folgt aus c · a ≡ c · b (mod m) die Kongruenz a ≡
b (mod m).
Diese Rechenregeln kann man direkt mit Hilfe der Definition von a ≡ b (mod m)
nachrechnen
Beispiel 2.32. In Satz 2.31 (6) muss man wirklich ggT(c, m) = 1 voraussetzen.
Zum Beispiel gilt 8 · 3 ≡ 8 · 6 (mod 6) aber nicht 3 ≡ 6 (mod 6).
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
35
Nützliche Operationen auf den reellen Zahlen, mit deren Hilfe man zum Beispiel
auch die Funktionen div und mod berechnen kann, sind das Auf- und Abrunden.
Definition 2.33. Für eine reelle Zahl r ist dre die kleinste ganze Zahl ≥ r. Analog
ist brc die größte ganze Zahl ≤ r. Man nennt d
b
e die obere Gaußklammer und
c die untere Gaußklammer.
Beispiel 2.34. Es gilt
d3.14e
√
d 2e
=
4,
3,
2,
b3.14c
√
b 2c
=
=
=
1,
d5e
=
5,
b5c
=
5,
d−1.2e
=
-1, b−1.2c
=
-2.
m
Für alle m ∈ Z und n ∈ N gilt m div n = b m
n c sowie m mod n = m − n · b n c.
36
STEFAN GESCHKE
3. Elementare Kombinatorik
Definition 3.1. Für eine endliche Menge M sei |M | die Anzahl der Elemente von
M.
(1) (Additionsregel) M sei eine endliche Menge und M1 , . . . , Mn
Satz 3.2.
seien disjunkte Teilmengen von M mit M = M1 ∪ · · · ∪ Mn . Dann gilt
|M | =
n
X
|Mi |.
i=1
(2) (Multiplikationsregel) Seien A1 , . . . , An endliche Mengen. Dann gilt
|A1 × · · · × An | = |A1 | · . . . · |An | =
n
Y
|Ai |.
i=1
(3) (Gleichheitsregel) Seien A und B zwei endliche Mengen. Dann gilt |A| = |B|
genau dann, wenn es eine Bijektion f : A → B gibt.
Eine typische Anwendung der Multiplikationsregel ist die folgende:
Für ein n ∈ N betrachten wir n Kästchen K1 , . . . , Kn .
...
K1
K2
...
Kn
In das erste Kästchen K1 legen wir ein Objekt a1 , in das zweite Kästchen K2
ein Objekt a2 und so weiter. Wenn wir k1 Möglichkeiten haben, das erste Kästchen
K1 zu belegen, k2 Möglichkeiten, das zweite Kästchen K2 zu belegen und so weiter,
dann gibt es insgesamt k1 · k2 · . . . · kn Möglichkeiten, die n Kästchen zu belegen.
Beispiel 3.3.
(1) Eine Kennziffer bestehe aus drei Buchstaben und vier dar-
auffolgenden Ziffern, wie F AB3447 oder ARR5510. Wieviele derartige Kennziffern gibt es?
Nach der Multiplikationsregel gibt es
26 · 26 · 26 · 10 · 10 · 10 · 10 = 263 · 104 = 175760000
Kennziffern.
(2) Wieviele Kennziffern wie in (1) gibt es, in denen kein Buchstabe und keine
Ziffer doppelt vorkommen?
Nach der Multiplikationsregeln ergibt sich
26 · 25 · 24 · 10 · 9 · 8 · 7 = 78624000.
(3) Gegeben seien 15 unterschiedliche Bücher, von denen 8 auf Englisch, 3 auf
Deutsch und 4 auf Russisch sind. Auf wie viele Arten kann man zwei Bücher
in verschiedenen Sprachen auswählen?
Nach Additions- und Multiplikationsregel ergibt sich
8 · 3 + 8 · 4 + 3 · 4 = 68.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
37
Wir diskutieren im Folgenden fünf grundlegende Fragestellungen, die wir Grundaufgaben nennen.
Vorher definieren wir noch Tupel der Länge 0.
Definition 3.4. Für eine beliebige Menge M sei ∅ das eindeutig bestimmte 0-Tupel
von Elementen von M . Mit anderen Worten, M 0 = {∅}.
Grundaufgabe 1. Es seien n, k ∈ N0 . Wie viele k-Tupel von Elementen einer
n-elementigen Menge gibt es?
Antwort: nk
Diese Antwort ergibt sich sofort mit Hilfe der Multiplikationsregel.
Beispiel 3.5.
(1) Sei M = {a, b}. Dann gibt es 23 = 8 3-Tupel von Elementen
von M . Es gilt
M 3 = {(a, a, a), (a, a, b), (a, b, a), (a, b, b), (b, a, a), (b, a, b), (b, b, a), (b, b, b)}.
(2) Sei M = {a, b, c, d, e, f, g}. Dann gibt es 73 = 343 3-Tupel von Elementen
von M .
Grundaufgabe 2. Es seien n, k ∈ N0 . Wieviele k-Tupel von Elementen einer nelementigen Menge gibt es, in denen kein Element doppelt vorkommt?
Antwort: Falls k ≥ 1 ist, so gibt es nach der Multiplikationsregel n · (n − 1) · . . . ·
(n − (k − 1)) k-Tupel von Elementen einer n-elementigen Mengen, in denen kein
Element doppelt vorkommt. Ist k = 0, so gibt es genau ein k-Tupel.
Diese Antwort legt folgende Definition nahe:
Definition 3.6. Für n, k ∈ N0 sei

n · (n − 1) · . . . · (n − k + 1), falls k ≥ 1 und
nk :=
1, sonst.
Beispiel 3.7.
(1) 70 = 1
(2) 71 = 7
(3) 72 = 7 · 6 = 42
(4) 73 = 7 · 6 · 5 = 210
Beispiel 3.8. Sei M = {a, b, c, d, e, f, g}. Dann gibt es 73 = 210 3-Tupel von
Elementen von M , in denen kein Element doppelt vorkommt.
Definition 3.9. Sei M eine Menge. Eine Permutation von M ist eine Bijektion
π : M → M.
Beispiel 3.10. Sei M = {1, 2, 3}. Wir definieren π : M → M durch π(1) = 3,
π(2) = 1 und π(3) = 2. Dann ist π eine Permutation auf M .
38
STEFAN GESCHKE
Ist M eine endliche Menge {m1 , . . . , mn }, wobei wir annehmen, dass die mi
paarweise verschieden sind, so kann man eine Permutation π : M → M in der
Form
m1
m2
...
π(m1 ) π(m2 ) . . .
mn
!
π(mn )
darstellen. In dieser Schreibweise lautet die Permutation aus Beispiel 3.10
!
1 2 3
π=
.
3 1 2
Aus der Grundaufgabe 2 ergibt sich, dass die Anzahl der Permutationen einer
n-elementigen Menge genau nn = n · (n − 1) · . . . · 1 ist. Anstelle von nn schreibt
man üblicher Weise n! (gelesen „n Fakultät“).
Beispiel 3.11. 0! = 00 = 1, 1! = 11 = 1, 2! = 22 = 2 · 1 = 2, 10! = 1010 =
10 · 9 · . . . · 2 · 1 = 3628800.
(1) Sei M = {1, 2, 3}. Dann gibt es genau 3! = 3 · 2 · 1 = 6
Beispiel 3.12.
Permutationen von M :
!
1 2 3
1
2
1
3
1
2
!
3
1
2
3
2
1
3
1
2
3
3
1
2
1
3
2
3
!
3
1
2
2
!
3
2
1
2
3
1
!
!
(2) Sei M = {a, b, c, d, e, f, g}. Dann gibt es 7! = 5040 Permutationen von M .
Grundaufgabe 3. Es sei n ≥ k ≥ 0. Wieviele k-elementige Teilmengen einer
n-elementigen Menge gibt es?
Antwort: Es gibt
nk
k!
k-elementige Teilmengen einer n-elementigen Menge.
Das kann man wie folgt sehen: Nach Grundaufgabe 2 wissen wir schon, dass es
für eine n-elementige Menge M genau nk k-Tupel von Elementen von M gibt, in
denen kein Element doppelt vorkommt. Für jedes k-Tupel (m1 , . . . , mk ) von Elementen von M können wir nun die k-elementige Menge {m1 , . . . , mk } betrachten.
Jede k-elementige Teilmenge von M entsteht auf diese Weise. Für jede k-elementige
Teilmenge Teilmenge {m1 , . . . , mk } von M gibt es genau k! k-Tupel, deren Komponenten genau die Elemente m1 , . . . , mk sind. Das liegt daran, dass jedes solche kTupel einer Permutation der Menge {m1 , . . . , mk } entspricht. Da also je k! k-Tupel
k
dieselbe k-elementige Teilmenge von M liefern, gibt es insgesamt nk! k-elementige
Teilmengen von M .
Für die Anzahl der k-elementigen Teilmengen einer n-elementigen Menge schreibt
n
k . Es gilt
n
nk
nk · (n − k)!
n!
=
=
=
.
k
k!
k! · (n − k)!
k! · (n − k)!
man auch
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
39
Ist k ≥ 1, so können wir auch
n
n · (n − 1) · . . . · (n − k + 1)
=
k
k · (k − 1) · . . . · 1
schreiben.
Definition 3.13. Für n, k ∈ N0 mit n ≥ k ≥ 0 nennt man die Zahl
n
k
=
nk
k!
einen
Binomialkoeffizienten.
Beispiel 3.14. Sei M = {a, b, c, d, e, f, g}. Dann hat M genau
7
7·6·5
=
= 35
3
3·2·1
3-elementige Teilmengen.
Satz 3.15 (Rekursive Berechnung der Binomialkoeffizienten). Für alle n, k ∈ N
mit n ≥ 2 und 1 ≤ k ≤ n − 1 gilt
n
n−1
n−1
=
+
.
k
k
k−1
Beweis. Es gilt
(n − 1)!
n−1
n−1
(n − 1)!
+
+
=
k! · (n − 1 − k)! (k − 1)! · (n − k)!
k
k−1
(n − 1)! · (n − k) + k · (n − 1)!
n!
=
=
=
k! · (n − k)!
k! · (n − k)!
n
.
k
Wir ordnen die Binomialkoeffizienten wie folgt im Pascalschen Dreieck an:
0
0
1
1
1
0
2
0
3
0
.
2
2
3
1
..
2
1
3
2
3
3
4
4
4
4
0
1
2
3
..
.
4
4
..
.
Dabei ist jeder Binomialkoeffizient im Innern des (unendlichen) Dreiecks nach
Satz 3.15 die Summe der beiden Binomialkoeffizienten, die sich rechts und links darüber befinden. Auf diese Weise lassen sich leicht die Werte der Binomialkoeffizienten
berechnen:
40
STEFAN GESCHKE
1
1
1
1
1
.
3
4
1
1
2
1
3
6
5
10
1
4
10
1
5
1
..
.
..
..
.
Die Binomialkoeffizienten verdanken ihren Namen dem folgenden Satz:
Satz 3.16 (Binomischer Lehrsatz). Seien a, b ∈ R. Dann gilt für alle n ∈ N0
n X
n n−i i
n n−1
n
(a + b)n =
a b = an +
a
b + ... +
abn−1 + bn .
i
1
n
−
1
i=0
Pn
Man beachte, dass der Ausdruck i=0 ni an−i bi auch für n = 0 definiert ist,
n−1
n
während an + n1 an−1 b + . . . + n−1
ab
+ bn nur für n ≥ 3 sinnvoll ist. Das zeigt
den Vorteil der Schreibweise mit dem Summenzeichen gegenüber der unexakten
Pünktchen-Schreibweise.
Beweis. Wir beweisen den Satz durch Induktion über n.
Induktionsanfang. Für n = 0 gilt
(a + b)n = (a + b)0 = 1 = a0 b0 .
Induktionsschritt. Wir nehmen an, dass
(a + b)n =
n X
n
i
i=0
an−i bi
für ein gewisses n ∈ N0 gilt (Induktionsannahme).
Dann gilt
I.A.
(a + b)n+1 = (a + b)n · (a + b) =
n X
n
i=0
i
!
an−i bi
· (a + b)
!
!
n n X
X
n n−i i
n n−i i
=
a b ·a+
a b ·b
i
i
i=0
i=0
n n X
n n+1−i i X n n−i i+1
=
a
b +
a b
i
i
i=0
i=0
n n+1 X
n n+1−i i X
n
=
a
b +
an+1−i bi
i
i
−
1
i=0
i=1
n n+1
X
X n + 1 n
n
n+1
n+1−i i
n+1
=a
+
+
a
b +b
=
an+1−i bi ,
i
i
−
1
i
i=1
i=0
wobei sich das letzte Gleichungszeichen aus Satz 3.15 ergibt.
Beispiel 3.17.
2
(1) Für n = 2 ist Satz 3.16 die bekannte binomische Formel
2
(a + b) = a + 2ab + b2 .
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
41
(2) Für n = 3 gilt (a + b)3 = a3 + 3a2 b + 3ab2 + b3 .
(3) Für n = 4 gilt (a + b)4 = a4 + 4a3 b + 6a2 b2 + 4ab3 + b4 .
Wir bemerken noch zwei wichtige Regeln für Binomialkoeffizienten.
Pn
(1) Für alle n ∈ N0 gilt 2n = i=0
n
.
(2) Für alle n, k ∈ N0 mit n ≥ k gilt nk = n−k
Korollar 3.18.
n
1
.
Beweis. (1) Nach Satz 3.16 gilt
2n = (1 + 1)n =
n X
n
i=0
1
1n−i 1i =
n X
n
i=0
1
.
(2) Es gilt
n
n!
n!
n
=
=
=
.
k
k! · (n − k)!
(n − k)! · (n − (n − k))!
n−k
Wir geben noch ein weiteres Argument für diese Gleichung an. Sei M eine nelementige Menge. Die Komplementbildung ist eine Bijektion zwischen der Menge der k-elementigen Teilmengen von M und der Menge der (n − k)-elementigen
Teilmengen von M . Damit gibt es genausoviele k-elementige Teilmengen von M
wie (n − k)-elementige. Nach Grundaufgabe 3 und der Gleichheitsregel gilt also
n
n
k = n−k .
Korollar 3.19. Sei n ∈ N0 und sei M eine n-elementige Menge. Dann hat P(M )
genau 2n Elemente.
Wir geben zwei Beweise dieser wichtigen Tatsache an.
Erster Beweis. Für k ∈ N0 mit 0 ≤ k ≤ n sei Pk die Menge der k-elementigen
Teilmengen von M . Nach Grundaufgabe 3 wissen wir, dass |Pk | = nk gilt. Außerdem sind die Pk disjunkt und es gilt P(M ) = P0 ∪ · · · ∪ Pn . Nach der Additionsregel
Pn
und nach Korollar 3.18 ist damit |P(M )| = k=0 nk = 2n .
Zweiter Beweis. Sei
P := {f : f ist eine Funktion von M nach {0, 1}}.
Da M genau n Elemente hat, können wir M als {m1 , . . . , mn } schreiben. Jeder
Funktion f ∈ P ordnen wir nun das n-Tupel (f (m1 ), f (m2 ), . . . , f (mn )) zu. Das
liefert eine Bijektion zwischen der Menge P und der Menge {0, 1}n . Nach der Gleichheitsregel ist also |P | = |{0, 1}n |. Nach Grundaufgabe 1 ist |{0, 1}n | = 2n . Damit
ist |P | = 2n .
Für jede Menge A ⊆ M betrachten wir nun die charakteristische Funktion
χA : M → {0, 1} von A, die wie folgt definiert ist: Für jedes x ∈ M sei

0, falls x 6∈ A und
χA (x) =
1, falls x ∈ A.
42
STEFAN GESCHKE
Die Abbildung A 7→ χA ist eine Bijektion von P(M ) nach P . Wieder nach der
Gleichheitsregel folgt daraus |P(M )| = |P | = 2n .
Grundaufgabe 4. Sei n ∈ N und k ∈ N0 . Es seien n Gefäße K1 , . . . , Kn gegeben,
auf die k ununterscheidbare Kugeln verteilt werden sollen. Wieviele Möglichkeiten
gibt es, die Kugeln zu verteilen?
Antwort. Es gibt
n+k−1
k
Möglichkeiten, die Kugeln zu verteilen.
Das sehen wir wie folgt ein: Wir beschreiben die Verteilung der Kugeln durch
eine Folge von Nullen und Einsen. Wir beginnen mit so vielen Nullen, wie Kugeln
in P1 liegen. Dann schreiben wir eine Eins. Es folgen so viele Nullen, wie in P2
liegen. Darauf schreiben wir wieder eine Eins und so weiter.
Sei zum Beispiel n = 4 und k = 5. Angenommen, in P1 liegen 2 Kugeln, in P2
eine, in P3 keine und in P4 die restlichen zwei. Das liefert die Folge 00101100.
Bei n Gefäßen und k Kugeln erhalten wir eine Folge mit k Nullen und n − 1
Einsen. Umgekehrt ist klar, dass wir aus jeder Folge mit k Nullen und n − 1 Einsen
eindeutig ein Belegung der n Gefäße mit k Kugeln ablesen können.
Mit anderen Worten, es gibt eine Bijektion zwischen der Menge der Belegungen
der n Gefäße mit k Kugeln und den Folgen der Länge n+k −1 mit n−1 Einsen und
k Nullen. Die Folgen der Länge n + k − 1 mit n − 1 Einsen und k Nullen können wir
als charakterische Funktionen von (n − 1)-elementigen Teilmengen einer n + k − 1
elementigen Menge interpretieren. Damit gibt es genau n+k−1
= n+k−1
mögliche
n−1
k
Belegungen der n Gefäße mit k Kugeln.
Beispiel 3.20. Angenommen, k Abgeordnete wählen je einen von n Kandidaten.
Keiner der Abgeordneten enthält sich. Dann gibt es n+k−1
mögliche Verteilungen
k
der k Stimmen auf die n Kandidaten.
Grundaufgabe 5. Gegeben seien r verschiedene Zeichen Z1 , . . . , Zr . Wie viele verschiedene Zeichenfolgen der Länge n kann man aus den Zeichen Z1 , . . . , Zr bilden,
wenn man verlangt, dass das Zeichen Z1 genau n1 -mal auftritt, das Zeichen Z2
genau n2 -mal und so weiter.
Beispiel 3.21. Wie viele Wörter lassen sich aus den Buchstaben des Wortes
ANAGRAMM bilden (wobei alle Buchstaben verwendet werden sollen)?
Die Zeichen, die in diesem Beispiel auftreten, sind Z1 =A, Z2 =G, Z3 =M, Z4 =N
und Z5 =R. Kommt A dreimal vor, darf also auch dreimal verwendet werden. n1
ist also 3. Analog sind n2 = 1, n3 = 2, n4 = 1 und n5 = 1.
Eine Zeichenkette, die aus den Buchstaben in ANAGRAMM gebildet ist, wie
zum Beispiel AMMAGRAN, ändert sich nicht, wenn wir die A’s untereinander
vertauschen oder wenn wir die M’s vertauschen. Die drei A’s können wir auf 3!=6
Arten permutieren und die M’s auf 2!=2 Arten. Insgesamt gibt es also 3! · 2! =
12 Permutationen der Zeichen in AMMAGRAN, die genau dieselbe Zeichenfolge
liefern.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
43
Das gleich Argument zeigt für jede Zeichenfolge aus den Buchstaben von ANAGRAMM, dass es genau 12! Permutationen der Zeichen gibt, die dieselbe Zeichenfolge liefern. Insgesamt gibt es 8! = Permutationen der Zeichen von ANAGRAMM
Ingesamt gibt es 8! = 40320 Permutationen der acht Zeichen in dem Wort ANAGRAMM, von denen wir aber jeweils Klassen von 12 Permutationen nicht unterscheiden können. Damit gibt es
8!
3!·2!
=
40320
12
= 3360 mögliche Zeichenfolgen aus
den Buchstaben des Wortes ANAGRAMM.
Antwort zu Grundaufgabe 5. Es gibt genau
(n1 + . . . + nr )!
n1 ! · . . . · nr !
Zeichenfolgen aus den Zeichen Z1 , . . . , Zr , in denen für jedes i ∈ {1, . . . , r} das
Zeichen Zi genau ni -mal vorkommt.
Das sieht man genauso, wie in Beispiel 3.21. Wir betrachten die Zeichenfolge W
in der zunächst n1 -mal das Zeichen Z1 auftritt, dann n2 -mal das Zeichen Z2 und so
weiter. Die Wörter aus den Zeichen Z1 , . . . , Zr , die in der Grundaufgabe 5 gebildet
werden dürfen, entstehen durch Permutation der Zeichen in W . W hat die Länge
n1 + . . . + nr . Also gibt es (n1 + . . . + nr )! solcher Permutationen.
Die Menge dieser Permutationen zerfällt wieder in Klassen disjunkter Mengen,
die ununterscheidbare Zeichenfolgen liefern. Die Größe einer jeden solchen Klasse
ist n1 ! · . . . · nr !, nämlich die Anzahl der Permutationen der Zeichen Z1 in einem
Wort, multipliziert mit der Anzahl der Permutationen der Zeichen Z2 in einem
Wort und so weiter.
(n1 +...+nr )!
n1 !·...·nr !
Zeichenfolgen.
Pr
Definition 3.22. Seien n1 , . . . , nr ∈ N0 und n = i=1 ni . Dann nennt man
n
n!
=
n1 ! · . . . · nr !
n1 , . . . , n r
Insgesamt erhalten wir
einen Multinomialkoeffizienten.
Wegen 0! = 1 sind die Multinomialkoeffizienten auch definiert, wenn für ein oder
mehrere i ∈ {1, . . . , r} die Gleichung ni = 0 gilt. Auch die Lösung der Grundaufgabe
5 stimmt in dieser Situation. Extrem ist der Fall n = n1 +. . .+nr = 0. Aber auch hier
geht alles glatt. Es gibt genau eine Zeichenfolge der Länge 0, die leere Zeichenfolge.
Im Spezialfall r = 2 sind die Multinomialkoeffizienten genau die schon betrachteten Binomialkoeffizienten. Sei nämlich n = n1 + n2 . Dann gilt
n
n!
n!
n
n!
n
=
=
=
=
=
.
n1 , n2
n1 ! · n2 !
n1 ! · (n − n1 )!
n1
n2 ! · (n − n2 )!
n2
3.1. Ziehen von Elementen einer Menge. Die ersten vier Grundaufgaben gehen alle auf dieselbe grundlegende Frage zurück: Wieviele Möglichkeiten gibt es, k
Elemente aus einer n-elementigen Menge zu ziehen?
Dabei wird auf unterschiedliche Weisen gezogen, und die Ergebnisse werden auf
unterschiedliche Arten gezählt. Es gibt folgende Möglichkeiten:
44
STEFAN GESCHKE
(1) Ziehen mit Zurücklegen, wobei die Reihenfolge, in der die Elemente gezogen
werden, berücksichtigt wird.
(2) Ziehen ohne Zurücklegen, mit Berücksichtigung der Reihenfolge.
(3) Ziehen ohne Zurücklegen, ohne Berücksichtigung der Reihenfolge.
(4) Ziehen mit Zurücklegen, ohne Berücksichtigung der Reihenfolge.
Satz 3.23. Seien n, k ∈ N0 . Dann gibt es genau nk Möglichkeiten, k Elemente mit
Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge, in
der die Elemente gezogen werden, berücksichtigt wird.
Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kTupeln von Elementen der n-elementigen Menge. Gemäß der Lösung von Grundaufgabe 1 gibt es also genau nk Möglichkeiten.
Satz 3.24. Seien n, k ∈ N0 mit k ≤ n. Dann gibt es genau nk Möglichkeiten, k
Elemente ohne Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die
Reihenfolge, in der die Elemente gezogen werden, berücksichtigt wird.
Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kTupeln von Elementen der n-elementigen Menge, in denen kein Element doppelt
vorkommt. Gemäß der Lösung von Grundaufgabe 2 gibt es also genau nk Möglich
keiten.
Satz 3.25. Seien n, k ∈ N0 mit k ≤ n. Dann gibt es genau
n
k
Möglichkeiten,
k Elemente ohne Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die
Reihenfolge, in der die Elemente gezogen werden, nicht berücksichtigt wird.
Beweis. Die Möglichkeiten, die k Elemente zu ziehen, entsprechen genau den kelementigen Teilmengen der n-elementigen Menge. Gemäß der Lösung von Grund
aufgabe 3 gibt es also genau nk Möglichkeiten.
Satz 3.26. Seien n, k ∈ N0 . Dann gibt es genau
n+k−1
k
Möglichkeiten, k Elemente
mit Zurücklegen aus einer n-elementigen Menge zu ziehen, wobei die Reihenfolge,
in der die Elemente gezogen werden, nicht berücksichtigt wird.
Beweis. Wir führen den Satz auf die Lösung der Grundaufgabe 4 zurück. Wenn die
Reihenfolge, in der die Elemente gezogen werden, keine Rolle spielt, so müssen wir
nur zählen, wie oft jedes Element der n-elementigen Menge gezogen wurde.
Diese Situation können wir wie folgt kodieren: Sei M = {a1 , . . . , an } eine nelementige Menge. Für jedes Element ai der n-elementigen Menge M betrachten
wir ein Gefäß Ki . Nun ziehen wir die k Elemente der n-elementigen Menge mit
Zurücklegen. Immer wenn wir ein Element ai ziehen, tun wir eine Kugel in das
Gefäß Ki .
Jede Verteilung von k Kugeln auf die Gefäße K1 , . . . , Kn entspricht genau einer
Ziehung von k Elementen der n-elementigen Menge und umgekehrt. Nach der Lö
sung von Grundaufgabe 4 gibt es n+k−1
mögliche Verteilungen von k Kugeln auf
k
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
die n Gefäße. Also gibt es auch
n+k−1
k
45
Möglichkeiten, k Elemente ohne Zurück-
legen aus einer n-elementigen Menge zu ziehen, wenn man die Reihenfolge, in der
die Elemente gezogen werden, nicht berücksichtigt.
3.2. Der Multinomialsatz.
Satz 3.27 (Multinomialsatz). Seien r, n ∈ N0 mit r ≥ 1. Dann gilt für alle
x1 , . . . , x r ∈ R
n
(x1 + . . . + xr ) =
X
n1 +...+nr =n
n
xn1 · . . . · xnr r .
n1 , . . . , n r 1
Diese Summe läuft über alle r-Tupel (n1 , . . . , nr ) ∈ Nr0 mit n1 + . . . + nr = n.
Man beachte, dass man für r = 2 aus dem Multinomialsatz genau den Binomialsatz erhält.
Beweis. Den Binomialsatz hatten wir mittels vollständiger Induktion bewiesen. Für
den Multinomialsatz geben wir einen kombinatorischen Beweis an, der nur die Lösung von Grundaufgabe 5 benutzt. Wir können
(x1 + . . . + xr )n = (x1 + . . . + xr ) · . . . · (x1 + . . . + xr )
{z
}
|
n Faktoren
durch Ausmultiplizieren berechnen. Für n1 , . . . , nr ∈ N0 mit n1 + . . . + nr = n
zählen wir, wie oft das Produkt xn1 1 · . . . · xnr r beim Ausmultiplizieren auftritt.
Beim Ausmultiplizieren wählen wir aus jedem der n Faktoren (x1 + . . . + xr ) eine
Variable aus. Wir wählen also ein Wort der Länge n aus den Zeichen x1 , . . . , xr .
Um das Produkt xn1 1 · . . . · xnr r zu erhalten, muss in dem Wort, das wir Auswählen,
die Variable x1 genau n1 -mal auftreten, die Variable x2 n2 -mal und so weiter. Nach
n
der Lösung von Grundaufgabe 5 gibt es genau n1 ,...,n
Wörter der Länge n, in
r
denen für alle i ∈ {1, . . . , r} das Zeichen xi genau ni -mal auftritt. Damit ist der
Koeffizient vor dem Produkt x1n1 · . . . · xnr r , der sich beim Ausmultiplizieren von
n
(x1 + . . . + xr )n ergibt, die Zahl n1 ,...,n
. Das zeigt den Multinomialsatz.
r
Beispiel 3.28. Nach Ausmultiplizieren von (x + y + z)10 ist der Koeffizient vor
dem Produkt x5 y 3 z 2 die Zahl
10 · 9 · 8 · 7 · 6
10 · 9 · 8 · 7
10
10!
=
=
= 7 · 4 · 9 · 10 = 2520.
=
5! · 3! · 2!
3! · 2!
2
5, 3, 2
3.3. Das Schubfachprinzip (pigeonhole principle).
Satz 3.29 (Schubfachprinzip). Seien m, n ∈ N mit m > n. Wenn m Objekte
auf n Fächer verteilt werden, so gibt es mindestens ein Fach mit mindestens zwei
Objekten.
Eine andere Formulierung dieses Satzes ist die folgende: Sind m und n natürliche
Zahlen mit m > n, so gibt es keine injektive Abbildung f : {1, . . . , m} → {1, . . . , n}.
Beispiel 3.30. In einer Menge von 13 Menschen gibt es mindestens zwei, die
im gleichen Monat Geburtstag haben. In einer Menge von 367 Menschen gibt es
46
STEFAN GESCHKE
mindestens zwei, die am gleichen Tag Geburtstag haben. (Der 29. Februar ist ein
möglicher Geburtstag.)
Wir beweisen eine Verstärkung von Satz 3.29.
Satz 3.31. Seien m, n ∈ N. Wenn m Objekte auf n Fächer verteilt werden, so gibt
es mindestens ein Fach mit mindestens d m
n e Objekte.
Beweis. Angenommen, das ist nicht der Fall. Dann enthält jedes Fach höchstens
dm
n e − 1 Objekte.
Damit enthalten die Fächer insgesamt nicht mehr als n · d m
n e − 1 Objekte. Es
gilt also
m≤n·
Umformen liefert
l m m
n
lmm
−1 .
m
.
n
n
Das ist aber unmöglich, da für jede reelle Zahl a der Abstand zwischen dae und a
1≤
−
echt kleiner als 1 ist.
Es gibt auch Versionen des Schubfachprinzips für unendliche Mengen.
Satz 3.32. Sei M eine unendliche Menge und n ∈ N. Sind M1 , . . . , Mn Teilmengen
von M mit M = M1 ∪ · · · ∪ Mn , so ist eine der Mengen M1 , . . . , Mn unendlich.
Beweis. Sind die Mengen M1 , . . . , Mn alle endlich, so sei m maximale Mächtigkeit
einer der Mengen M1 , . . . , Mn . Dann hat M1 ∪ · · · ∪ Mn höchstens die Mächtigkeit
m · n und ist damit endlich. Das widerspricht aber unserer Annahme, dass M =
M1 ∪ · · · ∪ Mn unendlich ist.
Aus diesem Satz folgt sofort, dass für jede Funktion f von einer unendlichen
Mengen A in eine endliche Menge B ein b ∈ B existiert, so dass die Menge
{a ∈ A : f (a) = b}
unendlich ist.
3.4. Das Prinzip der Inklusion und Exklusion (Siebformel). Seien A1 , . . . , An
endliche Mengen. Wir suchen eine Formel für die Mächtigkeit der Vereinigung der
Mengen Ai , i ∈ {1, . . . , n}, also für die Mächtigkeit |A1 ∪ · · · ∪ An | der Menge
A1 ∪ · · · ∪ An .
Wir betrachten zunächst den Fall zweier Mengen, A1 und A2 . Eine naheliegende
Vermutung ist, dass |A1 ∪ A2 | einfach die Summe von |A1 | und |A2 | ist. Das stimmt
aber nur, wenn A1 und A2 disjunkt sind.
Ist A1 = {1, 2, 3} und A2 = {2, 3, 4}, so ist |A1 ∪ A2 | = 4, |A1 | = 3, |A2 | = 3
und damit |A1 | + |A2 | = 6. Das Problem ist, dass die Elemente des Durchschnitts
A1 ∩ A2 = {2, 3} in der Rechnung |A1 | + |A − 2| doppelt gezählt werden. Um die
korrekte Mächtigkeit von A1 ∪ A2 zu berechnen, können wir |A1 | und |A2 | addieren
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
47
und dann die Mächtigkeit |A1 ∩ A2 | des Durchschnitts, der doppelt gezählt wurde,
abziehen:
|A1 ∪ A2 | = |A1 | + |A2 | − |A1 ∩ A2 |
(1)
In unserem Beispiel erhalten wir |A1 ∪ A2 | = 4 und
|A1 | + |A2 | − |A1 ∩ A2 | = 3 + 3 − 2 = 4.
Nun betrachten wir drei Mengen A1 , A2 und A3 . Wir wir schon gesehen haben,
gilt für zwei endliche Mengen B und C die Formel |B ∪ C| = |B| + |C| − |B ∩ C|.
Setzt man B := A1 ∪ A2 und C = A3 , so ergibt sich
|A1 ∪ A2 ∪ A3 | = |A1 ∪ A2 | + |A3 | − |(A1 ∪ A2 ) ∩ A3 |.
(2)
Nun ist (A1 ∪ A2 ) ∩ A3 = (A1 ∩ A3 ) ∪ (A2 ∩ A3 ). Also gilt
(3) |(A1 ∪A2 )∩A3 )| = |(A1 ∩A3 )∪(A2 ∩A3 )| = |A1 ∩A3 |+|A2 ∩A3 |−|A1 ∩A2 ∩A3 |.
Einsetzen von (1) und (3) in (2) liefert
|A1 ∪ A2 ∪ A3 |
= |A1 | + |A2 | − |A1 ∩ A2 | + |A3 | − (|A1 ∩ A3 | + |A2 ∩ A3 | + |A1 ∩ A2 ∩ A3 |)
= |A1 | + |A2 | + |A3 | − |A1 ∩ A2 | − |A1 ∩ A3 | − |A2 ∩ A3 | + |A1 ∩ A2 ∩ A3 |.
An dieser Gleichung sehen wir schon das allgemeine Prinzip der Inklusion und
Exklusion.
Satz 3.33 (Prinzip der Inklusion und Exklusion, Siebformel). Sei n ∈ N und seien
A1 , . . . , An endliche Mengen. Dann gilt

n
X
(−1)k−1 ·
|A1 ∪ · · · ∪ An | =
k=1

X
|An1 ∩ · · · ∩ Ank | .
1≤n1 <···<nk ≤n
Die innere Summe auf der rechten Seite der Gleichung läuft dabei über alle k-Tupel
(n1 , . . . , nk ) natürlicher Zahlen mit 1 ≤ n1 < · · · < nk ≤ n.
Für den Beweis dieses Satzes benutzen wir folgendes Lemma:
Lemma 3.34. Jede nichtleere endliche Menge M hat genauso viele Teilmengen
mit gerader Mächtigkeit wie mit ungerader Mächtigkeit.
Beweis. Sei n die Mächtigkeit von M . Wir nehmen zunächst an, dass n ungerade
ist. Dann ist die Abbildung a 7→ M \ a eine Bijektion zwischen der Menge der Teilmengen von M , die eine gerade Mächtigkeit haben, und der Menge der Teilmengen
von M , deren Mächtigkeit ungerade ist. Also hat M genauso viele Teilmengen mit
gerader Mächtigkeit wie mit ungerader Mächtigkeit.
Sei nun n gerade. Dann hat M genau
nX
2 −1 n
n
n
+ ··· +
=
1
n−1
2k + 1
k=0
48
STEFAN GESCHKE
Teilmengen mit ungerader Mächtigkeit. Nach Satz 3.15 gilt
n
2k+1
=
n−1
2k
+
n−1
2k+1
.
Also ist
n
2 −1
X
k=0
n
2k + 1
n
2 −1
=
X n − 1
2k
k=0
n−1
+
2k + 1
=
n−1
X
i=0
n−1
= 2n−1 .
i
n
Da M insgesamt 2 Teilmengen hat, hat genau die Hälfte aller Teilmengen eine
gerade Mächtigkeit.
Beweis von Satz 3.33. Sei a ∈ A1 ∪· · ·∪An . Auf der linken Seite der Gleichung wird
a genau einmal gezählt. Wir zeigen, dass a auch auf der rechten Seite der Gleichung
insgesamt genau 1 beiträgt. Sei B := {i : 1 ≤ i ≤ n ∧ a ∈ Ai } und ` := |B|. Die
Zahl ` gibt also an, in wie vielen der Mengen Ai das Element a vorkommt.
Die Summanden auf der rechten Seite der Siebformel haben alle die Form (−1)k ·
|An1 ∩ · · · ∩ Ank |, wobei k mindestens 1 ist und 0 ≤ n1 < · · · < nk ≤ n gilt. Das
Element a trägt nur dann etwas zu einem solchen Summanden bei, wenn a ∈ An1 ∩
· · · ∩ Ank gilt, wenn also n1 , . . . , nk Elemente von B sind. Das heißt, a trägt genau
dann zu einem Summanden (−1)k−1 · |An1 ∩ · · · ∩ Ank | bei, wenn {n1 , . . . , nk } ⊆ B
gilt. Wir wissen für jedes k ≤ `, dass B genau k` Teilmengen hat.
Damit kann man den Beitrag von a zu den Summanden auf der rechten Seite
der Siebformel als
`
X
(−1)
k=1
k−1
`
k
schreiben. Nach Lemma 3.34 hat jede `-elementige Menge genauso viele Teilmengen
mit gerader Mächtigkeit wie mit ungerader Mächtigkeit. Es gilt also
X
X
`
`
`
k−1 `
k−1 `
−
+
(−1)
=
(−1)
= 0.
0
k
k
k=1
k=0
Damit ist
`
X
(−1)k−1
k=1
`
`
=
= 1.
k
0
Damit ist der Beitrag von a zur rechten Seite der Siebformel ebenfalls genau 1.
Da dieses Argument für jedes a ∈ A1 ∪ · · · ∪ An stimmt, sind die beiden Seiten
der Siebformel tatsächlich gleich.
3.5. Die Abzählbarkeit von Q und die Überabzählbarkeit von R. Wir haben schon gesehen, dass es reelle Zahlen gibt, die nicht rational sind, wie zum
√
Beispiel 2. In diesem Abschnitt werden wir sehen, dass es sogar viel mehr reelle
als rationale Zahlen gibt.
Definition 3.35. Zwei Mengen A und B heißen gleichmächtig, wenn es eine
Bijektion f : A → B gibt.
Diese Definition ist auch für unendliche Mengen sinnvoll. So ist
f : Z → {a ∈ Z : a ist gerade}; a 7→ 2a
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
49
eine Bijektion zwischen den ganzen Zahlen und den (positiven sowie negativen)
geraden Zahlen. Z und die Menge aller geraden Zahlen sind also gleichmächtig.
Definition 3.36. Eine Menge M heißt abzählbar, wenn M entweder endlich ist
oder es eine Bijektion f : N → M gibt. Eine Menge, die nicht abzählbar ist, heißt
überabzählbar.
Man kann leicht zeigen, dass eine Menge genau dann M abzählbar ist, wenn M
entweder leer ist oder es eine surjektive Abbildung f : N → M gibt. Eine Surjektion
f : N → M nennt man eine Aufzählung von M . Eine Aufzählung f von M kann
man einfach in der Form f (1), f (2), . . . notieren.
So ist zum Beispiel 0, 1, −1, 2, −1, . . . eine Aufzählung von Z. Die Menge der
ganzen Zahlen ist also abzählbar. Etwas verblüffender ist folgender Satz, der von
Cantor bewiesen wurde.
Satz 3.37. Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis. Wir geben zunächst eine Aufzählung q1 , q2 , . . . der Menge der rationalen
Zahlen > 0 an. Man erhält die Aufzählung, indem man im folgenden Bild bei den
Bruch
1
1
beginnt und den Pfeilen folgt.
1
1
1
2
1
3
1
4
1
5
1
6
···
2
1
2
2
2
3
2
4
2
5
2
6
···
3
1
3
2
3
3
3
4
3
5
3
6
···
4
1
4
2
4
3
4
4
4
5
4
6
···
5
1
5
2
5
3
5
4
5
5
5
6
···
..
.
..
.
..
.
..
.
..
.
..
.
Die Aufzählung lautet also
1
1
2
3
2
, q2 = , q3 = q3 = , q4 = , q5 = , . . .
1
2
1
1
2
Die Tatsache, das viele rationale Zahlen hierbei doppelt auftreten, zum Beispiel
q1 =
1 als
1
1
und
2
2
spielt keine Rolle, da eine Aufzählung nicht injektiv sein muss. Es
ist aber klar, das jede rationale Zahl > 0 in dieser Aufzählung irgendwann einmal
auftritt.
Mit dieser Aufzählung der rationalen Zahlen > 0 können wir nun aber leicht eine
Aufzählung aller rationalen Zahlen angeben:
0, q1 , −q1 , q2 , −q2 , . . .
leistet das Gewünschte.
Satz 3.38. Die Menge R der reellen Zahlen ist überabzählbar.
50
STEFAN GESCHKE
Beweis. Wir zeigen, dass die schon die Menge der reellen Zahlen, die echt größer als
0 und echt kleiner als 1 sind, überabzählbar sind. Wir führen einen Widerspruchsbeweis.
Angenommen, es gibt eine Aufzählung s1 , s2 , s3 , . . . der reellen Zahlen s mit
0 < s < 1. Die Zahlen sn , n ∈ N lassen sich als Dezimalzahlen ohne Vorzeichen mit
einer 0 vor dem Dezimalpunkt schreiben. Für alle i, j ∈ N sei sij die Ziffer, die in
der j-ten Nachkommastelle der Dezimaldarstellung von si steht. Dann können wir
die Aufzählung s1 , s2 , . . . wie folgt notieren:
s1
= 0.s11 s12 s13 . . .
s2
= 0.s21 s22 s23 . . .
s3
..
.
= 0.s31 s32 s33 . . .
..
.
Nun definieren wir eine weitere reelle Zahl a, die echt zwischen 0 und 1 liegt,
die in der Aufzählung aber nicht auftritt. Das widerspricht der Annahme, dass
s1 , s2 , s3 , . . . eine Aufzählung der reellen Zahlen ist, die echt zwischen 0 und 1
liegen.
Wir geben die Nachkommastellen a1 a2 a3 . . . der Zahl a an. Für i ∈ N sei

4, falls s 6= 4 ist und
ii
ai :=
5, sonst.
Es ist klar, dass a = 0.a1 a2 a3 . . . echt zwischen 0 und 1 liegt. a ist so gewählt, dass es
sich an der i-ten Nachkommastelle von si unterscheidet. Da die Nachkommastellen
von a nicht irgendwann konstant 0 oder konstant 9 werden, ist a damit von allen
si , i ∈ N verschieden.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
51
4. Relationen
In Definition 1.15 haben wir das kartesische Produkt A × B zweier Mengen A
und B als die Menge aller Paare (a, b) mit a ∈ A und b ∈ B definiert.
Definition 4.1. Eine Relation von A nach B ist eine Teilmenge R von A × B.
Eine Relation auf A ist eine Teilmenge von A × A. Für (a, b) ∈ R schreiben wir
auch aRb.
Beispiel 4.2.
(1) Sei A = {1, 2, 3} und B = {0, 1}. Dann sind R1 , . . . , R4
Relationen von A nach B:
(a) R1 = {(1, 0), (2, 0), (2, 1)}.
(b) R2 = {(1, 1), (2, 1), (3, 0), (3, 1)}
(c) R3 = A × B
(d) R4 = ∅.
(2) R = {(a, b) : a, b ∈ N ∧ a < b}, S = {(a, b) : a, b ∈ N ∧ a ≤ b} und
T = {(a, b) : a, b ∈ N ∧ a = b} sind Relationen auf N. Üblicher Weise
identifizieren wir < mit R, ≤ mit S und T mit =.
Wir können Relationen ähnlich wie Funktionen mit Hilfe von Pfeildiagrammen
notieren. Hier sind zwei Diagramme für die Relationen R1 und R2 .
A
B
A
1
B
1
0
0
2
2
1
1
3
3
Eine Relation R auf einer Menge A können wir als gerichteten Graphen darstellen, wobei für jedes Element von A ein Punkt gezeichnet wird und für jedes
Paar (a, b) ∈ R ein Pfeil von dem Punkt, der a entspricht zu dem, der b entspricht.
Sei zum Beispiel A = {1, 2, 3, 4, 5} und
R = {(1, 1), (1, 2), (1, 5), (2, 3), (2, 4), (2, 5), (3, 4), (4, 5), (5, 1), (5, 3)}.
Dann sieht der entsprechende gerichtete Graph wie folgt aus:
2
1
5
4
3
52
STEFAN GESCHKE
Die Punkte 1, 2, 3, 4 und 5 nennt man die Knoten des Graphen. Einen Pfeil
von einem Knoten zu einem Knoten nennt man auch eine gerichtete Kante Eine
Kante von einem Knoten auf sicher selber nennt man auch eine Schlinge.
Definition 4.3. Sei A eine Menge und sei R eine Relation auf A.
(1) R heißt reflexiv, falls für alle a ∈ A das Paar (a, a) in R ist.
(2) R heißt irreflexiv, falls R kein Paar der Form (a, a) enthält.
(3) R heißt symmetrisch, falls für alle (a, b) ∈ R auch (b, a) ∈ R gilt.
(4) R heißt antisymmetrisch, falls aus (a, b) ∈ R und a 6= b stets (b, a) 6∈ R
folgt.
(5) R heißt transitiv, falls aus (a, b) ∈ R und (b, c) ∈ R stets (a, c) ∈ R folgt.
Wir diskutieren die Bedeutung dieser Begriffe anhand der gerichteten Graphen,
mit denen wir Relationen veranschaulichen.
Beispiel 4.4. Sei R eine Relation auf der Menge A.
(1) R ist reflexiv, falls jeder Knoten im zugehörigen gerichteten Graphen eine
Schlinge hat.
(2) R ist irreflexiv, falls kein Knoten im zugehörigen gerichteten Graphen eine
Schlinge hat.
(3) R ist symmetrisch, wenn im gerichteten Graphen für jeden Pfeil von a nach
b auch der Pfeil zurück von b nach a vorhanden ist.
(4) R ist antisymmetrisch, wenn für je zwei verschiedene Knoten im gerichteten
Graphen höchstens ein Pfeil zwischen den beiden Knoten a und b vorhanden
ist.
(5) R ist transitiv, wenn für den gerichteten Graphen folgendes gilt: Immer
wenn man entlang der Pfeile (in Pfeilrichtung) von einem Knoten a zu
einem Knoten b laufen kann, dann ist bereits ein direkter Pfeil von a nach
b vorhanden.
Man beachte, dass irreflexiv nicht dasselbe ist wie nicht reflexiv. Ebenso ist
antisymmetrisch nicht dasselbe wie nicht symmetrisch.
4.1. Partitionen und Äquivalenzrelationen.
Definition 4.5. Eine Relation R auf einer Menge A heißt Äquivalenzrelation, falls
R reflexiv, transitiv und symmetrisch ist.
Ist R eine Äquivalenzrelation auf A so bezeichnen wir für jedes a ∈ A mit [a]R
die Menge {b ∈ A : (a, b) ∈ R} und nennen diese Menge die Äquivalenzklasse
von a.
Satz 4.6. Sei A eine Menge und R eine Äquivalenzrelation auf A. Dann gilt für
alle a, b ∈ A entweder [a]R ∩ [b]R = ∅ oder [a]R = [b]R . Der zweite Fall tritt genau
dann ein, wenn aRb gilt.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
53
Beweis. Seien a, b ∈ A mit [a]R ∩ [b]R 6= ∅. Sei c ∈ [a]R ∩ [b]R . Dann gilt aRc und
bRc. Wegen Symmetrie und Transitivität von R folgt daraus aRb. Wieder wegen
Symmetrie und Transitivität von R ist jedes Element von A, das zu a äquivalent
ist, auch zu b äquivalent und umgekehrt. Damit sind [a]R und [b]R gleich.
Für eine Äquivalenzrelation R auf einer Menge A ist {[a]R : a ∈ A} eine Partition von A.
Definition 4.7. Sei A eine Menge, I eine Indexmenge und für alle i ∈ I sei Ki ⊆ A.
P = {Ki : i ∈ I} ist eine Partition von A, falls gilt:
(1) Für alle i, j ∈ I mit i 6= j ist Ki ∩ Kj = ∅.
S
(2) Es gilt i∈I Ki = A.
S
Dabei ist i∈I Ki die Menge {x : ∃i ∈ I(x ∈ Ki )}.
Umgekehrt kann man einer Partition P = {Ki : i ∈ I} von A eine Äquivalenzrelation auf A zuordnen, deren Äquivalenzklassen genau die Mengen Ki sind. Sei
nämlich P = {Ki : i ∈ I} eine Partition von A. Sei
R := {(a, b) ∈ A × A : ∃i ∈ I(a, b ∈ Ki )}.
Wir nennen also zwei Elemente a und b von A äquivalent, wenn sie in derselben
Menge Ki liegen.
S
Wegen i∈I Ki = A gibt es für jedes a ∈ A ein i ∈ I mit a ∈ Ki . Damit steht
jedes a ∈ A zu sich selbst in Relation. R ist also reflexiv. Gilt a, b ∈ Ki , so gilt auch
b, a ∈ Ki . Damit ist R symmetrisch. Seien schließlich a, b, c ∈ A mit aRb und bRc.
Dann gibt es i, j ∈ I mit a, b ∈ Ki und b, c ∈ Kj . Nun gilt b ∈ Ki ∩ Kj . Da die
Mengen in der Partition paarweise disjunkt sind, muss Ki = Kj gelten. Also gilt
a, c ∈ Ki . Damit ist aRc. Das zeigt die Transitivität von R.
Korollar 4.8. Es sei A eine Menge. Für jede Äquivalenzrelation auf A bilden die
Äquivalenzklassen eine Partition von A. Umgekehrt gibt es für jede Partition von A
eine Äquivalenzrelation, deren Äquivalenzklassen genau die Mengen in der Partition
sind.
Beispiel 4.9. Sei m ∈ N und R = {(a, b) ∈ Z × Z : a ≡ b(mod m)}. Dann ist
R eine Äquivalenzrelation auf Z, deren Äquivalenzklassen genau die Restklassen
modulo m sind.
Die Anzahl der Restklassen modulo m ist genau m. Die verschiedenen Restklassen sind die Mengen
{m · q + 0 : q ∈ Z},
{m · q + 1 : q ∈ Z},
...,
{m · q + (m − 1) : q ∈ Z}.
4.2. Ordnungsrelationen.
Definition 4.10. Sei A eine Menge und R eine Relation auf A. Dann ist R eine
Ordnungsrelation, falls R reflexiv, antisymmetrisch und transitiv ist. Ordnungsrelationen nennt man auch Halbordnungen oder partielle Ordnungen. Das
Paar (A, R) ist eine halbgeordnete oder partiell geordnete Menge.
54
STEFAN GESCHKE
Ordnungsrelationen werden oft mit ≤ oder einem ähnlichen Zeichen bezeichnet.
Man schreibt dann praktisch immer a ≤ b anstelle von (a, b) ∈ ≤. Man beachte,
dass dabei nicht unbedingt die bekannte ≤-Relation auf den reellen Zahlen gemeint
ist.
Beispiel 4.11. Sei A := {a, b, c, d} und
R := {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, d), (c, d)}.
Der entsprechende gerichtete Graph sieht dann wie folgt aus:
d
c
b
a
Wie man an dem gerichteten Graphen leicht sieht, ist R reflexiv, transitiv und
antisymmetrisch.
Beispiel 4.12. Sei A := {a, b, c, d} und
R := {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}.
Der entsprechende gerichtete Graph sieht dann wie folgt aus:
d
c
b
a
Wieder sieht man leicht, dass R reflexiv, transitiv und antisymmetrisch ist.
Beispiel 4.13.
(1) Die Relation ≤ ist eine Ordnungsrelation of N, Z, Q und
R.
(2) Für jede Menge M ist ⊆ eine Ordnungsrelation auf P(M ).
(3) Die Teilbarkeitsrelation | ist eine Ordnungsrelation auf N.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
55
Definition 4.14. Ein Ordnungsrelation R auf einer Menge R heißt lineare Ordnung, falls für alle a, b ∈ A mit a 6= b entweder aRb oder bRa gilt. Lineare Ordnungen nennt man auch totale Ordnungen.
Beispiel 4.15. Die Relation ≤ auf N, Z, Q und R ist jeweils eine lineare Ordnung.
Die Relation R aus Beispiel 4.12 ist ebenfalls eine lineare Ordnung, während die
Relation aus Beispiel 4.11 keine lineare Ordnung ist, da die Element b und c nicht
vergleichbar sind, also da weder (b, c) noch (c, b) in R ist. Ebenso ist ⊆ keine
lineare Ordnung auf P(M ), falls M mindestens zwei Elemente hat.
Wir betrachten noch einmal die Beispiele 4.11 und 4.12. Wenn man von einer
Relation R auf einer Menge A schon weiß, dass es sich um eine Ordnungsrelation
handelt, dann kann man in dem gerichteten Graphen die Schlingen an den einzelnen
Knoten weglassen sowie gerichtete Kanten, deren Existenz aus der Transitivität der
Relation folgt. Schließlich können wir noch vereinbaren, dass Kanten immer nach
oben zeigen, so dass wir die Pfeilspitzen weglassen können. Diese Darstellung nennt
man ein Hassediagramm einer geordneten Menge.
Folgende Diagramme sind Hassediagramme der Relationen in Beispiel 4.11 und
4.12.
d
d
c
c
b
b
a
a
4.3. Hüllenbildungen. Sei R eine Relation auf einer Menge A. Falls R nicht bereits reflexiv ist, so kann man R zu einer reflexiven Relation R0 machen, indem man
für jedes a ∈ A das Paar (a, a) zu R hinzufügt.
Definition 4.16. Für eine Relation R auf einer Menge A sei
R0 := R ∪ {(a, a) : a ∈ A}.
R0 ist die kleinste reflexive Relation, die R umfasst, und wird die reflexive Hülle
von R genannt.
Sei zum Beispiel < die übliche <-Relation auf N, Z, Q oder R. Dann ist die
Relation ≤ auf derselben Menge die reflexive Hülle von <.
Auf ähnliche Weise können wir aus einer Relation R eine transitive Relation
machen. Sei A = {a, b, c} und R = {(a, b), (b, c)}.
a
b
c
56
STEFAN GESCHKE
Damit R transitiv wird, müssen wir das Paar (a, c) zu R hinzufügen.
Wir betrachten noch die folgende, etwas kompliziertere Situation. Sei A = {a, b, c, d}
und R = {(a, b), (b, c), (c, d)}.
a
c
b
d
Hier müssen wir zunächst (a, c) und (b, d) zu R hinzufügen. Aber die Relation
R ∪ {(a, c), (b, d)} ist immer noch nicht transitiv, denn obwohl
(a, b), (b, d) ∈ R ∪ {(a, c), (b, d)}
gilt, ist das Paar (a, d) nicht in der Relation R ∪ {(a, c), (b, d)} enthalten. Wenn wir
jedoch auch noch (a, d) hinzufügen, so erhalten wir eine transitive Relation.
Im Allgemeinen gilt für eine transitive Relation R: Falls
(a1 , a2 ), . . . , (an−1 , an ) ∈ R
gilt, so ist auch (a1 , an ) ∈ R. Das erklärt die folgende Definition:
Definition 4.17. Sei R eine Relation auf einer Menge A. Dann ist
R+ := {(a, b) : es gibt n ≥ 2 und a1 , . . . , an ∈ A mit
a = a1 , b = an und (a1 , a2 ), . . . , (an−1 , an ) ∈ R}
die kleinste transitive Relation mit R ⊆ R+ . R+ ist die transitive Hülle von R.
Man sieht schnell, dass R+ transitiv ist. Man beachte, dass es durchaus vorkommen kann, dass (a1 , a2 ), . . . , (an−1 , an ) ∈ R gilt und dabei a1 = an ist. So ist die
transitive Hülle der Relation R = {(a, b), (b, c), (c, a)} auf der Menge A die Relation
R+ = A × A.
c
a
b
Schließlich kombinieren wir noch die transitive und die reflexive Hülle.
Definition 4.18. Sei R eine Relation auf einer Menge A. Dann ist R∗ = R+ ∪ R0
die reflexive, transitive Hülle von R. R∗ ist die kleinste reflexive, transitive
Relation, die R umfasst.
Beispiel 4.19. Sei A = {a, b, c, d} und R = {(a, b), (b, c), (c, d), (b, d)}. Wir geben
die reflexive Hülle, die transitive Hülle und die reflexive, transitive Hülle von R an.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
57
R = {(a, b), (b, c), (c, d), (b, d)}
a
b
c
d
R0 = {(a, a), (b, b), (c, c), (d, d), (a, b), (b, c), (c, d), (b, d)}
a
b
c
d
c
d
R+ = {(a, b), (a, c), (a, d), (b, c), (b, d), (c, d)}
a
b
R∗ = {(a, a), (b, b), (c, c), (d, d), (a, b), (a, c), (a, d), (b, c), (b, d), (c, d)
a
b
c
d
Die reflexive, transitive Hülle R∗ einer Relation R ist immer reflexiv und transitiv. Aber R∗ muss natürlich nicht antisymmetrisch sein. Da reflexive, transitive
Relationen aber relativ häufig vorkommen, bekommen sie einen eigenen Namen.
Definition 4.20. Eine reflexive, transitive Relation heißt Quasiordnung.
Die reflexive, transitive Hülle einer Relation ist also immer eine Quasiordnung,
aber nicht unbedingt eine Ordnungrelation. Es stellt sich heraus, dass R∗ genau
dann eine Ordnungsrelation ist, wenn es in R keine Kreise der Form
a1
a2
an−1
an
mit n ≥ 2 gibt.
4.4. n-stellige Relationen. In Definition 1.15 hatten wir schon kartesische Produkte der Form An betrachtet. Analog können wir auch kartesische Produkte zwischen verschiedenen Mengen definieren.
58
STEFAN GESCHKE
Definition 4.21. Sei n ≥ 1 und seien A1 . . . , An Mengen. Dann ist
A1 × . . . × An = {(a1 , . . . , an ) : a1 ∈ A1 ∧ · · · ∧ an ∈ An }
das kartesische Produkt der Mengen A1 , . . . , An .
Eine n-stellige Relation über A1 , . . . , An ist eine Teilmenge R des Produkts
A1 × . . . × An . Eine n-stellige Relation auf einer Menge A ist eine Teilmenge R
von An .
Im vorigen Abschnitt haben wir nur binäre, also zweistellige Relationen diskutiert. Einstellige Relationen auf einer Menge A sind einfach Teilmengen der Menge
A.
Beispiel 4.22. Seien A = {1, 2, 3}, B = {0, 1} und C = {2, 3}. Dann sind R1 = ∅,
R2 = {(2, 0, 2)}, R3 = {(1, 0, 2), (1, 1, 2), (2, 1, 3)} und R4 = A × B × C Relationen
über A, B und C.
4.5. Mehr über Abbildungen.
Definition 4.23. Seien A und B Mengen und f : A → B eine Abbildung. Für
A0 ⊆ A ist die Menge
f [A0 ] = {b ∈ B : ∃a ∈ A0 (f (a) = b)} = {f (a) : a ∈ A0 }
das Bild von A0 unter f . Anstelle von f [A0 ] schreibt man auch f (A0 ).
Für B 0 ⊆ B ist die Menge
f −1 [B 0 ] = {a ∈ A : f (a) ∈ B 0 }
das Urbild von B 0 unter f .
Beispiel 4.24. Sei A = {1, 2, 3, 4, 5} und B = {0, 1, 2}. Weiter sei f : A → B
definiert durch f (1) = f (2) = 0, f (3) = f (5) = 1 und f (4) = 2. Schließlich seien
A0 = {3, 4, 5} und B 0 = {0, 2}. Dann gilt f [A0 ] = {1, 2} und f −1 [B 0 ] = {1, 2, 4}.
Satz 4.25. Es seien A und B Mengen und f : A → B eine Funktion. Für alle
A1 , A2 ⊆ A und B1 , B2 ⊆ B gelten die folgenden Aussagen:
(1) f [A1 ∩ A2 ] ⊆ f [A1 ] ∩ f [A2 ]
(2) f [A1 ∪ A2 ] = f [A1 ] ∪ f [A2 ]
(3) f −1 [B1 ∩ B2 ] = f −1 [B1 ] ∩ f −1 [B2 ]
(4) f −1 [B1 ∪ B2 ] = f −1 [B1 ] ∪ f −1 [B2 ]
(5) f −1 [f [A1 ]] ⊇ A1
(6) f [f −1 [B1 ]] ⊆ B1
Beweis. Wir zeigen (1), (3) und (5) und lassen (2), (4) und (6) als Übungen.
(1) Sei b ∈ f [A1 ∩A2 ]. Dann existiert a ∈ A1 ∩A2 mit f (a) = b. Wegen a ∈ A1 gilt
b = f (a) ∈ f [A1 ]. Wegen a ∈ A2 gilt b = f (a) ∈ f [A2 ]. Also ist b ∈ f [A1 ] ∩ f [A2 ].
Damit gilt f [A1 ∩ A2 ] ⊆ f [A1 ] ∩ f [A2 ].
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
59
(3) Sei a ∈ f −1 [B1 ∩ B2 ]. Dann gilt f (a) ∈ B1 ∩ B2 . Also ist f (a) ∈ B1 und
f (a) ∈ B2 . Damit ist a ∈ f −1 [B1 ] und a ∈ f −1 [B2 ]. Es folgt a ∈ f −1 [B1 ] ∩ f −1 [B2 ].
Das zeigt f −1 [B1 ∩ B2 ] ⊆ f −1 [B1 ] ∩ f −1 [B2 ].
Sei nun a ∈ f −1 [B1 ] ∩ f −1 [B2 ]. Dann ist a ∈ f −1 [B1 ] und a ∈ f −1 [B2 ]. Also gilt
f (a) ∈ B1 und f (a) ∈ B2 . Damit ist f (a) ∈ B1 ∩ B2 . Es folgt a ∈ f −1 [B1 ∩ B2 ].
Das zeigt f −1 [B1 ] ∩ f −1 [B2 ] ⊆ f −1 [B1 ∩ B2 ].
(5) Sei a ∈ A1 . Dann ist f (a) ∈ f [A1 ]. Also gilt a ∈ f −1 [f [A1 ]]. Das zeigt
A1 ⊆ f −1 [f [A1 ]].
Definition 4.26. Sind f : A → B und g : B → C Funktionen, so definieren wir
die Komposition von f und g als die Funktion g ◦ f : A → C; a 7→ g(f (a)). Die
Komposition g ◦ f wird „g nach f “ gelesen.
Beispiel 4.27. Es seien A = {1, 2, 3}, B = {2, 3, 4, 5} und C = {0, 1}. Die Funktionen f : A → B und g : B → C seien definiert durch f (1) = f (2) = 2, f (3) = 4,
g(2) = g(5) = 0 und g(3) = g(4) = 1. Dann gilt (g ◦ f )(1) = (g ◦ f )(2) = 0 sowie
(g ◦ f )(3) = 1.
Die Komposition g ◦ f kann man sich leicht vorstellen, wenn man die entsprechenden Pfeildiagramme betrachtet.
2
1
3
2
0
4
1
3
5
A
f
g
B
C
Die Komposition von Abbildungen erfüllt das Assoziativgesetz.
Satz 4.28. Seien f : A → B, g : B → C und h : C → D Abbildungen. Dann gilt
h ◦ (g ◦ f ) = (h ◦ g) ◦ f .
Beweis. Wir müssen zeigen, dass für alle a ∈ A die Gleichung
(h ◦ (g ◦ f ))(a) = ((h ◦ g) ◦ f )(a)
gilt. Sei also a ∈ A. Dann ist
(h ◦ (g ◦ f ))(a) = h((g ◦ f )(a)) = h(g(f (a))) = (h ◦ g)(f (a)) = ((h ◦ g) ◦ f )(a).
Das zeigt den Satz.
60
STEFAN GESCHKE
Definition 4.29. Sei f : A → B eine Funktion und A0 ⊆ A. Unter der Einschränkung oder Restriktion von f auf A0 versteht man die Funktion g : A0 → B; a 7→
f (a). Für die Einschränkung von f auf A0 schreibt man f A0 oder f |A0 .
Definition 4.30. Sei f : A → B eine injektive Funktion. Dann kann man eine
Funktion g : f [A] → A so definieren, dass für alle b ∈ f [A] und a ∈ A die Gleichung
g(b) = a genau dann gilt, wenn f (a) = b ist. Die Funktion g ist die Umkehrfunktion von f . Für die Umkehrfunktion von f schreibt man f −1 .
Bemerkung 4.31. Sei f : A → B eine Bijektion und sei B1 ⊆ B. Die Schreibweise
f −1 [B1 ] erscheint zunächst mehrdeutig, da entweder das Urbild von B1 unter f
oder das Bild von B1 unter der Abbildung f −1 gemeint sein könnte. Allerdings sind
diese Mengen identisch. Es gilt
{a ∈ A : f (a) ∈ B1 } = {f −1 (b) : b ∈ B1 }.
Also ist diese Mehrdeutigkeit unproblematisch.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
61
5. Graphen
Graphen gehören zu den wichtigsten mathematischen Strukturen für die Informatik. In diesem Kapitel werden die wichtigsten Grundbegriffe der Graphentheorie
diskutiert.
5.1. Grundlegende Definitionen.
Definition 5.1. Ein ungerichteter Graph G ist ein Paar (V, E), wobei V eine
beliebige Menge ist und E eine Menge von zweielementigen Teilmengen von V . Die
Elemente von V heißen Ecken oder Knoten (im Englischen vertices, Singular
vertex) von G, die Elemente von E Kanten (im Englischen edges).
Ist ein Graph G gegeben, so schreiben wir V (G) für die Menge der Ecken von G
und E(G) für die Menge der Kanten.
In der Mathematik werden auch unendliche Graphen betrachtet, aber für das
vorliegende Skript vereinbaren wir, dass alle Graphen endlich sind, also nur endlich
viele Ecken haben. Anstelle von „ungerichteter Graph“ sagen wir meistens einfach
nur „Graph“.
Graphen lassen sich veranschaulichen, in dem man für jede Ecke einen Punkt
zeichnet und zwei Punkte genau dann durch eine Linie verbindet, wenn die beiden
entsprechende Ecken eine Kante bilden.
Beispiel 5.2. Sei G = (V, E) mit V = {1, 2, 3, 4, 5} und
E = {{1, 2}, {1, 3}, {1, 5}, {2, 3}, {3, 4}, {4, 5}}.
Diesen Graphen veranschaulichen wir durch folgendes Bild:
1
2
3
4
5
Diese Darstellung ist aber nicht eindeutig. Man kann G auch wie folgt darstellen:
2
1
3
5
4
Beispiel 5.3. Sei G = (V, E) mit V = {1, 2, 3, 4} und
E = {{1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}}.
62
STEFAN GESCHKE
3
4
1
2
Dieser Graph hat die Eigenschaft, dass je zwei verschiedene Ecken eine Kante bilden.
So einen Graphen nennt man vollständig.
Für jedes n ∈ N gibt es genau einen vollständigen Graphen mit der Eckenmenge
{1, 2, . . . , n}. Dieser Graph wird mit Kn bezeichnet. Der abgebildete Graph ist also
K4 .
Beispiel 5.4. Sei G = (V, E) mit V = {v0 , . . . , v4 }, wobei die vi paarweise verschieden sind, und sei E = {{v0 , v1 }, {v1 , v2 }, {v2 , v3 }, {v3 , v4 }}.
v0
v1
v2
v3
v4
Dann nennt man G einen Weg der Länge 4.
Allgemein nennt man für alle n ∈ N einen Graphen mit einer Eckenmenge von
n + 1 verschiedenen Knoten v0 , . . . , vn , dessen Kanten genau die Mengen {vi , vi+1 },
0 ≤ i < n, sind, einen Weg der Länge n.
Beispiel 5.5. Sei G = (V, E) mit V = {v1 , v2 , v3 , v4 }, wobei die vi paarweise
verschieden sind, und sei E = {{v1 , v2 }, {v2 , v3 }, {v3 , v4 }, {v4 , v1 }}.
v4
v3
v1
v2
Dann nennt man G einen Kreis der Länge 4.
Allgemein nennt man für alle n ∈ N\{1, 2} einen Graphen mit einer Eckenmenge
von n verschiedenen Knoten v1 , . . . , vn , dessen Kanten genau die Mengen {vi , vi+1 },
1 ≤ i < n, und {vn , v1 } sind, einen Kreis der Länge n.
Definition 5.6. Sei seien G und G0 Graphen. G0 heißt Teilgraph von G, falls
V (G0 ) ⊆ V (G) und E(G0 ) ⊆ E(G) gelten. Ist G0 ein Teilgraph von G, so schreiben
wir G0 ⊆ G.
Beispiel 5.7. Sei G der folgende Graph:
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
v4
63
v3
v5
v1
v2
Die folgenden Graphen sind Teilgraphen von G:
v4
v3
v4
v3
v1
v2
v5
v1
v2
Definition 5.8. Ein Graph G heißt zusammenhängend, wenn für je zwei Knoten
v, w ∈ V (G) ein Weg in G existiert, der v und w verbindet. Ein Weg, der v und w
verbindet, ist dabei ein Teilgraph W von G, der ein Weg ist, so dass v und w unter
den Ecken von W sind.
Beispiel 5.9. Der Graph G aus Beispiel 5.7 ist zusammenhängend. Der folgende
Teilgraph H von G ist nicht zusammenhängend:
v4
v3
v5
v1
v2
Definition 5.10. Ein Teilgraph G0 eines Graphen G heißt Zusammenhangskomponente von G, falls G0 selbst zusammenhängend ist und es keinen zusammenhängenden Teilgraphen F von G gibt, so dass G0 ⊆ F und G0 6= F gilt.
Beispiel 5.11. Der Graph H aus Beispiel 5.9 hat zwei Zusammenhangskomponenten, eine mit der Eckenmenge {v3 , v5 } und eine mit der Eckenmenge {v1 , v2 , v4 }.
Definition 5.12. Ein Graph G ist ein Baum, wenn G zusammenhängend ist und
keine Kreise enthält, also keine Teilgraphen hat, die Kreise sind.
Beispiel 5.13. Der linke Graph ist ein Baum, der rechte nicht:
64
STEFAN GESCHKE
v4
v3
v4
v3
v5
v1
v5
v2
v1
v2
In der Informatik betrachtet man oft Bäume mit einer Wurzel, d.h., man legt
fest, dass ein bestimmter Knoten des Baumes die Wurzel ist.
Beispiel 5.14. Wir legen den Knoten v3 als Wurzel des Baumes aus Beispiel 5.13
fest. Eine naheliegende Darstellung dieses Graphen ist dann die folgende:
v1
v4
v2
v5
v3 (Wurzel)
Allerdings ist es in der Informatik relativ üblich, dass Bäume von oben nach
unten wachsen. Das führt zum Beispiel zu der folgenden Darstellung:
v3 (Wurzel)
v2
v5
v1
v4
Wählen wir v2 als Wurzel, so ist zum Beispiel die folgende Darstellung naheliegend:
v2 (Wurzel)
v1
v4
v3
v5
Definition 5.15. Sei G ein Graph und v ∈ V (G). Der Grad der Ecke v ist die
Anzahl der Kanten, an denen v beteiligt ist. Den Grad von v bezeichnen wir mit
d(v).
Beispiel 5.16. Wir betrachten wieder den Baum aus Beispiel 5.13. Es gilt
d(v1 ) = d(v4 ) = d(v5 ) = 1,
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
65
d(v2 ) = 3 und d(v3 ) = 2. Wenn wir die Grade der Ecken in diesem Graphen
addieren, erhalten wir 1 + 1 + 1 + 2 + 3 = 8. Das ist genau das Doppelte der
Kantenzahl dieses Graphen. Das liegt daran, dass wir beim Addieren der Grade
jede Kante zweimal zählen, nämlich je einmal für jede der beiden Ecken, die an der
Kante beteiligt sind.
Satz 5.17. Sei G ein Graph mit V (G) = {v1 , . . . , vn }, wobei die Ecken vi paarweise
verschieden sind. Dann gilt
n
X
d(vi ) = 2 · |E(G)|.
i=1
Korollar 5.18. In einem Graphen ist die Zahl der Knoten von ungeradem Grad
immer gerade.
Beweis. Sei G ein Graph. Sei A die Menge der Ecken von G, deren Grad gerade
ist, und sei B die Menge der Ecken, deren Grad ungerade ist. Nach Satz 5.17 ist
X
X
d(v) +
d(v) = 2 · |E(G)|.
v∈A
Da
P
v∈A
v∈B
d(v) und 2 · |E(G)| beide gerade sind, ist auch
P
v∈B
d(v) gerade. Wie
man mittels vollständiger Induktion leicht sieht, ist eine Summe ungerader Zahlen
genau dann gerade, wenn die Summe eine gerade Anzahl von Summanden hat. Also
hat B eine gerade Anzahl von Elementen, was zu zeigen war.
Definition 5.19. Sei G ein Graph und v ∈ V (G) ein Knoten vom Grad 1. Dann
heißt v ein Endknoten von G.
Lemma 5.20. Ist B ein Baum mit mindestens zwei Knoten, so hat B auch mindestens zwei Endknoten.
Beweis. Sei W ein Weg in B von maximaler Länge. Seien a1 , . . . , an die Ecken
dieses Weges, wobei a1 mit a2 verbunden ist, a2 mit a3 und so weiter. Dann ist an
ein Endknoten von W .
Das sieht man wie folgt: Angenommen an hat mehr als einen Nachbarn. Dann
hat an einen Nachbarn b, der von an−1 verschieden ist. Da a1 , . . . , an ein Weg
maximaler Länge ist, ist a1 , . . . , an , b kein Weg in B. Das heißt aber, dass b einer
der Knoten a1 , . . . , an − 2 ist. Damit gibt es in B einen Kreis. Das widerspricht aber
der Annahme, dass B ein Baum ist. Das zeigt, dass an ein Endknoten von B ist.
Genauso sieht man, dass a1 ein Endknoten von B ist.
Mit Hilfe dieses Lemmas können wir schnell die Anzahl der Kanten eines Baumes
mit n Knoten bestimmen.
Satz 5.21. Sei B ein Baum mit n Knoten. Dann hat B genau n − 1 Kanten.
Beweis. Wir zeigen den Satz durch vollständige Induktion über n.
Induktionsanfang: Falls B genau einen Knoten hat, so gilt |E(G)| = 0.
66
STEFAN GESCHKE
Induktionsschritt: Sei n ∈ N. Angenommen, jeder Baum mit n Knoten hat n − 1
Kanten. Sei B ein Baum mit n+1 Knoten. Nach Lemma 5.20 hat B einen Endknoten
v. Sei B 0 der Graph, den wir erhalten, wenn wir v und die eine Kante, die v enthält,
aus B entfernen. Da B keine Kreise enthält, enthält B 0 auch keine.
Außerdem ist B 0 zusammenhängend. Sind nämlich a und b verschiedene Knoten
in B 0 , so existiert ein Weg W in B, der in a beginnt und in b endet, da B zusammenhängend ist. Aber alle Knoten in W , die nicht Endknoten des Weges sind, haben
mindestens den Grad 2 in B. Damit sind alle diese Knoten von v verschieden. Also
ist der Weg auch ein Weg in B 0 .
Insgesamt sehen wir, dass B 0 ebenfalls ein Baum ist. Da B 0 n Knoten hat, wissen
wir nach der Induktionsannahme, dass B 0 n − 1 Kanten hat. Also hat B genau n
Kanten. Das beendet den Induktionsschritt und zeigt den Satz.
Für die Eigenschaften eines Graphen ist es normaler Weise egal, wie die Ecken
des Graphen heißen. Daher führen wir einen Begriff ein, der beschreibt, dass zwei
Graphen im wesentlichen gleich sind.
Definition 5.22. Zwei Graphen G und H heißen isomorph, falls es eine Bijektion
f : V (G) → V (H) gibt, so dass für alle x, y ∈ V (G) mit x 6= y gilt:
{x, y} ∈ E(G) ⇔ {f (x), f (y)} ∈ E(H)
Solch eine Bijektion f heißt Isomorphismus zwischen G und H.
Zum Beispiel sind je zwei vollständige Graphen mit der gleichen Eckenzahl isomorph. Ebenso sind je zwei Wege der gleichen Länge isomorph. Auch je zwei Kreise
der gleichen Länge sind isomorph.
Definition 5.23. Für einen Graphen G definiert man den Komplementgraphen
(oder einfach das Komplement) von G als den Graphen mit derselben Eckenmenge, dessen Kanten genau die zweielementigen Teilmengen von V (G) sind, die nicht
Kanten von G sind.
Beispiel 5.24. Hier ein Beispiel für einen Graphen und sein Komplement:
Sind zwei Graphen isomorph, so sind es auch ihre Komplemente.
Definition 5.25. Sei G ein Graph mit n Ecken und sei {v1 , . . . , vn } die Menge der Ecken von G, so dass d(v1 ) ≥ d(v2 ) ≥ · · · ≥ d(vn ) gilt. Dann heißt
(d(v1 ), d(v2 ), . . . , d(vn )) die Gradfolge von G. Bei manchen Autoren wird die Gradfolge auch in aufsteigender Reihenfolge angegeben.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
67
Beispiel 5.26. Der folgende Graph hat die Gradfolge (4, 3, 3, 2, 2). Die Knoten
sind so bezeichnet, dass d(v1 ) ≥ d(v2 ) ≥ · · · ≥ d(v5 ) gilt.
v2
v3
v5
v4
v1
Bemerkung 5.27. Wenn zwei Graphen G und H isomorph sind, so haben sie dieselbe Gradfolge. Die Umkehrung gilt nicht unbedingt. Die folgenden zwei Graphen
haben beide die Gradfolge (2, 2, 2, 1, 1), sind aber nicht isomorph.
Manchmal ist es nützlich, in Graphen Mehrfachkanten und Schlingen zu erlauben.
Definition 5.28. Ein Multigraph ist ein Tripel (V, E, f ), wobei V eine Menge
von Ecken ist, E eine Menge von Kanten und f eine Abbildung, die jedem Element
von E eine ein- oder zweielementige Teilmenge von V zuordnet. Für eine Kante
e ∈ E ist f (e) die Menge der Endknoten von e. Die Elemente von E, denen durch f
eine einelementige Teilmenge von V zugeordnet wird, heißen Schlingen. Wird zwei
verschiedenen Kanten e1 und e2 dieselbe Menge von Endknoten zugeordnet, gilt
also f (e1 ) = f (e2 ), so spricht man von einer Mehrfachkante.
Beispiel 5.29. Ähnlich wie Graphen lassen sich auch Multigraphen durch Punkte, die durch Linien verbunden werden, graphisch darstellen. Der unten dargestellte Multigraph hat die Eckenmenge V = {v1 , . . . , v5 } und die Kantenmenge
E = {e1 , . . . , e10 }. Die Funktion f bildet jede Kante auf die Menge ihrer Endpunkte ab. Zum Beispiel gilt f (e10 ) = {v5 } und f (e2 ) = f (e3 ) = {v1 , v2 }.
68
STEFAN GESCHKE
v4
e5
v3
e9
e7
e1
e4
e6
e3
v1
e2
v5
e10
e8
v2
5.2. Eulersche Linien und Hamiltonsche Kreise.
Definition 5.30. Gegeben sei ein Multigraph G mit der Knotenmenge V , der
Kantenmenge E und einer Folge
v0 , e1 , v1 , . . . , v`−1 , e` , v`
mit vi ∈ V (i = 0, . . . , `) und ei ∈ E (i = 1, . . . , `).
(1) Die Folge heißt Kantenfolge, falls jedes ei eine Kante ist, deren Endpunkte
die Ecken vi−1 und vi sind.
(2) Ist die Folge eine Kantenfolge, in der alle Kanten verschieden sind, so spricht
man von einem Kantenzug.
(3) Ist die Folge ein Kantenzug, in dem alle Ecken verschieden sind, so handelt
es sich um einen Weg von v0 nach v` .
(4) Die Zahl ` ist die Länge der Kantenfolge.
(5) Die Kantenfolge ist geschlossen, falls v0 = v` gilt.
Wir nennen einen Multigraphen wieder zusammenhängend, wenn es zwischen
je zwei Ecken des Graphen einen Weg gibt, der die beiden Ecken verbindet.
Das Königsberger Brückenproblem ist die aus dem 18. Jahrhundert stammende Frage, ob es in der Stadt Königsberg einen Spaziergang machen kann, bei
dem man jede der 7 Brücken der Stadt genau einmal überquert und am Schluss
wieder auf demselben der vier Landstücke ankommt, auf dem man gestartet ist.
Graphentheoretisch kann man dieses Problem wie folgt formulieren: Gibt es in
dem folgenden Multigraphen einen geschlossenen Kantenzug, der alle Kanten durchläuft? Dabei entsprechen die Kanten den Brücken und die Ecken den Landstücken.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
69
Der Mathematiker Leonhard Euler konnte diese Frage negativ beantworten.
Definition 5.31. Sei G ein Multigraph. Einen Kantenzug in G nennt man eine Eulersche Linie bzw. einen Eulerschen Kreis, falls er geschlossen ist und sämtliche
Kanten von G durchläuft.
In Multigraphen definieren wir den Grad einer Ecke als die Anzahl der Kanten,
die an der Ecke anstoßen. Schlingen werden dabei doppelt gezählt, da sie mit zwei
Enden an demselben Knoten anstoßen.
Wir stellen folgendes fest: Sei G ein zusammenhängender Multigraph und
v0 , e1 , v1 , . . . , v`−1 , e` , v`
eine Eulersche Linie in G. Da G zusammenhängend ist, liegt jede Ecke an einer
Kante. Also ist jede Ecke des Graphen unter den Ecken v0 , . . . , v` . Da die Eulersche
Linie geschlossen ist, gilt v0 = v` . Da die Eulersche Linie jede Kante des Multigraphen genau einmal enthält, ist der Grad jeder Ecke v von G genau das doppelte der
Anzahl der Vorkommen der Ecke v unter den Ecken v0 , . . . , v` . Also ist der Grad
jeder Ecke in G gerade.
Das zeigt, dass der Spaziergang über die Königsberger Brücken unmöglich ist.
In dem zum Brückenproblem gehörendem Multigraphen gibt es nämlich Ecken von
ungeradem Grad.
Eine notwendige Bedingung für die Existenz einer Eulerschen Linie in einem Multigraphen ist also, dass jede Ecke einen geraden Grad hat. Im nächsten Satz stellen
wir fest, dass Zusammenhang und gerade Grade sogar hinreichende Bedingungen
für die Existenz einer Eulersche Linie sind.
Satz 5.32. Ein zusammenhängender Multigraph G besitzt genau dann eine Eulersche Linie, wenn alle Ecken einen geraden Grad haben.
Beweis. Wir haben schon gezeigt, dass die Existenz einer Eulerschen Linie impliziert, dass jede Ecke des Multigraphen einen geraden Grad hat.
Sei nun G ein zusammenhängender Multigraph, in dem jede Ecke einen geraden Grad hat. Wir zeigen die Existenz einer Eulerschen Linie mittelsvollständiger
Induktion über die Anzahl m der Kanten des Multigraphen G.
Induktionsanfang: Ist m = 0, hat also G keine Kanten, so kann G auch nur
einen Knoten v haben, da G zusammenhängend ist. In diesem Fall ist aber der
Kantenzug, der nur aus der einen Ecke v besteht, eine Eulersche Linie.
Induktionsschritt: Sei m > 0. Wir nehmen an, dass jeder zusammenhängende
Multigraph mit weniger als m Kanten, in dem jeder Knoten einen geraden Grad
hat, eine Eulersche Linie besitzt und zeigen, dass auch G eine Eulersche Linie hat.
Dazu wählen wir zunächst in G einen Kantenzug
v0 , e1 , v1 , . . . , v`−1 , e` , v` ,
der sich nicht mehr verlängern lässt. Dieser Kantenzug muss geschlossen sein. Falls
nämlich v0 6= v` ist, so benutzt der Kantenzug nur ungerade viele Kanten, die an
70
STEFAN GESCHKE
v` anstoßen, wobei wir Schleifen wieder doppelt zählen. Also stößt an v` eine Kante
an, die in dem Kantenzug noch nicht vorkommt. Damit lässt sich der Kantenzug
verlängern, was aber unserer Wahl des Kantenzugs widerspricht.
Nun entfernen wir alle Kanten e1 , . . . , e` , die in dem gewählten Kantenzug vorkommen, aus dem Multigraphen G. Übrig bleibt ein Multigraph G0 , der zwar nicht
mehr unbedingt zusammenhängend ist, in dem aber immer noch jede Ecke einen
geraden Grad hat.
Jede Zusammenhangskomponente von G0 hat weniger als m Kanten. Nach Induktionsannahme hat also jede Zusammenhangskomponente von G0 eine Eulersche
Linie. Wenn wir nun unseren Kantenzug v0 , e1 , v1 , . . . , v`−1 , e` , v` durchlaufen und
dabei nach Möglichkeit die Eulerschen Linien in den Zusammenhangskomponenten
von G0 einfügen, so erhalten wir eine Eulersche Linie des Multigraphen G.
Definition 5.33. Sei G ein Graph und C ein Kreis in G. Dann heißt C ein Hamiltonscher Kreis, wenn C alle Knoten von G enthält.
Der folgende Satz liefert eine notwendige Bedingung für die Existenz eines Hamiltonschen Kreises. Dabei sei c(G) die Anzahl der Zusammenhangskomponenten
eines Graphen G.
Satz 5.34. Hat ein Graph G einen Hamiltonschen Kreis, so gilt für jede nicht leere
Teilmenge A von V (G) die Ungleichung
c(G − A) ≤ |A|.
Dabei bezeichnet G − A den Graphen, den man erhält, wenn die Ecken in A und
die mit diesen Ecken inzidenten Kanten aus G entfernt.
Beweis. Für jeden Kreis C gilt folgendes: Ist A eine Menge von k Knoten in C,
so hat C − A höchstens k Zusammenhangskomponenten. Hat also G einen Hamiltonschen Kreis H, so gilt demnach für jede nicht leere Teilmenge A von V (G) die
Ungleichung c(H − A) ≤ |A|. Da H ein Teilgraph von G ist, der alle Ecken von G
enthält, gilt c(G − A) ≤ c(H − A) und somit auch c(G − A) ≤ |A|.
Beispiel 5.35. Der folgende Graph erfüllt die Bedingung aus Satz 5.34, hat aber
keinen Hamiltonschen Kreis.
Während wir mit Satz 5.32 ein einfach Werkzeug in der Hand haben, um zu
entscheiden, ob ein gegebener Graph oder Multigraph eine Eulersche Linie besitzt,
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
71
ist kein entsprechendes Kriterium für die Existenz eines Hamiltonschen in einem
Graphen bekannt. Es gibt auch effiziente Algorithmen, mit den man Eulersche
Linien in Multigraphen finden kann. Zum Finden von Hamiltonschen Kreisen in
beliebigen Graphen sind keine effizienten Algorithmen bekannt.
5.3. Gerichtete Graphen. Bisher haben wir gerichtete Graphen nur im Zusammenhang mit binären Relationen kennengelernt. Und in der Tat ist ein gerichteter
Graph auch im wesentlichen das gleiche wie eine zweistellige Relation.
Definition 5.36. Ein gerichteter Graph (oder Digraph) G ist ein Paar (V, E),
wobei V eine beliebige Menge ist und E eine zweistellige Relation auf V , also
E ⊆ V 2 . Wieder bezeichnen wir die Elemente von V als Ecken oder Knoten und
die Elemente von E als (gerichtete) Kanten. Eine Kante der Form (v, v) nennen
wir Schlinge.
Ist G ein gerichteter Graph, so schreiben wir V (G) für die Menge der Ecken von
G und E(G) für die Menge der Kanten.
Viele Begriffe lassen sich leicht von Graphen auf gerichtete Graphen übertragen.
Zum Beispiel ist klar, was ein (gerichteter) Teilgraph eines gerichteten Graphen ist,
oder wann zwei gerichtete Graphen isomorph sind.
Einen gerichteten Graphen G kann man in Form einer Adjazenzmatrix darstellen. Sei V (G) = {v1 , . . . , vn }. Die Adjazenzmatrix von G ist dann ein quadratisches
Zahlenschema mit n Zeilen und n Spalten. Der Eintrag in der i-ten Zeile und der
j-ten Spalte ist genau dann 1, wenn das Paar (vi , vj ) in E(G) ist.
Man beachte, dass die Adjazenzmatrix von G von der gewählten Aufzählung
v1 , . . . , vn von V (G) abhängt.
Man kann einen gerichteten Graphen auch in Form von Nachbarschaftslisten
angeben. Dabei notiert man für jeden Knoten v diejenigen Knoten, zu denen eine
Kante von v aus hinführt.
Beispiel 5.37. Sei G der folgende gerichtete Graph:
3
4
1
2
5
Die Adjazenzmatrix dieses gerichteten Graphen mit der Eckenaufzählung 1, . . . , 5
und Nachbarschaftslisten sehen wie folgt aus:
72
STEFAN GESCHKE
1
2
3
4
5
1
0
1
1
1
0
2
0
0
0
1
3
1
0
0
4
0
0
0
5
0
0
0
2
4
3
0
1
2
1
0
3
1
4
0
1
4
5
0
0
4
Man beachte, dass in der Adjazenzmatrix die Ecken 1, . . . , 5 nur der Übersichtlichkeit halber angegeben sind. Die eigentliche Adjazenzmatrix ist nur die Matrix mit
fünf Zeilen und Spalten, die nur Nullen und Einsen enthält.
Natürlich kann man auch Adjazenzmatrizen für ungerichtete Graphen angeben,
wobei jede Kante zweimal auftaucht, nämlich je einmal für jede mögliche Richtung.
Adjanzenzmatrizen ungerichteter Graphen sind symmetrisch: Spiegelung an der
Diagonalen von links oben nach rechts unten führt die Matrix wieder in sich selbst
über.
Man kann einen ungerichteten Graphen auch als einen gerichteten Graphen auffassen, indem man für jede ungerichtete Kante {v, w} die beiden gerichteten Kanten
(v, w) und (w, v) betrachtet.
Bemerkung 5.38. Für manche Anwendungen, insbesondere algorithmischer Art,
ist es nützlich, für einen gerichteten Graphen zwei Nachbarschaftslisten zu führen:
eine mit den Nachbarn, die sich von jedem Knoten aus erreichen lassen, und eine
mit den Nachbarn, von denen aus man einen Knoten erreichen kann.
Definition 5.39. Ist G ein gerichteter Graph und v eine Ecke von G, so definiertman den Außengrad d+ (v) von v als die Anzahl der Kanten, die von v wegführen,
und den Innengrad d− (v) als die Anzahl der Kanten, die zu v hinführen.
Definition 5.40. Gegeben sei ein gerichteter Graph G = (V, E) sowie eine Folge
v0 , e1 , v1 , . . . , v`−1 , e` , v`
mit vi ∈ V für alle i ∈ {0, . . . , `} und ei ∈ E für alle i ∈ {1, . . . , `}.
(1) Diese Folge heißt gerichtete Kantenfolge von v0 nach v` , falls für alle
i ∈ {1, . . . , `} die Kante ei eine Kante von vi−1 nach vi ist.
(2) Sind die Kanten in dieser Kantenfolge paarweise verschieden, so spricht
man von einem gerichteten Kantenzug.
(3) Sind außerdem die Knoten paarweise verschieden, so spricht man von einem
gerichteten Weg.
(4) Eine gerichtete Kantenfolge von v0 nach v` heißt geschlossen, falls v0 = v`
gilt.
Für die Definition von Zusammenhangskomponenten gerichteter Graphen gibt
es zwei Möglichkeiten.
Definition 5.41. Sei G = (V, E) ein gerichteter Graph. Unter dem G zugrunde liegendem ungerichteten Graphen verstehen wir den Graphen Gu mit der
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
73
Eckenmenge V , dessen Kantenmenge die Menge
E(Gu ) = {{v, w} : (v, w) ∈ E ∧ v 6= w}
ist.
Definition 5.42. Sei G eingerichteter Graph.
(1) G heißt schwach zusammenhängend, falls Gu zusammenhängend ist
(2) G heißt stark zusammenhängend, falls für je zwei verschiedene Ecken v
und w von G ein gerichteter Weg von v nach w existiert.
(3) Ein gerichteter Teilgraph G0 ⊆ G ist eine schwache Zusammenhangskomponente von G, falls G0 schwach zusammenhängend ist und kein Teilgraph, der G0 umfasst und echt größer ist, schwach zusammenhängend ist.
(4) Ein gerichteter Teilgraph G0 ⊆ G ist eine starke Zusammenhangskomponente von G, falls G0 stark zusammenhängend ist und kein Teilgraph,
der G0 umfasst und echt größer ist, stark zusammenhängend ist.
5.4. Bäume. Wir erinnern uns daran, dass Bäume zusammenhängende Graphen
ohne Kreise sind.
Sei B ein Baum. Nach Wahl einer Wurzel w von B können wir B als gerichteten
Graphen auffassen, wobei jede Kante von der Wurzel weg gerichtet ist. Geht bei
dieser Orientierung eine Kante von einem Knoten v zu einem Knoten w, so bezeichnen wir v als den Vater von w und w als das Kind von v. Ein Knoten, der keine
Kinder hat, heißt Blatt. Ein Knoten, der kein Blatt ist, heißt innerer Knoten
des Baumes. Die Höhe von B ist die maximale Länge eines Weges von der Wurzel
von B zu einem Blatt.
Unter dem Grad von B verstehen wir die maximale Zahl von Kindern eines
Knotens in B. B ist ein binärer Baum, falls B den Grad 2 hat. Hat B den Grad
3, so heißt B ternär. B heißt regulär, falls jeder innere Knoten von B dieselbe
Anzahl von Kindern hat.
Wir betrachten reguläre Bäume etwas genauer. Ist B ein regulärer binärer Baum
mit mehr als einem Knoten, so hat die Wurzel von B den Grad 2, jeder innere
Knoten außer der Wurzel den Grad 3 und jedes Blatt den Grad 1.
Wir wissen bereits, dass ein Baum mit n Knoten genau n − 1 Kanten hat und
dass die Summe der Grade in einem Graphen genau die zweifache Kantenzahl ist.
Ist p die Zahl der Blätter von B, so gilt
2 + (n − 1 − p) · 3 + p = 2(n − 1).
Es folgt p =
n+1
2 .
Die Zahl der inneren Knoten von B ist damit n − p =
n−1
2 .
Das zeigt den folgenden Satz:
Satz 5.43. Ein regulärer binärer Baum mit n Knoten hat
n+1
2
Blätter und
n−1
2
innere Knoten.
Abschließend beweisen wir noch einen Satz über die Anzahl der Knoten in einem
Baum in Abhängigkeit von Höhe und Grad.
74
STEFAN GESCHKE
Satz 5.44. Ein Baum der Höhe h vom Grad s hat höchstens
sh+1 −1
s−1
Knoten.
Beweis. Sei B ein Baum der Höhe h, wobei die Höhe in Bezug auf eine Wurzel w
berechnet wurde. Für ` ∈ N0 mit ` ≤ h sei die `-te Stufe des Baumes die Menge
der Knoten, für die der kürzeste Weg zur Wurzel die Länge ` hat. Die 0-te Stufe
des Baumes besteht also nur aus der Wurzel, die erste Stufe aus den Kindern der
Wurzel, die zweite Stufe aus den Kindern der Kinder der Wurzel und so weiter.
Die 0-te Stufe enthält also einen Knoten, die 1-te Stufe höchstens s Knoten, die
2-te Stufe höchstens s2 Knoten und so weiter. Für ` ≤ h enthält die `-te Stufe höchPh
stens s` Knoten. Also hat B höchstens `=0 s` Knoten. Nach der geometrischen
Summenformel gilt
h
X
s` =
`=0
sh+1 − 1
.
s−1
Das zeigt den Satz.
5.5. Breiten- und Tiefensuche. Wir betrachten zwei Algorithmen mit denen
man in einem Graphen die Menge der Knoten berechnen lässt, die man von einem
gegebenen Startknoten aus erreichen kann. Es wird also für ungerichtete Graphen
die Zusammenhangskomponente eines Knotens berechnet.
Wir stellen die Algorithmen für gerichtete Graphen vor. Im Falle von ungerichteten Graphen kann man die Algorithmen anwenden, indem man jede ungerichtete
Kante {v, w} die zwei gerichteten Kanten (v, w) und (w, v) einführt. Man beachte,
dass im Falle eines gerichteten Graphen die Menge der von einem Knoten v aus
mit gerichteten Wegen erreichbaren Knoten weder die starke noch die schwache
Zusammenhangskomponente von v sein muss.
5.5.1. Tiefensuche. Sei G = (V, E) ein gerichteter Graph und sei v ∈ V .
Wir konstruieren schrittweise einen gerichteten Baum B mit der Wurzel v. Dabei
ist ein gerichteter Baum mit einer Wurzel v ein gerichteter Graph, dessen zugrunde
liegender ungerichtete Graph ein Baum ist und bei dem alle Kanten von der Wurzel
weg zeigen. Dieser gerichtete Baum B ist ein gerichteter Teilgraph von G.
Im Laufe des Algorithmus markieren wir mehr und mehr Knoten von G und
versuchen unmarkierte Nachbarn eines aktuellen Knoten a zu finden. Genau läuft
die Tiefensuche wie folgt ab:
(1) Markiere den Knoten v und setze a := v. In diesem Schritt sei B der Baum,
dessen einziger Knoten die Wurzel v ist.
(2) Falls es einen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt,
so wählte ein solches u, füge u und die Kante (a, u) zu dem Baum B hinzu, markiere u und setze a := u. Diesen Schritt bezeichnet man als den
Vorwärtsschritt (advance step).
(3) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt,
und falls a nicht die Wurzel von B ist, so geht man zurück zum Vater
w von a in B und setzt a := w. Diesen Schritt bezeichnet man als den
Rückwärtsschritt (back-tracking step). Nun fährt man mit Schritt (2) fort.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
75
(4) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt,
und falls a die Wurzel von B ist, so endet der Algorithmus. Die von v
aus erreichbaren Knoten sind genau die markierten Knoten. Das sind auch
genau die Knoten von B.
Die aktuellen Knoten verwaltet man bei der Tiefensuche am besten mit Hilfe
eines Stapels (stack). In den Schritten (1) und (2) tut man jeweils den neuen aktuellen Knoten a oben auf den Stapel. Im Schritt (3) entfernt man den obersten
Knoten vom Stapel. Der neue aktuelle Knoten ist der Knoten darunter, der jetzt
der oberste Knoten des Stapels ist.
Die Tiefensuche wird auf Englisch depth first search (DFS) genannt. Dementsprechend heißt der Baum, der bei der Tiefensuche gewählt wird, DFS-Baum.
Man beachte, dass der Baum, der bei der Tiefensuche entsteht, von Wahlen abhängt, die während des Ablaufs des Algorithmus getroffen werden. Im allgemeinen
ist ein DFS-Baum also nicht durch v und G eindeutig bestimmt.
Satz 5.45. Sei G ein gerichteter Graph und v ∈ V (G). Weiter sei B der Baum
der markierten Knoten, der entsteht, wenn man die Tiefensuche in G ausgehend
von v durchführt. Dann ist ein Knoten w ∈ V (G) genau dann in B, wenn es einen
gerichteten Weg v0 , v1 , . . . , v` von v nach w in G gibt.
Beweis. Es ist klar, dass B ein Baum ist, der ein gerichteter Teilgraph von G ist,
und dass jeder Knoten von B durch einen gerichteten Weg in B, und damit auch
in G, erreichbar ist.
Sei umgekehrt w ein Knoten in G, der sich von v aus auf einem gerichteten Weg
in G erreichen lässt. Wir zeigen durch vollständige Induktion über die Länge eines
solchen Weges, dass w in B liegt. Der Induktionsanfang ist sehr einfach: Lässt sich
w von v aus in 0 Schritten erreichen, so ist w = v und liegt damit in B.
Für den Induktionsschritt sei w ein Knoten, der sich von v aus in ` Schritten
erreichen lässt. Die Induktionsannahme ist, dass alle Knoten von G, die sich von v
aus in weniger als ` Schritten erreichen lassen, in B liegen.
Sei v0 , . . . , v` ein gerichteter Weg von v nach w in G. Nach Induktionsannahme ist
v`−1 ein Knoten in B. Da der Algorithmus in endlichen gerichteten Graphen immer
terminiert, muss es in der Tiefensuche einen Moment gegeben haben, in dem v`−1
der aktuellen Knoten war und es keinen unmarkierten Nachbarn von v`−1 mehr
gab. Das heißt aber, dass w irgendwann markiert wurde. Also ist w ein Knoten in
B.
5.5.2. Breitensuche. Sei G = (V, E) ein gerichteter Graph und sei v ∈ V .
Wieder konstruieren wir einen gerichteten Baum B mit der Wurzel v. Wenn der
Algorithmus endet, so enthält B wieder alle Knoten, die von v aus erreichbar sind.
Der Unterschied zur Tiefensuche liegt darin, dass wir länger beim aktuellen Knoten
bleiben und die Suche entsprechend anders organisieren.
(1) Markiere den Knoten v und setze a := v. In diesem Schritt sei B der Baum,
dessen einziger Knoten die Wurzel v ist.
76
STEFAN GESCHKE
(2) Falls es einen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt,
so wähle ein solches u, füge u und die Kante (a, u) zu dem Baum B hinzu
und markiere u. Im Unterschied zur Tiefensuche bleibt in diesem Schritt
der ursprüngliche Knoten a der aktuelle Knoten.
(3) Falls es keinen unmarkierten Knoten u ∈ V gibt, so dass (a, u) ∈ E gilt,
und falls es einen Knoten b in B gibt, von dem aus es eine Kante (b, u) zu
einem unmarkierten Knoten u gibt, so wähle aus allen solchen Knoten b
denjenigen aus, der schon am längsten in dem Baum B ist und setze a := b.
Der Knoten b wird also der neue aktuelle Knoten und der Algorithmus fährt
mit Schritt (2) fort.
(4) Falls es keine Kante (a, u) vom aktuellen Knoten zu einem unmarkierten
Knoten gibt und auch kein Knoten b in B existiert, der zu einem unmarkierten Knoten benachbart ist, so stoppt der Algorithmus.
Die markierten Knoten verwaltet man bei der Breitensuche am besten mit Hilfe
einer Warteschlange (queue). In den Schritten (1) und (2) tut man jeweils den neu
markierten Knoten, v in Schritt (1) und u in Schritt (2), hinten in die Warteschlange. Im Schritt (3) betrachtet man den vordersten Knoten in der Warteschlange
und testet, ob dieser Knoten noch unmarkierte Nachbarn hat. Falls nicht, so wird
dieser Knoten aus der Warteschlange entfernt und der nächste Knoten in der Warteschlange getestet.
Die Breitensuche wird auf Englisch breadth first search (BFS) genannt.
Dementsprechend heißt der Baum, der bei der Breitensuche gewählt wird, BFSBaum. Man beachte, dass der Baum, der bei der Breitensuche entsteht, von Wahlen
abhängt, die während des Ablaufs des Algorithmus getroffen werden. Im allgemeinen ist ein BFS-Baum also nicht durch v und G eindeutig bestimmt.
Satz 5.46. Sei G ein gerichteter Graph und v ∈ V (G). Weiter sei B der Baum
der markierten Knoten, der entsteht, wenn man die Breitensuche in G ausgehend
von v durchführt. Dann ist ein Knoten w ∈ V (G) genau dann in B, wenn es einen
gerichteten Weg v0 , v1 , . . . , v` von v nach w in G gibt.
Beweis. Der Beweis ist praktisch identisch mit dem Beweis von Satz 5.45. Es ist
klar, dass B ein Baum ist, der ein gerichteter Teilgraph von G ist, und dass jeder
Knoten von B durch einen gerichteten Weg in B, und damit auch in G, erreichbar
ist.
Sei umgekehrt w ein Knoten in G, der sich von v aus auf einem gerichteten Weg
in G erreichen lässt. Wir zeigen durch vollständige Induktion über die Länge eines
solchen Weges, dass w in B liegt. Der Induktionsanfang ist sehr einfach: Lässt sich
w von v aus in 0 Schritten erreichen, so ist w = v und liegt damit in B.
Für den Induktionsschritt sei w ein Knoten, der sich von v aus in ` Schritten
erreichen lässt. Die Induktionsannahme ist, dass alle Knoten von G, die sich von v
aus in weniger als ` Schritten erreichen lassen, in B liegen.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
77
Sei v0 , . . . , v` ein gerichteter Weg von v nach w in G. Nach Induktionsannahme
ist v`−1 ein Knoten in B. Da der Algorithmus in endlichen gerichteten Graphen
immer terminiert, muss es in der Breitensuche einen Moment gegeben haben, in
dem v`−1 der aktuellen Knoten war und es keinen unmarkierten Nachbarn von
v`−1 mehr gab. Das heißt aber, dass w irgendwann markiert wurde. Also ist w ein
Knoten in B.
6. Elementare Zahlentheorie (Fortsetzung)
Sei m ∈ N. Wir erinnern uns an die Definition der Kongruenz modulo m. Zwei
Zahlen a, b ∈ Z sind kongruent modulo m,
a ≡ b (mod m),
falls a und b bei Division durch m denselben Rest haben. Die Kongruenz a ≡
b (mod m) gilt genau dann, wenn a − b durch m teilbar ist.
Die folgenden drei Eigenschaften aus Satz 2.31 zeigen, dass die Kongruenz modulo m eine Äquivalenzrelation ist:
(1) a ≡ a (mod m) (Reflexivität)
(2) a ≡ b (mod m) ⇒ b ≡ a (mod m) (Symmetrie)
(3) a ≡ b (mod m) ∧ b ≡ c (mod m) ⇒ a ≡ c (mod m) (Transitivität)
Die Äquivalenzklassen dieser Äquivalenzrelation haben wir Restklassen genannt und die Restklasse einer Zahl a mit [a]m bezeichnet. Es ist also
[a]m = {b ∈ Z : a ≡ b (mod m)} = {. . . , a − m, a, a + m, a + 2m, . . . }.
Es gibt genau m verschiedene Restklassen modulo m, nämlich
[0]m , [1]m , . . . , [m − 1]m .
Definition 6.1. Es sei
Zm := {[0]m , [1]m , . . . , [m − 1]m }
die Menge der Restklassen modulo m.
Für eine gegebene Restklasse K modulo m nennen wir ein Element a ∈ K einen
Repräsentanten oder Vertreter der Restklasse K. Ist a ein Repräsentant von K,
so gilt K = [a]m . Wählen wir aus jeder Restklasse genau einen Repräsentanten, so
spricht man von einem Repräsentanten- oder Vertretersystem. Das Standardrepräsentantensystem für die Restklassen in Zm sind die Zahlen 0, 1, . . . , m−1.
Wir definieren Rechenoperationen ⊕ und zwischen Restklassen modulo m.
Definition 6.2. Für a, b ∈ Z sei
[a]m ⊕ [b]m := [a + b]m
und
[a]m [b]m := [a · b]m .
78
STEFAN GESCHKE
Man beachte, dass diese Definition nur dann sinnvoll ist, wenn die Definition
unabhängig von der Wahl der Repräsentanten a und b der Restklassen [a]m und
[b]m ist, wenn also für alle c, d ∈ Z mit [a]m = [c]m und [b]m = [d]m gilt:
[a + b]m = [c + d]m und [a · b]m = [c · d]m
An dieser Stelle erinnern wir uns wieder an Satz 2.31. Es gilt:
(5) a ≡ b (mod m) ∧ c ≡ d (mod m) ⇒ a + c ≡ b + d (mod m)
Mit anderen Worten, wenn [a]m = [c]m und [b]m = [d]m gilt, dann gilt auch
[a + c]m = [b + d]m .
Das heißt, dass unsere Definition von [a]m ⊕[b]m tatsächlich nur von den Restklassen
[a]m und [b]m abhängt, und nicht von der Wahl der Repräsentanten a und b. Man
sagt, dass ⊕ wohldefiniert ist.
Beispiel 6.3. Sei m = 7, a = 5 und b = 8. Dann ist
[a]m ⊕ [b]m = [5]7 ⊕ [8]7 = [5 + 8]7 = [13]7 = [6]7 .
Wählt man nun c = −2 und d = 1, so gilt a − c = 7 und b − d = 7. Es gilt also
a ≡ c (mod m) und c ≡ d (mod m) und damit [a]m = [c]m und [b]m = [d]m . Nun ist
[c]m ⊕ [d]m = [−2]7 ⊕ [1]7 = [−2 + 1]7 = [−1]7 = [6]7 .
Also ist [a + b]m = [c + d]m , wie erwartet.
Wir müssen noch zeigen, dass auch wohldefiniert ist. Seien a, b, c, d ∈ Z mit
a ≡ c (mod m) und c ≡ d (mod m). Dann existieren r1 , r2 , qa , qb , qc , qd ∈ Z mit
a = qa · m + r1 , b = qb · m + r2 , c = qc · m + r1 , d = qd · m + r2 sowie 0 ≤ r1 , r2 < m.
Wir betrachten a · c und b · d. Es gilt
a · b = (qa · m + r1 ) · (qb · m + r2 ) = qa · qb · m2 + r1 · qb · m + r2 · qa · m + r1 · r2
und
c · d = (qc · m + r1 ) · (qd · m + r2 ) = qc · qd · m2 + r1 · qd · m + r2 · qc · m + r1 · r2 .
Also ist a · b ≡ c · d (mod m). Das zeigt, dass [a · b]m unabhängig von der Wahl
der Repräsentanten a und b der Restklassen [a]m und [b]m ist. Damit ist auch wohldefiniert.
Satz 6.4. Für alle a, b, c ∈ Z gilt:
(1) Kommutativgesetz:
• [a]m ⊕ [b]m = [b]m ⊕ [a]m
• [a]m [b]m = [b]m [a]m
(2) Assoziativgesetz:
• ([a]m ⊕ [b]m ) ⊕ [c]m = [b]m ⊕ ([a]m ⊕ [c]m )
• ([a]m [b]m ) [c]m = [b]m ([a]m [c]m )
(3) Existenz neutraler Elemente:
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
79
• [a]m ⊕ [0]m = [a]m
• [a]m [1]m = [a]m
(4) Distributivgesetz:
• [a]m ([b]m ⊕ [c]m ) = ([a]m [b]m ) ⊕ ([a]m [b]m )
(5) Existenz additiver Inverser.
• [a]m ⊕ [−a]m = [0]m
Beweis. Alle diese Eigenschaften folgen leicht aus den entsprechenden Eigenschaften von Z. Als Beispiel rechnen wir (4) nach. Es gilt
[a]m ([b]m ⊕ [c]m ) = [a]m [b + c]m = [a · (b + c)]m
= [a · b + a · c]m = [a · b]m ⊕ [a · c]m = ([a]m [b]m ) ⊕ ([a]m [b]m ).
Das zeigt (4).
Wir geben für m = 2, 3, 4, 5 Additionstabellen und Multiplikationstabellen an,
wobei wir anstelle von [r]m zur Abkürzung r schreiben.
m=2:
m=3:
m=4:
m=5:
⊕ 0
1
0
1
0
0
1
0
0
0
1
1
0
1
0
1
⊕ 0
1
2
0
1
2
0
0
1
2
0
0
0
0
1
1
2
0
1
0
1
2
2
2
0
1
2
0
2
1
⊕ 0
1
2
3
0
1
2
3
0
0
1
2
3
0
0
0
0
0
1
1
2
3
0
1
0
1
2
3
2
2
3
0
1
2
0
2
0
2
3
3
0
1
2
3
0
3
2
1
⊕ 0
1
2
3
4
0
1
2
3
4
0
0
1
2
3
4
0
0
0
0
0
0
1
1
2
3
4
0
1
0
1
2
3
4
2
2
3
4
0
1
2
0
2
4
1
3
3
3
4
0
1
2
3
0
3
1
4
2
4
4
0
1
2
3
4
0
4
3
2
1
Wir schreiben von nun an einfach + und · für ⊕ und und stellen fest, dass
sich nicht jede Rechenregel von Z auf Zm überträgt. Die Kürzungsregel, dass also
für a 6= 0 aus ab = ac immer b = c folgt, gilt zum Beispiel im Allgemeinen nicht
in Zm . Zum Beispiel gilt [2]4 · [1]4 = [2]4 = [6]4 = [2]4 · [3]4 und [2]4 6= [0]4 , aber
80
STEFAN GESCHKE
[1]4 6= [3]4 . Dieses Beispiel hängt damit zusammen, dass [2]4 · [2]4 = [4]4 = [0]4 gilt,
dass es also in Z4 von 0 verschiedene Elemente gibt, deren Produkt 0 ist.
Definition 6.5. Sei [a]m ∈ Zm . Ein Element [b]m ∈ Zm heißt multiplikatives
Inverses von [a]m , falls
[a]m · [b]m = [1]m
gilt. Besitzt [a]m ein multiplikatives Inverses, so nennt man [a]m invertierbar.
Beispiel 6.6. [3]4 ist invertierbar. Es gilt nämlich [3]4 · [3]4 = [9]4 = [1]4 .
[2]4 ist nicht invertierbar, da in Z4 kein Element [b]4 existiert, so dass [2]4 · [b]4 =
[1]4 gilt. Das liest man an der entsprechenden Multiplikationstabelle ab.
[2]5 ist invertierbar. Es gilt [2]5 · [3]5 = [6]5 = [1]5 .
Satz 6.7. Ein Element von Zm hat höchstens ein multiplikatives Inverses.
Beweis. Angenommen, [b]m und [c]m sind beide multiplikative Inverse von [a]m .
Dann gilt
[b]m = [b]m · [1]m = [b]m · ([a]m · [c]m ) = ([b]m · [a]m ) · [c]m = [1]m · [c]m = [c]m .
Also gibt es keine zwei verschiedenen multiplikativen Invsersen von [a]m .
Satz 6.8. Ein Element [a]m ∈ Zm ist genau dann invertierbar, wenn a und m
teilerfremd sind. Insbesondere ist jedes Element [a]p ∈ Zp \ {[0]p } invertierbar,
wenn p eine Primzahl ist.
Beweis. Sei zunächst [a]m ∈ Zm invertierbar. Dann existiert [b]m ∈ Zm mit
[a]m · [b]m = [1]m .
Es gilt also ab ≡ 1 (mod m. Damit existiert ein k ∈ Z mit ab − 1 = km. Es folgt
ab − km = 1. Ist g ∈ Z ein Teiler von a und m, so teilt g auch ab − km = 1. Damit
ist g entweder 1 oder −1. Also sind a und m Teilerfremd.
Nun nehmen wir an, dass a und m teilerfremd sind. Wir betrachten die Restklassen
[0 · a]m , [1 · a]m , . . . , [(m − 1) · a]m
und zeigen zunächst, dass sie paarweise verschieden sind.
Seien nämlich r, s ∈ Z. Angenommen [ra]m = [sa]m . Dann ist ra − sa = (r − s)a
durch m teilbar. Da a und m teilerfremd sind, folgt daraus, dass r−s durch m teilbar
ist. Also gilt [r]m = [s]m . Es folgt, dass für r, s ∈ Z mit r 6= s und 0 ≤ r, s < m die
beiden Restklassen [ra]m und [sa]m verschieden sind.
Da die m Restklassen
[0 · a]m , [1 · a]m , . . . , [(m − 1) · a]m
paarweise verschieden sind, muss die Restklasse [1]m unter ihnen sein. Also gibt es
ein b ∈ Z mit 0 ≤ b < m und [b · a]m = [1]m . Es gilt also [b]m · [a]m = [b · a]m = [1]m
und damit ist [a]m invertierbar.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
81
Aus den Sätzen 6.4 und 6.8 folgt sofort das nächste Korollar.
Korollar 6.9. Ist p eine Primzahl, so ist Zp ein Körper.
Der Beweis des nächsten Satzes zeigt, wie man multiplikative Inverse von invertierbaren Elementen von Zm berechnen kann.
Satz 6.10. Seien a, b ∈ N und d = ggT(a, b). Dann gibt es λ, µ ∈ Z mit d = λa+µb.
Beweis. Wir können annehmen, dass a ≤ b gilt und beweisen den Satz durch vollständige Induktion über die Anzahl der Schritte, die im euklidischen Algorithmus
durchgeführt werden, um ggT(a, b) zu berechnen.
Induktionsanfang: Wenn der euklidische Algorithmus bereits nach dem ersten
Schritt terminiert, so ist a ein Teiler von b. In diesem Falle ist ggT(a, b) = a und es
gilt a = 1 · a + 0 · b.
Induktionsschritt: Sei n ∈ N so gewählt, dass der euklidische Algorithmus zur
Berechnung von ggT(a, b) nach n Schritten terminiert und gelte n > 1. Angenommen der Satz gilt für alle a0 , b0 ∈ N, bei denen der euklidische Algorithmus nach
weniger als n Schritten terminiert.
Wir führen den ersten Schritt des euklidischen Algorithmus für a und b durch
und wählen r, q ∈ Z mit b = q · a + r und 0 ≤ r < a. Es gilt d = ggT(a, b) =
ggT(r, a). Nun lässt sich ggT(r, a) in weniger als n Schritten berechnen und nach
Induktionsannahme existieren λ0 , µ0 ∈ Z mit d = λ0 r + µ0 a. Es gilt r = b − qa und
damit
d = λ0 (b − qa) + µ0 a = λ0 b + (µ0 − λ0 q)a.
Setzt man also µ := λ0 und λ := µ0 − λ0 q, so ergibt sich d = λa + µb.
Man beachte, dass für teilerfremde a, m ∈ N aus Satz 6.10 folgt, dass es b, k ∈ Z
gibt, so dass 1 = ab + km gilt. Es folgt auf etwas andere Weise als im Satz 6.8, dass
[a]m invertierbar ist, nämlich mit dem multiplikativen Inversen [b]m . Man kann den
euklidischen Algorithmus also auch einsetzen, um Elemente von Zm zu invertieren.
Beispiel 6.11. a) Sei a = 228 und b = 294. Wir berechnen den größten gemeinsamen Teiler von a und b mit dem euklidischen Algorithmus. Es gilt:
294
=
1 · 228 + 66
228
=
3 · 66 + 30
66
=
2 · 30 + 6
30
=
5·6+0
Der größte gemeinsame Teiler von 228 und 66 ist also 6. Aus der vorletzten Gleichung erhalten wir 6 = 66 − 2 · 30. Aus der zweiten Gleichung ergibt sich 30 =
228 − 3 · 66. Einsetzen liefert 6 = 66 − 2 · (228 − 3 · 66) = 7 · 66 − 2 · 228. Die erste
Gleichung liefert 66 = 294 − 1 · 228. Durch Einsetzen in 6 = 7 · 66 − 2 · 228 folgt
6 = 7 · (294 − 1 · 228) − 2 · 228 = 7 · 294 − 9 · 228.
82
STEFAN GESCHKE
b) Sei a = 15 und m = 28. Wir wollen [a]m invertieren. Der euklidische Algorithmus liefert
28
=
1 · 15 + 13
15
=
1 · 13 + 2
13
=
6·2+1
2
=
2 · 1 + 0.
Der größte gemeinsame Teiler von 15 und 28 ist also 1. Auflösen der Gleichung in
diesem Durchlauf des euklidischen Algorithmus und Rückwärtseinsetzen liefert
1 = 13 − 6 · 2 = 13 − 6 · (15 − 1 · 13) = 7 · 13 − 6 · 15
= 7 · (28 − 1 · 15) − 6 · 15 = 7 · 28 − 13 · 15
Es gilt also
1 ≡ −13 · 15 (mod 28).
Damit ist [−13]28 = [15]28 das multiplikative Inverse von [15]28 in Z28 .
Auf ähnliche Weise wie Satz 6.8 können wir auch den folgenden Satz beweisen,
der wichtige Anwendungen in der Kryptographie hat. Für n ∈ N sei ϕ(n) die Anzahl
der zu n teilerfremden natürlichen Zahlen ≤ n.
Beispiel 6.12. a) Es gilt ϕ(1) = 1, da ggT(1, 1) = 1 gilt und damit 1 und 1
teilerfremd sind.
b) Für eine Primzahl p ist ϕ(p) = p − 1, da alle kleineren natürlichen Zahlen zu
p teilerfremd ist.
c) Die Zahlen 1, 5, 7, 11 sind zu 12 teilerfremd, während 2, 3, 4, 6, 8, 9, 10 nichttriviale gemeinsame Teiler mit 12 haben. Also ist ϕ(12) = 4.
d) Sind p und q verschiedene Primzahlen, so gilt
ϕ(p · q) = (p − 1) · (q − 1) = pq − p − q + 1.
Eine Zahl a ≤ p · q hat nämlich genau dann einen nichttrivialen gemeinsamen Teiler
mit p · q, wenn a ein Vielfaches von p oder q ist. Das kleinste gemeinsame Vielfache
von p und q ist p · q. Es gibt also p Vielfache von q und q Vielfache von p, die nicht
größer als p · q sind. Dabei wird das gemeinsame Vielfache p · q doppelt gezählt.
Insgesamt gibt es also p+q −1 natürliche Zahlen ≤ p·q, die nicht zu p·q teilerfremd
sind. Das zeigt ϕ(p · q) = (p − 1) · (q − 1).
Satz 6.13 (Der Satz von Fermat-Euler). Sei m, n ∈ N teilerfremd. Dann gilt
nϕ(m) ≡ 1 (mod m).
Beweis. Seien r1 , . . . , rϕ(n) die natürlichen Zahlen ≤ m, die zu m teilerfremd sind.
Wie im Beweis von Satz 6.8 sind die Restklassen
[r1 · n]m , [r2 · n]m , . . . , [rϕ(m) · n]m
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
83
paarweise verschieden. Für jedes i ∈ {1, . . . , ϕ(m)} sind ri und n beide zu m teilerfremd. Es folgt, dass auch ri · n zu m teilerfremd ist. Also gilt
{[r1 · n]m , [r2 · n]m , . . . , [rϕ(m) · n]m } = {[r1 ]m , [r2 ]m , . . . , [rϕ(m) ]m }
und damit auch
[r1 · n]m · [r2 · n]m · . . . · [rϕ(m) · n]m = [r1 ]m · [r2 ]m · . . . · [rϕ(m) ]m .
Daher gilt für v = r1 · r2 · . . . · rϕ(m) die Kongruenz
v ≡ (r1 · n) · (r2 · n) · . . . · (rϕ(m) · n) ≡ v · nϕ(m) (mod m).
Da v ein Produkt von zu m teilerfremden Zahlen ist, ist auch v selbst zu m teilerfremd. Also ist [v]m nach Satz 6.8 invertierbar und es existiert [b]m ∈ Zm mit
[b]m · [v]m = [1]m . Multiplikation der Gleichung [v]m = [v · nϕ(m) ]m mit [b]m liefert
[1]m = [nϕ(m) ]m , also nϕ(m) ≡ 1 (mod m).
Korollar 6.14 (Der kleine Satz von Fermat). Sei n ∈ N und p eine Primzahl, die
n nicht teilt. Dann gilt
np−1 ≡ 1 (mod p).
6.1. RSA-Verschlüsselungsverfahren. Die RSA-Verschlüsselung wurde 1977
von den Mathematikern Rivest, Shamir und Adleman entwickelt und ist immer
noch wichtiger Bestandteil heute gängiger Verschlüsselungsmethoden. Dabei wird
ein Nachrichtentext vom Sender zunächst auf irgendeine sinnvolle Weise als natürliche Zahl m kodiert, so dass sich die Nachricht vom Empfänger aus m leicht wieder
dekodieren lässt. Uns interessiert nur, wie wir nun die Zahl m verschlüsseln und
an den Empfänger versenden können, ohne dass Dritte die Nachricht entschlüsseln
können.
Es gibt beim RSA-Verfahren zwei Schlüssel, einen öffentlichen Schlüssel (public key) und einen privaten Schlüssel (private key). Die beiden Schlüssel
werden vom Empfänger der Nachricht erzeugt. Nur der öffentliche Schlüssel wird
an den Sender weitergeleitet. Der private Schlüssel ist nur dem Empfänger bekannt.
Es ist dabei unwichtig, ob der öffentliche Schlüssel Dritten bekannt wird.
Der öffentliche Schlüssel ist ein Zahlenpaar (e, N ) und der private Schlüssel
ein Zahlenpaar (d, N ), wobei N in beiden Fällen dieselbe Zahl ist. Man nennt N
den RSA-Modul, e den Verschlüsselungsexponenten und d den Entschlüsselungsexponenten. Die Schlüssel werde wie folgt erzeugt:
(1) Wähle zufällig zwei verschiedene Primzahlen p und q.
(2) Berechne den RSA-Modul N = p · q.
(3) Berechne ϕ(N ) = (p − 1) · (q − 1).
(4) Wähle eine zu ϕ(N ) teilerfremde Zahl e mit 1 < e < ϕ(N ).
(5) Berechne das multiplikative Inverse [d]ϕ(N ) von [e]ϕ(N ) .
84
STEFAN GESCHKE
Die Zahlen p, q und ϕ(N ) werden nun nicht mehr benötigt und können gelöscht
werden. Die Zahl m, die verschlüsselt werden soll, muss kleiner als das RSA-Modul
N sein.
Verschlüsselt wird nun wie folgt: Der Sender benutzt den öffentlichen Schlüssel (e, N ) und berechnet [me ]N . Die Restklasse [me ]N wird dann in Form eines
Repräsentanten zwischen 0 und N angegeben und an den Empfänger übermittelt.
Ohne Kenntnis des privaten Schlüssels (d, N ) lässt sich m nicht in sinnvoller Zeit
aus [me ]N rekonstruieren, obwohl man ja eigentlich nur in ZN die e-te Wurzel aus
[me ]N ziehen muss. Aber das geht eben nicht innerhalb eines sinnvollen Zeitrahmens.
Der Empfänger benutzt den privaten Schlüssel (d, N ) und berechnet [(me )d ]N .
Das geht wiederum schnell, da Potenzieren auch in ZN einfach ist. Wegen
e · d ≡ 1 (mod ϕ(N ))
existiert ein q ∈ Z mit e · d = q · ϕ(N ) + 1. Nach Satz 6.13 gilt
(me )d ≡ me·d ≡ mq·ϕ(N )+1 ≡ (mϕ(N ) )q · m ≡ 1q · m ≡ m (mod N )
und damit [(me )d ]N = [m]N . Damit ist die Nachricht entschlüsselt.
In der Praxis werden noch diverse weitere Forderungen an p, q und e gestellt,
damit das Verfahren effizient und sicher durchgeführt werden kann. Man beachte,
dass man den privaten Schlüssel (d, N ) aus (e, N ) berechnen kann, indem man N
in seine Primfaktoren p und q zerlegt. Das dauert aber zu lange, wenn p und q
ausreichend groß sind. Im September 2009 wurde eine 232-stellige Zahl (768 Bits)
mit einem Rechenaufwand von mehreren Jahren auf hunderten von Rechnern in ihre
Primfaktoren zerlegt. Eine gängige Größe für RSA-Moduln sind 1024 Bit, also etwa
300 Dezimalstellen. Selbst diese Schlüsselgröße wird aber inzwischen nicht mehr für
absolut sicher gehalten.
Beispiel 6.15. Wir wählen die zwei Primzahlen p = 11 und q = 13. Das liefert den
RSA-Modul N = 143. Es gilt ϕ(N ) = (p−1)·(q−1) = 10·12 = 120. Die Zahl e = 23
ist zu 120 teilerfremd. Wir wählen (23, 143) als den öffentlichen Schlüssel. Mit dem
euklidischen Algorithmus bestimmen wir das multiplikative Inverse von [23]120 in
Z120 . Es gilt ggT(23, 120) = 1 = 23 · 47 − 9 · 120. Damit ist 23 · 47 ≡ 1 (mod 120)
und wir setzen d = 47. Der private Schlüssel ist also (47, 143).
Angenommen, die Zahl 7 soll verschlüsselt werden. Es gilt
723
mod 143 = 27368747340080916343
mod 143 = 2.
Die verschlüsselte Nachricht ist also 2.
Zum Entschlüsseln müssen wir mit d = 47 potenzieren. Es gilt
247
mod 143 = 140737488355328
mod 143 = 7.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
85
7. Gruppentheorie
7.1. Algebraische Strukturen, Halbgruppen und Monoide.
Definition 7.1. Eine algebraische Struktur ist eine Menge M zusammen mit endlich vielen endlichstelligen Operationen f1 , . . . , fk auf M . Formal schreibt man für
die algebraische Struktur M = (M, f1 , . . . , fk ). Dabei heißt M die M unterliegende Menge. Oft wird jedoch nicht zwischen einer algebraischen Struktur und
ihrer unterliegenden Menge unterschieden. So bezeichnet R sowohl die Menge der
reellen Zahlen als auch die algebraische Struktur (R, +, ·).
Beispiel 7.2. Wir haben schon einiger Beispiele algebraischer Strukturen kennengelernt.
a) Ein Körper ist eine Menge K zusammen mit zwei zweistelligen Operationen +
und ·, so dass die Axiome (K1)–(K5) erfüllt sind. Damit sind Körper algebraische
Strukturen. Das gilt insbesondere für (Q, +, ·) und (R, +, ·).
b) (Z, +, ·) und (N, +, ·) sind ebenfalls algebraische Strukturen.
c) Konstanten in einer Menge M kann man als 0-stellige Operationen auf M
interpretieren. Damit können algebraische Strukturen auch Konstanten enthalten.
So sind Boolesche Algebren algebraische Strukturen mit zwei zweistelligen Operationen t und u sowie einer einstelligen Operation ¬ und zwei Konstanten 0 und
1.
c) Für eine Menge A sei F (A) die Menge der Funktionen von A nach A. Dann
ist (F (A), ◦) eine algebraische Struktur.
Ist S(A) die Menge der Bijektionen von A nach A, so ist (S(A), ◦) eine algebraische Struktur. Man beachte, dass die Komposition ◦ von Abbildungen tatsächlich
eine zweistellige Operation auf S(A) ist, da die Komposition zweier Bijektionen
wieder eine Bijektion ist.
Definition 7.3. Ist (M, ∗) eine algebraische Struktur mit einem zweistellingen
Operator ∗. Ein Element e ∈ M wird neutrales Element (bezüglich ∗) genannt,
falls für alle a ∈ M gilt:
e∗a=a∗e=a
Beispiel 7.4. a) Die 0 ist ein neutrales Element bezüglich + in R, Q und Z. In
denselben Strukturen ist 1 ein neutrales Element bezüglich ·.
b) In einer Booleschen Algebra ist 1 neutral bezüglich u und 0 ist neutral bezüglich t.
c) In F (A) und S(A) ist die identische Abbildung
idA : A → A; x 7→ x
ein neutrales Element bezüglich ◦.
d) Es gibt nicht in jeder algebraischen Struktur mit einer zweistelligen Operation
ein neutrales Element. Ein Beispiel ist (N, +).
86
STEFAN GESCHKE
Lemma 7.5. Ist ∗ eine zweistellige Operation auf M , so gibt es höchstens ein
neutrales Element bezüglich ∗.
Beweis. Seien c und d neutrale Elemente bezüglich ∗. Dann gilt c = c ∗ d = d.
Definition 7.6. Sei ∗ eine zweistellige Operation auf M mit einem neutralen Element e. Für a ∈ M heißt b ∈ M invers zu a (bezüglich ∗), falls a ∗ b = b ∗ a = e gilt.
Falls für a ∈ M ein b ∈ M existiert, das zu a invers ist, so heißt a invertierbar.
Beispiel 7.7. a) Für jedes a in Z, Q oder R ist −a das zu a inverse Element
bezüglich +.
b) Für jedes a in Z, Q oder R mit a 6= 0 ist a−1 das zu a inverse Element
bezüglich ·.
c) Es gibt nicht in jeder algebraischen Struktur mit einer zweistelligen Operation
ein neutrales Element. Sei nämlich A = {a ∈ N : a ≥ 2}. Dann ist (A, +) eine
algebraische Struktur ohne ein neutrales Element bzgl. +.
d) Wenn ein neutrales Element existiert, muss nicht jedes Element Inverse besitzen. So besitzt 0 in R kein Inverses bezüglich ·.
Das Element [2]4 hat in Z4 kein Inverses bezüglich ·, wie wir bereits gesehen
haben. Andererseits ist [3]4 in Z4 invertierbar bezüglich · und zu sich selbst invers.
Bezüglich + sind alle Elemente [a]m von Zm invertierbar, wobei [−a]m zu [a]m
invers ist.
Definition 7.8. Es sei (M, ∗) eine algebraische Struktur mit einer zweistelligen
Verknüpfung ∗. Gilt für alle a, b, c ∈ M das Assoziativgesetz
a ∗ (b ∗ c) = (a ∗ b) ∗ c,
so ist (M, ∗) eine Halbgruppe.
Hat (M, ∗) außerdem ein neutrales Element, so nennt man (M, ∗) ein Monoid.
Beispiel 7.9. a) Die Strukturen (N, ·), (R, +), (R, ·) und (F (A), ◦) sind Monoide.
(N, +) ist jedoch kein Monoid, da es in N bezüglich + kein neutrales Element gibt.
b) Für eine Menge A, die wir in diesem Zusammenhang Alphabet nennen. sei
∗
A die Menge aller endlichen Folgen von Zeichen aus A. Die Elemente von A∗
nennen wir Wörter über A. Für zwei Wörter v = a1 . . . an und w = b1 . . . bm
definieren wir die Verkettung v _ w von v und w als das Wort a1 . . . an b1 . . . bm .
Dann ist (A∗ , _ ) ein Monoid. Dabei ist das leere Wort das neutrale Element.
c) Ist (K, +, ·) ein Körper, so ist sowohl (K \ {0}, ·) als auch (K, ·) ein Monoid.
d) Für m ≥ 2 ist (Zm , ·) ein Monoid. Nach c) ist (Zm \ {[0]m }, ·) ein Monoid,
falls m eine Primzahl ist. Ist m keine Primzahl, so ist (Zm \ {[0]m }, ·) nichtmal eine
algebraische Struktur. Seien nämlich k, ` ∈ N mit m = k · ` und k, ` 6= 1. Dann
gilt [k]m · [`]m = [k · `]m = [m]m = [0]m . Damit sind [k]m und [`]m in Zm \ {[0]m },
während [k]m · [`]m kein Element von Zm \ {[0]m } ist. In diesem Falle ist · also gar
keine Operation auf Zm \ {[0]m }.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
87
Satz 7.10. Ist (M, ∗) ein Monoid, so besitzt jedes Element a von M höchstens ein
Inverses.
Beweis. Der Beweis ist eine allgemeine Fassung des Beweises von Satz 6.7. Seien
b, c ∈ M Inverse von a ∈ M . Dann gilt b = b∗e = b∗(a∗c) = (b∗a)∗c = e∗c = c. 7.2. Gruppen.
Definition 7.11. Eine Gruppe ist ein Monoid, in dem jedes Element invertierbar
ist. Der Übersichtlichkeit halber geben wir die Axiome für Gruppen noch einmal
gesammelt an.
Sei (G, ∗) eine algebraische Struktur mit einer zweistelligen Verknüpfung ∗. Dann
heißt (G, ∗) eine Gruppe, falls gilt:
(G1) Für alle a, b, c ∈ G gilt: a ∗ (b ∗ c) = (a ∗ b) ∗ c (Assoziativgesetz)
(G2) Es gibt ein Element e ∈ G, so dass für alle a ∈ G gilt: a ∗ e = e ∗ a = a
(Existenz eines neutralen Elements)
(G3) Für alle a ∈ G existiert ein b ∈ G, so dass für das eindeutig bestimmte
neutrale Element e ∈ G gilt: a ∗ b = b ∗ a = e (Existenz inverser Elemente)
Nachdem wir die entsprechenden Tatsachen für Monoide bewiesen haben, wissen
wir, dass das neutrale Element einer Gruppe eindeutig bestimmt ist. Ebenso ist für
jedes Element einer Gruppe das Inverse eindeutig bestimmt.
Beispiel 7.12. a) Wir haben schon zahlreiche Beispiele für Gruppen gesehen. So
sind (Z, +), (Q, +) und (R, +) Gruppen. Ebenso ist für jedes m ≥ 2 die Struktur
(Zm , +) eine Gruppe.
b) Auch (Q \ {0}, ·) und (R \ {0}, ·) sind Gruppen. Ist m eine Primzahl, so ist
(Zm \ {[0]m }, ·) eine Gruppe.
c) Sei A eine Menge und sei S(A) wieder die Menge der Bijektionen von A nach A.
Dann ist (S(A), ◦) eine Gruppe. Für jede Funktion f ∈ S(A) ist die Umkehrfunktion
f −1 das zu f inverse Element. Die Gruppe (S(A), ◦) heißt die symmetrische
Gruppe auf A. Besonders wichtig sind die Gruppen Sn = (S({1, . . . , n}), ◦) für
n ∈ N. Im Gegensatz zu den Gruppen, die wir bisher diskutiert haben, erfüllt
(S(A), ◦) nicht das Kommutativgesetz, falls A mindestens drei Elemente hat.
Seien nämlich a, b, c ∈ A verschieden und seien f, g : A → A Permutationen, die
alle x ∈ A \ {a, b, c} wieder auf x abbilden. Weiter sei f (a) = b, f (b) = a, f (c) = c,
g(a) = b, g(b) = c und g(c) = a. Dann gilt (f ◦ g)(a) = f (g(a)) = f (b) = a und
(g ◦ f )(a) = g(f (a)) = g(b) = c. Also ist f ◦ g 6= g ◦ f .
d) Sei m ≥ 2 und E(Zm ) = {[a]m : a und m sind teilerfremd}. E(Zm ) ist also genau die Menge der invertierbaren Elemente von Zm . Dann ist (E(Zm ), ·) eine
Gruppe, die Einheitengruppe von Zm . Die Elemente von E(Zm ) nennt man Einheiten von Zm . Anstelle von E(Zm ) schreibt man auch Z∗m .
Dass die Einheiten eine Gruppe bilden sieht man wie folgt: Zunächst müssen
wir zeigen, dass · überhaupt eine Operation auf E(Zm ) ist, d.h., dass das Produkt
zweier Einheiten wieder eine Einheit ist.
88
STEFAN GESCHKE
Seien a, b ∈ Z teilerfremd zu m. Dann gibt es c, d ∈ Z, so dass [c]m und [d]m zu
[a]m und [b]m invers sind. Damit ist aber [c]m · [d]m zu [a]m · [b]m invers. Also ist
[a]m · [b]m ∈ E(Zm ).
Dass · das Assoziativgesetz erfüllt wissen wir schon. [1]m ist das neutrale Element
von E(Zm ). Auch wissen wir, das alle Elemente von E(Zm ) in Zm invertierbar sind.
Wir müssen noch zeigen, dass das Inverse einer Einheit auch wieder eine Einheit
ist. Das ist aber klar: Ist [b]m zu [a]m invers, so ist [a]m zu [b]m zu invers. Also ist
für jedes Element von E(Zm ) auch sein Inverses eine Einheit.
e) Wir betrachten nun noch ein geometrisches Beispiel, die Gruppe G4 der
Symmetrien eines gleichseitigen Dreiecks, also der Transformationen der Ebene,
die das Dreieck auf das Dreieck abbilden. Die zweistellige Operation auf der Menge
dieser Symmetrien ist die Komposition von Abbildungen. Diese Gruppe nennen wir
kurz die Dreiecksgruppe.
C
A
B
Diese Transformationen sind zunächst die Identität, die jeden Punkt der Ebene
wieder auf sich selbst abbildet. Die Identität bezeichnen wir mit i. Weiter sei r
die Drehung um 120◦ entgegen dem Uhrzeigersinn, also im mathematisch positiven
Drehsinn. Es sei s die Drehung um 240◦ entgegen dem Uhrzeigersinn. Schließlich
seien x, y und z die Spiegelungen entlang der in der Zeichnung angegebenen Achsen.
y
x
z
Diese Symmetrien sind jeweils eindeutig dadurch bestimmt, auf welche Ecken
die Ecken des Dreiecks abgebildet werden. Damit entspricht jede Symmetrie einer
Permutation der Menge {A, B, C}.
Wir listen die Entsprechungen auf.
i
r
A
B
C
A
B
C
!
s
A
B
C
B
C
A
!
A
B
C
C
A
B
!
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
x
y
A
B
C
B
A
C
!
89
z
A
B
C
A
C
B
!
A
B
C
C
B
A
!
Wir wissen, dass die Komposition von Abbildungen das Assoziativgesetz erfüllt.
Auch wissen wir, dass die Identität ein neutrales Element bezüglich der Komposition ist. Um zu zeigen, dass die Menge G = {i, r, s, x, y, z} mit der Komposition von
Abbildungen tatsächlich eine Gruppe ist, müssen wir noch zeigen, dass die Komposition je zwei der Abbildungen in G wieder in G ist und dass jede Abbildung in G eine
Umkehrfunktion in G hat. Dazu berechnen wir alle Kompositionen von Elementen
von G und stellen das Ergebnis in einer Multiplikationstabelle dar. Multiplikationstabellen werden in diesem Zusammenhang auch Gruppentafeln genannt. In der
Zeile rechts neben dem Element a und der Spalte unter dem Element b steht das
Produkt a ◦ b.
◦
i
r
s
x
y
z
i
i
r
s
x
y
z
r
r
s
i
z
x
y
s
s
i
r
y
z
x
x
x
y
z
i
r
s
y
z
y
z
z
x
x
y
s
r
i
s
r
i
Dieser Gruppentafel entnehmen wir, dass für je zwei Elemente a, b ∈ G die
Komposition a ◦ b wieder in G liegt und dass jedes Element von G invertierbar ist.
So sind i, x, y und z zu sich selbst invers, während r zu s invers ist.
Wir stellen fest, dass in der Gruppentafel in Beispiel 7.12 e) in jeder Zeile und
Spalte jedes Element genau einmal auftaucht. Das folgende Lemma zeigt, dass das
kein Zufall ist. Im folgenden schreiben wir für a ∗ b kurz ab. Außerdem schreiben wir
e für das neutrale Element einer Gruppe und a−1 für das Inverse eines Elements a.
Lemma 7.13. Sei G eine Gruppe.
a) Seien a, b, c ∈ G. Gilt ab = ac, so ist b = c. Genauso folgt aus ba = ca, dass
b = c gilt.
b) Die Gleichungen ax = b und xa = b, wobei x eine Unbekannte ist, sind
eindeutig lösbar.
Beweis. a) Es gelte ab = ac. Wir multiplizieren diese Gleichung von links mit a−1
und erhalten a−1 ab = a−1 ac, also eb = ec und damit b = c, wie behauptet. Man
beachte, dass wir aufpassen müssen, von welcher Seite wir mit a−1 multiplizieren, da
in G nicht unbedingt das Kommutativgesetz gilt. Es könnte also sein, dass b = a−1 ab
und aba−1 verschieden sind.
Falls ba = ca gilt, so multiplizieren wir diese Gleichung von rechts mit a−1 und
erhalten b = c.
90
STEFAN GESCHKE
b) Ist die Gleichung ax = b gegeben, so multiplizieren wir wieder von links mit
−1
a
. Das liefert x = a−1 b. Die Gleichung wird also von dem Gruppenelement a−1 b
gelöst. Mit Hilfe einer Multiplikation von rechts sehen wir, dass xa = b die Lösung
x = ba−1 hat.
Teil a) dieses Lemmas zeigt, dass in einer Gruppentafel in jeder Zeile und Spalte
jedes Element höchstens einmal auftritt. Teil b) zeigt, dass in jeder Zeile und in
jeder Spalte einer Gruppentafel jedes Element mindestens einmal auftritt.
Beispiel 7.14. Wir betrachten wieder die Dreiecksgruppe G4 . Wir benutzen X
als Unbekannte, um die Unbekannte von dem Gruppenelement x zu unterscheiden.
Angenommen, wir wollen die Gleichung Xs = y lösen. Multiplikation von rechts
mit s−1 liefert X = ys−1 . In der Gruppentafel von G4 lesen wir ab, dass s−1 = r
gilt und dass yr = z ist. Damit löst X = z die Gleichung Xs = y.
7.3. Die Ordnung eines Gruppenelements. Gegeben sei eine Gruppe (G, ∗).
Dann definiert man die Potenzen an eines Gruppenelements a wie folgt: Es sei
a0 := e. Für n ∈ N0 sei an+1 := an ∗ a. Potenzen mit negativen Exponenten
definiert man durch a−n := (a−1 )n
Wie für Potenzen reeller Zahlen rechnet man schnell für alle a ∈ G und alle
m, n ∈ Z die folgenden Rechenregeln nach:
am an = am+n und (am )n = amn .
Definition 7.15. Sei G eine Gruppe und a ∈ G. Falls ein m > 1 existiert, so dass
am = 1 gilt, so definiert man die Ordnung von a als das kleinste m ∈ Z mit m > 0
und am = 1. Falls kein solches m exisitiert, so sagen wir, dass a die Ordnung ∞
hat.
Die Ordnung einer Gruppe G ist einfach ihre Mächtigkeit.
Den Zusammenhang zwischen der Ordnung einer Gruppe und der Ordnung eines
Gruppenelements werden wir später noch näher betrachten.
Satz 7.16. In einer endlichen Gruppe hat jedes Element eine endliche Ordnung.
Beweis. In einer endlichen Gruppe G gibt es nur endlich viele Möglichkeiten für
die Potenzen eines Elements. Ist also a ∈ G und G endlich, so gibt es m, n ∈ N mit
m < n und am = an . Nun gilt an−m am = an = am = eam . Da man in Gruppen
kürzen kann, folgt an−m = e. Damit existiert eine natürliche Zahl k mit ak = e.
Also hat a eine endliche Ordnung.
Beispiel 7.17. a) Zunächst beachte man, dass mit unserer Schreibweise das neutrale Element e von (Z, +) einfach 0 ist. Auch steht unsere allgemeine Schreibweise
an im Fall von (Z, +) für die Zahl n · a. Die ganze Zahl 1 hat in (Z, +) unendliche
Ordnung.
b) In G4 haben r und s die Ordnung 3, x, y und z die Ordnung 2 und i die
Ordnung 1.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
91
c) In (Z15 , +) hat [3]15 die Ordnung 5. Das Element [4]15 hat die Ordnung 15.
d) Wir betrachten die Gruppe (E(Z10 ), ·). Die Zahl 7 ist zu 10 teilerfremd, und
damit gilt [7]10 ∈ E(Z10 ). Wir berechnen die Potenzen von [7]10 in Z10 . Es gilt
72 ≡ 49 ≡ 9 (mod 10),
73 ≡ 9 · 7 ≡ 63 ≡ 3 (mod 10)
und
74 ≡ 49 · 49 ≡ 9 · 9 ≡ 81 ≡ 1 (mod 10).
Also ist 4 die kleinste natürliche Zahl m mit [7]m
10 = [1]10 . Damit ist 4 die Ordnung
von [7]10 in E(Z10 ).
e) Die Permutation
1
2
2
3
3
4
4
1
5
5
!
hat in Sn die Ordnung 4.
Satz 7.18. Sei G eine Gruppe und sei a ∈ G ein Element von endlicher Ordnung
m. Dann gilt für alle n ∈ Z genau dann an = e, wenn m ein Teiler von n ist.
Beweis. Sei zunächst m ein Teiler von n. Dann existiert q ∈ Z mit n = qm. Nun
ist an = aqm = (am )q = eq = e.
Sei umgekehrt an = e. Wähle q, r ∈ Z mit 0 ≤ r < m und n = qm + r. Dann gilt
e = an = aqm+r = (am )q ar = eq ar = ear = ar .
Da nun m die kleinste natürliche Zahl mit am = e ist und da r < m ist, muss r = 0
gelten. Damit ist n = qm und m|n.
7.4. Isomorphie von Gruppen.
Definition 7.19. Seien (G, ∗G ) und (H, ∗H ) zwei Gruppen. Eine Bijektion
f :G→H
heißt ein Isomorphismus von Gruppen (oder Gruppenisomorphismus), falls
für alle a, b ∈ G gilt:
f (a ∗G b) = f (a) ∗H f (b)
Falls ein Isomorphismus zwischen zwei Gruppen G und H existiert, so nennt man
∼ H.
die Gruppen isomorph und schreibt G =
Wir haben die Operationen ∗G und ∗H nur der Deutlichkeit halber unterschieden.
In unserer normalen Schreibweise lautet die Gleichung f (a ∗G b) = f (a) ∗H f (b)
einfach f (ab) = f (a)f (b).
Lemma 7.20. a) Ist f : G → H ein Isomorphismus von Gruppen, so auch
f −1 : H → G.
b) Sind f : F → G und g : G → H Gruppenisomorphismen, so ist auch
g◦f :F →H
ein Isomorphismus.
92
STEFAN GESCHKE
c) Ist f : G → H ein Gruppenisomorphismus und sind eG und eH die neutralen
Elemente von G bzw. H, so gilt f (eG ) = eH . Für jedes a ∈ G gilt
f (a−1 ) = (f (a))−1 .
Beweis. a) Es ist klar, dass f −1 eine Bijektion ist. Seien x, y ∈ H. Dann existieren
a, b ∈ G mit f (a) = x und f (b) = y. Es gilt f −1 (x) = a und f −1 (y) = b. Da f ein
Isomorphismus ist, gilt f (ab) = f (a)f (b) = xy. Also ist
f −1 (xy) = ab = f −1 (x)f −1 (y).
Damit ist f −1 ein Isomorphismus.
b) Wir wissen schon, dass die Komposition von Bijektionen wieder eine Bijektion
ist. Seien a, b ∈ F . Dann gilt
(g ◦ f )(ab) = g(f (ab)) = g(f (a)f (b)) = g(f (a))g(f (a)) = (g ◦ f )(a)(g ◦ f )(b)
damit ist g ◦ f ein Isomorphismus.
c) Wir erinnern uns zunächst daran, dass neutrale und inverse Elemente in Gruppen eindeutig bestimmt sind.
Sei x ∈ H. Dann existiert ein a ∈ A mit f (a) = x. Es gilt
f (a) = f (eG a) = f (eG )f (a) = f (eG )x.
Genauso sieht man, dass xf (eG ) = x gilt. Das zeigt f (eG ) = eH .
Für die Inversen sei wieder x ∈ H und a ∈ G mit f (a) = x. Dann gilt
xf (a−1 ) = f (a)f (a−1 ) = f (aa−1 ) = f (eG ) = eH .
Genauso sieht man f (a−1 )x = eH . Das zeigt f (a−1 ) = x−1 = (f (a))−1 .
Dieses Lemma zeigt unter anderem, dass die Relation ∼
= zwischen Gruppen symmetrisch und transitiv ist. Da für jede Gruppe G die identische Abbildung
idG : G → G; a 7→ a
ein Isomorphismus ist, ist ∼
= auch reflexiv.
Beispiel 7.21. Die Gruppen G4 und S3 sind isomorph.
In Beispiel 7.12 e) hatten wir bereits jeder Transformation in G4 eine Permutation der Menge {A, B, C} zugeordnet. Man rechnet leicht nach, dass es sich bei
dieser Zuordnung um einen Isomorphismus handelt. Es ist klar, dass die Gruppen
S3 und S({A, B, C}) isomorph sind.
7.5. Zyklische Gruppen.
Definition 7.22. Eine Gruppe G heißt zyklisch, wenn es ein Element a ∈ G mit
G = {an : n ∈ Z}
gibt, wenn G also aus den Potenzen eines einzigen Elements besteht. Gilt
G = {an : n ∈ Z},
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
93
so sagt man, dass G von a erzeugt wird.
Beispiel 7.23. a) Die Gruppe (Z, +) ist zyklisch. Alle ganzen Zahlen sind Vielfache von 1. Das Element a = 1 erzeugt also die Gruppe Z. Man erinnere sich daran,
dass aus dem Vielfachen n · 1 in der multiplikativen Schreibweise, die wir für allgemeine Gruppen benutzen, die Potenz an wird. Das Element −1 erzeugt ebenfalls
die Gruppe Z.
b) Für alle m ∈ N ist die Gruppe (Zm , +) zyklisch. Diese Gruppe wird von [1]m
erzeugt.
c) Die Gruppe G4 ist nicht zyklisch. Wir weisen diese Behauptung nach, indem
wir zeigen, das kein Element von G4 die ganze Gruppe erzeugt. Für a = x, y, z gilt
a2 = i, a3 = a, a4 = i und so weiter. Mittels vollständiger Induktion weist man
leicht nach, dass für alle geraden n ∈ Z an = i gilt, während für alle ungeraden n
an = a ist. Also sind nur zwei verschiedene Element von G Potenzen von a.
Für a = i ist jede Potenz von a das Element i. Also erzeugt auch i nicht die
ganze Gruppe. Für a = r, s gilt a0 = i, a1 = a, a2 = a−1 und a3 = i. Mittels
vollständiger Induktion rechnet man schnell nach, dass an = an
mod 3
gilt. Damit
sind nur drei verschiedene Gruppenelemente Potenzen von a.
Wir haben also gesehen, dass es kein a ∈ G4 gibt, das sechs verschiedene Potenzen hat. Also ist G4 nicht zyklisch.
Satz 7.24. Eine zyklische Gruppe G ist entweder zu (Z, +) isomorph oder es gibt
ein m ∈ N mit G ∼
= (Zm , +).
Beweis. Da G zyklisch ist, existiert ein a ∈ G mit
G = {an : n ∈ Z}.
Sei f : Z → G definiert durch f (n) = an .
Ist a von unendlicher Ordnung, so ist f injektiv:
Sonst gäbe es nämlich m, n ∈ Z mit m 6= n. Wir können annehmen, dass m < n
gilt. Es ist an−m = an a−m = an (am )−1 = an a−n = e. Also hat a doch eine endliche
Ordnung. Ein Widerspruch.
Das G von a erzeugt wird, ist f auch surjektiv. Nun zeigen wir, dass f ein
Isomorphismus ist. Das ist aber einfach. Für alle m, n ∈ Z gilt nämlich
f (m + n) = am+n = am an = f (m)f (n).
Damit sind G und Z isomorph.
Sei nun a von der endlichen Ordnung m. Seien n, n0 ∈ Z, so dass f (n) = f (n0 )
0
0
gilt. Dann ist an = an . Damit gilt an−n = e. Nach Satz 7.18 folgt daraus, dass
n − n0 ein Vielfaches von m ist. Es gilt also n ≡ n0 (mod m).
0
0
Ist umgekehrt n ≡ n0 (mod m), so ist an−n = e, also an = an und damit
f (n) = f (n0 ). Das zeigt, dass die Abbildung g : Zm → G; [n]m 7→ an wohldefiniert
und injektiv ist. Da a die Gruppe G erzeugt, ist g auch surjektiv.
94
STEFAN GESCHKE
Für alle n, n0 ∈ Z gilt außerdem
0
0
g([n]m + [n0 ]m ) = g([n + n0 ]m ) = an+n = an an = g([n]m )g([n0 ]m ).
Damit ist g ein Isomorphismus.
Wir haben schon festgestellt, dass die Gruppen (Z, +), (Q, +), (R, +), (Q\{0}, ·)
und (R\{0}, ·) das Kommutativgesetz erfüllen, während zum Beispiel G4 nicht das
Kommutativgesetz erfüllt.
Definition 7.25. Eine Gruppe G heißt kommutativ oder abelsch, wenn für je
zwei Elemente a, b ∈ G gilt: ab = ba
Korollar 7.26. Alle zyklischen Gruppen sind abelsch.
Beweis. Ist G zyklisch, so ist G isomorph zu (Z, +) oder zu einer der Gruppen
(Zm , +) für ein m ∈ N. In jedem Falle ist G zu einer abelschen Gruppen isomorph.
Damit ist G auch selbst abelsch.
Die Umkehrung dieses Korollars stimmt nicht. So ist (Q, +) abelsch, aber nicht
zyklisch. Ist nämlich a ∈ Q und a 6= 0, so ist
a
2
∈ Q, aber
a
2
ist kein Vielfaches von
a.
7.6. Untergruppen und Nebenklassen.
Definition 7.27. Sei (G, ∗) eine Gruppe. Dann heißt U ⊆ G eine Untergruppe,
von G, falls U zusammen mit der Einschränkung der Operation ∗ auf U × U wieder
eine Gruppe ist.
Beispiel 7.28. a) Für m ∈ N sei mZ = {m · a : a ∈ Z} die Menge aller Vielfachen
von m. Dann ist mZ eine Untergruppe von (Z, +). Um das nachzuweisen, müssen
wir zunächst zeigen, dass + überhaupt eine zweistellige Operation auf mZ ist.
Seien also a, b ∈ mZ. Dann existieren c, d ∈ Z mit a = mc und b = md. Wegen
a + b = mc + md = m(c + d) ist a + b wieder ein Element von mZ. Damit ist die
Einschränkung von + auf mZ × mZ tatsächlich eine Operation auf mZ. Wegen 0 ∈
mZ hat mZ ein neutrales Element. Für jedes ma ∈ mZ ist −ma = m(−a) ∈ mZ.
Damit existiert in mZ zu jedem Element ein Inverses. Also ist mZ eine Untergruppe
von Z.
b) Für jede Gruppe G sind {e} und G selbst Untergruppen von G.
c) Wir betrachten Untergruppen von G4 . Die kleinste Untergruppe ist {i}, die
grösste ist G4 selbst. Weiter sind {i, x}, {i, y} und {i, z} Untergruppen, da die
Transformationen x, y und z jeweils zu sich selbst invers sind. Schließlich {i, r, s}
eine Untergruppe von G4 .
Das sind alle Untergruppen von G4 , wie wir demnächst sehen werden.
Satz 7.29. Sei G eine Gruppe und U ⊆ G.
a) U ist genau dann eine Untergruppe von G, wenn für alle a, b ∈ U gilt:
e, a−1 , ab ∈ U
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
95
b) U ist genau dann eine Untergruppe von G, wenn U nicht leer ist und für alle
a, b ∈ U gilt:
ab−1 ∈ U
c) Ist U endlich, so ist U bereits dann eine Untergruppe von G, wenn U nicht
leer ist und für alle a, b ∈ U gilt:
ab ∈ U
Beweis. a) Sei U eine Untergruppe von G. Da die Operation von G auf U eingeschränkt immer noch eine zweistellige Operation auf U ist, gilt für alle a, b ∈ U
auch ab ∈ U .
Sei eU das neutrale Element der Gruppe U . Dann gilt in U die Gleichung eU eU =
eU . Damit gilt in G die Gleichung eU eU = eU e, wobei e das neutrale Element von
G ist. Nach Lemma 7.13 a) folgt aus der Gleichung eU eU = eU e, dass eU = e gilt.
Also ist e ∈ U und die neutralen Elemente von U und G stimmen überein.
Für a ∈ U existiert b ∈ U mit ab = e. Bezeichne a−1 das Inverse von a in G.
Dann ist ab = aa−1 . Aus Lemma 7.13 a) folgt a−1 = b. Insbesondere gilt a−1 ∈ U .
Gelte umgekehrt für alle a, b ∈ U
e, a−1 , ab ∈ U.
Dann ist die Operation von G eingeschränkt auf U eine zweistellige Operation auf
U . Außerdem enthält U das neutrale Element von G, welches auch ein neutrales
Element von U ist. Für jedes a ∈ U ethält U auch das Inverse a−1 . Da aa−1 = e in
G gilt, gilt die Gleichung auch in U . Also ist a−1 auch in U zu a invers. Das zeigt,
dass U eine Untergruppe von G ist.
b) Ist U eine Untergruppe von G und sind a und b in U , so gilt nach a) b−1 ∈ U .
Ebenfalls nach a) gilt: ab−1 ∈ U
Gelte nun für alle a, b ∈ U auch ab−1 ∈ U und sei U 6= ∅. Sei a ∈ U . Dann gilt
e = aa−1 ∈ U . Also gilt für alle a ∈ U auch a−1 = ea−1 ∈ U . Seien nun a, b ∈ U .
Dann ist b−1 ∈ U . Es folgt ab = a(b−1 )−1 ∈ U . Damit ist U eine Untergruppe von
G.
c) Sei a ∈ U . Nach Lemma 7.13 sind die Elemente ab, b ∈ U , paarweise verschieden. Da sie auch Elemente von U sind, muss es ein b ∈ U mit ab = a geben. Wieder
nach Lemma 7.13 gilt b = e. Damit ist e ∈ U . Also gibt es ein b ∈ U mit ab = e. Es
gilt b = a−1 . Nach a) ist U eine Untergruppe von G.
Definition 7.30. Sei G eine Gruppe und U ⊆ G eine Untergruppe. Für a ∈ G
schreiben wir aU für die Menge {ag : g ∈ U } sowie U a für die Menge {ga : g ∈ U }.
Wir nennen die Mengen der Form aU Linksnebenklassen von U und die Mengen
der Form U a Rechtsnebenklassen.
Beispiel 7.31. a) Sei G = (Z, +), und U = 6Z. Dann ist die Rechtsnebenklasse
von 4 von U die Menge 6Z + 4 = {. . . , −2, 4, 10, . . . } = [4]6 . Hierbei beachte man,
dass die Operation die Gruppe G die Addition ist, auch wenn wir die Operation
auf einer Gruppe im Allgemeinen multiplikativ schreiben. Die Linksnebenklasse
96
STEFAN GESCHKE
von 4 von U ist die Menge 4 + 6Z, die aber mit 6Z + 4 übereinstimmt, da + das
Kommutativgesetz erfüllt.
b) Wir betrachten die Gruppe G4 und die Untergruppe U = {i, y}. Dann gilt
iU = {i, y}, xU = {x, r}, yU = {y, i}, zU = {z, s}, rU = {r, x} und sU = {s, z},
wie man leicht an der Gruppentafel von G4 abliest. Die verschiedenen Linksnebenklassen von U in G4 sind also die Mengen iU = yU = U = {i, y}, xU = rU = {r, x}
und zU = sU = {z, s}.
Die entsprechende Rechnung liefert die Rechtsnebenklassen U i = U y = U =
{i, y}, U x = U s = {x, s} und U z = U r = {z, r}.
Satz 7.32. Sei G eine Gruppe und U ⊆ G eine Untergruppe.
a) Für jedes a ∈ G ist a ∈ aU und a ∈ U a.
b) Für alle c ∈ U ist cU = U = U c.
c) Für a, b ∈ G mit b ∈ aU gilt aU = bU . Für a, b ∈ G mit b ∈ U a gilt U a = U b.
d) Für a, b ∈ G sind die Linksnebenklassen aU und bU entweder disjunkt oder
gleich. Auch die Rechtsnebenklassen U a und U b sind entweder disjunkt oder gleich.
e) Für alle a ∈ G sind aU , U und U a gleichmächtig.
Beweis. a) Wegen e ∈ U gilt a = ae ∈ aU und a = ea ∈ U a.
b) Es ist klar, dass cU, U c ⊆ U gilt. Sei nun d ∈ U . Dann ist c−1 d ∈ U . Also ist
d = cc−1 d ∈ U . Das zeigt U ⊆ cU . Auf ähnliche Weise sieht man U ⊆ U c.
c) Ist b ∈ aU , so existiert c ∈ U mit b = ac. Es gilt bU = acU = aU . Auf ähnliche
Weise sieht man U = U b, falls b ∈ U a gilt.
d) Falls aU ∩bU nicht leer ist, so existiert c ∈ aU ∩bU . Nach c) gilt aU = cU = bU .
Auf ähnliche Weise sieht man, dass U a und U b entweder gleich oder disjunkt sind.
e) Wir zeigen nur, dass U und aU gleichmächtig sind, indem wir eine Bijektion
zwischen beiden Mengen angeben. Die Gleichmächtigkeit von U und U a kann auch
ähnliche Weise nachgerechnet werden.
Sei f : U → aU ; b 7→ ab. Aus der Definition von aU folgt sofort, dass f surjektiv
ist. Seien nun b, c ∈ U mit ab = f (b) = f (c) = ac. Nach Lemma 7.13 a) folgt daraus
b = c. Damit ist f injektiv. Also sind U und aU in der Tat gleichmächtig.
Beispiel 7.33. Sei G eine Gruppe und a ∈ G. Dann ist hai := {an : n ∈ Z} eine
Untergruppe von G, die von a erzeugte Untergruppe von G. Die Ordnung von
U ist genau die Ordnung von a.
Korollar 7.34 (Satz von Lagrange). Ist G eine endliche Gruppe und U eine Untergruppe von G, so ist die Ordnung von U ein Teiler der Ordnung von G. Insbesondere
ist die Ordnung von jedem Element von G ein Teiler von |G|.
Beweis. Nach Satz 7.32 bilden die Rechtsnebenklassen von U eine Partition von G
in Klassen der Mächtigkeit |U |. Ist m die Anzahl der verschiedenen Rechtsnebenklassen, so gilt |G| = m · |U |. Die Ordnung eines Elements a von G ist die Ordnung
der von a erzeugten Untergruppe und damit ein Teiler der Ordnung von G.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
97
Definition 7.35. Sei G eine Gruppe und G eine Untergruppe von G. Die Zahl der
Rechtsnebenklassen von U in G (die identisch ist mit der Zahl der Linksnebenklassen) nennt man den Index von U in G. Man schreibt [G : U ] für den Index von U
in G.
Der Beweis des Satzes von Lagrange zeigt also für jede endliche Gruppe G und
jede Untergruppe U die Gleichung
|G| = [G : U ] · |U |,
was auch die Notation [G : U ] erklärt.
Beispiel 7.36. Wir betrachten wieder die Dreiecksgruppe G4 . Die Gruppe hat 6
Elemente. Also sind die möglichen Ordnungen von Untergruppen von G die Zahlen
1, 2, 3 und 6. Die einzige Untergruppe der Ordnung 1 ist {i}. Diese Untergruppe
hat den Index 6.
Ist U ⊆ G4 eine Untergruppe der Ordnung 2, so enthält U das Element i und ein
weiteres Element, dass die Ordnung 2 haben muss. Damit sind die Untergruppen
der Ordnung 2 genau {i, x}, {i, y} und {i, z}. Diese Untergruppen haben den Index
3.
Sei nun U eine Untergruppe von G der Ordnung 3. Nach Korollar 7.34 hat jedes
Element von U eine Ordnung, die die Zahl 3 teilt. Also hat U nur Elemente der
Ordnung 1 und 3. Damit ist U = {i, r, s}. Diese Untergruppe hat den Index 2.
Die einzige Untergruppe von G4 mit 6 Elementen ist G4 selbst. Diese Untergruppe hat den Index 1.
Wir bestimmen die Nebenklassen der Untergruppen von G4 . Für jede Untergruppe U ist U = iU = U i sowohl eine Rechts- als auch Linksnebenklasse. U = G4
hat nur die Nebenklasse U , und hierbei ist es egal, ob wir Rechts- oder Linksnebenklassen betrachten.
U = {i, r, s} hat die Rechts und Linksnebenklasse U . Da die Nebenklassen alle
dieselbe Mächtigkeit haben wie U und eine Partition von G4 bilden, gibt es genau
eine weitere Nebenklasse, nämlich {x, y, z}. Diese Menge ist wieder sowohl Rechtsals auch Linksnebenklasse.
Nun betrachten wir eine Untergruppe der Ordnung 2, zum Beispiel U = {i, x}. Es
gibt insgesamt 3 Rechts- und 3 Linksnebenklassen. Eine Nebenklasse, die sowohl
Rechts- als auch Linksnebenklasse ist, ist U selbst. Es gilt yU = {y, s}, wie wir
der Gruppentafel von G4 entnehmen. {y, s} ist also eine Linksnebenklasse von U .
Da die Linksnebenklassen von U eine Partition von G4 bilden und alle dieselbe
Mächtigkeit haben, hat U noch eine dritte Linksnebenklasse, nämlich {z, r}.
Auf dieselbe Weise rechnet man nach, dass die Rechtsnebenklassen von U genau
die Mengen U , U y = {y, r} und {z, s} sind. Insbesondere sind die Linksnebenklassen
von U in G4 nicht identisch mit den Rechtsnebenklassen.
98
STEFAN GESCHKE
Die Nebenklassen von U = {i} sind die Einermengen U = {i}, {x}, {y}, {z},
{r} und {s}. Hierbei stimmen wieder die Links- und Rechtsnebenklassen überein,
auch wenn G4 nicht abelsch ist.
Beispiel 7.37. Auch wenn die Gruppe G und ihre Untergruppe U unendlich sind,
kann es sein, dass der Index von U in G endlich ist. Für jedes m ∈ N ist mZ eine
Untergruppe von Z und es gilt
[Z : mZ] = m,
da die Mengen [0]m , . . . , [m − 1]m genau die verschiedenen Nebenklassen von mZ
in Z sind. In Z ist es nicht nötig, zwischen Links- und Rechtsnebenklassen zu unterscheiden, da die Gruppe abelsch ist.
Beispiel 7.38. Aus dem Satz von Lagrange (Korollar 7.34) können wir sehr einfach
den Satz von Fermat und Euler (Satz 6.13) folgern. Sei m ≥ 2 und n ∈ Z zu m
teilerfremd. Dann ist [n]m ∈ E(Zm ) und E(Zm ) hat die Ordnung ϕ(m). Nach dem
Satz von Lagrange ist die Ordnung von [n]m in E(Zm ) ein Teiler der Ordnung ϕ(m)
von E(Zm ). Damit gilt aber ([n]m )ϕ(m) = [1]m , also nϕ(m) ≡ 1 (mod m).
Satz 7.39. Sei G eine zyklische Gruppe. Ist U eine Untergruppe von G, so ist auch
U zyklisch.
Beweis. Sei a das erzeugende Element von G, also G = {an : n ∈ Z}. Ist U = {e}, so
ist U zyklisch. Wir können also annehmen, dass U ein von e verschiedenes Element
enthält. Also gibt es ein n ∈ Z mit n 6= 0 und an ∈ U . Mit an ist auch a−n = (an )−1
in U . Damit existiert ein n > 0 mit an ∈ U .
Sei nun m die kleinste natürliche Zahl mit am ∈ U . Wir zeigen, dass alle Elemente
von U Potenzen von am sind. Sei an ∈ U . Wir zeigen, dass n ein Vielfaches von m
ist. Wieder können wir annehmen, dass n > 0 ist.
Seien q, r ∈ Z mit n = qm + r und 0 ≤ r < m. Dann gilt an a−qm = ar ∈ U . Aus
r < m und der Wahl von m als kleinste natürliche Zahl mit am ∈ U folgt r = 0.
Damit ist n = qm und an = (am )q . Das zeigt, dass U zyklisch ist.
Beispiel 7.40. Wir betrachten die Untergruppen der Gruppe Z12 . Die möglichen
Ordnungen sind 1, 2, 3, 4, 6 und 12 und alle Untergruppen sind zyklisch.
Für alle m ∈ {1, . . . , 11} die zu 12 teilerfremd sind, erzeugt [m]12 die ganze
Gruppe Z12 . [2]12 und [10]12 erzeugen jeweils die Untergruppe
{[0]12 , [2]12 , [4]12 , [6]12 , [8]12 , [10]12 }.
[3]12 und [9]12 erzeugen jeweils die Untergruppe
{[0]12 , [3]12 , [6]12 , [9]12 }.
[4]12 und [8]12 erzeugen jeweils die Untergruppe
{[0]12 , [4]12 , [8]12 }.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
99
[6]12 erzeugt die Untergruppe
{[0]12 , [6]12 }.
[0]12 erzeugt schließlich die Untergruppe {[0]12 }. Das sind alle Untergruppen von
Z12 .
Satz 7.41. Ist G eine Gruppe, deren Ordnung eine Primzahl p ist. Dann ist G
zyklisch und die einzigen Untergruppen von G sind G und {e}.
Beweis. Sei a ∈ G. Nach dem Satz von Lagrange ist die Ordnung von a ein Teiler
von p. Damit hat a entweder die Ordnung 1 oder p. Im ersten Fall gilt a = e. Im
zweiten Fall ist G = {an : n ∈ Z}.
7.7. Permutationen. Man kann zeigen, dass jede Gruppe zu einer Menge von Permutationen isomorph ist. Daher ist das Studium von Permutationen in der Gruppentheorie von besonderem Interesse.
Zur Erinnerung: Eine Permutation einer Menge A ist eine Bijektion von A nach
A. Die Komposition g ◦ f zweier Permutationen einer Menge A ist wieder eine
Permutation von A. Die Menge aller Permutationen einer Menge A zusammen mit
der Komposition ◦ ist eine Gruppe S(A). Das neutrale Element ist die Identität
idA : A → A; x 7→ x.
Für jede Permutation π ∈ S(A) ist die Umkehrfunktion π −1 das zu π inverse
Element von S(A).
Ist A endlich, also zum Beispiel A = {a1 , . . . , an }, so können wir eine Permutation
π : A → A als
a1
...
an
π(a1 ) . . .
!
π(an )
aufschreiben.
Beispiel 7.42. Es gilt
1
2
3
4
5
3
2
5
1
4
!
◦
1
2
3
4
5
4
2
1
5
3
!
=
1
2
3
4
5
1
2
3
4
5
!
.
Die Permutation auf der rechten Seite der Gleichung ist id{1,2,3,4,5} . Damit sind die
beiden Permutationen auf der linken Seite der Gleichung in S5 = S({1, 2, 3, 4, 5})
invers zueinander.
Wir betrachten die Permutation π :=
1
2
3
4
5
!
etwas eingehender. Es
3 2 5 1 4
gilt π(2) = 2. Die 2 wird also durch π auf sich selbst abgebildet. Die 1 wird durch π
auf 3 abgebildet, die 3 auf die 5, die 5 auf die 4 und die 4 wieder auf die 1. Iteriert
man also die Anwendung von π auf 1 so landet man zunächst bei 3, dann bei 5, bei
4 und schließlich wieder bei 1.
Lemma 7.43. Ist A eine endliche Menge und π ∈ S(A), so existiert für jedes
a ∈ A ein n ∈ N mit π n (a) = a.
100
STEFAN GESCHKE
Beweis. Da A endlich ist, gibt es k, ` ∈ N mit k < ` und π k (a) = π ` (a). Nun gilt
a = (π −k ◦ π k )(a) = (π −k ◦ π ` (a) = π `−k (a). Setzt man n := ` − k, so ergibt sich
π n (a) = a.
Definition 7.44. Sei A eine Menge, n ≥ 2 und a1 , . . . , an paarweise verschiedene
Elemente von A. Dann bezeichen wir mit (a1 a2 . . . an ) die Permutation π von A,
die wie folgt definiert ist:


a, falls a ∈ A \ {a1 , . . . , an },


π(a) = ai+1 , falls a = ai für ein i ∈ {1, . . . , n − 1} und



a , falls a = a .
1
n
Die Permutation (a1 a2 . . . an ) nennen wir einen Zyklus der Länge n.
Zwei Zyklen (a1 . . . an ) und (b1 . . . bm ) heißen disjunkt, falls die Mengen
{a1 , . . . , an } und {b1 , . . . , bm }
disjunkt sind. Zyklen der Länge 2 heißen Transpositionen.
Satz 7.45. Sei A eine endliche Menge.
a) Jede Permutation π von A ist ein Produkt von paarweise disjunkten Zyklen.
Eine Darstellung von π als Produkt disjunkter Zyklen heißt Zyklenzerlegung von
π. Die Zyklenzerlegung von π ist bis auf die Reihenfolge eindeutig.
b) Jeder Zyklus ist ein Produkt von Transpositionen.
c) Jede Permutation von A ist ein Produkt von Transpositionen.
Beweis. a) Für a, b ∈ A schreiben wir a ∼ b, falls es ein n ∈ Z mit π n (a) = b gibt.
Die Relation ∼ ist eine Äquivalenzrelation auf A. Sei nun a ∈ A. Nach Lemma 7.43
existiert ein m ∈ N mit π m (a) = a. Sei nun b ∼ a. Dann existiert ein n ∈ Z mit
π n (a) = b. Wähle q, r ∈ Z mit n = q · m + r und 0 ≤ r < m. Dann gilt
b = π n (a) = π q·m+r (a) = π r ((π m )q (a)) = π r (a).
Das zeigt, dass die ∼-Äquivalenzklasse von a genau die Menge {π 0 (a), . . . , π m−1 (a)}
ist.
Ist m = 1, so besteht diese Äquivalenzklasse nur aus dem Element a und a wird
von π nicht bewegt. Ist m > 1, so ist π auf der Äquivalenzklasse von a genau der
Zyklus (π 0 (a), . . . , π m−1 (a)).
Für jede ∼-Äquivalenzklasse mit mindestens zwei Elementen erhalten wir also
einen Zyklus, dessen Einträge genau die Elemente dieser Äquivalenzklasse sind.
Da die Äquivalenzklassen paarweise disjunkt sind, sind diese Zyklen disjunkt. Die
Permutation π ist das Produkt dieser Zyklen.
b) Es gilt (a1 , . . . , an ) = (a1 a2 ) ◦ · · · ◦ (an−1 an ).
c) Die Behauptung folgt sofort aus a) und b).
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
101
Beispiel 7.46. Sei A = {1, 2, 3, 4, 5, 6} und
π=
1
2
3
4
5
6
4
5
1
3
6
2
!
.
Dann gilt
π = (143) ◦ (256).
Weiter gilt
(143) = (14) ◦ (43)
und
(256) = (25) ◦ (56).
Damit ist
π = (14) ◦ (43) ◦ (25) ◦ (56).
Satz 7.47. Sei π eine Permutation einer endlichen Menge A. Ist π ein Produkt
von gerade vielen Transpositionen, so hat jede Darstellung von π als Produkt von
Transpositionen eine gerade Anzahl von Faktoren. In diesem Falle nennen wir π
eine gerade Permutation. Permutationen, die nicht gerade sind, nennen wir ungerade.
Korollar 7.48. Sei A eine endliche Menge. Die geraden Permutationen bilden eine
Untergruppe der Gruppe aller Permutationen von A vom Index 2.
Beweis. Es ist klar, dass das Produkt zweier gerader Permutationen wieder gerade
ist. Man sieht auch schnell, dass das Inverse einer geraden Permutation wieder
gerade ist. Die Untergruppe U von S(A) der geraden Permutationen hat genau zwei
Nebenklassen, nämlich U selbst und die Menge der ungeraden Permutationen. Beispiel 7.49. Die Gruppe S3 hat 3! = 6 Elemente. Damit gibt es 3 gerade Permutationen und 3 ungerade Permutationen. Die die geraden Permutationen sind die
Identität, (123) = (12)(23) und (321) = (32)(21). Die ungeraden Permutationen
sind (12), (13) und (23). Man beachte, dass die Darstellungen von Permutationen
als Produkt von Transpositionen nicht eindeutig ist. Es gilt zum Beispiel
(123) = (12)(23) = (231) = (23)(31) = (312) = (31)(12).
Auch die Anzahl der Transpositionen ist nicht eindeutig:
(321) = (32)(21) = (123)2 = (12)(23)(31)(12)
Was aber nach Satz 7.47 eindeutig ist, ist die Anzahl der Transpositionen modulo
2.
102
STEFAN GESCHKE
8. Ringe, Körper und Polynome
8.1. Ringe.
Definition 8.1. Eine Menge R zusammen mit zwei binären Operationen + und ·
und zwei verschiedenen Konstanten 0 und 1 heißt ein Ring (mit 1), falls für alle
a, b, c ∈ R die folgenden Axiome gelten:
(R1) Assoziativgesetze
• a + (b + c) = (a + b) + c
• a · (b · c) = (a · b) · c
(R2) Kommutativgesetz der Addition:
• a+b=b+a
(R3) Distributivgesetze
• a · (b + c) = a · b + a · c
• (b + c) · a = b · a + c · a
(R4) Existenz neutraler Elemente bezüglich der Addition und der Multiplikation
• a+0=a
• 1·a=a
(R5) Existenz inverser Elemente bezüglich der Addition
• Es gibt ein Element −a mit a + (−a) = 0.
Man beachte, dass der offizielle Name für hier definierten Strukturen „Ring mit 1“
lautet. Wir werden aber keine Ringe ohne 1 betrachten und sagen daher abkürzend
einfach „Ring“, obwohl wir eigentlich „Ring mit 1“ meinen. Unter Verwendung der
Begriffe Gruppe und Monoid können wir Ringe auch in der folgenden kompakten
Form definieren.
Definition 8.2. Eine Menge R mit zwei binären Operationen + und · ist ein Ring
(mit 1) falls gilt:
(RI) (R, +) ist eine kommutative Gruppe.
(RII) (R \ {0}, ·) ist ein Monoid.
(RIII) Es gelten die Distributivgesetze, d.h., für alle a, b, c ∈ R gilt:
• a · (b + c) = a · b + a · c
• (b + c) · a = b · a + c · a
Bei dieser Definition definieren wir 0 als das neutrale Element der Addition und 1
als das neutrale Element der Multiplikation.
Wie üblich schreiben wir −a für das additive Inverse eines Ringelements a und
−1
a
für das multiplikative Inverse, falls es denn existiert.
Beispiel 8.3. a) Jeder Körper ist ein Ring. Umgekehrt ist ein Ring (R, +, ·) ein
Körper, wenn das Kommutativgesetz für · gilt und jedes von 0 verschiedene Element
ein multiplikatives Inverses besitzt.
b) Die ganzen Zahlen mit Addition, Multiplikation und den üblichen Konstanten
0 und 1 bilden einen Ring, aber bekanntlich keinen Körper.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
103
c) Für jedes m ≥ 2 ist (Zm , +, ·) ein Ring.
Definition 8.4. Sei (R, +, ·) ein Ring. Die Einheitengruppe E(R) von R ist
die Menge derjenigen Elemente von R, die ein mutliplikatives Inverses besitzen,
zusammen mit der Multiplikation.
Wir hatten schon gesehen, dass die Einheitengruppe eines Ringes der Form Zm ,
m ≥ 2, tatsächlich eine Gruppe ist. Das gleiche Argument liefert die entsprechende
Aussage für beliebige Ringe:
Satz 8.5. Für jeden Ring R ist E(R) eine Gruppe.
Beweis. Zunächst müssen wir zeigen, dass · überhaupt eine Operation auf E(R)
ist, dass also das Produkt zweier invertierbarer Elemente von R wieder invertierbar
ist. Seien also a, b ∈ E(R). Dann ist
(ab)(b−1 a−1 ) = aa−1 = 1 = b−1 b = (b−1 a−1 )(ab).
Also ist ab invertierbar und es gilt (ab)−1 = b−1 a−1 .
1 ist zu sich selbst invers und damit gilt 1 ∈ E(R). Es ist auch klar, dass mit
a ∈ R auch a−1 invertierbar ist. Das Inverse von a−1 ist nämlich einfach a. Damit
ist E(R) tatsächlich eine Gruppe.
Beispiel 8.6. a) Für jeden Körper K ist E(K) = K \{0}. Insbesondere ist E(R) =
R \ {0}, E(Q) = Q \ {0} und E(Zp ) = Zp \ {[0]p } für jede Primzahl p.
b) Es gilt E(Z) = {−1, 1}.
c) Es gilt E(Z8 ) = {[1]8 , [3]8 , [5]8 , [7]8 } und E(Z12 ) = {[1]12 , [5]12 , [7]12 , [11]12 }.
8.2. Der Polynomring K[X].
Definition 8.7. Ist K ein Körper, so bezeichnen wir einen Ausdruck der Form
a0 X 0 +a1 X 1 +a2 X 2 +· · ·+an X n , wobei die Koeffizienten a0 , . . . , an aus K stammen
und X eine Unbekannte ist, als Polynom (in der Unbestimmten X) über K. Die
Menge aller Polynome über K bezeichnen wir mit K[X]. Polynome der Form a0
nennen wir konstant. Die Elemente von K identifizieren wir mit den konstanten
Polynomen und fassen so K als Teilmenge von K[X] auf.
Bemerkung 8.8. In unserer Definition von Polynomen haben wir die verschiedenen Potenzen von X in aufsteigender Reihenfolge angegeben. Meistens werden die
Potenzen jedoch in absteigender Reihenfolge angegeben. Statt
a0 X 0 + a1 X 1 + a2 X 2 + · · · + an X n
schreibt man also
an X n + an−1 X n−1 + · · · + a0 X 0 .
Die Potenz X 0 hat für alle X den Wert 1. Deshalb lässt man den Term X 0 normalerweise weg. Anstelle von X 1 schreibt man einfach X. Mit diesen Konventionen
lautet das Polynom also
an X n + · · · + a1 X + a0 .
104
STEFAN GESCHKE
Ist für ein i der Koeffizient ai gleich 0, so lässt man den Term ai X i weg. Bei
negativen Koeffizienten zieht man das Minuszeichen mit dem vorhergehenden Pluszeichen zu einem Minuszeichen zusammen. Koeffizienten, die den Wert 1 haben
lässt man weg, falls es sich nicht um den Koeffizienten vor X 0 handelt. Anstelle
von
1X 0 + (−5)X 1 + 0X 2 + 1X 3
schreibt man also
X 3 − 5X + 1.
Beispiel 8.9. a) Aus der Schule sind Polynome mit reellen oder rationalen Koeffizienten bekannt, also Polynome über R oder Q, wie das oben genannte Beispiel
X 3 − 5X + 1. Streng genommen sind die Koeffizienten dieses Polynoms sogar ganzzahlig, so dass man von einem Polynom über Z sprechen könnte. Wir werden jedoch
nur Polynome über Körpern betrachten.
b) Wir kennen auch schon weitere Körper außer R und Q, nämlich die endlichen
Körper Zp für Primzahlen p. So ist zum Beispiel X 2 − X + 1 ein Polynom über Z2 ,
wobei wir 1 für das neutrale Element der Multiplikation schreiben. Wir könnten
dieses Polynom auch X 2 − X + [1]2 oder [1]2 X 2 + [−1]2 X 1 + [1]2 schreiben. Man
beachte, dass für alle a ∈ Z2 die Gleichung a = −a gilt. Damit ist dieses Polynom
identisch mit X 2 + X + 1. Man sieht, dass es in diesem Falle wichtig ist, festzulegen,
über welchem Körper man das Polynom betrachtet.
c) Wenn man Polynome über Zp betrachtet, wird es schnell lästig, die Koeffizienten in der Form [n]p zu schreiben. Deshalb schreiben wir in diesem Zusammenhang anstelle der Restklassen einfach die Standardrepräsentanten der Restklassen.
Für das Polynom X 3 + [2]3 X 2 + [−2]3 X + [1]3 über Z3 schreiben wir also einfach
X 3 + 2X 2 + X + 1. Die Schreibweise X 3 + 2X 2 − 2X + 1 ist aber auch akzeptabel.
d) Spezielle Polynome sind die sogenannten Monome X n , n ∈ N0 .
Wir haben schon intuitiv zwei Polynome gleich genannt, wenn sie dieselben Koeffizienten haben. An dieser Stelle müssen wir jedoch vorsichtig sein. Was ist zu
Beispiel mit den Polynomen 0X 2 + X − 1 und X − 1?
Definition 8.10. Sei p = a0 X 0 + · · · + an X n ein Polynom über einem Körper K.
Der Grad grad(p) von p ist das größte i ∈ {0, . . . , n} mit ai 6= 0, falls solch ein i
existiert. EXistiert kein i mit ai 6= 0, so nennt man p das Nullpolynom und setzt
grad(p) := −∞. Polynome vom Grad ≤ 0 nennen wir konstant.
Ist grad(p) ≥ 0, so nennt man den Koeffizienten agrad(p) den Leitkoeffizienten
von p. Das Polynom p heißt normiert, falls der Leitkoeffizient 1 ist.
Wir nennen zwei Polynome p = a0 X 0 + · · · + an X n und q = b0 X 0 + · · · + bm X m
über demselben Körper K gleich, wenn sie denselben Grad k haben und für alle
i ∈ {0, . . . , k} die Koeffizienten ai und bi gleich sind.
Insbesondere sind also die Polynome 0X 2 + X − 1 und X − 1 gleich. Beide
Polynome haben den Grad 1 und die Koeffizienten vor X 1 und X 0 sind jeweils
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
105
dieselben. Man beachte, dass es in diesem Beispiel egal ist, über welchem Körper
man die Polynome betrachtet, solange es für beide Polynome derselbe Körper ist.
Als nächstes definieren wir Summen und Produkte von Polynomen.
Definition 8.11. Seien p = a0 X 0 + · · · + an X n und q = b0 X 0 + · · · + bm X m
Polynome über demselben Körper K. Sei k = max(m, n). Für alle i ∈ Z mit
n < i ≤ k sei ai := 0. Für alle j ∈ Z mit m < j ≤ k sei bj := 0. Dann gilt
p = a0 X 0 + · · · + ak X k und q = b0 X 0 + · · · + bk X k . Nun sei p + q := (a0 + b0 ) + · · · +
(ak + bk )X k . Wir definieren die Summe zweier Polynome also „koeffizientenweise“.
Das Produkt von p und q definieren wir durch Ausmultiplizieren. Das Produkt
p · q sei das Polynom c0 + · · · + cn+m X n+m mit ci = a0 bi + a1 bi−1 + · · · + ai b0 .
Beispiel 8.12. Addition und Multiplikation von Polynomen über Q und R setzen
wir als bekannt voraus.
a) Wir betrachten Polynome über Z5 . Sei p = X 3 +3X 2 +2 und q = 2X 2 −X +4.
Dann ist
p + q = X 3 + (3 + 2)X 2 − X + (2 + 4) = X 3 + 4X + 1
und
p · q = (X 3 + 3X 2 + 2) · (2X 2 − X + 4)
= 2X 5 + (−1 + 3 · 2)X 4 + (4 − 3)X 3 + (3 · 4 + 2 · 2)X 2 − 2X + 2 · 4
= 2X 5 + X 3 + X 2 + 3X + 3.
Insbesondere ist
grad(p · q) = grad(p) + grad(q).
Wie man leicht nachrechnet, gilt diese Gleichung für je zwei Polynome über demselben Körper.
b) Wir betrachten wieder Polynome über Z5 . Sei p = X 3 + 3X 2 + 2 wie oben
und q = −X 3 + X 2 − 3. Dann gilt
p + q = (1 − 1)X 3 + (3 + 1)X 2 + (2 − 3) = 4X 2 − 1 = 4X 2 + 4.
Insbesondere ist
grad(p + q) < grad(p), grad(q).
Das ist aber ein Spezialfall. Sind p und q Polynome von verschiedenem Grad, so ist
grad(p + q) = max(grad(p), grad(q)).
Sind p und q Polynome vom selben Grad und ist der Leitkoeffizient von p nicht
genau das additive Inverse des Leitkoeffizienten von q, so ist
grad(p + q) = grad(p) = grad(q).
Satz 8.13. Die Menge K[X] zusammen mit den eben definierten Operationen +
und · für Polynome bildet einen Ring, in dem das Kommutativgesetz für · gilt.
(Damit ist K[X] ein kommutativer Ring.) Diesen Ring nennt man den Polynomring (in der Unbestimmten X) über K.
106
STEFAN GESCHKE
Beweis. Die Axiome für Ringe und das Kommutativgesetz der Multiplikation rechnet man leicht nach.
Für Polynome können wir die Teilbarkeitsrelation wie für ganze Zahlen definieren.
Definition 8.14. Seien p und q Polynome über einem Körper K. Wir sagen, dass
p das Polynom q teilt, wenn es ein Polynom r über K gibt, so dass q = p · r gilt. In
diesem Falle heißt q ein Vielfaches von p und wir schreiben p|q.
Ein Polynom r ist ein gemeinsamer Teiler von p und q, wenn r sowohl p als
auch q teilt. Das Polynom r ist ein größter gemeinsamer Teiler von p und q,
wenn r ein gemeinsamer Teiler von p und q von maximalem Grad ist.
Beispiel 8.15. a) Wir rechnen wieder über Z5 . Die Gleichung
(X 3 + 3X 2 + 2) · (2X 2 − X + 4) = 2X 5 + X 3 + X 2 + 3X + 3,
zeigt, dass X 3 + 3X 2 + 2 und 2X 2 − X + 4 Teiler von 2X 5 + X 3 + X 2 + 3X + 3
sind.
b) Wir rechnen über R. Die Zahlen 2.5 und π, aufgefasst als konstante Polynome
werden beide von allen reellen Zahlen 6= 0 geteilt. Für jedes a ∈ R \ {0} gilt nämlich
2.5 = a ·
2.5
a
und π = a · πa . Für jedes Polynom p ∈ R[X] vom Grad ≥ 1 und jedes
r ∈ R[X] mit r 6= 0 ist grad(p·r) ≥ 1 und damit p·r 6= 2.5. Die Zahl 2.5 wird also nur
von konstanten Polynomen geteilt, aber von allen von 0 verschiedenen konstanten
Polynomen. Dasselbe gilt für π. Damit sind genau die konstanten Polynome 6= 0
größte gemeinsame Teiler von 2.5 und π. Insbesondere sind größte gemeinsame
Teiler in Polynomringen in allgemeinen nicht eindeutig bestimmt.
Wie im Falle von Z lassen sich größte gemeinsame Teiler in K[X] mit dem
euklidischen Algorithmus bestimmen. Dazu müssen wir zunächst die Division mit
Rest von Polynomen einführen, die sogenannte Polynomdivision.
Satz 8.16. Seien p und m Polynome über einem Körper K. Ist m 6= 0, so existieren
Polynome q und r über K mit p = q · m + r und grad(r) < grad(m).
Beweis. Ist m konstant, also zum Beispiel m = b0 ∈ K so setzen wir
a0
an n
X + ··· +
q :=
b0
b0
und r := 0. Dann gilt p = q · m + r und die Gradbedingung ist erfüllt.
Ist grad(m) ≥ 1, so beweisen wir den Satz durch vollständige Induktion über
den Grad von p.
Induktionsanfang: Ist grad(p) < grad(m), so setzen wir q := 0 und r := p. Dann
gilt p = q · m + r, wobei r die gewünschte Gradbedingung erfüllt.
Induktionsschritt: Sei nun der Grad von p ist mindestens so hoch wie der Grad
von m.
Wir nehmen an, dass für alle Polynome p0 mit grad(p0 ) < grad(p) Polynome q 0
und r0 mit p0 = q 0 · m + r0 und grad(r0 ) < grad(m) existieren (Induktionsannahme).
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
107
Wir suchen Polynome q und r mit p = q · m + r und grad(r) < grad(m).
Sei n = grad(p), k = grad(m), p = an X n + · · · + a0 und m = bk X k + · · · + b0 .
Wir setzen
an
· X n−k · m
bk
und berechnen den Koeffizienten cn von X n in p0 . X n−k · m ist ein Polynom vom
p0 := p −
Grad n − k + k = n mit dem Leitkoeffizienten bk . Damit ist cn = an −
0
an
bk
· bk = 0.
0
Also ist p ein Polynom mit grad(p ) < n = grad(p).
Nach Induktionsannahme existieren Polynome q 0 und r0 mit p0 = q 0 · m + r0 und
grad(r0 ) < grad(m). Nach Wahl von p0 gilt
an
p=
· X n−k · m + p0 .
bk
Setzt man nun für p0 den Ausdruck q 0 · m + r0 ein, so ergibt sich
an
an
n−k
0
0
n−k
0
·X
·m+q ·m+r =
·X
+ q · m + r0 .
p=
bk
bk
Wir setzen r := r0 und q := abkn · X n−k + q 0 . Nun gilt p = q · m + r, wobei die
Gradbedingung grad(r) < grad(m) erfüllt ist. Das beendet den Induktionsschritt.
Der Beweis von Satz 8.16 liefert ein rekursives Verfahren, mit dem sich der
Quotient q und damit auch der Rest r bei Division von p durch m berechnen lässt.
Wesentlicher Punkt dieser Polynomdivision ist die folgende Bemerkung.
Bemerkung 8.17. Sei grad(p) ≥ grad(m) ≥ 1. Im Beweis von Satz 8.16 haben
wir gesehen, dass es Polynome q und r mit grad(r) < grad(m) und p = q · m + r
gibt, wobei q die Form
an
bk
· X n−k + q 0 hat. Dabei gilt p0 = q 0 · m + r0 für ein Polynom
p0 mit grad(p0 ) < grad(p). Also ist der Grad von q 0 kleiner als n − k, wobei n der
Grad von p und k der Grad von m ist. Damit ist
an
bk
der Leitkoeffizient von q.
Außerdem ist der Rest r bei der Division von p durch m einfach das Polynom
r0 , also der Rest bei der Division von p0 durch m.
Wir beschreiben den Algorithmus zur Division von Polynomen, der sich aus dem
Beweis von Satz 8.16 ergibt.
Polynomdivision. Seien zwei Polynome
p = an X n + · · · + a0
und
m = bk X k + · · · + b0
über einem festen Körper K gegeben. Das Polynom m habe den Grad k ≥ 0. Wir
wollen Polynome q und r wie in Satz 8.16 bestimmen.
Ist k = 0, so ist p durch m teilbar und man erhält den Quotienten q, indem man
jeden Koeffizienten von p durch m ∈ K teilt. Der Rest ist in diesem Fall r = 0.
Nun nehmen wir an, dass k ≥ 1 gilt. Wir halten p und m im Laufe der Berechnung fest und verändern die Variablen p̄ und n̄. Dabei seien ān̄ , . . . , ā0 immer
108
STEFAN GESCHKE
die Koeffizienten des Polynoms p̄. Die Koeffizienten cn−k , . . . , c0 des Quotienten q
werden nach und nach berechnet, falls n ≥ k ist.
(1) Setze n̄ := n und p̄ := p.
(2) Ist n̄ < k, so ist r = p̄ der Rest bei der Division von p durch m. Ist n ≥ k,
so ist q = cn−k X n−k + · · · + c0 der Quotient bei der Division von p durch
m. Ist n < k, so ist lautet der Quotient q = 0 und es wurden auch keine ci
berechnet. Die Berechnung endet hier.
(3) Ist n̄ ≥ k, so speichere den Koeffizienten
cn̄−k :=
ān̄
bk
und setze
p̄ := p̄ − cn̄−k · X n̄−k · m.
(4) Ist p̄ das Nullpolynom, so setze n̄ := −∞ und fahre mit Schritt (2) fort.
(5) Ist p̄ 6= 0, so setze n̄ := n̄ − 1 und fahre mit Schritt (2) fort.
Bemerkung 8.18. Seien p und m wie im Algorithmus zur Polynomdivision. Wir
nehmen an, dass n ≥ k ≥ 1 ist. Dann kann man die Berechnung des Algorithmus
wie folgt aufschreiben: Wir starten mit der Zeile
(an X n + · · · + a0 ) : (bk X k + · · · + b0 ) =
Zunächst berechnen wir den Koeffizienten cn−k =
mit der passenden Potenz X
an
bk
und tragen ihn zusammen
n−k
auf der rechten Seite ein. Das liefert
an n−k
n
k
(an X + · · · + a0 ) : (bk X + · · · + b0 ) =
X
+ ...
bk
Als nächstes multiplizieren wir m mit
an
n−k
.
bk X
Das liefert ein Polynom vom Grad
n, das wir unter das Polynom p schreiben. Als nächstes ziehen wir
an
n−k
bk X
· m von
p ab und schreiben das Ergebnis ebenfalls darunter. Die dritte Zeile lautet nun
an
0 + an−1 − bk−1
X n−1 + . . .
bk
Wir setzen dann die Polynomdivision mit dem Polynom in der dritten Zeile fort,
und zwar solange bis der Grad der letzten Differenz kleiner als der Grad von m
geworden ist. Dabei schreiben wir die neu berechneten Terme ci X i von q oben
rechts hinter den Ausdruck
an
n−k
.
bk X
Am Schluss steht das gesamte Polynom q auf
der rechten Seite der Gleichung und die Differenz in der letzten Zeile ist der Rest
bei der Division von p durch m. Damit das Gleichheitszeichen gerechtfertigt ist,
tragen wir am Schluss der obersten Zeile noch den Summanden
r
m.
Es ist übrigens nicht nötig, die Differenzen immer vollständig aufzuschreiben, da
alle bis auf die ersten k − 1 Summanden mit den entsprechenden Summanden von
p übereinstimmen.
Beispiel 8.19. Wir rechnen über Q.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
109
a) Sei p = X 3 − 2X 2 + 4X + 7 und m = X + 1. Die Polynomdivision sieht dann
wie folgt aus:
X 3 − 2X 2 + 4X + 7 : X + 1 = X 2 − 3X + 7
− X3 − X2
− 3X 2 + 4X
3X 2 + 3X
7X + 7
− 7X − 7
0
In diesem Fall ergibt sich der Rest 0. Insbesondere ist p durch m teilbar.
b) Sei p = X 3 − 2X 2 + 5X + 6 und m = X 2 − X + 1. Die Polynomdivision sieht
dann wie folgt aus:
X 3 − 2X 2 + 5X + 6 : X 2 − X + 1 = X − 1 +
− X3 + X2 − X
3X + 7
−X +1
X2
− X 2 + 4X + 6
X2 − X + 1
3X + 7
Hier ist der Quotient X − 1 und der Rest 3X + 7.
Wie bei ganzen Zahlen kann man größte gemeinsame Teiler von Polynomen mit
Hilfe des euklidischen Algorithmus berechnen. Dabei spielt der Grad die Rolle des
Betrages bei den ganzen Zahlen. Ein Unterschied zur Situation bei den ganzen Zahlen besteht darin, dass es durchaus passieren kann, dass zwei Polynomen denselben
Grad haben, ohne dass die beiden Polynomen einander teilen. In diesem Falle ist
es egal, ob man zunächst das eine Polynom durch das andere teilt oder umgekehrt.
Beispiel 8.20. Wir wollen einen größten gemeinsamen Teiler der Polynome
p = X 3 − 3X 2 + 5X − 3
und
q = X3 − 1
bestimmen. Eigentlich müssten wir beim euklidischen Algorithmus zunächst das
Polynom vom höheren Grad durch das vom niedrigeren Grad teilen. Die beiden
Grade sind aber gleich. Deshalb ist es egal, ob wir zunächst p durch q teilen oder
umgekehrt. Wir starten mit der Division von p durch q.
−3X 2 + 5X − 2
X 3 − 3X 2 + 5X − 3 : X 3 − 1 = 1 +
X3 − 1
− X3
+1
− 3X 2 + 5X − 2
110
STEFAN GESCHKE
Der Rest ist also −3X 2 + 5X − 2. Also dividieren wir im nächsten Schritt q durch
−3X 2 + 5X − 2.
− 1 : − 3X 2 + 5X − 2 = − 13 X −
X3
5
9
+
− X 3 + 35 X 2 − 23 X
−
5 2
3X
5 2
3X
19
19
9 X − 9
−3X 2 + 5X −
2
− 23 X − 1
+
25
9 X
−
10
9
19
9 X
−
19
9
Das liefert den Rest
19
9 (X
− 1). Man beachte, dass das Polynom
19
9 (X
− 1) genau
dieselben Teiler wie X − 1 hat und auch genau dieselben Polynome teilt. Damit
können wir im nächsten Schritt der Einfachheit halber durch X − 1 anstelle von
19
9 (X
− 1) teilen.
− 3X 2 + 5X − 2 : X − 1 = − 3X + 2
3X 2 − 3X
2X − 2
− 2X + 2
0
Der Rest ist dabei 0. Also ist X − 1 ein größter gemeinsamer Teiler von p und q.
8.3. Polynomfunktionen und Nullstellen von Polynomen.
Definition 8.21. Sei K ein Körper und p = a0 + · · · + an X n ∈ K[X]. Dann ist die
Funktion
fp : K → K; x 7→ a0 + · · · + an xn
die zu p gehörige Polynomfunktion.
Man berechnet also fp in dem man ein gegebenes Körperelement x (nicht zu
verwechseln mit der Unbestimmten X) für X in das Polynom einsetzt.
Beispiel 8.22. a) Sei p = 2X 2 − 3X + 7 ∈ Q[X]. Dann ist
fp (3) = 2 · 32 − 3 · 3 + 7 = 18 − 9 + 7 = 16.
b) Sei p = X 3 − 2X + 1 ∈ Z3 [X]. Dann ist
fp (2) = 23 − 2 · 2 + 1 = 2 − 1 + 1 = 2.
(Wir schreiben wieder Standardvertreter anstelle von Restklassen und rechnen modulo 3.)
Der Grund, weshalb wir zwischen Polynomen und den zugerörigen Polynomfunktionen unterscheiden ist, dass es über einem endlichen Körper K zwar unendlich
viele Polynome gibt, aber nur endlich viele Polynomfunktionen. Es gibt also verschiedene Polynome p und q über K, deren Polynomfunktionen übereinstimmen.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
111
Beispiel 8.23. Sei p = X 4 + X + 2 und q = X 3 + X 2 + 2, wobei wir p und q als
Polynome über Z3 auffassen. Dann ist p 6= q, und zwar schon deshalb, weil p und q
unterschiedlichen Grad haben. Es gilt aber
fp (0) = 2 = fq (0),
fp (1) = 1 + 1 + 2 = 1 = fq (1)
und fp (2) = 1 + 2 + 2 = 2 = 2 + 1 + 2 = fq (2).
Damit sind die Polynomfunktionen fp und fq gleich.
Ist p ∈ K[X] und x ∈ K, so schreibt man in der Praxis anstelle von fp (x) eher
p(x). Für ein Körperelement x steht p(x) also für das Körperelement, das man
erhält, wenn man für die Unbestimmte X das Körperelement x in das Polynom
einsetzt.
Definition 8.24. Sei K ein Körper und p ∈ K[X]. Dann heißt a ∈ K eine NullstelleÊvon p, falls p(a) = 0 ist.
Satz 8.25. Ein Körperelement a ∈ K ist genau dann eine Nullstelle von p ∈ K[X],
wenn X − a ein Teiler von p ist.
Beweis. Angenommen, X − a teilt p. Dann existiert q ∈ K[X] mit p = q · (X − a).
Es gilt
p(a) = q(a) · (a − a) = q(a) · 0 = 0.
Also ist X − a eine Nulsstelle von p.
Sei umgekehrt p(a) = 0. Nach Satz 8.16 existieren Polynome q, r ∈ K[X] mit
p = q · (X − a) + r und grad(r) < grad(X − a) = 1. Das Polynom r ist also konstant.
Es gilt
0 = p(a) = q(a) · (a − a) + r = r
und damit p = q · (X − a). Damit teilt (X − a) das Polynom p.
Korollar 8.26. Ein Polynom p ∈ K[X] vom Grad n > 0 hat höchstens n verschiedene Nullstellen.
Beweis. Wir zeigen das Korollar durch Induktion über n.
Induktionsanfang: Sei n = 1. Dann ist p von der Form a1 X + a0 mit a0 , a1 ∈ K
und a1 6= 0. Sei x ∈ K mit p(x) = 0. Dann gilt a1 x+a0 = 0 und damit x = −a0 ·a−1
1 .
Insbesondere hat p genau eine Nullstelle, nämlich −a0 a−1
1 .
Induktionsschritt: Sei n ∈ N. Angenommen, jedes Polynom vom Grad n hat
höchstens n verschiedene Nullstellen. Sei p ∈ K[X] ein Polynom vom Grad n+1 und
a ∈ K eine Nullstelle von p. Nach Satz 8.25 existiert q ∈ K[X] mit p = q · (X − a).
Sei b ∈ K eine weitere, also von a verschiedene, Nullstelle von p.
Dann gilt 0 = p(b) = q(b) · (b − a). Wegen b 6= a ist b − a 6= 0. Also ist q(b) = 0.
Jede von a verschiedene Nullstelle von p ist also eine Nullstelle von q. Das Polynom
q hat den Grad n. Nach Induktionsannahme hat q aber höchstens n verschiedene
Nullstellen. Damit hat p höchstens n verschiedene Nullstellen, die von a verschieden
sind. Also hat p höchstens n + 1 verschiedene Nullstellen.
112
STEFAN GESCHKE
Der Beweis dieses Korollars liefert ein rekursives Verfahren, alle Nullstellen eines Polynoms zu bestimmen, wenn man in der Lage ist, einzelne Nullstellen zu
bestimmen:
Sei p ∈ K[X] ein Polynom vom Grad n > 0. Bestimme eine Nullstelle a1 von p
und teile p durch (X − a1 ). Wiederhole das Verfahren mit p/(X − a1 ). Iteriere das
Verfahren solange, wie der Grad des Polynom > 0 ist.
Um Nullstellen von Polynomen zweiten Grades über R zu bestimmen, gibt es
die bekannte p-q-Formel: Das Polynom X 2 + pX + q hat die Nullstellen
r
p
p2
x1 = − +
−q
2
4
und
r
p2
p
x2 = − −
− q,
2
4
falls die Diskriminante
p2
4
− q nicht negativ ist. Ist
p2
4
− q < 0, so hat X 2 + pX + q
keine reellen Nullstellen.
Herleitung der p-q-Formel: Gegeben sei eine quadratische Gleichung der Form
X 2 + pX + q = 0.
Diese Gleichung lässt sich nicht einfach nach X auflösen. Eine Gleichung der Form
(X + a)2 = b
lässt sich allerdings einfach nach X auflösen:
√
Aus (X + a)2 = b folgt b ≥ 0 und X + a = ± b. Ist (X + a)2 = b genau dann
√
lösbar, wenn b ≥ 0 gilt, und die Lösungen sind die Zahlen x1,2 = −a ± b.
Die Gleichung X 2 + pX + q = 0 können wir aber auf die Form (X + a)2 = b
bringen:
X 2 + pX + q
p
p 2 p 2
X2 + 2 X +
−
+q
2
2
2
p
p 2
X2 + 2 X +
2
2
p 2
X+
2
2
p 2
p
Setzt man also a := 2 und b = 2 − q = p4
=
0
=
0
p 2
−q
2
p 2
=
−q
2
=
− q, so hat man die Gleichung
X 2 + pX + q = 0 in die Form (X + a)2 = b überführt.
Damit ist X 2 + pX + q = 0 genau dann lösbar, wenn
p 2
−q
2
Falle lauten die Lösungen
x1,2 = −a ±
√
p
b=− ±
2
Das erklärt die Gültigkeit der p-q-Formel.
r p 2
− q.
2
≥ 0 gilt. In diesem
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
113
Indem man ein von 0 verschiedenes Polynom durch seinen Leitkoeffizienten teilt,
kann man es normieren, ohne die Nullstellen zu verändern. Damit löst die p-qFormel das Problem des Findens von Nullstellen von Polynomen vom Grad 2 über
R. Nullstellen von Polynomen vom Grad 1 lassen sich direkt durch Auflösen einer
Gleichung mittels Äquivalenzumformungen finden. Für Polynome 3. und 4. Grades
über R gibt es auch Formeln, die aber zu umfangreich sind, um sie hier zu präsentieren. Man kann beweisen, dass es zur Berechnung von Nullstellen von Polynomen
5. Grades über R keine allgemeinen Formeln mehr gibt. Allerdings kann man mit
Hilfe numerischer Verfahren immer noch Näherungslösungen für Gleichungen der
Form p(x) = 0 finden.
Hilfreich ist allerdings folgender Satz:
Satz 8.27. Sei p = X n + an−1 X n−1 + · · · + a0 ein normiertes Polynom vom Grad
n > 0 mit ganzzahligen Koeffizienten. Dann ist jede Nullstelle a ∈ Q von p eine
ganze Zahl, die a0 teilt.
Der Beweis dieses Satzes übersteigt den Rahmen dieser Vorlesung. Der Satz zeigt
aber, dass man die rationalen Nullstellen eines normierten Polynoms mit ganzzahligen Koeffizienten einfach durch Ausprobieren der Teiler des konstanten Summanden
des Polynoms finden kann.
Beispiel 8.28. Sei p = X 3 − 6X 2 + 11X − 6 ∈ Q[X]. Wir wollen die rationalen
Nullstellen von p finden. Nach Satz 8.27 sind die rationalen Nullstellen in Wirklichkeit ganze Zahlen, die −6 teilen. Die Kandidaten sind also −6, −3, −2, −1, 1, 2, 3, 6.
Als erstes probieren wir 1 aus, weil in diesem Fall die Rechnung am einfachsten ist.
Es gilt p(1) = 1 − 6 + 11 − 6 = 0. Damit haben wir die erste Nullstelle a1 = 1
von p gefunden. Nun teilen wir p durch X − 1.
X 3 − 6X 2 + 11X − 6 : X − 1 = X 2 − 5X + 6
− X3 + X2
− 5X 2 + 11X
5X 2 − 5X
6X − 6
− 6X + 6
0
Die weiteren Nullstellen von p sind Nullstellen des Quotienten q = X 2 − 5X + 6.
Da q ein Polynom zweiten Grades ist, können wir die p-q-Formel benutzen, um die
Nullstellen zu finden. Die Diskriminante ist in diesem Falle
2
25
25 24
1
1
D=
−6=
−
= =
.
4
4
4
4
2
Es gilt
a2 = −
−5 √
5 1
+ D= + =3
2
2 2
114
STEFAN GESCHKE
und
−5 √
5 1
− D = − = 2.
2
2 2
Damit haben wir alle Nullstellen von p gefunden.
a3 = −
8.4. Vektorrechnung und Matrizenringe. In diesem Abschnitt führen wir noch
einen Ring ein, bei dem das Kommutativgesetz für die Multiplikation nicht gilt.
Dieser Ring wird im nächsten Semester in eine wichtige Rolle spielen.
Erinnerung: Für einen Körper K und n ∈ N ist K n die Menge aller n-Tupel mit
Einträgen aus K.
Wir definieren eine Addition auf K n .
Definition 8.29. Wir nennen die Elemente von K n Vektoren. Die Summe zweier
Vektoren (a1 , . . . , an ), (b1 , . . . , bn ) ∈ K n definieren wir komponentenweise. Es sei
(a1 , . . . , an ) + (b1 , . . . , bn ) := (a1 + b1 , . . . , an + bn ).
Außerdem definieren wir die Multiplikation von Vektoren mit Elementen des Körpers K. Sei α ∈ K und v = (a1 , . . . , an ) ∈ K n . Dann sei
αv := (αa1 , . . . , αan ).
In diesem Zusammenhang nennt man α einen Skalar mit dem der Vektor v skaliert
wird.
Beispiel 8.30. Wir stellen uns Vektoren in R2 als Punkte in der Anschauungsebene oder als Pfeile vom Nullpunkt zu einem Punkt in der Ebene vor. Die Summe
von Vektoren lässt sich dann geometrisch als Aneinanderreihung von Pfeilen interpretieren. Entsprechendes gilt in R3 oder ganz allgemein in Rn , wobei unsere
Anschauung im Falle n > 3 natürlich sehr herausgefordert wird.
Sei v := (−1, 3) und w := (2, −1).
y-Achse
w (um v verschoben)
v
v+w
w
x-Achse
Sei α = 2.5. Dann ist αv = (−2.5, 7.5). Die Multiplikation mit dem Skalar α
entspricht einer Streckung um den Faktor α.
Satz 8.31. Sei K ein Körper und n ∈ N.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
115
a) (K n , +) ist eine abelsche Gruppe. Das neutrale Element der Addition ist der
Vektor (0, . . . , 0), den wir den Nullpunkt nennen.
b) Für alle v, w ∈ K n und alle α, β ∈ K gilt
(1) α(v + w) = αv + αw
(2) (α + β)v = αv + βv
(3) (α · β)v = α(βv)
(4) 1v = v.
Beweis. a) Die Axiome für abelsche Gruppen rechnet man schnell nach. Dabei wird
nur verwendet, dass (K, +) eine abelsche Gruppe ist.
b) Die Eigenschaften der Multiplikation von Vektoren mit Skalaren rechnet man
schnell nach.
Eine Struktur der Form K n mit der Operation + und der Multiplikation mit Skalaren ist ein Vektorraum. Wir werden Vektorräume im zweiten Teil der Vorlesung
studieren.
Beispiel 8.32. Wir betrachten wieder R2 und v = (−1, 3). Sei
U = {αv : α ∈ R}.
Dann ist U eine Untergruppe von (R2 , +).
Für α, β ∈ R gilt nämlich nach Satz 8.31 αv − βv = (α + (−β))v ∈ U . Nach
unserem Kriterium für Untergruppen folgt nun, dass U tatsächlich eine Untergruppe
von (R2 , +) ist.
Die Menge U der skalaren Vielfachen von v ist einfach die Gerade durch den
0-Punkt, die den Vektor v enthält. Die Nebenklassen von U in R2 sind die Geraden
in R2 , die zu der Geraden U parallel sind.
Wir definieren noch eine weitere Operation zwischen Vektoren in K n .
Definition 8.33. Seien (a1 , . . . , an ), (b1 , . . . , bn ) ∈ K n . Dann ist das (Standard-)
Skalarprodukt von v = (a1 , . . . , an ) und w = (b1 , . . . , bn ) das Körperelement
hv, wi := a1 b1 + · · · + an bn .
Die Bezeichnungen „Skalarprodukt“ und „Multiplikation mit einem Skalar“ geben
leicht Anlass zur Verwirrung. Es handelt sich um die Standardbezeichnungen und
man muss aufpassen, dass man sich immer genau klarmacht, worum es geht.
Beispiel 8.34. Wir rechnen wieder über dem Körper R. Sei v = (1, 2, 3) und
w = (−1, 2, 1). Dann gilt
hv, wi = 1 · (−1) + 2 · 2 + 3 · 1 = −1 + 4 + 3 = 6.
Man erinnere sich an den Satz von Pythagoras: In einem rechtwinkligen Dreieck,
in dem die Längen der Katheten, also der Seiten, die am rechten Winkel anliegen,
a und b sind, gilt für die Länge c der Hypothenuse, also der Seite, die dem rechten
116
STEFAN GESCHKE
Winkel genüber liegt, die Gleichung
a2 + b2 = c2 .
Insbesondere ist der Abstand des Punktes (a, b) ∈ R2 vom Nullpunkt genau
p
p
a2 + b2 = h(a, b), (a, b)i.
y-Achse
√
(a, b)
a2 + b2
b
a
x-Achse
In höheren Dimensionen gilt das Entsprechende. Daher nennen wir für einen
p
hv, vi den Betrag von v. Der Betrag von v ist
Vektor v ∈ Rn die Zahl |v| =
nichts anderes als der Abstand von v vom 0-Punkt. Der Betrag |λ| einer reellen
Zahl λ ist der Wert den man erhält, wenn man das Vorzeichen von λ weglässt. So
ist | − 5| = 5, |2.5| = 2.5 und |0| = 0.
Der folgende Satz fasst die Eigenschaften des Standardsskalarprodukts und des
Betrages zusammen.
Satz 8.35. a) Sei K ein Körper und n ∈ N. Dann gelten folgende Aussagen für
alle α ∈ K und alle u, v, w ∈ K n :
(1) hv, wi = hw, vi
(2) hαv, wi = αhv, wi
(3) hu + v, wi = hu, wi + hv, wi
b) Für alle n ∈ N, alle v, w ∈ Rn und alle λ ∈ R gelten die folgenden Aussagen:
(1) |v| ≥ 0
(2) |v| = 0 ⇔ v = (0, . . . , 0)
(3) |λv| = |λ|v
(4) |v + w| ≤ |v| + |w| (Dreiecksungleichung)
Auf den Beweis dieses Satzes gehen wir hier aus Zeitgründen noch nicht ein.
MATHEMATIK I FÜR STUDIERENDE DER INFORMATIK
117
Definition 8.36. Seien m, n ∈ N und sei K ein Körper. Eine m × n-Matrix über
K ist ein rechteckiges Zahlenschema der Form


a11 a12 . . . a1n


 a21 a22 . . . a2n 
 .
..
.. 
 .
,
 .
.
. 
am1
am2
...
amn
wobei die aij Elemente von K sind. Wir schreiben eine solche Matrix kürzer als
(aij )1≤i≤m∧1≤j≤n oder auch einfach als (aij ), wenn die Dimension m×n der Matrix
klar ist. In einer solchen Matrix nennen wir (ai1 , . . . , ain ) die i-te Zeile und


a1j
 . 
 . 
 . 
amj
die j-te Spalte. Die Menge der m × n-Matrizen über dem Körper K bezeichnen wir
mit K m×n .
Man beachte, dass eine m × n-Matrix im wesentlichen denselben Informationsgehalt wie ein Vektor in K m·n hat, nur dass die Matrix graphisch anders dargestellt
wird.
Entsprechend definieren wir auch die Summe von zwei m × n-Matrizen.
Definition 8.37. Für zwei m × n-Matrizen A = (aij ) und B = (bij ) über einem
Körper K sei A + B die Matrix (aij + bij ). Der Eintrag in der i-ten Zeile und der
j-ten Spalte der Matrix A+B lautet also aij +bij . Die m×n-Matrix, deren Einträge
alle 0 sind, nennen wir die Nullmatrix (im Format m × n).
Für α ∈ K und A = (aij ) ∈ K m×n sei
αA := (αaij )1≤i≤m∧1≤j≤n .
Wie im Falle von K n sieht man schnell, dass (K m×n , +) eine abelsche Gruppe
ist. Neben der Addition von Matrizen und der Multiplikation von Matrizen mit
Skalaren gibt es eine weitere Verknüpfung von Matrizen, die fast noch wichtiger ist
als die beiden schon genannten Operationen, nämlich die Matrizenmultiplikation.
Definition 8.38. Sei K ein Körper und seien `, m, n ∈ N. Weiter sei A = (aij ) ∈
K `×m und B = (bjk ) ∈ K m×n . Dann ist AB = A · B die ` × n-Matrix C = (cik ),
deren Eintrag cik das Körperelement
ai1 b1k + · · · + aim bmk ,
also das Skalarprodukt der i-ten Zeile von A mit der k-ten Spalte von B, ist. Es
gilt also

AB = 
m
X
j=1

aij bjk 
.
1≤i≤`∧1≤k≤n
118
STEFAN GESCHKE
Eine wichtige, nichttriviale Eigenschaft der Matrizenmultiplikation ist die Assoziativität.
Satz 8.39. Sei K ein Körper und seien k, `, m, n ∈ N. Sind A ∈ K k×` , B ∈ K `×m
und C ∈ K m×n , so gilt
(A · B) · C = A · (B · C).
Betrachtet man n × n-Matrizen für ein festes n, so kann man die Matrizen in
beliebiger Reihenfolge multiplizieren und erhält wieder n × n-Matrizen.
Satz 8.40. Sei n ∈ N und sei K ein Körper. Dann ist (K n×n , +, ·) ein Ring, der
Ring der n × n-Matrizen über K.
Das neutrale Element bezüglich der Multiplikation in K n×n ist die Einheitsmatrix

1 0

0 1
En = 
 .. ..
. .
0
0

...
0
...

0
.. 
,
.
...
1
bei der auf der Diagonalen Einsen stehen und sonst nur Nullen.
Die Einheitengruppe des Matrizenringes K n×n sind die invertierbaren Matrizen. Der Matrizenring K n×n ist für n > 1 nicht kommutativ. Matrizen und ihre
Multiplikation spielen eine wesentliche Rolle im Page-Rank-Algorithmus mit dem
zum Beispiel Google die Reihenfolge der Suchergebnisse festlegt.