Grundlagen der Computernutzung - Goethe

Werbung
Grundlagen der Computernutzung Mathematik
WiSe 2007/08
J. Baumeister1
9. Februar 2010
1
Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgültig korrigiert sind.
Hinweise auf Fehler und Verbesserungsvorschläge an [email protected]
Inhaltsverzeichnis
Vorwort
i
Literatur
ii
1 Aussagen und Mengen
1.1 Aussagen und ihre Verknüpfungen
1.2 Mengen . . . . . . . . . . . . . . .
1.3 Alphabete . . . . . . . . . . . . . .
1.4 Relationen . . . . . . . . . . . . . .
1.5 Übungen . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
9
11
13
2 Graphen
2.1 Definition und Diagramme . .
2.2 Wege, Kreise, Zusammenhang
2.3 Planare Graphen . . . . . . .
2.4 Bäume . . . . . . . . . . . . .
2.5 Übungen . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
19
22
24
25
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Algorithmen und Programme
3.1 Algorithmen . . . . . . . . . . . . . . .
3.2 Programme und Programmiersprachen
3.3 Ordnung und Listen . . . . . . . . . .
3.4 Sortieren . . . . . . . . . . . . . . . . .
3.5 Computerzahlen . . . . . . . . . . . .
3.6 Übungen . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
27
27
28
30
31
33
36
4 Abbildungen
4.1 Definitionen . .
4.2 Permutationen
4.3 Metriken . . . .
4.4 Isomorphismen
4.5 Übungen . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
45
49
50
5 Zählen
5.1 Natürliche Zahlen .
5.2 Induktion . . . . .
5.3 Abzählen . . . . .
5.4 Rekursion . . . . .
5.5 Primzahlen . . . .
5.6 Übungen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
52
52
55
58
60
62
64
.
.
.
.
.
1
6 Elementare Arithmetik
6.1 Ganze Zahlen . . . . . . .
6.2 Teilbarkeit . . . . . . . . .
6.3 Euklidischer Algorithmus
6.4 Modulare Arithmetik . . .
6.5 Pseudozufallszahlen . . .
6.6 Übungen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7 Polynome und ihre Nullstellen
7.1 Polynome . . . . . . . . . . . . . . . . .
7.2 Nullstellen von Polynomen formelmäßig
7.3 Determinanten und Eigenwerte . . . . .
7.4 Fundamentalsatz der Algebra . . . . . .
7.5 Übungen . . . . . . . . . . . . . . . . . .
8 Zufall
8.1 Laplace–Häufigkeiten . . . . . .
8.2 Kombinatorische Überlegungen
8.3 Bedingte Wahrscheinlichkeiten
8.4 Das Ziegenproblem . . . . . . .
8.5 Markov–Ketten . . . . . . . . .
8.6 Übungen . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
65
65
67
69
74
75
80
.
.
.
.
.
81
81
85
88
90
93
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
94
99
102
104
106
110
9 Modellierung
9.1 Wissenschaft . . . . . . . . . . .
9.2 Modelle . . . . . . . . . . . . . .
9.3 Mathematische Modellierung . .
9.4 Simulation . . . . . . . . . . . . .
9.5 Zur Mendelschen Vererbungslehre
9.6 Das Fallgesetz von Galilei . . . .
9.7 Gutgestelltheit – Wellposedness .
9.8 Übungen . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
111
111
112
113
114
115
117
119
120
2
Vorwort
Die Lehrveranstaltung Grundlagen der Computernutzung“ ist ein Teil des Moduls Rechnerun”
”
terstützung in der Mathematik“ im 1. Studienjahres des Bachelorstudiengangs Mathematik“,
”
der im Wintersemester 2006/07 an der Johann Wolfgang Goethe-Universität neu aufgenommen
wurde. Es ist die zweite Auflage einer Lehrveranstaltung dieses Titels, dieser Art und Form.
Inhalt und Umsetzung sind daher noch mehr oder minder im Experimentierstadium.
Die Lehrveranstaltung beinhaltet in einem mathematischen Teil Grundlagen für die Analyse, algorithmische Aufbereitung und Simulation einfacher Sachverhalte der Analysis, Linearen
Algebra und damit in Verbindung stehender Anwendungen. Mit der Vorlesung sollen mehrere
Ziele verfolgt werden:
(1) Erlernen algorithmischen Handelns
(2) Kennenlernen von einfachen Algorithmen im Kontext der Analysis und der Linearen Algebra
(3) Zuhilfenahme des Computer-Algebra-Systems Maple
(4) Einbeziehung des Mathematik-tauglichen“ Textverarbeitungssystems LATEX
”
(5) Erste Schritte bei der Anwendung von Mathematik als Modellierungsinstrument
Aus den Zielen sollte klar werden, dass es sich bei der Vorlesung weder um einen Programmierkurs noch um einen die Vorlesungen Analysis, Lineare Algebra“ begleitenden Rezeptkurs
”
handelt. Es werden wesentliche Inhalte der Analysis und Linearen Algebra algorithmisch aufbereitet und Konzepte vorbereitet, die in Vorlesungen zur Numerischen und Diskreten Mathematik
und über schnelle Algorithmen im Zentrum stehen.
Wie oben angedeutet, ist algorithmisches Handeln und Modellierung ein Teil der Betrachtungen. Algorithmen sind sequentielle Handlungsanweisungen“ zur Lösung eines (in mathemati”
scher Sprache formulierten) Problems. Die Abarbeitung der Handlungsanweisungen erfolgt meist
mit dem Computer unter Nutzung von Programmiersprachen und Programmpaketen; hier nutzen wir ausschließlich Maple. Wir werden keine Theorie von Algorithmen formulieren sondern
die wesentlichen Aspekte algorithmisches Handeln ausschließlich an Beispielen erläutern.
Modelle sind mathematische Abstraktionen einer Fragestellung/eines Phänomens mit dem
Ziel, mathematische Methoden zur Analyse und Algorithmen zur Lösung anwenden zu können.
Wir skizzieren dies an Hand einfacher Beispiele; Literatur zu diesem Aspekt [13, 8, 14, 17, 12].
Dieses Skriptum erfasst den mathematischen Teil der Lehrveranstaltung, die Skripten zu
Maple und LATEX finden sie hier:
www.math.uni-frankfurt.de/∼mkreth/gnr
www.math.uni-frankfurt.de/∼pbauer/gnr
Frankfurt, im Oktober 2007
Johann Baumeister
i
Literaturverzeichnis
[1] Aigner, M., Ziegler, G.M., Proofs from THE BOOK Springer, New York, 1998
[2] Argyris, J., Faust, G., Haase, M. Die Erforschung des Chaos Vieweg–Verlag, 1993
[3] Aulbach, B. Gewöhnliche Differentialgleichungen Spektrum, 1997
[4] Bamberg, P., Sternberg, S. A Course in Mathematics for Students of Physics
Cambridge University Press, 1990
[5] Braun, M., Meise, R. Analysis mit Maple Vieweg, 1995
[6] Braun, M. Differential Equations and Applications Springer, 1996
[7] Ebbinghaus, H.D., u.a. Zahlen Springer, New York, 1988
[8] Ebenhöh, W. Einführung in die mathematische Modellierung
[9] Forster, O., Analysis 1 Vieweg, Braunschweig, 1976
[10] Forster, O., Analysis 2 Vieweg, Braunschweig, 1976
[11] Forster, O., Algorithmische Zahlentheorie Vieweg, Braunschweig, 1979
[12] Fulford, G., Forrester, P., Jones, A., Modelling with Differential and Difference
Equations Cambridge University Press, Cambridge 1997
[13] Grüne, L. Modellierung mit Differentialgleichungen
http://www.math.uni-bayreuth.de/departments/math/∼lgruene/
[14] Ortlieb, C.P. Exakte Naturwissenschaft und Modellbegriff Hamburger Beiträge zur
Modellierung und Simulation, Universität Hamburg, 2000
[15] Russio, L. Die vergessene Revolution Springer, 2003
[16] Scheid, H., Einführung in die Zahlentheorie Klett Verlag, Stuttgart, 1972
[17] Sonar, T., Angewandte Mathematik, Modellbildung und Informatik Vieweg, Braunschweig 2001
[18] Walter, W. Gewöhnliche Differentialgleichungen Springer, 1972
[19] Werner, W., Mathematik lernen mit Maple 1 dpunkt–Verlag, 1996
[20] Werner, W., Mathematik lernen mit Maple 2 dpunkt–Verlag, 1998
ii
Kapitel 1
Aussagen und Mengen
Für die Formulierung von Aussagen von mathematischem Gehalt benötigen wir Verabredungen,
Sprechweisen, Symbole und eine griffige Notation. Dabei wollen wir aber nicht in die Tiefen der
mathematischen Grundlagen (Mengenlehre, Logik) eintauchen, sondern geben uns mit einem
naiven“ Standpunkt zufrieden. Er führt zu keinerlei Konflikten, solange wir uns mit konkret
”
definierten Objekten beschäftigen.
1.1
Aussagen und ihre Verknüpfungen
Argumentationen in der Mathematik beruhen darauf, dass ein Zusammenhang zwischen Aussagen hergestellt wird, dass Aussagen verknüpft werden. Was eine Aussage sein soll, halten wir in
einer Definition fest, die umgangssprachlich formuliert ist.
Definition 1.1.1 Eine Aussage ist eine sprachliche Feststellung, die entweder wahr oder falsch
ist. Falsch bzw. wahr charakterisiert man dabei durch einen Wahrheitswert: (w) steht für wahr,
(f ) steht für falsch.
In der obigen Definition“ spiegelt sich das aristotelische1 Prinzip des tertium non datur
”
wieder: eine Aussage ist entweder wahr oder falsch, eine dritte Möglichkeit gibt es nicht. Beispiele:
1.
2.
3.
4.
5.
6.
2 ist eine gerade Zahl
1004 ist durch 3 teilbar
Brasilien ist ein Entwicklungsland
Die Straße X ist nass
Das Dreieck ABC ist gleichschenklig
2999999991 − 1 ist eine Primzahl
Die erste Aussage ist wahr, die zweite Aussage ist falsch, wenn wir eine Definition von Teilbarkeit
unterstellen; der Wahrheitsgehalt der dritten Aussage hängt von einer Definition eines Entwicklungslandes ab; die vierte Aussage kann auf ihren Wahrheitsgehalt mit physikalischen“ Mitteln
”
geprüft werden; ob die fünfte Aussage wahr ist, ist offen, solange keine exakte Definition und
Beschreibung des konkreten Dreiecks vorliegt; der Wahrheitsgehalt der letzten Aussage ist offen:
2999999991 − 1 ist eine Primzahl oder sie ist keine, die Instanz“, die dies (schnell) entscheiden
”
kann, ist wohl noch zu finden.
Als erstes Aussagenkonstrukt betrachten wir die Verneinung/Negation einer Aussage.
Konkret: Ist P eine Aussage, so bezeichnen wir mit ¬P die Negation der Aussage P ; es ist
1
Aristoteles von Stagira (384-322 v. Chr.)
1
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
also P wahr genau dann, wenn ¬P falsch ist. Man bezeichnet die Negation als einstellige
Verknüpfung“, benötigen wir doch dabei nur eine Aussage. Logische Verknüpfungen, bei denen
”
zwei Aussagen beteiligt sind, nennen wir zweistellige oder binäre Aussageverknüpfungen.
Die Aussageverknüpfungen werden – in streng mathematischen Sinne – in der boolschen2 Algebra
zusammengefasst. In der folgenden Tabelle fügen wir logische Operatoren, wie sie in Maple
nutzbar sind, ein.
Durch logische VerOperation
Sprechweise
Symbol
Maple
knüpfung zweier Aussagen P,Q ensteht eiNegation
nicht . . .
¬
&not
ne dritte Aussage R,
Konjunktion
. . . und . . .
∧
&and
eine sogenannte verbundene Aussage.
Alternative
. . . oder . . .
∨
&or
Um den WahrheitsgeImplikation
wenn . . ., dann . . .
=⇒
&implies
halt dieser verbundenen Aussage geht es
. . . genau dann, wenn . . .
⇐⇒
&iff
Äquivalenz
dann. Bestimmt wird
die Aussage R dadurch, welcher Wahrheitswert ihr für die verschiedenen Belegungen mit (w) und (f) der Aussagen
P und Q zukommt. Die folgende Wahrheitstafel zeigt, wie die oben angeführten Aussageverknüpfungen definiert sind:
P
Q
P ∧ Q
P ∨ Q
P =⇒ Q
P ⇐⇒ Q
(w)
(w)
(w)
(w)
(w)
(w)
P
¬P
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(f)
(f)
(w)
(w)
Man beachte insbesondere die Wahrheitstafel zu P =⇒ Q: Ist P falsch, so ist die Implikation
P =⇒ Q wahr, unabhängig vom Wahrheitsgehalt von Q. Die Wahrheitstafel der Negation ist
angefügt.
Maple - Illustration 1.1
Maple kennt den Datentyp
boolsche Variable und hat die
einfachen logischen Operationen
&and, &or, &not ständig verfügbar. Eine Aussage ist eine
Tautologie, wenn sie unabhängig
vom Wahrheitswert der zu Grunde liegenden Literale“ immer
”
wahr wird.
> with(logic):
> x:=3: evalb(5*xˆ3-200>0);
false
> tautology((&and(a,b) &or (&not a) &or
(&not b));
true
Mit den nun eingeführten Verknüpfungen stehen uns schon eine große Anzahl von Aussagenkonstrukten zur Verfügung. Halten wir einige logische Gesetze fest:
2
George Boole, 1815-1864, Mathematiker
Stand: 9. Februar 2010
2
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
Regel 1.1.2 Seien P, Q Aussagen.
(P =⇒ Q)
¬(P ∧ Q)
¬(P ∨ Q)
(P =⇒ Q)
⇐⇒
(¬Q =⇒ ¬P )
⇐⇒
¬P ∧ ¬Q
⇐⇒
(1.1)
¬P ∨ ¬Q
⇐⇒
(1.2)
(1.3)
(¬P ∨ Q)
(1.4)
Von der Richtigkeit dieser Aussagen überzeugen wir uns, indem wir die Wahrheitstafeln erstellen.
Etwa zu (1.1):
P =⇒ Q ¬ Q ¬ P ¬ Q =⇒ ¬ P
(P =⇒ Q) ⇐⇒ (¬ Q =⇒ ¬ P)
P
Q
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(w)
(w)
Die Wahrheitstafel zu P =⇒ Q ist identisch mit der Wahrheitstafel zu ¬ P ∨ Q, wie man
leicht verifiziert. Die Aussage ¬ P ∨ Q vermeidet also das der Umgangssprache nahestehende
“folgt“ in P =⇒ Q.
Regel 1.1.3 Seien P,Q,R Aussagen.
P ∧ Q
P ∨ Q
⇐⇒
Q ∧ P
⇐⇒
(1.5)
Q ∨ P
(1.6)
(P ∧ Q) ∧ R
⇐⇒
P ∧ (Q ∧ R)
(1.7)
P ∧ (P ∨ Q)
⇐⇒
P
(1.9)
P
(1.10)
(P ∧ Q) ∨ (P ∧ R)
(1.11)
(P ∨ Q) ∨ R
P ∨ (P ∧ Q)
P ∧ (Q ∨ R)
P ∨ (Q ∧ R)
⇐⇒
P ∨ (Q ∨ R)
⇐⇒
⇐⇒
⇐⇒
(1.8)
(P ∨ Q) ∧ (P ∨ R)
(1.12)
Die Gültigkeit von (1.5) , . . . , (1.12) belegt man wieder mit Hilfe von Wahrheitstafeln. Etwa zu
(1.11) in nicht vollständiger Aufzählung:
P
Q
R
Q ∨ R
P ∧ (Q ∨ R)
P ∧ Q
P ∧ R
(P ∧ Q) ∨ (P ∧ R)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
Sprechweisen:
(1.5), (1.6)
(1.7), (1.8)
(1.9), (1.10)
(1.11), (1.12)
Stand: 9. Februar 2010
Kommutativgesetze
Assoziativgesetze
Verschmelzungsgesetze
Distributivgesetze
3
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
In Definitionen weisen wir mathematischen Objekten manchmal Eigenschaften mit einem
definierenden Äquivalenzzeichen “ : ⇐⇒ ,“ zu, etwa:
Objekt O hat Eigenschaft E : ⇐⇒
Eine Aussage A über das Objekt O , die äquivalent
mit dem Eintreten der Eigenschaft E ist, ist wahr (gilt).
Ein Satz, Lemma, eine Folgerung, . . . ist die Ausformulierung einer mathematischer Aussage, die wahr ist. Meist stellt sich diese Ausformulierung so dar, dass aus einer Voraussetzung
V eine Behauptung B gefolgert werden soll; V, B sind selbst mathematische Aussagen.
Ein Beweis eines Satzes mit Voraussetzung V und Behauptung B ist also eine Kette
von Implikationen, ausgehend von der Aussage V bis zur Aussage B:
V
=⇒ . . . =⇒ B
Die Regel (1.1) sagt uns, dass wir den Beweis auch führen können, indem wir die Gültigkeit von
V =⇒ B dadurch zeigen, dass wir ¬B =⇒ ¬V nachweisen; Beweis durch Kontraposition).
Der Widerspruchsbeweis basiert auf der Regel (1.4) zusammen mit (1.3). Er stellt sich so
dar:
V ∧ ¬B =⇒ . . . =⇒ Q
Hierbei ist mit Q dann eine Aussage erreicht, die nicht wahr ist.
Der Beweis durch Fallunterscheidung kann angewendet werden, wenn sich die Voraussetzung
V als V1 oder V2 formulieren läßt. Dann reicht es die Fälle V1 =⇒ B und V2 =⇒ B zu zeigen,
wie eine Wahrheitstafel sofort zeigt.
Dem Nachweis von Euklid3 , dass
spruchbeweises zugrunde:
√
2 nicht rational ist, liegt die Beweistechnik des Wider-
V : a ist eine Zahl mit a2 = 2
B: a ist eine Zahl, die nicht rational ist
√
Aus der Annahme V ∧ ¬B, also der Annahme, dass 2 eine rationale Zahl ist, leiten wir durch
logisches Schließen (gültige Aussageverknüpfungen) eine Aussage ab, die nicht wahr ist. Also
kann die Annahme V ∧ ¬B nicht wahr sein; V =⇒ B ist also wahr. Wir kommen auf diesen
Beweis zurück, wenn wir etwas mehr über rationale und irrationale Zahlen Bescheid wissen.
Bemerkung 1.1.4 Beweise führt man, u. a. dazu,
(-) sich selbst zu überzeugen, dass man richtig überlegt hat;
(-) andere Mathematiker zu überzeugen, dass die Aussage eines Satzes, Lemmas, . . . zutrifft;
(-) den inneren Aufbau eines mathematischen Gebäudes zu erläutern.
Einen Beweis zu finden, erfordert oft ein großes Maß an Intuition und Vorstellungsvermögens.
3
Euklid, 365(?) – 300(?), Mathematiker“
”
Stand: 9. Februar 2010
4
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2
1.2. MENGEN
Mengen
Den Begriff der Menge wollen und können wir hier ebenso wie die obige Aussagenlogik“ nicht
”
im strengen Sinne der mathematischen Grundlagen einführen. Er dient uns nur als Hilfsmittel
für eine möglichst kurze Notation von konkreten Mengen. Von G. Cantor,4 dem Begründer der
Mengenlehre, haben wir folgende Definition:
Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer Anschauung oder unseres Denkens – welche Elemente der Menge genannt werden – zu einem
Ganzen.
Diese Begriffsbildung hat die Mathematik tief beeinflusst.
Eine Menge besteht also aus Elementen, kennt man alle Elemente der Menge, so kennt man
die Menge. Beispiele, die wir noch genauer studieren werden, sind:
N := Menge der natürlichen Zahlen Z := Menge der ganzen Zahlen
Q := Menge der rationalen Zahlen R := Menge der reellen Zahlen .
Mit den natürlichen Zahlen 1, 2, 3, . . . sind wir schon (aus der Schule) wohlvertraut. Später gehen
wir etwas struktureller darauf ein.
Man kann eine Menge dadurch bezeichnen, dass man ihre Elemente zwischen zwei geschweifte
Klammern (Mengenklammern) schreibt. Die Zuordnung eines Elements zu einer Menge erfolgt
mit dem Zeichen “ ∈ “. Gehört ein Objekt x nicht zu einer Menge M, so schreiben wir x ∈
/ M.
Es hat sich als zweckmäßig erwiesen, den Mengenbegriff so aufzufassen, dass eine Menge aus
gar keinem Element bestehen kann. Dies ist dann die leere Menge, das Zeichen dafür ist ∅ .
Beispielsweise ist die Menge der rationalen Zahlen, deren
Quadrat gleich 2 ist, leer. Dies wissen
√
wir aus der Anmerkung über die Irrationalität von 2 .
Das Hinschreiben der Elemente einer Menge kann auf zweierlei Weisen geschehen.
Hat die Menge nur ganz wenige Elemente, so kann man sie einfach alle hinschreiben, durch
Kommata getrennt, auf die Reihenfolge kommt es dabei nicht an und eine Mehrfachnennung ist
nicht von Bedeutung, etwa:
{1, 2, 3} = {2, 3, 1} = {3, 3, 1, 2} .
Abgekürzt verfährt man oft auch so: Elemente, die man nicht nennt aber gut kennt, werden
durch Punkte angedeutet, etwa:
{1, 2, 3, 4, 5, 6, 7, 8} = {1, 2, . . . , 8} = {1, . . . , 8} .
Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Umfangsdefinition.
Die zweite Möglichkeit besteht darin, Objekte einer Menge als Elemente dadurch zuzuordnen,
dass man ihnen eine charakterisierende Eigenschaft zuweist. Ist E eine Eigenschaft, die jedes
Objekt x einer Menge M hat oder nicht hat, so bezeichne
{x ∈ M |x hat die Eigenschaft E}
die Menge aller Elemente von M , die die Eigenschaft E haben; etwa
KO := {x ∈ Obst|x Kernobst}
UNO := {x ∈ Länder|x Mitglied der UNO}
4
Georg Cantor, 1845-1918, Mathematiker
Stand: 9. Februar 2010
5
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Inhaltsdefinition.
Wichtig beim Hinschreiben von Mengen ist, dass stets nachgeprüft werden kann, ob ein
spezielles Objekt einer in Frage stehenden Menge angehört oder nicht; in der Definition von
Cantor ist dies festgehalten. Dies korrespondiert mit dem ausgeschlossenen Dritten bei Aussagen.
Bei J.A. Poulos5 lesen wir:
... Ähnlich ist es mit der Notation der Mengenlehre. Sie ist so einfach, dass sie schon an
der Grundschule gelehrt werden kann. Was manchmal seitenlang in einem Vorwort zu einem
Lehrbuch steht, passt schon in ganz wenige Sätze: Mit p ∈ F wird ausgedrückt, dass p ein
Element der Menge F ist, und mit F ⊂ G, dass jedes Element von F ebenso ein Element
von G ist. Haben wir zwei Mengen A und B, dann ist A ∩ B die Menge, die jene Elemente
enthält, die sowohl zu A als auch zur Menge B gehören; mit A ∪ B ist die Menge gemeint,
die jene Elemente enthält, die zur Menge A, B oder zu beiden gehören; und A′ ist die Menge
jener Elemente, die nicht zu A gehören. Eine Menge, die keine Elemente enthält, ist eine
leere Menge und wird mit ∅, manchmal auch mit {} angegeben, geschweifte Klammern ohne
Inhalt. Ende des Mini-Kurses.
Was uns von den Begriffen aus dem obigen Minikurs noch nicht begegnet ist, bringen wir
noch in eine anständige“ Form:
”
Definition 1.2.1 Seien A, B Mengen und sei z irgendein Objekt.
(a) A ⊂ B : ⇐⇒ (x ∈ A =⇒ x ∈ B)
Damit ist die Teilmengeneigenschaft/Inklusion ⊂ definiert.
(b) A = B : ⇐⇒ (A ⊂ B und B ⊂ A)
(c) z ∈ A ∩ B : ⇐⇒ (z ∈ A und z ∈ B) .
Damit ist der Durchschnitt A ∩ B definiert: A ∩ B := {x|x ∈ A und x ∈ B}
(d) z ∈ A ∪ B : ⇐⇒ (z ∈ A oder z ∈ B) .
Damit ist die Vereinigung A ∪ B definiert: A ∪ B := {x|x ∈ A oder x ∈ B}
Das Symbol “ := “ haben wir als definierendes Gleichsetzen von Mengen eingeführt. Es korrespondiert mit dem Symbol “: ⇐⇒ “.
Definition 1.2.2 Sei A eine Menge. Die Potenzmenge von A ist die Menge der Teilmengen
von A einschließlich der leeren Menge:
P OT (A) := {B|B ⊂ A} .
Beispiel 1.2.3 Sei A := {p, q, r}. Wie sieht die Potenzmenge P OT (A) aus? Wir haben
P OT (A) = {∅, {p}, {q}, {r}, {p, q}, {q, r}{p, r}, {p, q, r}}
Wir stellen fest, dass die Menge A drei und die Menge P OT (A) 8 = 23 Elemente enthält. Dies
hat dazugeführt, dass man P OT (A) auch als 2A schreibt, und die Bezeichung Potenzmenge“
”
leitet sich daraus ab.
5
Poulos, J.A.: Von Algebra bis Zufall, Campus, Frankfurt, 1992
Stand: 9. Februar 2010
6
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Maple - Illustration 1.2
> M:= {2,3,rot,Hahn,rot} ; A:={Hut,Hahn,†};
Maple kennt den Datentyp Menge. Eine Menge ist
eine in geschweifte Klammern
eingeschlossene
Folge
von
Ausdrücken, Objekten;
Mehrfachnennungen
werden
unterdrückt. Die gängigen Operationen mit endlichen Mengen
sind durchführbar. Aufzählende
Definition, Element von, Durchschnitt und Vereinigung von
Mengen sind handhabbar.
M:= {2,3,rot,Hahn}
A:={Hut,Hahn,†}
> member(rot,M);
true
> M intersect A;
{Hahn}
Mitunter wollen wir eine Bezeichnung für diejenigen Elemente haben, die eine gewisse Eigenschaft nicht haben. Dies ist Inhalt von
Definition 1.2.4 Seien A, B Teilmengen von U .
(a) A\B := {x ∈ A|x ∈
/ B} heißt das relative Komplement von B in A .
(b) ∁A := U \A heißt das Komplement von A (in U ).
(In der Definition (b) steht U für die (universelle) Grundmenge, auf die wir uns bei der Komplementbildung beziehen.)
Ein bequemes Hilfsmittel beim Nachdenken über Mengen sind die Venn–Diagramme, bei
denen in der Zeichenblattebene Gebiete zur Darstellung von Mengen benutzt werden: Durch
Kurven umschlossene Gebiete stellen Mengen A, B, . . . dar. Solche Darstellungen sind gut geeignet, formale Argumente für einen zu beweisenden Sachverhalt zu finden.
A
B
(a) Teilmenge
A
B
(b) Vereinigung
A
B
(c) Durchschnitt
Abbildung 1.1: Venn–Diagramme
Die Nützlichkeit der leeren Menge ∅ wird deutlich bei der Definition des Durchschnitts. Hier
ist ja der Fall, dass A ∩ B kein Element enthält, sicherlich nicht auszuschließen, wie uns ein
geeignetes Venn–Diagramm sofort lehrt. Zwei Mengen, deren Durchschnitt leer ist, heissen disjunkt.
Stand: 9. Februar 2010
7
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Regel 1.2.5 Seien A, B, C Mengen.
A ⊂ B, B ⊂ C
A ∪ (B ∪ C)
=⇒
=
A∩B
=
A∪B
=
A ∩ (B ∪ C)
=
A ∪ (B ∩ C)
(A ∪ B) ∪ C
=
A ∩ (B ∩ C)
A⊂C
(1.14)
(A ∩ B) ∩ C
(1.15)
B∩A
(1.17)
B∪A
(1.16)
(A ∩ B) ∪ (A ∩ C)
(1.18)
(A ∪ B) ∩ (A ∪ C)
=
(1.13)
(1.19)
Beweis von (1.18):
Wir haben zu zeigen: A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C), (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) .
Sei x ∈ A ∩ (B ∪ C). Dann gilt: x ∈ A, x ∈ B ∪ C . Daraus folgt: x ∈ A ∩ B oder x ∈ A ∩ C,
je nachdem, ob x ∈ B und/oder x ∈ C. Daraus schließen wir: x ∈ (A ∩ B) ∪ (A ∩ C). Für den
Beweis der anderen Inklusion lese man die eben vorgeführten Beweisschritte rückwärts.
Sprechweisen:
(1.13)
(1.14), (1.15)
(1.16), (1.17)
(1.18), (1.19)
Transitivität
Assoziativgesetze
Kommutativgesetze
Distributivgesetze.
Definition 1.2.6 Seien A, B Mengen.
(a) Sind a ∈ A, b ∈ B, so heißt (a, b) das damit gebildete geordnete Paar (bezogen auf die
Reihenfolge “zuerst A, dann B“).
(b) Zwei Paare (a, b), (a′ , b′ ) mit a, a′ ∈ A, b, b′ ∈ B, heißen gleich genau dann, wenn a =
a′ , b = b′ gilt.
(c) Die Menge A × B := {(a, b)|a ∈ A, b ∈ B} heißt das kartesische Produkt der Faktoren
A, B .
Mit geordneten Paaren notieren wir etwa die kartesischen Koordinaten (Vielfache der Einheitsstrecke) eines Punktes in der Ebene: wir kommen darauf zurück.6
Beispiel 1.2.7 Z2 := {(x, y)|x, y ∈ Z} ist die Menge aller Punkte der Ebene mit ganzzahligen
Koordinaten. Solche Punkte heißen auch Gitterpunkte“ der Ebene. Analog ist Z n die Menge
”
aller Gitterpunkte des Rn .
Regel 1.2.8 Seien A, B, C Mengen:
A × (B ∪ C) = (A × B) ∪ (A × C) .
A × (B ∩ C) = (A × B) ∩ (A × C) .
(1.20)
(1.21)
6
Da René Descartes, 1596-1650, sehr erfolgreich die Koordinatisierung algebraischer Probleme betrieben hat,
ist die Bezeichnung kartesisch“ wohl angebracht.
”
Stand: 9. Februar 2010
8
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.3. ALPHABETE
Diese Regeln bestätigt man ganz leicht. Nehmen wir uns die Regel (1.20) vor und beweisen eine
der Inklusionen, die es zu beweisen gilt: A × (B ∪ C) ⊂ (A × B) ∪ (A × C) .
Sei x ∈ A × (B ∪ C) . Dann gibt es a ∈ A, d ∈ B ∪ C mit x = (a, d) . Nach Definition von B ∪ C
bedeutet dies
x = (a, d) mit a ∈ A, d ∈ B, oder x = (a, d) mit a ∈ A, d ∈ C .
Also x ∈ A × B oder x ∈ A × C .
Es ist klar, dass wir das kartesische Produkt auf mehr als zwei Faktoren“ ausdehnen können.
”
Etwa korrespondiert ein (gültiger) Lottoschein mit den Elementen der Menge
{x = (x1 , x2 , x3 , x4 , x5 , x6 ) ∈ Z × · · · × Z|x1 , . . . , x6 sind paarweise verschieden};
dabei ist Z = {1, 2, 3, . . . , 49}. Ein Element (x1 , . . . , x6 ) der Menge nennt man ein 6-Tupel.
Das mehrfache kartesische Produkt einer Menge A erhält eine Kurzschreibweise, nämlich
An := A
· · × A} := {x = (x1 , . . . , xn )| alle xi ∈ A} .
| × ·{z
n−mal
Ein Element x = (x1 , . . . , xn ) der Menge An nennt man ein n-Tupel.
Eine Menge kann endlich viele Elemente haben oder unendlich viele. Hier begnügen wir uns
mit einer Definition der Endlichkeit“, die aus unserer Erfahrung heraus sehr wohl geeignet ist;
”
später, wenn wir uns mit Abbildungen beschäftigt haben, bessern wir nach:
Eine Menge heißt endlich, wenn jedem Element der Menge der Reihe nach die Zahlen
1, 2, . . . , N zugeordnet werden kann, wobei mit N dann allen Elementen eine Zahl
zugeordnet ist. Eine Menge heißt unendlich, wenn sie nicht endlich ist.
Eine endliche Menge {x1 , . . . , xn } hat somit n Elemente, wenn alle xi paaarweise verschieden
sind.
Die Anzahl der Elemente einer Menge M bezeichnen wir so: #M .
1.3
Alphabete
Alphabete sind ein zentraler Begriff der theoretischen Informatik im Zusammenhang mit Grammatiken und Verschlüsselungsverfahren.
Definition 1.3.1 Sei A eine nichtleere Menge. A∗ bezeichne die Menge der endlichen Tupel
von Elementen von A, also x ∈ A∗ genau dann, wenn x = () oder x ∈ An für ein n ∈ N, .
Die Elemente von A∗ werden A–Wörter – in der Informatik A–Strings – genannt, das Symbol
() bezeichnet das so genannte leere Wort (leeres Tupel). (Wörter sind Bausteine von Sprachen.)
Die Menge A wird in diesem Zusammenhang ein Alphabet genannt; die Elemente von A sind
der Zeichenvorrat für die Wörter.
Einem Element w ∈ A∗ mit w ∈ An wird die Länge n zugesprochen; wir nennen es ein n–Wort;
das leere Wort () hat die Länge 0.
Im Spezialfall A = {0, 1} spricht man bei A∗ von binären Worten.
In der obigen Definition haben wir Wörter als Tupel definiert. Im Kontext von Alphabeten
und deren Wörter läßt man in der Tupel-Schreibweise begrenzende runde Klammern und trennende Kommata weg: x = x1 x2 . . . xn ist ein Wort der Länge n . Damit ist die Bezeichnung
String“ in der Informatik auch erklärt.
”
Stand: 9. Februar 2010
9
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
Beispiel 1.3.2
BAUM
1234
01001
− − •−
:
:
:
:
1.3. ALPHABETE
Deutsches Alphabet {A,B,C, . . . , X,Y,Z,Ä,Ü,Ö}
Dezimalziffern-Alphabet {0,1,2,3,4,5,6,7,8,9}
Binäres Alphabet {0, 1}
Morsealphabet {−, •, ⊔} (− − •− steht für “q“)
Bemerkung 1.3.3 Sei X = {x1 , . . . , xn } eine Menge mit n Elementen. Jeder Teilmenge A
von X, d.h. jedem Element der Potenzmenge von X, entspricht eindeutig ein n−Wort aus dem
Alphabet {0, 1} :
1 , falls xi ∈ A
A ←→ b1 b2 . . . bn , wobei bi =
0 , falls xi 6∈ A
Also ist die Anzahl der Elemente von P OT (X) gleich der Anzahl der möglichen binären n−Worte.
Diese können wir so abzählen:
Es gibt wn n−Wörter und wn+1 (n + 1)−Wörter. Wir sortieren“ die (n + 1)−Wörter nach dem
”
1. Buchstaben: genau wn Wörter beginnen mit 0, genau wn Wörter beginnen mit 1. Daher gilt:
wn+1 = 2 · wn , w1 = 2 . Daraus folgt die Formel wn = 2n , n ∈ N, .
(Wir haben hier eine Art Induktionsbeweis“ aufgeschrieben; dazu später.)
”
Bemerkung 1.3.4 Es gilt heute als gesicherte Tatsache, dass die Erbanlagen von Pflanzen und
Tieren durch die DNS (Desoxyribonukleinsäure) in den Chromosomen übertragen werden. Man
konnte zeigen, dass die DNS aus einer langen Kette besteht, die aus 4 Bausteinen, die durch die
Buchstaben A,T,G,C dargestellt werden, aufgebaut ist. Hier ist ein Ausschnitt:
ATGGCAAGTTACA. . .
Vererbung besteht daher aus langen Nachrichten, die in Worten (Strängen) aus einem Vierbuchstabenalphabet geschrieben werden können; das Ergebnis einer Genom–Analyse ist also so
hinschreibbar.
Die Übertragung von Nachrichten geschieht mittels durch Hardware realisierter mechanischer
oder elektronischer Impulse. Telefon, Morseapparat, Telegraph, Funkgerät sind Instrumente der
Nachrichtenübermittlung. Die Strecke (physikalische Verbindung), auf der die Übermittlung vor
sich geht, bezeichnet man als Kanal. Zur Übertragung werden die Nachrichten in besonderer
Weise vorbereitet. Eine erste Vorbereitung ist die sogenannte Quellencodierung, bei der eine
Nachricht (einer natürlichen Sprache), die ein Sender an einen Empfänger übermitteln will, in
einem vorgegebenen System, Code genannt, dargestellt wird. Quellencodierung bedeutet in der
Regel, einer Nachricht x einer Gesamtheit X von Nachrichten ein Wort w, geschrieben in einem
Alphabet A zuzuordnen.
Ein eventuell so codiertes Wort des Senders geht
nun über den Kanal an den Empfänger. Hier ergeben sich zwei wesentliche Probleme. Zum einen kann
der Kanal Störungen ausgesetzt sein (atmosphärische Störungen bei Satelliten, . . . ), zum anderen
können beabsichtigte Eingriffe (Lauschen, Stören,
gezieltes Abändern, . . . ) von Unbefugten vorgenommen werden. Der erste Aspekt erfordert eine Technik, die Fehler erkennt und korrigiert, der zweite
Stand: 9. Februar 2010
10
ASCII–Zeichen
Codewort
⊔ (Zwischenraum)
00100000
0
00110000
1
00110001
2
00110010
!
00100001
A
01000001
c J.Baumeister
B
01000010
C
01000011
KAPITEL 1. AUSSAGEN UND MENGEN
1.4. RELATIONEN
Aspekt eine Technik, die die Nachrichten für Unbefugte unlesbar macht. Die Methode für Abhilfe
ist bei beiden Aspekten die gleiche: die Nachricht
im Quellencode wird vor der Sendung über den Kanal einer Sicherheitsmaßnahme unterzogen; sie wird
nochmals codiert. Diesen zweiten Schritt fasst man
unter dem Stichwort Kanalcodierung zusammen.
Auf der Empfängerseite hat man dann entsprechend
zwei Decodierungsmaßnahmen zu treffen, die Kanaldecodierung und die Quellendecodierung.
Beispiel 1.3.5 Beispiele für in der Praxis verwendete Codes sind:
• ASCII–Code (American Standard Code for Information Interchange)
Damit wird ein Alphabet, das aus Buchstaben, Ziffern und Sonderzeichen besteht, über dem
Alphabet {0, 1} mit Wortlänge 8 codiert. Ein Ausschnitt ist in Abbildung 1.2 zu sehen.
• Lochstreifencode
Damit wird ein Alphabet aus Buchstaben und Sonderzeichen über dem Alphabet {0, 1} mit
Wortlänge 5 dargestellt, physikalisch realisiert als Fünferkombination von gestanzten Löchern
und ungestanzten Leerstellen im Lochstreifen.
• Zeichensatzcode etwa bei LATE X.
Damit wird ein Alphabet aus Buchstaben, Ziffern und Sonderzeichen über dem Alphabet der
Ziffern {0, 1, . . . , 7} (oktal) mit Wortlänge 3 dargestellt. Ein Beispiel: 046 steht für & im Zeichensatz cmr10. Dabei ist cmr10 selbst wieder ein Codewort, dessen Bauart sich so erklärt:
“cm“ steht für “Computer Modern“, “r“ steht für die Schriftart “Roman“, “10“ steht für die
Entwurfsgröße.
• ISBN (International Standard Book Number)
Beispiel: 3 – 127 – 01901 – 7
(Die Zahl 3 steht für den deutschsprachigen Raum, 127 steht für den Verlag, 01901 steht für die
Nummer des Buches in der internen Zählung des Verlages, 7 ist eine Prüfziffer, die so zustande
kommt:
1 · 3 + 2 · 1 + 3 · 2 + 4 · 7 + 5 · 0 + 6 · 1 + 7 · 9 + 8 · 0 + 9 · 1 hat Rest 7 bei Teilung durch 11
Eine Prüfziffer 10 wird als X (römische 10) geschrieben.)
• E A N (European Article Number/Strichcode)
Beispiel: | ||| | || || |
1.4
Relationen
Das Gleichheitszeichen “ = “ verwenden wir in einer Menge unter der stillschweigenden Annahme
der folgenden Regeln:
x = x ; (x = y =⇒ y = x) ; (x = y, y = z =⇒ x = z) .
Dies nehmen wir zum Anlass für
Definition 1.4.1 Sei X eine Menge. Eine Teilmenge R ⊂ X × X heißt Äquivalenzrelation
auf X, falls
(i) (x, x) ∈ R für alle x ∈ X
(Reflexivität)
(ii) (x, y) ∈ R =⇒ (y, x) ∈ R
(Symmetrie)
Stand: 9. Februar 2010
11
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.4. RELATIONEN
(iii) (x, y), (y, z) ∈ R =⇒ (x, z) ∈ R
(Transitivität)
gilt.
R
Liegt mit R auf X eine Äquivalenzrelation vor, so schreiben wir für (x, y) ∈ R x ∼ y oder
kurz x ∼ y , wenn R uns aus dem Zusammenhang klar ist.
Die Bedeutung einer Äquivalenzrelation R auf X liegt darin, dass man damit die Menge
X in Teilmengen (Klassen, Bündel) einteilen kann, eine Einteilung, die eventuell gröber ist,
als die Aufteilung in einelementige Mengen, und die bezüglich eines Merkmales“ doch noch
”
aussagekräftig ist. Die Einteilung geschieht durch
R
[x] := {y ∈ X|y ∼ x} , x ∈ X , und X/ R := {[x] | x ∈ X} .
Die Objekte [x] heißen Äquivalenzklassen, x heißt Repräsentant der Klasse [x] . Man beR
achte, dass jedes y ∈ X mit y ∼ x als Repräsentant für [x] Verwendung finden kann.
Beispiel 1.4.2 Blutgruppen werden grob eingeteilt in A, AB, B, 0. Sei K eine Gruppe von
Kindern. Wir erklären darauf eine Relation durch
x ∼ y : ⇐⇒ x, y haben dieselbe Blutgruppe
In der Tat liegt eine Äquivalenzrelation vor. Dadurch wird die Gruppe der Kinder in 4 Klassen
eingeteilt.
Beispiel 1.4.3 Man überlege sich, in welcher Weise, die Geraden in der Ebene durch eine
Äquivalenzrelation in Klassen eingeteilt werden können.
Lemma 1.4.4 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann sind mit
x, y ∈ X folgende Bedingungen äquivalent:
R
(a) y ∼ x .
(b)
y ∈ [x] .
(c)
[y] ∩ [x] 6= ∅ .
(d) [y] = [x] .
(e)
x ∈ [y] .
(f )
x ∼ y.
R
Beweis:
Wollten wir alle Äquivalenzen einzeln zeigen, müssten wir 10 Implikationen beweisen. Dies
können wir wesentlich abkürzen durch einen Ringschluss: es genügt zu zeigen:
(a) =⇒ (b) =⇒ (c) =⇒ (d) =⇒ (e) =⇒ (f ) =⇒ (a) .
Dies tun wir nun. Beachte dabei, dass wegen der Reflexivität stets z ∈ [z] .
(a) =⇒ (b)
Dies folgt aus der Definition der Klasse [x] .
(b) =⇒ (c)
Klar, y ∈ [y] ∩ [x] .
(c) =⇒ (d)
Stand: 9. Februar 2010
12
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
Sei z ∈ [y] ∩ [x] , d.h. z ∼ x, z ∼ y . Wir zeigen [z] = [x] = [y] . Es genügt dazu [z] = [y] zu zeigen,
der Beweis der anderen Aussage verläuft völlig analog.
Sei u ∈ [z] . Dann gilt u ∼ z, z ∼ y und daher mit der Transitivität u ∈ [y] .
Sei v ∈ [y] . Dann gilt v ∼ y, z ∼ y und daher mit der Symmetrie und Transitivität u ∈ [z] .
(d) =⇒ (e)
Klar, denn x ∈ [x] .
(e) =⇒ (f )
Dies folgt aus der Definition der Klasse [y] .
(f ) =⇒ (a)
Symmetrie von ∼ .
R
Das folgende Lemma zeigt, dass X durch “ ∼“ in disjunkte Klassen zerlegt wird.
Lemma 1.4.5 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann gilt:
(a) Für jedes x ∈ X gibt es [y] ∈ X/ R mit x ∈ [y] .
(c) Zwei Äquivalenzklassen besitzen genau dann nichtleeren Durchschnitt, wenn sie gleich sind.
Beweis:
Zu (a). Klar: x ∈ [x] für alle x ∈ X wegen der Reflexivität von “∼“.
Zu (b). Siehe Lemma 1.4.4.
1.5
1.)
Übungen
Verneine folgende Aussagen:
(a) Wenn es regnet, ist die Straße nass.
(b) Es gibt kein Tier, das genau ein Ohr und genau zwei Augen hat.
(c) Alle Quadrate von ganzen Zahlen sind gerade.
Was läßt sich über den Wahrheitsgehalt der Aussagen in (a), (b), (c) sagen?
2.)
A, B, C, D sind vier Tatverdächtige. Genau einer unter ihnen ist der Täter. Beim Verhör
machen sie folgende Aussagen:
A: B ist der Täter
B: D ist der Täter
C,D: Ich bin nicht der Täter
Wer ist der Täter, wenn
(a) genau einer lügt,
(b) genau einer die Wahrheit sagt ?
3.)
Seien P, Q Aussagen. Stelle die Wahrheitstafel zu
(a) ¬(P ∨ Q) ⇐⇒ ¬P ∧ ¬Q
(b) P ∧ (P ∨ Q) ⇐⇒ P
auf.
4.)
(a)
Fülle die folgende Wahrheitstabelle aus:
P
(w)
(w)
(f)
(f)
Stand: 9. Februar 2010
Q
(w)
(f)
(w)
(f)
¬P
¬Q
(¬ P ∨ Q)
13
¬ (¬ P ∨ Q)
P ∧ ¬Q
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
Was schließt man aus den beiden letzten Spalten?
(b) Fülle die folgende Wahrheitstabelle aus:
P
(w)
(w)
(f)
(f)
Q
(w)
(f)
(w)
(f)
P =⇒ Q
(P =⇒ Q) ∨ P
Was schließt man aus der letzten Spalte?
5.)
Seien A, B Mengen. Zeige:
(a)
Zeige: P OT (A ∩ B) = P OT (A) ∩ P OT (B)
(b) Zeige: P OT (A) ∪ P OT (B) ⊂ P OT (A ∪ B)
(c)
Ist sogar P OT (A ∪ B) = P OT (A) ∪ P OT (B) richtig ?
6.)
Seien A, B Mengen. Welche Beziehung besteht zwischen A und
B, falls A ∩ B = A oder A ∪ B = B gilt?
7.)
Seien G, M Mengen und sei I ⊂ G × M . Zu A ⊂ G setze
Aˆ:= {m ∈ M |(a, m) ∈ I für alle a ∈ A} .
Zeige:
(a)
Bˆ⊂ Aˆ falls A ⊂ B .
(b) A ⊂ Aˆˆ, Aˆ= Aˆˆˆ.
(In der Literatur heisst ein solches Tripel (G, M, I) auch Kontext mit Gegenstandsmenge
G, Merkmalen M und Inzidenz I .)
8.)
Beweise für Mengen A, B, C : A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) .
9.)
Die symmetrische Differenz von Mengen A und B ist definiert durch
A △ B := {x ∈ A|x ∈
/ B} ∪ {x ∈ B|x ∈
/ A}
Beweise für Mengen A, B, C : A △ (B △ C) = (A △ B) △ C.
10.) Seien A, B Mengen und definiere
((a, b)) := {{a}, {a, b}} , a ∈ A, b ∈ B .
Zeige für a, p ∈ A, b, q ∈ B: ((a, b)) = ((p, q)) ⇐⇒ a = p, b = q .
(Damit haben wir geordnete Paare neu definiert.)
11.) Zeige für Mengen A, B die Äquivalenz der folgenden beiden Aussagen:
(a)
A=B.
(b) A ∪ B = A ∩ B .
12.) MAPLE: Was schliesst man aus der folgenden Sequenz?
> with(logic) :
> bequal((p &nand q) &nand r, p &nand (q &nand r));
false
Stand: 9. Februar 2010
14
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
13.) MAPLE: Gegeben seien die Mengen A := {a, b, c} und B := {c, d} . Berechne die Potenzmenge von A und teste, ob B eine Teilmenge von A ist. Hinweis: Berechne die
Potenzmenge in einer Schleife.
14.) MAPLE: Zeige:
(a)
p &or q genau dann, wenn &nand (&nand(p, p), &nand(q, q)) .
(b) &not p genau dann, wenn &nand(p, p) .
15.) MAPLE: Ermittle die Arbeitsfunktion des boolschen Operators &xor durch Erstellen
einer Wahrheitstafel.
Stand: 9. Februar 2010
15
c J.Baumeister
Kapitel 2
Graphen
Graphen bilden eine fundamentale Datenstruktur in der Diskreten Mathematik. Entstehung
und Entwicklung der Graphentheorie waren weitgehend durch das Bemühen, eine Lösung des
4–Farbenproblems anzugeben, gekennzeichnet; siehe unten. Die Informatik ist heutzutage Motor der Entwicklung und erfolgreicher Abnehmer von Resultaten der diskreten Mathematik und
insbesondere der Graphentheorie. Hier entwerfen wir eine kleine Skizze interessanter Fragestellungen.1
2.1
Definition und Diagramme
Die einfachste Struktur auf endlichen Mengen wird von einer zweistelligen Relation erzeugt:
Zwei Elemente einer Menge stehen in einer vorgegebenen Beziehung oder nicht. Mit dem Begriff
des Graphen erfassen wir gerade diese Situation, wie wir noch sehen werden.
Beginnen wir mit einem bestens bekannten Gra”
phen“. Er hat 5 Ecken (◦) und 8 Kanten (—) und
ist im Rythmus von
Dies ist das Haus vom Ni–ko–laus
in einem Zug auf das Papier zu zaubern, ohne zweimal eine Kante nachziehen zu müssen. Damit sind
schon wesentliche Begriffe der Graphentheorie angesprochen.
Definition 2.1.1 Ein Graph G = G(E, K) besteht aus einem Paar (E, K), wobei E eine nichtlee- Abbildung 2.1: Das Haus vom Nikolaus
re Menge von Ecken und K eine Menge von Kanten ist und einer Vorschrift, die jeder Kante k ∈ K
genau zwei (verschiedene oder gleiche) Ecken a, b ∈ E zuordnet, die wir Endecken von k nennen; ist a = b, so nennen wir k eine Schlinge bei a.
Im Allgemeinen haben wir endliche Graphen im Blick, also Graphen, deren Eckenmenge eine
endliche Menge ist. (Im englischen Sprachgebrauch spricht man bei Kanten von vertices oder
nodes und bei Kanten von edges; daher G = G(V, E).)
1
Im Internet findet man ein ziemlich umfangreiches Skriptum unter:
www2.informatik.hu-berlin.de/alcox/lehre/skripte/ga/
16
KAPITEL 2. GRAPHEN
2.1. DEFINITION UND DIAGRAMME
Ist G = G(E, K) ein Graph, so sagen wir, dass k ∈ K die Ecken a und b verbindet, wenn a, b
Endecken von k sind; oft schreiben wir dafür k = {a, b} oder kurz k = ab . Ecken, die durch eine
Kante verbunden sind, nennen wir benachbart. Eine Ecke, die zu keiner Kante Endecke ist,
nennen wir isoliert. Sind zwei Ecken durch Kanten k1 , k2 , . . . , kn , n ≥ 2, verbunden, so heißen
die Kanten k1 , . . . , kn Mehrfachkanten. Wir betrachten im Folgenden ausschließlich einfache
Graphen, also solche, die weder Schlingen noch Mehrfachkanten besitzten.
Abbildung 2.2: Vollständige Graphen
Einen Graph veranschaulicht man sich am besten durch ein Diagramm, indem man die Ecken
als Punkte der (Zeichen–)Ebene zeichnet und die Kanten als Kurven zwischen den Endpunkten
zeichnet; hier wird die zweistellige Relation, die abstraktes Kernstück eines Graphen ist, deutlich.
Dadurch ist auch die Bezeichnung Graph“ erklärt: das Ecken–Kanten–System erinnert an die
”
graphische Darstellung von Funktionen.
Beispiel 2.1.2 Hat man bei einem Graphen G(E, K) als Eckenmenge E = {1, . . . , n}, so kann
man offenbar insgesamt 12 n(n−1) verschiedene Kanten einzeichnen. Da man nun zu jeder Kante
1
die Auswahl treffen kann, ob sie im Graphen vorkommen soll ja oder nein, gibt es 2 2 n(n−1)
verschiedene Graphen.
Die Anzahl der Ecken eines Graphen G =
G(E, K) wird üblicherweise als Ordnung von G
bezeichnet, die Anzahl seiner Kanten als Größe.
Einen Graph nennt man dann dicht, wenn das
Verhältnis d von Größe zu Ordnung groß ist; bei
einer Veranschaulichung in der Ebene kann man
Dichte“ sehen.
”
Beispiel 2.1.3 Betrachte ein Beispiel einer
endlichen Geometrie“:
”
P := {A, B, C} , G := {{A, B}, {A, C}, {B, C}}
(a)
(b)
Abbildung 2.3: Bipartite Graphen
P steht für die Punkte, G steht für die Menge der
Geraden.
Dies ist ein Graph G(P, G). Endecken etwa der Kante k := {A, B} sind A und B.
Einige einfache Graphen sind so wichtig, dass sie eigene Namen tragen. Z.B. heißen die
einfachen Graphen Gn := G(E, K) mit Eckenanzahl n und einer Kante zwischen jedem Paar
von Ecken vollständige Graphen. In Abbildung 2.2 sind Diagramme dazu für n ≤ 5 enthalten.
Weitere Graphen spezieller Struktur sind die bipartiten Graphen G = G(E, K), bei denen
es eine Zerlegung der Eckenmenge E gibt derart, dass
E = U ∪ V , U ∩ V = ∅,
Stand: 9. Februar 2010
17
c J.Baumeister
KAPITEL 2. GRAPHEN
2.1. DEFINITION UND DIAGRAMME
und jede Kante hat eine Ecke in U und eine Ecke in V . Ist jede Ecke aus U mit einer Ecke aus
V verbunden, so sprechen wir von einem vollständigen bipartiten Graphen; wir bezeichnen
sie mit Gm,n , wobei hier die Zerlegung so möglich ist, dass U m und V n Ecken hat. Der
vollständige bipartite Graph G3,3 ist in Abbildung 2.3 (a) skizziert. Abbildung 2.3 (b) gibt einen
unvollständigen bipartiten Graphen wieder.
Beispiel 2.1.4 Geplant ist ein Tennisturnier mit fünf Teilnehmern a, b, c, d, e . Die Turnierbedingungen seien:
(1) Es steht nur ein Tennisplatz zur Verfügung.
(2) Jeder Teilnehmer spielt gegen jeden anderen Teilnehmer genau einmal.
(3) Kein Teilnehmer spielt in zwei aufeinanderfolgenden Spielen.
a
ab
ce
e
b
cd
bc
ae
ad
c
be
d
(a) Der zugehörige Graph
de
bd
ac
(b) Ein erlaubter Spielplan
Abbildung 2.4: Graph für ein Tennisturnier
In der Abbildung 2.4 (a) stellt jede der zehn Verbindungslinien eines der Spiele dar. In der
Abbildung 2.4 (b) ist auch ein Spielplan aufgezeichnet: Die zehn Punkte repräsentieren die Spiele,
und zwei Punkte sind genau dann verbunden, wenn sie keinen gemeinsamen Spieler haben; die
zugehörige Abbildung ist also ein Graph mit 10 Ecken und 15 Kanten. Der fett eingezeichnete
Weg“ liefert eine Lösung für die obigen Bedingungen (1), (2), (3).
”
Das Diagramm haben wir nicht willkürlich gestaltet, sondern eine ästhetisch ansprechende
und einprägsame Form dafür gewählt. Der Graph in Abbildung 2.4 (b) ist der berühmte Petersengraph. Seine Bedeutung liegt in der Liste von Eigenschaften, die er besitzt oder nicht besitzt.
Definition 2.1.5 Sei G(E, K) ein Graph. Eine Ecke e hat Grad d = d(e), wenn die Anzahl der
Kanten, die e als Endecke haben, d ist. Eine Ecke e mit d(e) = 1 heißt Blatt.
Lemma 2.1.6 (Handschlaglemma) Sei G = G(E, K) ein Graph mit k Kanten. Dann gilt:
X
2k =
d(v) .
v∈E
Beweis:
Wir zählen die Paare (v, k), v ∈ E, k ∈ K, ab, für die v Endecke von k ist. Da jede Kante genau
2 Endecken hat, ist die Anzahl einerseits 2k, andererseits trägt jede Ecke v ∈ E mit d(v) zu
dieser Anzahl bei.
Die Wortwahl für das obige Lemma kommt von der Interpretation, dass man sich K als
die Paare von Personen (E) vorstellen kann, die sich per Handschlag begrüßen. Z.B. lesen wir
Stand: 9. Februar 2010
18
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
daraus ab, dass die Anzahl der Personen, die auf einer Party eine ungerade Anzahl von Gästen
mit Handschlag begrüßt haben, gerade ist.
Graphentheorie hat vielfältige Anwendungen; etwa
(-) Reise- oder Transportplanung
(-) Datenstrukturen in der Informatik
(-) Computernetzwerke
(-) Strukturformeln in der Chemie
(-) Anwendungen in der Mathematik
2.2
Wege, Kreise, Zusammenhang
Mit den nun folgenden Begriffen Kantenzug, Weg, Kreis“ können wir etwas über die Feinstruk”
tur von Graphen herausfinden.
Definition 2.2.1 Sei G(E, K) ein Graph.
(a) Sind v0 , v1 , . . . , vl ∈ E, so dass vi mit vi+1 für jedes i = 0, . . . , l − 1 verbunden ist, so
nennen wir W := [v0 , . . . , vl ] einen Kantenzug von v0 nach vl der Länge l .
(b) Ein Kantenzug W = [v0 , . . . , vl ] heißt Weg, falls alle zugehörigen Kanten vi vi+1 paarweise
verschieden sind.
(c) Ein Weg W = [v0 , . . . , vl ] heißt Kreis, falls v0 = vl gilt.
Ohne Beweis führen wir an, dass aus jedem Kantenzug von v0 nach vl ein Weg von v0 nach
vl gemacht werden kann durch Weglassung von Kanten (Beachte die Absprache, dass wir nur
endliche Graphen betrachten).
Beispiel 2.2.2 Betrachte den vollständigen Graphen G4 ; siehe Abbildung 2.2: er hat 4 Ecken
und 6 Kanten; die Dichte ist also 32 . Er enthält Kreise der Länge 3 und 4. Intuitiv sollte man
erwarten, dass ein dichter Graph lange“ Kreise enthalten sollte. Dazu gibt es auch eine präzise
”
Aussage, nämlich den Satz von Dirac (1952), der diese Erwartung bestätigt: gilt für die Dichte
d ≥ 2, so gibt es einen Kreis der Länge größer als d .
Definition 2.2.3 Ein Graph G(E, K) heißt zusammenhängend, wenn je zwei Ecken durch
einen Kantenzug verbindbar sind.
Offenbar ist Verbindbarkeit“ eine Äquivalenzrelation auf der Eckenmenge eines Graphen. Die
”
Äquivalenzklassen bezüglich dieser Relation heißen Zusammenhangskomponenten des Graphen.
Bemerkung 2.2.4 Wir betrachten stets ungerichtete Graphen, d.h. solche, deren Kanten
beim Durchlaufen keine Richtung auszeichnen. Ungerichtete Graphen sind solche, deren Kanten mit einem Pfeil“ dargestellt werden; sie können nur in Pfeilrichtung durchlaufen werden.
”
Gewichtete Graphen sind Graphen, bei denen Kanten ein Gewicht tragen, das die Kosten“
”
angibt, wenn die Kante durchlaufen wird.
Stand: 9. Februar 2010
19
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
Definition 2.2.5 Sei G(E, K) ein Graph.
(a) Ein Weg W = [v0 , . . . , vl ] heißt ein Eulerweg, wenn der Weg jede Kante des Graphen
genau einmal enthält.
(b) Ein Eulerweg heißt ein Eulerkreis, wenn er ein Kreis ist.
(c) Der Graph heißt Eulergraph, falls er einen Eulerkreis enthält.
D
D
a
a
d
e
A
b
e
A
C
C
c
c
B
g
d
g
b
f
f
B
(a) Skizze der Landkarte
(b) Der zugehörige Graph
Abbildung 2.5: Das Königsberger Brückenproblem
Der Begriff Eulerkreis“ stammt von dem vermutlich ältesten graphentheoretisch erfassten
”
Problem, nämlich dem Königsberger Brückenproblem, das seine Lösung durch L. Euler2 im
Jahre 1736 fand. Die Abbildung 2.5 zeigt 4 Landstücke A, B, C, D und 7 Verbindungsbrücken
a, b, . . . , g.
Frage: Ist es möglich, von der Insel A aus einen Spaziergang zu machen, bei dem
man alle Brücken genau einmal passiert und schließlich nach A zurückkehrt?
Übersetzen wir dies in die Graphensprache, so resultiert der Graph aus Abbildung 2.5 (b).
Euler hat die Frage nach einer zulässigen Tour im Königsberger Brückenproblem negativ
beantworten können, indem er zeigte, dass kein Eulerkreis existiert. Dafür gibt es eine sehr
einfache Argumentation. Sie geht so: In jeder Ecke kann man die Anzahl der Kanten zählen,
die dort enden; diese Anzahl ist der Grad der Ecke. Soll es einen Eulerkreis geben, dann muss
jede Ecke offenbar geraden Grad haben. Beim Königsberger Brückenproblem gibt es aber Ecken
ungeraden Grades.
Korollar 2.2.6 Ist G ein Eulergraph, dann hat jede Ecke geraden Grad.
Beweis:
Dies ist die Argumentation von Euler.
Gilt auch die Umkehrung in Korollar 2.2.6? Ja, sie gilt, wenn mann nur zusammenhängende
Graphen betrachtet! Dies ist das Resulat von Hierholzer (1873). Damit ist auch klar, dass Eulergraphen schnell ( in linearer Zeit“) anhand der geraden Eckengrade erkannt werden können.
”
Aber wie konstruiert man einen Eulerweg? Darüber gibt auch das Resultat von Hierholzer Auskunft. Die sehr befriedigende Zusatznachricht ist, dass dies auch sehr schnell ( in linearer Zeit“)
”
bewerkstelligt werden kann.
2
Euler, Leonhard (1707 — 1783)
Stand: 9. Februar 2010
20
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
Definition 2.2.7 Sei G(E, K) ein Graph.
(a) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonweg, wenn der Weg W jede Ecke des Graphen
genau einmal enthält.
(b) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonkreis, wenn W ′ := [v0 , . . . , vl−1 ] ein Hamiltonweg ist und v0 = vl gilt.
Das Problem der Hamiltonkreise ist ungleich tiefliegender als das der Eulerkreise, für Anwendungen aber sehr viel interessanter: es gibt keine Charakterisierungen für Hamiltonkreise, für
Eulerkreise schon.3
(a) Dodekaeder
(b) Tetraeder
(c) Würfel
Abbildung 2.6: Hamiltonkreise
Bekanntlich gibt es fünf reguläre Körper/platonische Körper: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder. Dies zu zeigen, ist die Theorie der Graphen ein entscheidendes
Hilfsmittel, ebenso dafür, das bekannte Färbungsproblem, das wir unten noch kennenlernen
werden, zu lösen. Hamilton fragte nach einem Hamiltonkreis im Graphen, der dem Kantenweg
auf dem Dodekaeder entspricht. Die Abbildung 2.6 (a) gibt die Antwort. In Abbildung 2.6 (b),
(c) finden wir Hamiltonkreise zu anderen regulären Körpern. Dabei verwenden wir die sogenannten Schlegel–Diagramme für die platonischen Körper: Projektionen der Körper auf eine
Zeichenebene von einem Punkt über dem Körper.
Euler behandelte schon das Problem des
Rösselsprungs auf einem n × n–Schachbrett.
Gefordert ist, dass der Springer von einem
Feld beginnend mit kontinuierlichen Zügen alle Felder genau einmal berührt (und dann
eventuell wieder zu seinem Ausgangspunkt
zurückkehrt).
Nehmen wir ein (quadratisches) Schachbrett mit n2 Feldern und verbinden wir zwei
Ecken, wenn sie durch einen Springerzug verbunden sind; es resultiert ein Graph. Dann ist
die Frage nach einem Hamiltonweg bzw. Hamiltonkreis klar.4 In Abbildung 2.7 ist ein Hamiltonweg für den Rösselsprung auf einem 9 ×
9–Schachbrett aufgeführt.
5
2
7
80
77
74
11
16
13
8
79
4
1
10
81
14
75
18
3
6
9
78
73
76
17
12
15
32
29
34
69
66
63
24
19
22
35
68
31
72
27
70
21
64
25
30
33
28
67
62
65
26
23
20
39
36
41
56
71
58
47
52
49
42
55
38
61
44
53
50
59
46
37
40
43
54
57
60
45
48
51
Abbildung 2.7: Rösselsprung
3
Spezielle Aufgaben, die sich mit der Problematik Hamiltonweg/Hamiltonkreis beschäftigen, sind viel älter als
die Graphentheorie.
4
Das Studium der Hamiltonwege und Hamiltonkreise wurde 1856, etwa gleichzeitig, von Kirkmann und Hamilton angeregt.
Stand: 9. Februar 2010
21
c J.Baumeister
KAPITEL 2. GRAPHEN
2.3. PLANARE GRAPHEN
Wie oben schon angemerkt, Hamiltongraphen lassen sich nicht so einfach charakterisieren wie
Eulergraphen. Da die Ordnung n eines Graphen stets die Länge eines Hamiltonkreises angibt,
kann man einen Hamiltonkreis dadurch finden, dass man alle n-elementigen Teilmengen der
Kantenmenge daraufhin überprüft, ob sie einen Hamiltonkreis darstellen. Dies ist bei dichten
Graphen ein sehr aufwändiges Verfahren. Es ist aber kein sehr viel schnelleres Verfahren bekannt,
ja es sieht so aus, als gebe es kein sehr viel schnelleres Verfahren; siehe nächstes Kapitel.
Die Suche nach notwendigen und hinreichenden Bedingungen für die Existenz eines Hamiltonweges hat ein umfangreiches Gebäude von neuen Begriffen und Fragestellungen hervorgebracht.
2.3
Planare Graphen
Wir haben schon darauf hingewiesen, dass wir üblicherweise einen Graphen G(E, K) durch
ein Punkt–Linien–System in der Ebene veranschaulichen. Gibt es eine Darstellung, in der die
Kanten von G sich nur an Ecken treffen aber niemals dazwischen, so sagen wir, der Graph G ist
plättbar und nennen den so darstellbaren Graphen einen ebenen Graphen (enbettbar in die
Ebene). Isolierte Ecken spielen dabei keine Rolle, sie können ja irgendwohin platziert werden,
allerdings darf keine Kante über eine isolierte Ecke laufen. In Abbildung 2.8 sind einige ebene
Graphen dargestellt. Dort sieht man auch, wie der Graph zum Haus vom Nikolaus plättbar ist.
Ist G(E, K) ein ebener Graph, so zerlegen die Kanten die Ebene in endlich viele (topologisch)
zusammenhängende Gebiete, von denen genau eines, das äußere“ Gebiet, nicht beschränkt ist.
”
Zusammenhängend bedeutet hier (etwas oberflächlich): Wir können zwischen je zwei Punkten
des Gebietes mit Bleistift (ohne abzusetzen) eine Linie ziehen, die das betreffende Gebiet nicht
verläßt. Der Grund dafür ist der berühmte Jordansche Kurvensatz:
Eine geschlossene Jordankurve γ zerlegt die Ebene in zwei topologisch zusammenhängende Gebiete, von denen genau eines nicht beschränkt ist.
Dies heißt: Zwei Punkte der Ebene können genau dann durch eine Jordan–Kurve
verbunden werden, die γ nicht trifft, wenn sie entweder beide im Inneren oder beide
im Äußeren von γ liegen.
So einleuchtend dieser Satz auch ist, sein Beweis ist alles andere als leicht.
6
1
3
4
2
5
(a)
(b)
(c)
Abbildung 2.8: Beispiele für ebene Graphen
Wir wollen nun erläutern, wie das Färbungsproblem für Landkarten mit den Resultaten der
Graphentheorie zusammenhängt.
Wir können also unterstellen, dass bei einem ebenen Graphen die Linien (die für die Kanten stehen) die Ebene in endlich viele topologisch zusammenhängende Gebiete zerlegen. Diese
Gebiete wollen wir Länder nennen.
Stand: 9. Februar 2010
22
c J.Baumeister
KAPITEL 2. GRAPHEN
2.3. PLANARE GRAPHEN
Haben wir umgekehrt eine reale Landkarte“ L gegeben, so können wir L sofort einen ebenen
”
Graphen G(E, K) zuordnen: Die Ecken E sind die Schnittpunkte verschiedener Grenzen und die
Kanten sind die zwischen Schnittpunkten verlaufenden Grenzlinien; eine Insel wird als Punkt
und seine Grenze als Schlinge dargestellt. Wir halten ausdrücklich fest: Länder grenzen entlang
einer Grenzlinie aneinander, nicht nur in einem Punkt, und die Länder sind zusammenhängend,
d.h. je zwei Punkte eines landes sind durch einen Streckenzug verbindbar, der das Land nicht
verlässt.
Definition 2.3.1 Eine Landkarte L(E, K, L) ist ein ebener Graph G = G(E, K) zusammen
mit den zu G gehörenden Ländern L . Länder, die eine gemeinsame Grenze haben, nennen wir
benachbart.
Definition 2.3.2 Eine Färbung einer Landkarte L(E, K, L) ist eine Färbung der Länder mit
endlich vielen verschiedenen Farben, und zwar so, dass Länder, die eine gemeinsame Grenzkante
besitzen, stets verschiedene Farben erhalten.
Mit diesen Begriffen können wir nun den 4–Farben–Satz formulieren:
Für jede Landkarte reichen 4 Farben für eine Färbung aus.
Der 4–Farben–Satz hat eine interessante Geschichte, die Beweisversuche dazu haben viel zur
Entwicklung der Graphentheorie beigetragen. Schon 1878 legte A. Kempe einen Beweisversuch
für den 4–Farben Satz vor. Obwohl Kempes Beweis einen Fehler enthielt – er wurde 1890 von
Heawood entdeckt –, so vereinigte er doch nahezu alle Ideen, die zur endgültigen Lösung 100
Jahre später geführt haben. Der 5–Farbensatz von Heawood aus dem Jahre 1898 sagt, dass stets 5
Farben ausreichen. Ein korrekter Beweis für den 4–Farbensatz wurde 1976 von Appel und Haken
vorgelegt. Allerdings wurde der Beweis von der mathematischen Welt mit gemischten Gefühlen
aufgenommen, denn der Beweis wurde geführt unter massivem Einsatz von Computern. Es gibt
nun einen Beweis, der zwar immer noch nicht ohne Computer auskommt, der diesen aber schon
reduziert einsetzt.
Nach der Skizzierung des 4–Farbensatzes liegt es auf der Hand, was Färbungen von Graphen
sein sollen: benachbarte Ecken sollen unterschiedliche Farben erhalten. Wir werden diese Frage
im Kapitel über Abbildungen wieder aufgreifen. Hier nur ein Beispiel, das einen Anwendungshintergrund der Problematik aufzeigt.
Beispiel 2.3.3 In einem Zoo soll der Aquariumsbereich umgebaut werden und dazu Notbecken
aufgestellt werden. Dabei ist zu berücksichtigen, dass gewisse Fischarten sich nicht vertragen
und daher nicht in ein gemeinsames Becken eingebracht werden dürfen. Es ist das Ziel, mit
möglichst wenig Notbecken auszukommen.
Seien 1, . . . , N die unterschiedlichen Fischarten; sie dienen als Ecken eines Graphen. Zwei
Fischarten sind durch eine Kante verbunden, wenn sie sich nicht vertragen. Es entsteht ein
Graph. Jeder Fischart soll nun eine Farbe – sie steht für ein Becken – so zugeordnet werden,
dass Knoten, die mit einer Kante verbunden sind, eine unterschiedliche Farbe erhalten.
Kommen wir zu planaren Graphen zurück. Jedem planaren Graphen können Fächen zugeordnet werden; eines davon ist die Außenfläche.
Stand: 9. Februar 2010
23
c J.Baumeister
KAPITEL 2. GRAPHEN
2.4. BÄUME
Satz 2.3.4 (Eulerscher Polyedersatz) Sei G = G(E, K) ein planarer zusammenhängender
Graph mit n = #E, m = #K und f Flächen. Dann gilt:
n+f −m = 2
(2.1)
Beweis:
Den Beweis können wir hier noch nicht führen. Er bedient sich im Allgemeinen der vollständigen
Induktion und der speziellen Graphen Bäume“; siehe unten. Für m = 0 können wir die Rich”
tigkeit aber erkennen. Hier muß nämlich n = f = 1 sein (Zusammenhang!).
2.4
Bäume
Eine weitere einfache, aber wichtige Graphenklasse ist die der Bäume. Bäume sind beispielsweise
als Datenstrukturen in der Informatik und bei der Betrachtung von elektrischen Netzwerken von
großer Bedeutung.5
Definition 2.4.1 Ein Graph heißt Baum, wenn er zusammenhängend ist und keine Kreise
enthält.
Ein Baum heis̈t Binärbaum, wenn der Grad einer jeden Ecke höchstens zwei ist.
In Abbildung 2.9 sind im wesentlichen alle“ Bäume mit höchstens 6 Ecken aufgeführt.
”
(a) Alle Bäume mit höchstens 5 Ecken
(b) Alle Bäume mit 6 Ecken
Abbildung 2.9: Alle Bäume mit höchstens 6 Ecken
Ein Ereignisbaum ist ein Hilfsmittel, das es uns erlaubt, alle möglichen Ergebnisse einer
Folge von Experimenten abzuzählen, wenn bekannt ist, dass jeweils nur endlich viele Ergebnisse
möglich sind. Wir erläutern dies an folgendem Beispiel.
Beispiel 2.4.2 Mark und Erich bestreiten eine Tennisauseinandersetzung: Wer zuerst zwei
Sätze hintereinander oder insgesamt drei Sätze gewonnen hat, gewinnt die Auseinandersetzung.
Alle möglichen Ergebnisse des Wettkampfes entsprechen den Worten
MM,MEMM,MEMEM,MEMEE,MEE,EMM,EMEMM,EMEME,EMEE,EE .
Der Weg von der Wurzel des Baumes bis zum Endpunkt gibt an, wer jeweils den Wettkampf
gewonnen hat.
Bäume lassen sich ziemlich einfach charakterisieren. Wir geben drei äquivalente Charakterisierungen ohne vollständigen Beweis an.
5
Historisch gesehen, stammt das Interesse aus der Chemie im Zusammenhang mit der Darstellung von Kohlenwasserstoffverbindungen.
Stand: 9. Februar 2010
24
c J.Baumeister
KAPITEL 2. GRAPHEN
2.5. ÜBUNGEN
Fisch
1
2
3
4
5
6
7
8
9
10
11
12
Satz 2.4.3 Sei G ein Graph mit n Ecken. Es sind
äquivalent:
(a) G ist ein Baum.
(b)
Je zwei Ecken des Graphen sind durch genau
einen Weg verbunden.
(c)
G ist zusammenhängend, aber für jede Kante k
von G ist der Graph G′ := G(E, K\{k}) nicht
zusammenhängend.
(d) G ist zusammenhängend und besitzt genau n −
1 Kanten.
(e)
G besitzt keinen Kreis und besitzt genau n − 1
Kanten.
Unverträglich mit
3,6,7
1,3,6,7
6,8,9,10
1,2,6
11,12
3,7
1,2,3,4
3,6,7,9,10,11
3,6,7
1,3,6,7
1,3,6,7
5,6,8
Abbildung 2.10: Fischbeckenproblem
Beweis:
Wir beweisen nicht alle Implikationen.
a) =⇒ b).
Da ein Baum zusammenhängend ist, gibt es stets einen Weg, der zwei beliebige Ecken verbindet.
Annahme, es gibt mindestens zwei Wege, die ein gegebenes Paar e, e′ von Ecken verbindet. Wenn
beide Wege keine Kante gemeinsam haben, bilden sie einen Kreis: wir laufen den einen Weg von
e nach e′ und laufen nun den zweiten Weg von e′ nach e . Enthalten die beiden Wege eine
gemeinsame Kante, dann finden wir wieder einen Kreis, denn die beiden Wege treffen sich nun
in einer Ecke e′′ , die beide Wege gemeinsam haben. In jedem Falle haben wir, dass der Graph
einen Kreis enthält. Widerspruch!
b) =⇒ c).
Es ist klar, dass G zusammenhängend ist. Sei k = uv eine Kante mit Endecken u, v . Dann ist
[u, v] der einzige Weg, der u, v verbindet; in G′ := G(E, K\{k}) können also u, v nicht durch
einen Weg verbunden sein. Also kann G′ nicht zusammenhängend sein.
c) =⇒ d).
Auf Graphen kennen wir die Äquivalenzklassen der Zusammenhangskomponenten; siehe oben.
Der zusammenhängende Graph G hat eine Zusammenhangskomponente. Nimmt man eine Kante
{k} weg, entsteht ein Graph G′ := G(E, K\{k}), der zwei Zusammenhangskomponenten hat.
Nach Wegnahme aller Kanten hat der entstandene Graph n keine Kante ist mehr und daher n
Zusammenhangskomponenten. Also muss es n − 1 Kanten im Graphen geben.
2.5
Übungen
2.)
Sei G = G(E, K) ein Graph. Der Komplementgraph G von G hat als Eckenmenge
E und als Kantenmenge alle möglichen Kanten zwischen den Ecken, mit Ausnahme der
Kanten in G . Finde den Komplementgraph zum Haus vom Nikolaus“.
”
Jeder Graph mit mindestens zwei Ecken desselben Grades.
3.)
Mindestens einer der Graphen G, G ist zusammenhängend.
4.)
Sei G ein Graph mit n Ecken. Zeige: Gilt d(e) ≥
zusammenhängend.
5.)
Zeige: Ein Kreis in einem Graphen ist bipartit genau dann, wenn alle Ecken gerade sind.
1.)
Stand: 9. Februar 2010
25
1
2 (n
− 1) für alle Ecken, dann ist G
c J.Baumeister
KAPITEL 2. GRAPHEN
2.5. ÜBUNGEN
6.)
Zeige: Jeder endliche Baum hat mindestens zwei Blätter.
7.)
Beweise in Satz 2.4.3 die Implikation a) =⇒ b) .
8.)
Ist der vollständige bipartite Graph Gn,n+1 ein Hamiltongraph?
9.)
Ist der Petersengraph ein Hamiltongraph?
10.) Gibt es einen interessanten“ Graphen, der zugleich eulersch und hamiltonsch ist?
”
11.) Versuche den arithmetischen Ausdruck (in Maple-Schreibweise)
((a+b) * (c-d-7))/(23 * e)
als Binärbaum darzustellen. Wieviele Blätter hat eine solche Darstellung.
12.) Sei G = G(E, K) ein Graph. Zeige, dass die Anzahl der Ecken von ungeradem Grad
stets gerade ist.
Hinweis: Handschlaglemma und Aufspaltung“ des Graphen in Ecken mit geradem Grad
”
und Ecken mit ungeradem Grad.
13.) Betrachte die Graphen
a
b
c
d
e
b
a
e
h
g
f
c
(a)
d
(b)
(a)
Bestimme einen Eulerkreis im Graphen (a).
(b) Gibt es einen Eulerkreis im Graphen (a), wenn man die Kante, die f mit e verbindet,
wegnimmt?
(c)
Bestimme einen Hamiltonkreis im Graphen (b).
14.) Betrachte das Fischbeckenproblem aus Beispiel 2.3.3 für N = 12 Fische. Die Unverträglichkeiten gibt die Tabelle 2.10 wieder. Zeichne mit Maple einen Graphen, der das
Problem beschreibt und finde eine Lösung.
Stand: 9. Februar 2010
26
c J.Baumeister
Kapitel 3
Algorithmen und Programme
Für die Formulierung von Lösungsverfahren, die auf einem Computer realisiert werden sollen,
bedient man sich des Algorithmus“. Hier skizzieren wir, worauf es bei Algorithmen ankommt,
”
und geben erste Beispiele. Für die Analyse von Algorithmen ist der Begriff Abbildung“ hilfreich.
”
Die zuletzt betrachtete Struktur Graphen“ ist beim Studium von Algorithmen von Bedeutung.
”
3.1
Algorithmen
Ein Computer ist ein Werkzeug zur Verarbeitung und Speicherung von Information. Um ihn zu
nutzen, ist er mit Verarbeitungsvorschriften zu füttern“. Wir formulieren solche Vorschriften
”
in der Regel unter dem Stichwort Algorithmus.
Ein Algorithmus1 für eine vorgegebene bestimmte Art von Aufgaben ist eine endliche
Abfolge von wohldefinierten, ausführbaren Vorschriften, die bei Abarbeitung, ausgehend von einem Eingangszustand (Input) nach einer endlichen Anzahl von Verarbeitungsschritten einen Ausgangszustand (Output) bestimmen, der als Lösung der durch
den Eingangszustand charakterisierten Aufgabe angesehen werden kann.
Algorithmen sind unabhängig von einer konkreten Programmiersprache und einem konkreten
Computertyp, auf denen sie ausgeführt werden.
Beispiel 3.1.1 Betrachte folgende Liste von Anweisungen:
EIN: Natürliche Zahl n .
step 1 k := 1, a := n .
step 2 Ist a (
= 1, dann gehe zu AUS.
3a + 1 falls a ungerade
step 3 a :=
a/2
falls a gerade
step 4 k := k + 1, gehe zu step 2.
AUS: Mit k die Länge der erzeugten Zahlenfolge.
Die Rechenschritte erklären sich selbst: ausgehend von n wird eine Folge von natürlichen
Zahlen erzeugt, eine so genannte Collatz/Uhlam/Warring-Folge.
Ist dies ein Algorithmus? NEIN, denn es ist nicht sichergestellt, dass die Abfrage
”
Ist a = 1, dann gehe zu AUS“
1
Die Bezeichnung leitet sich aus dem Namen Al–Khwarizmi (Al–Khwarizmi,780? — 850?), einem der bedeutensten Mathematiker des anfangenden Mittelalters, ab.
27
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.2. PROGRAMME UND PROGRAMMIERSPRACHEN
irgendwann zur Beendigung führt.
ABER: Bisher hat man keine natürliche Zahl gefunden, bei der die obige Liste von Anweisungen
nicht endet.
Unterschiedliche Algorithmen können entworfen werden zur Lösung ein und derselben Aufgabe. Leistungsunterschiede lassen sich herausarbeiten, wenn man ihren Aufbau und ihre Wirkungsweise analysiert. Fragestellungen dafür sind:
• Entwurf von Algorithmen: Wie soll ein Algorithmus zur Lösung einer bestimmten
Aufgabe aussehen?
• Berechenbarkeit: Gibt es Aufgaben, für die kein Algorithmus existiert?
• Komplexität: Wie läßt sich der Aufwand, der betrieben werden muss, um eine Problemklasse von Aufgaben zu lösen, bestimmen/abschätzen?
• Korrektheit: Wie läßt sich nachweisen, ob ein vorliegender Algorithmus die Aufgabe
korrekt löst?
• Robustheit/Zuverlässigkeit: Wie groß ist die Problemklasse von Aufgaben, die der
Algorithmus löst?
• Genauigkeit: Was ist die Qualität der Lösung, wenn numerisches Rechnen nötig ist?
Hauptziel der Analyse ist die Effizienzuntersuchung und die Entwicklung effizienterer Algorithmen. Diese Analyse sollte aber rechnerunabhängig durchgeführt werden. Dazu benötigt
man ein geeignetes Rechnermodell. Solche Modelle stehen zur Verfügung! Wir wollen hier nicht
darauf eingehen, unsere Analyseuntersuchungen stützen wir auf die Ermittlung des Rechenaufwands, ausgedrückt durch die Anzahl von elementaren Operationen. Hierbei kann man drei
Ansätze unterscheiden:
– Worst-case-Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit
vom Input.
– Mittlere Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit
vom Input bei gewissen Annahmen über das Auftreten des Inputs in der Problemklasse.
– Untere Komplexität: Hierunter versteht man die Ermittlung unterer Schranken für den
zu betreibenden Aufwand.
Diese Ansätze können rechnerunabhängig und a-priori erfolgen, d.h. ohne den Algorithmus zu
testen. Unter einer a-posteriori–Analyse versteht man das Testen des Algorithmus an Aufgaben
mit (hinreichend) großem Input.
3.2
Programme und Programmiersprachen
Die konkrete Ausführung eines Algorithmus nennt man einen Prozess. Die Einheit, die den
Prozess ausführt, ist ein Prozessor. Beim Kuchenbacken ist der Algorithmus das Rezept, der
Prozess die Abarbeitung des Rezepts, der Prozessor der Koch. Hier denken wir natürlich an
den Prozessor Computer“. Um eine Analyse des Ablaufs eines Algorithmus auf diesem Pro”
zessor vornehmen zu können, ist ein geeignetes Modell für den Computer (Maschinenmodell)
Stand: 9. Februar 2010
28
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.2. PROGRAMME UND PROGRAMMIERSPRACHEN
bereitzuhalten. Die Informatik studiert u.a. die Turing-Maschine und die Random-AccessMaschine (RAM), welche in gewissem Sinne sogar äquivalent sind. Die Analyse von Algorithmen auf einem abstrakten Niveau ist eine Disziplin der Informatik und/oder mathematischen
Informatik.
Die Hardware-Komponenten eines Computers sind
• Zentraleinheit (CPU)
• Speicher (Memory)
• Ein- Ausgabegeräte (Input, Output Devices)
Die Merkmale, die einen Computer bezüglich Hardware kennzeichnen sind Geschwindigkeit,
Speichergröße, Zuverlässigkeit, Kosten, Vernetzbarkeit.
Die Ausführung eines Algorithmus auf einem Prozessor setzt voraus, dass der Computer den
Algorithmus interpretieren können muss, d.h. er muss
• verstehen, was jeder Abarbeitungsschritt bedeutet,
• die jeweilige Operation ausüben können.
Dies leisten die Programmiersprachen. Die Algorithmen werden damit in Programmen aufgeschrieben; die einzelnen Schritte heißen nun (Programm–)Anweisung, Befehl. Bei einfachen Programmiersprachen (Maschinensprachen) kann jede Anweisung direkt vom Computer interpretiert werden. Da nur elementare Operationen damit erfaßt werden, muß man sehr
lange Programme schreiben. Zur Vereinfachung der Programmierung wurden höhere Programmiersprachen entwickelt. Programme in solchen Programmiersprachen können nicht direkt
durch den Computer interpretiert werden, sie werden durch Übersetzungsprogramme in die
Maschinensprache überführt. Der Übergang von Maschinensprachen zu höheren Programmiersprachen ist fließend. Es gibt eine ganze Hierarchie von Programmiersprachen:
• Basic, Fortran
• Algol
• Pascal, C, C++, Java
Auf Computern kann man Programme auf Vorrat“ für bestimmte Aufgaben ablegen. Diese
”
Sammlung von Programmen nennt man Software. Man unterscheidet
• Anwendungssoftware (Textverarbeitungssoftware, Statistiksoftware, . . . )
• Systemsoftware (Betriebssystem, Editor, Compiler, . . . )
Besonderen Stellenwert nehmen Software-Pakete ein wie Maple, Mathematica, Derive,
Matlab, Cinderella, die alle eine spezielle Ausrichtung haben: symbolisches Rechnen die
ersten drei, numerisches Rechnen Matlab und geometrisches Rechnen das letzte.
Stand: 9. Februar 2010
29
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.3
3.3. ORDNUNG UND LISTEN
Ordnung und Listen
Bei den natürlichen Zahlen 1,2,3,. . . – und nicht nur dort – verwenden wir das Ungleichungszeichen “≤“. Es hat die Eigenschaften (x, y, z ∈ N)
x ≤ x;
x ≤ y und y ≤ x =⇒ y = x ;
x ≤ y und y ≤ z =⇒ x ≤ z ;
x ≤ y oder y ≤ x .
Wir nehmen dies zum Anlaß für
Definition 3.3.1 Sei X eine Menge. Eine Teilmenge O ⊂ X × X heißt Halbordnung von X,
falls gilt:
(i) Für alle x ∈ X gilt (x, x) ∈ O.
(ii) (x, y) ∈ O , (y, x) ∈ O =⇒ y = x .
(iii) (x, y), (y, z) ∈ O =⇒ (x, z) ∈ O .
Ist zusätzlich noch
(iv) Für alle x, y ∈ X gilt (x, y) ∈ O oder (y, x) ∈ O
erfüllt, dann heißt O eine Ordnung von X.
O
Meist schreibt man bei Vorliegen einer Halbordnung O statt (x, y) ∈ O auch x ≤ y oder kurz
x ≤ y , wenn der Zusammenhang klar ist.
Beispiel 3.3.2 Ist X eine Menge, dann ist in P OT (X) eine Halbordnung O definiert durch
(A, B) ∈ O : ⇐⇒ A ≤ B : ⇐⇒ A ⊂ B .
Beachte, dass nur in trivialen Fällen eine Ordnung vorliegt.
Beispiel 3.3.3 Sei A ein (endliches) Alphabet und seien An die Wörter der Länge n über dem
Alphabet A . Sei in A eine Ordnung ≤ gegeben.
Wir setzen für a = a1 . . . an , b = b1 . . . bn ∈ An :
a ≤ b : ⇐⇒ a = b oder ak ≤ bk für das kleinste k mit ak 6= bk .
lex
Dann ist ≤ eine Halbordnung in An . Man nennt sie die lexikographische Halbordnung. Als
lex
Anwendung ordne man
0002, 0008, 0013, 0029, 0132, 1324
als Worte über dem in natürlicher Weise angeordneten Alphabet A := {0, 1, 2, . . . , 9} .
Eine Liste besteht aus einer Sammlung von wohlbestimmten und wohlunterscheidbaren Objekten und ihrer Anordnung nach einem Prinzip; die leere Liste ist zugelassen.
Stand: 9. Februar 2010
30
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.4. SORTIEREN
Die Anordnung kann nach dem chronologischen Prinzip, nach einem alphabetischen Prinzip oder
allgemein mit einer Ordnung erfolgen. Kennt man alle Objekte der Liste, so kennt man die Liste;
Hat die Liste nur ganz wenige Elemente, so kann man sie einfach alle innerhalb einer eckigen
Klammer – damit machen wir den Unterschied zu Mengen klar – hinschreiben, durch Kommata
getrennt, auf die Reihenfolge kommt es hierbei offenbar an.
Maple - Illustration 3.1
Maple kennt den Datentyp Liste. Eine Liste ist eine in eckige
Klammern eingeschlossene Folge von Ausdrücken, Objekten.
Die Zahl der Einträge in einer
Liste erhält man mit dem Befehl nops. Das k-te Element einer Liste kann man sich durch
Anhängen des Index k an den Listennamen besorgen.
3.4
> L1:= [2,3,rot,Hahn,rot] ;
L1:= [2,3,rot,Hahn,rot]
> nops(L1);
5
> L1[4];
Hahn
Sortieren
Sei M eine endliche Menge mit n Elementen und versehen mit einer Ordnung ≤ . Sortieren heißt, die Elemente von M so anzuordnen, daß sie bzgl. der Ordnung ≤ eine aufsteigende
Elementfolge bilden. Sortierverfahren werden benötigt etwa bei: Einordnen von Schlüsseln im
Werkzeugkasten, Ordnen der erhaltenen Karten beim Skatspiel, Sortieren von Dateien der Größe
nach. Gesichtspunkte für die Leistungsfähigkeit eines Sortierverfahrens sind:
Schnelligkeit. Wieviele Rechenoperationen (Vergleiche, Umstellen in einer Liste) in Abhängigkeit von n sind nötig? Dieser Aufwand wird Laufzeitkomplexität des Verfahrens genannt.
Speicherplatz. Im allgemeinen kann man sich die Elemente der Menge abgelegt in Fächern
vorstellen. Beim Sortieren kann es sinnvoll sein, Zusatzfächer zu benutzen. Der Bedarf an
Fächern in Abhängigkeit von n ist die Speicherplatzkomplexität des Verfahrens.
Sei nun eine Menge M = {a1 , . . . , an } vorgegeben. Wir denken uns die Elemente a1 , . . . , an
jeweils einzeln in einer Liste (Feld von Fächern) abgelegt. Wir sortieren diese Liste, indem wir
die Objekte in den Fächern irgendwie solange austauschen, bis sie angeordnet in den Fächern
liegen.
Sortieren durch Auswählen (Selection–sort).
Hier geht man folgendermaßen vor:
• Finde das kleinste Element und tausche es gegen das an der ersten Stelle befindliche Element (1. Schleife).
• Fahre in dieser Weise jeweils auf dem Rest des Feldes, das noch nicht sortiert ist fort (i–te
Schleife).
Man stellt leicht fest, dass in der i–ten Schleife n − i Vergleiche und eventuell ein Austausch
anfallen: Wegen
n−1
X
i=1
(n − i) =
Stand: 9. Februar 2010
n−1
X
j=1
1
1
j = ((1 + · · · + n − 1) + (n − 1 + · · · + 1)) = n(n − 1)
2
2
31
(3.1)
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.4. SORTIEREN
gilt für die Komplexität: Es fallen etwa n2 /2 Vergleiche und etwa n Austausche an. Auf den
Aufwand“ −n/2 bei den Vergleichen und −1 beim Austauschen kann man für große n verzich”
ten; etwa“ bedeutet diese Vernachlässigung, wir schreiben dafür meist ∼. Hierzu ein Beispiel,
”
wobei hier die Elemente die Buchstaben des Alphabets in ihrer alphabetischen Ordnung sind.
Anwendung von Selection–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (a).
EXAMPLE
AXEMPLE
AEXMPLE
AEEMPLX
AEELPMX
AEELMPX
EXAMPLE
EXAMPLE
AEXMPLE
AEMXPLE
AEMPXLE
AELMPXE
AEELMPX
EXAMPLE
EAXMPLE
AEXMPLE
AEMXPLE
AEMPXLE
AEMPLXE
AEMLPXE
AELMPXE
AELMPEX
AELMEPX
AELEMPX
AEELMPX
EXAMPLE
EEAMPLX
EEALPMX
EEALMPX
EEAL
EEA
AEE
A
E
E
AEELMPX
(a) Selection–sort
(b) Insert–sort
(c) Bubble–sort
(d) Quick–sort
M
L
L
L
PX
M P X
M P X
M
P
X
Sortieren durch Einfügen (Insert–sort). Betrachte die Listenelemente der Reihe nach und
füge jedes an seinem richtigen Platz zwischen den bereits betrachteten ein, wobei diese sortiert
bleiben. Das gerade bestimmte Element wird eingefügt, indem die größeren Elemente um eine
Position nach rechts geschoben werden und das betrachtete Element auf dem frei gewordenen
Platz eingefügt wird.
Anwendung von Insert–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (b). Man stellt
fest, dass für die Laufzeitkomplexität gilt: ∼ n2 /2 Vergleiche , ∼ n2 /4 Austausche .
Sortieren durch Austausch (Bubble–sort). Durchlaufe immer wieder das Feld und vertausche jedesmal, wenn es notwendig ist, benachbarte Elemente; wenn beim Durchlauf kein
Austausch mehr nötig ist, ist das Feld sortiert. Anwendung von Bubble–sort auf unser Beispiel
EXAMPLE ergibt die Sequenz (c). Man stellt fest, dass für die Laufzeitkomplexität gilt:
∼ n2 /2 Vergleiche , ∼ n2 /2 Austausche .
Sortieren nach Quick–sort. Dies ist der wohl am meisten angewendete Sortieralgorithmus.
Seine Idee geht auf C.A.R. Hoare (1960) zurück. Es ist ein Vorgehen, das vom Typ Teile und
Herrsche (divide et impera, divide and conquer) ist und auf einem Zerlegen des Feldes in zwei
Teile und anschließendem Sortieren der Teile unabhängig voneinander beruht. Auf die Teile
kann nun diese Idee wieder angewendet werden: Das Verfahren ist rekursiv, d.h. es ruft sich
selbst (auf kleinerer Stufe) wieder auf. Wir kommmen im nächsten Kapitel auf das Prinzip
Rekursivität“ zurück.
”
Eine entscheidende Bedeutung kommt der Zerlegung eines Feldes zu. Es soll (zweckmäßigerweise) so erfolgen, dass gilt: Wird das Feld mit Hilfe des Elements ar zerlegt, so soll dies bedeuten:
(1) ar befindet sich an seinem endgültigen Platz;
(2) für alle j < r gilt aj ≤ ar ;
(3) für alle j > r gilt aj ≥ ar .
Bei jedem rekursiven Schritt wird eine solche Zerlegung benötigt. Wie findet man eine solche
Zerlegung? Hier ist die Realisierung:
Stand: 9. Februar 2010
32
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
• Wähle irgendein ar .
• Durchsuche das Feld von links, bis ein Element gefunden ist, das nicht kleiner als ar ist,
und durchsuche das Feld von rechts, bis ein Element gefunden ist, das nicht größer als ar
ist. Tausche die so gefundenen Elemente.
• Wiederhole den obigen Suchprozess solange, bis sich die Suche von links und rechts bei
einem Element trifft. Nun ist das Element ar mit dem Element zu tauschen, bei dem sich
die Suche von links und rechts getroffen hat.
Ist das Feld nun zerlegt (Start), das Startfeld ist also nun a1 , . . . , ar , . . . , an , wird das Sortierverfahren auf die Teile a1 , . . . , ar−1 und ar+1 , . . . , an angewendet; als trennende Elemente
können nun etwa die Elemente ar−1 und an verwendet werden. Anwendung von Quick–sort auf
unser Beispiel EXAMPLE ergibt die Sequenz (d) (M ist beim Start das trennende Element).
Das Beste, was bei Quick–sort passieren könnte, ist, dass durch jede Zerlegung das Feld
genau halbiert wird. Dann würde die Anzahl Cn der von Quick–sort benötigten Vergleiche der
rekurrenten Beziehung vom Typ Teile und Herrsche“ genügen (n gerade!): Cn = 2C n2 + n .
”
Dabei ist 2C n2 der Aufwand für das Sortieren der zwei halbierten Felder und n der Aufwand für
die Zerlegung. Man kann zeigen, dass Cn = n log2 n gilt; wir kommen im Zusammenhang mit der
(vollständigen) Induktion darauf zurück. Für den allgemeinen Fall zeigt eine etwas aufwendigere
Analyse Cn = 2n ln n . log2 n ist der Logarithmus zur Basis 2, d.h. log2 ist die Umkehrfunktion
der Funktion a 7−→ 2a . ln n ist der natürliche Logarithmus, d.h. ln ist die Umkehrfunktion der
Funktion a 7−→ ea mit der Eulerschen Zahl e . Es gilt: 2n ln n ∼ 1.38n log2 n .
Eine wichtige Begriffsbildung ist die Laufzeitkomplexität im Mittel eines Verfahrens.
Damit ist hier gemeint, wieviele Rechenschritte ein Sortierverfahren benötigt, wenn es auf ein
zufällig“ vorsortiertes Feld angewendet wird. Diese Begriffsbildung können wir erst diskutieren,
”
wenn wir wissen, was zufällig“ heißen soll, und wie ein zufällig“ vorsortiertes Feld hergestellt
”
”
werden kann. Hier spielen Zufallszahlengeneratoren eine Rolle, wie wir sie in Abschnitt ?? besprechen werden.
3.5
Computerzahlen
In einer Grundvorlesung über Analysis beweist man folgenden Satz:
Satz 3.5.1 Sei g eine Zahl in N mit g ≥ 2 . Für jedes x ∈ R, x 6= 0, gibt es genau eine
Darstellung der Gestalt
∞
X
n
x = σg
x−k g−k
(3.2)
k=1
mit σ ∈ {+, −}, n ∈ Z und x−k ∈ {0, 1, . . . , g−1}, wenn man von den Zahlen x−k noch zusätzlich
fordert, dass x−1 6= 0 und dass zu jedem n ∈ N ein Index k ≥ n existiert mit x−k 6= g − 1 .
Wichtige Spezialfälle von Satz (3.5.1) sind g = 10 (Dezimalsystem), g = 2 (Dualsystem), g =
8 (Oktalsystem) und g = 16 (Hexadezimalsystem). Beim Hexadezimalsystem benötigen wir
zusätzlich Ziffern“, da man etwa 12 nicht als Ziffer verwenden will. Man wählt
”
0, 1, . . . , 9, A, B, C, D, E, F .
In (3.2) ist also die Zahl x durch eine Reihe dargestellt, wobei der ganze Anteil“ (gn ) abge”
spaltet wurde, die Forderung x−1 6= 0“ macht diese Abspaltung eindeutig. g heißt Basis der
”
Darstellung, welche im Allgemeinen eine gerade Zahl ist. σ steht für das Vorzeichen der Zahl.
Stand: 9. Februar 2010
33
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
Die Forderung x−k 6= g − 1“ für fast alle k schließt aus, dass eine Nichteindeutigkeit, wie wir
”
sie vom Dezimalsystem in Form von
0.99999 · · · = 1.00000 . . .
kennen, zugelassen ist.
Die positionelle Schreibweise sieht so aus:
(x)g := σ0.a−1 a−2 · · · gn .
(3.3)
Der Punkt zwischen 0 und a−1 wird Dezimalpunkt genannt, wenn g = 10, Binärpunkt, wenn
g = 2.
Eine Zahl x kann eine endliche Anzahl von Ziffern haben bezüglich einer Basis und eine
unendliche Anzahl von Ziffern in einer anderen Basis. Zum Beispiel gilt für x = 1/3:
(x)10 = +0.3 , (x)3 = +0.1 .
Für x := 103 3/4 haben wir
(x)10 = +[103.75] , (x)2 = +[1100111.11] , (x)16 = +[67.C] .
Um jede Ziffer in der Darstellung (3.3) im Dualsystem darstellen zu können, benötigen wir einen
Code. Für das Oktalsystem (g = 8) kann man etwa nutzen:
Ziffer
0
1
2
3
4
5
6
7
Codewort 000 001 010 011 100 101 110 111
Für die Zahlen, die wir oben beschrieben haben, benötigen wir im Allgemeinen unendlich viele
Speicherplätze. Daher müssen wir die Darstellung (3.3) einschränken. Dies geschieht dadurch,
dass die Reihe bei einem t ∈ N, der Mantissenlänge, abgebrochen wird und der Exponent n
eingeschränkt wird. So gelangen wir zur Darstellung
(x)g = σ0.x−1 . . . x−t ge
wobei t ∈ N die Anzahl der erlaubten signifikanten Ziffern x−i ∈ {0, 1, . . . , g − 1} ist; e ∈ Z
wird Exponent genannt, welcher in einem Bereich emin , emax variieren kann. Damit gelangen
wir zur Menge der Computerzahlen/Fließkommazahlen
x−1 , . . . x−t ∈ {0, 1, . . . , g − 1}, x−1 6= 0,
e
F := F(g, t, emin , emax ) := σ 0.x−1 . . . x−t g |
∪{0} .
e ∈ Z, emin ≤ e ≤ emax , σ ∈ {+, −}
Es ist einfach, diese Zahlen zu zählen:
#F(g, t, emin , emax ) = 2(g − 1)gt−1 (emax − emin + 1)
In F(g, t, emin , emax ) sind größte und kleinste Zahl gegeben durch
xmin := +[10 . . . 0] gemin −t = gemin −1 , xmax := +[δ . . . δ] gemax −t = gemax (1−g−t ) wobei δ = g−1 .
Offenbar gilt für alle Computerzahlen x 6= 0 g−emin −1 ≤ |x| ≤ gemax . Gilt |x| < g−emin −1 , so
wird im Allgemeinen x durch Null ersetzt. Zahlen x mit |x| > gemax können nicht verarbeitet
werden. Treten diese Fälle auf, so spricht man von Exponentenüberlauf. In jedem Intervall
[ge−1 , ge ], emin ≤ e ≤ emax , finden wir µ = gt − gt−1 + 1 gleichförmig verteilte Zahlen:
F ∩ [ge−1 , ge ] = {ge−1 , ge−1 + ge−t , . . . , ge−1 + µge−t } .
(3.4)
Beachte, dass der Zuwachs ge−t anwächst, wenn e von emin auf emax anwächst.
Stand: 9. Februar 2010
34
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
Lemma 3.5.2 Betrachte das System F(g, t, emin , emax ) . Sei x eine reelle Zahl mit xmin ≤ |x| ≤
xmax . Dann gilt:
|z − x|
1
min
≤ g−t+1 .
(3.5)
z∈F
|x|
2
Beweis:
Ohne Einschränkungen können wir annehmen: x ist positiv. Wir können annehmen, dass mit
einem e mit emin ≤ e ≤ emax gilt: x ∈ [ge−1 , ge ] . Aus (3.4) erhalten wir, dass eine Zahl z ∈
[ge−1 , ge ] mit |z − x| ≤ 21 ge−t existiert. Wegen ge−1 ≤ x ist die Behauptung bewiesen.
Die Zahl eps := 12 g−t+1 heißt Maschinengenauigkeit. Beachte, sie hängt nur von der
Mantissenlänge t ab.
Auf einem Computer sind üblicherweise zwei Formate von Fließkommazahlen verfügbar: einfache und doppelte Genauigkeit. Im IEEE-Standard mit einfacher Geneauigkeit haben wir
eps = 2−23 ≈ 10−7 .
Wegen des nötigen Übergangs von einer reellen Zahl x zu einer Computerzahl, muß x im Allgemeinen durch eine Approximation ersetzt werden. Dieser Prozeß wird als Runden bezeichnet.
Sei F das obige System der Computerzahlen. Es werden zwei Wege beschritten, eine gegebene reelle Zahl x durch eine Computerzahl f l(x) zu ersetzen: Runden und Abschneiden. Betrachte
die positive reelle Zahl x dargestellt durch
x = σ0.x−1 . . . d−t d−t−1 . . . ge .
Abschneiden:
ch(x) := σ0.x−1 . . . d−t ge .
Rundung:
(
σ0.x−1 . . . (1 + d−t ) ge
rd(x) :=
σ0.x−1 . . . d−t ge
, falls dt+1 ≥ g/2
.
, sonst
Der Fehler, der ensteht, wenn man x durch f l(x) ersetzt, wird Rundungsfehler genannt.
Definition 3.5.3 Sei x eine reelle Zahl, x 6= 0 . Der absolute Fehler von x ist gegeben durch
|x − f l(x)| und der relative Fehler durch |x − f l(x)|/|x| .
Korollar 3.5.4 Sei das System F(g, t, emin , emax ) gegeben und sei x eine reelle Zahl mit xmax ≤
|x| ≤ xmin . Dann folgt für den relativen Rundungsfehler:
|ch(x) − x|
|rd(x) − x|
≤ eps ,
≤ 2eps .
|x|
|x|
(3.6)
Die Grundoperationen der Arithmetik sind +, −, ·, / . Wie sind diese Operationen realisiert
in einem Fließkommasystem F := F(g, t, emin , emax )? Sei eine der Operationen +, −, ·, / . Wir
bezeichnen die entsprechende Operation, realisiert in F mit ∗ . Wir nehmen an, dass sie so
realisiert sei:
x∗ y := f l(xy) für x, y ∈ F mit xmin ≤ |x∗ y| ≤ xmax .
(3.7)
Klar, im Fall = / haben wir anzunehmen, dass y 6= 0 .
Stand: 9. Februar 2010
35
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.6. ÜBUNGEN
Als Konsequenz haben wir:
x∗ y = (xy)(1 + τ ) mit |τ | ≤ κ eps .
Hier ist κ eine Konstante, die nicht von x, y abhängt.
Probleme der Computer-Arithmetik sind:
Überlauf Siehe oben.
Unterlauf Siehe oben.
Auslöschung Addition etwa gleich großer Zahlen mit entgegengesetztem Vorzeichen führt zu
einer starken Verringerung der Tahl der gültigen Ziffern.
Rechenregeln Selbst in Fällen, wo weder Überlauf noch Unterlauf eintritt, gelten die Rechenregeln der reellen Zahlen nicht mehr.
3.6
1.)
Übungen
S
Sei A ein (endliches) Alphabet, sei A∗ := {()} ∪ n∈N An die Menge der Wörter (beliebiger Länge) über dem Alphabet A .
Für zwei Worte u = (u1 , . . . , uk ) ∈ Ak , v = (v1 , . . . , vl ) ∈ Al setzen wir:
uv := (u1 , . . . , uk , v1 , . . . , vl ) ∈ Ak+l .
Wir definieren für u, v ∈ A∗ :
u ≤ v : ⇐⇒ Es gibt z ∈ A∗ mit uz = v .
(a)
Zeige: ≤ ist eine Halbordnung in A∗ .
(b) Ist ≤ stets eine Ordnung in A∗ ?
(c)
Gibt es in A∗ ein Wort w, so dass gilt:
w ≤ u für alle u ∈ A∗ .
2.)
Maple
Eine Armstrong-Zahl ist eine n-stellige natürliche Zahl, deren Wert gleich der Summe der
n-ten Potenzen ihrer Ziffern ist. Ermitteln Sie mit Maple eine Liste aller dreistelligen
Armstrong-Zahlen.
3.)
Maple: Eine Permutation der Zahlen 1, 2, . . . , n ist eine Umstellung dieser Zahlen.
(a)
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 8 .
(b) Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung mit dieser Permutation in falscher Reihenfolge stehen.
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl.
Stand: 9. Februar 2010
36
c J.Baumeister
Kapitel 4
Abbildungen
Hier stellen wir zum Einen das Handwerkszeug beim Umgang mit Abbildungen dar, zum Anderen skizzieren wir zwei konkrete Abbildungsklassen, die für Anwendungen interessant sind.
Dabei begegnen wir auch dem Gruppenbegriff. Abschließend wollen wir mit dem Begriff des
Isomorphismus andeuten, was eine Struktur ausmacht. Am Ende dieses Kapitels haben wir
dann die wesentlichen Objekte kennengelernt, mit denen weitere Begriffe definiert und Theorien
entwickelt werden.
4.1
Definitionen
Mit Abbildungen drücken wir den mathematischen Sachverhalt aus, dass es zwischen zwei Objekten eine klar definierte Abbhängigkeit gibt. Wiederum behandeln wir den Begriff auf der Ebene
einer naiven Auffassung, auf der Ebene einer fundierten Mengenlehre lässt sich der Begriff der
Abbildung ebenso wie der Umgang mit Mengen auf eine sicherere Basis stellen.
Definition 4.1.1 Seien A, B, C, D Mengen.
(a) Eine Abbildung f von A nach B ist eine Vorschrift, durch die jedem a ∈ A genau ein
Bild f (a) ∈ B zugeordnet wird; A heißt Definitionsbereich, B heißt Wertebereich
von f. Wir schreiben f : A −→ B .
(b) Zwei Abbildungen f : A −→ B, g : C −→ D heißen gleich, wenn gilt:
A = C, B = D, f (x) = g(x) für alle x ∈ A .
Wir werden später auch von Funktionen sprechen. In unserem Verständnis ist eine Funktion
ein Spezialfall einer Abbildung: wir sprechen dann von einer Funktion, wenn wir eine Abbildung
zwischen Zahlbereichen haben, d.h. wenn Definitions– und Wertebereich der Abbildung Mengen
von Zahlen sind.1
Beispiel 4.1.2 Sei A eine Menge. Dann nennt man die Abbildung
idA : A ∋ x 7−→ x ∈ A
die Identität auf A. (Manchmal lassen wir den Index A weg und schreiben einfach id, wenn
klar ist, um welches A es sich handelt.)
1
Der Abbildungsbegriff, wie wir ihn hier eingeführt haben, konnte erst nach G. Cantor in Mode“ kommen,
”
da nun Mengen handhabare Objekte waren.
37
KAPITEL 4. ABBILDUNGEN
4.1. DEFINITIONEN
Beispiel 4.1.3 Seien A, B Mengen. Dann heißt die Abbildung
π1 : A × B ∋ (a, b) 7−→ a ∈ A
die Projektion auf den ersten Faktor.2 Es sollte klar sein, dass entsprechend auch die
Projektionen auf beliebige Faktoren in einem kartesischen Produkt erklärt sind.
Beispiel 4.1.4 Sei A eine Menge.
Jede Abbildung
N ∋ n 7−→ xn ∈ A
nennt man eine Folge mit Folgengliedern aus A . Meist schreiben wir dafür kurz (xn )n∈N .
Jede Abbildung
{1, . . . , m} × {1, . . . , n} ∋ (i, j) 7−→ aij ∈ A
nennen wir eine Matrix mit m Zeilen und n Spalten mit Einträgen aus A . Meist schreiben wir
dafür kurz (aij )1≤i≤n,1≤j≤m .
Wenn wir A := {0, 1, . . . , 255} wählen, können wir eine solche Matrix als Pixelbild mit m · n
Pixeln und 28 = 256 Grauwertstufen interpretieren.
Definition 4.1.5 Sei f : A −→ B eine Abbildung. Die Menge
graph(f ) := {(a, b) ∈ A × B|a ∈ A, b = f (a)}
heißt der Graph von f .
Definition 4.1.6 Sei f : X −→ Y eine Abbildung und seien A ⊂ X, B ⊂ Y . Dann heißt die
Menge
f (A) := {f (x)|x ∈ A}
die Bildmenge von A oder das Bild von A, und die Menge
−1
f (B) := {x ∈ X|f (x) ∈ B}
heißt die Urbildmenge von B oder einfach das Urbild von B.
Beispiel 4.1.7 Sei f : N ∋ n 7−→ 2n + 1 ∈ N . Dann ist das Bild von f die Menge aller
ungeraden natürlichen Zahlen mit Ausnahme von 1 .
Regel 4.1.8 Sei f : X −→ Y, A1 , A2 ⊂ X, B1 , B2 ⊂ Y .
A1 ⊂ A2
f (A1 ∪ A2 )
f (A1 ∩ A2 )
−1
B1 ⊂ B 2
f (B1 ∪ B2 )
=⇒
f (A1 ) ⊂ f (A2 )
f (A1 ) ∪ f (A2 )
=
⊂
=⇒
(4.2)
f (A1 ) ∩ f (A2 )
(4.3)
f (B1 ) ⊂ f (B2 )
(4.4)
f (B1 ) ∪ f (B2 )
(4.5)
−1
−1
=
(4.1)
−1
−1
2
Die Wortwahl wird verständlich, wenn wir uns A × A als Koordinatensystem realisiert denken. Dann wird
von einem Punkt durch Beleuchtung parallel zur zweiten Koordinatenachse auf der ersten Achse der projezierte
Punkt sichtbar.
Stand: 9. Februar 2010
38
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweisen wir etwa (4.5).
Da eine Gleichheit von Mengen behauptet wird, sind zwei Inklusionen zu verifizieren.
−1
−1
−1
Zu f (B1 ∪ B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
Sei x ∈ f (B1 ∪ B2 ) . Also gilt f (x) ∈ B1 ∪ B2 . Ist f (x) ∈ B1 , dann ist x ∈ f (B1 ) ⊂
−1
−1
−1
−1
−1
f (B1 ) ∪ f (B2 ) . Ist f (x) ∈ B2 , dann ist x ∈ f (B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
−1
Zu f (B1 ) ∪ f (B2 ) ⊂ f (B1 ∪ B2 ) .
−1
−1
−1
−1
Sei x ∈ f (B1 ) ∪ f (B2 ) . Ist x ∈ f (B1 ), dann ist f (x) ∈ B1 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
−1
−1
Ist x ∈ f (B2 ), dann ist f (x) ∈ B2 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
Definition 4.1.9 Seien f : X −→ Y , g : Y −→ Z Abbildungen. Die Hintereinanderausführung oder Komposition g ◦ f der Abbildungen f, g ist erklärt durch
g ◦ f : X ∋ x 7−→ g(f (x)) ∈ Z .
Regel 4.1.10 Seien f : X −→ Y, g : Y −→ Z, h : Z −→ W Abbildungen.
idY ◦ f
= f ◦ idX
(4.6)
h ◦ (g ◦ f ) = (h ◦ g) ◦ f
(4.7)
Die Identität in (4.7) nennt man das Assoziativgesetz. Man beachte, dass für die Hintereinanderausführung von Abbildungen ein Kommutativgesetz ( f ◦ g = g ◦ f ) im allgemeinen nicht
gilt.
4.2
Permutationen
Definition 4.2.1 Sei f : X −→ Y eine Abbildung.
(i) f injektiv genau dann, wenn für alle x, x′ ∈ X x 6= x′ =⇒ f (x) 6= f (x′ ) gilt.
(ii) f surjektiv genau dann, wenn für alle y ∈ Y ein x ∈ X existiert mit y = f (x) .
(iii) f bijektiv : ⇐⇒ f injektiv und surjektiv
Wir charakterisieren die Eigenschaften von Abbildungen aus Definition 4.2.1 in einer Weise,
die uns dann weiterbringt.
Satz 4.2.2 Sei f : X −→ Y eine Abbildung und sei B := f (X). Dann gilt:
(a) f ist injektiv genau dann, wenn g : B −→ X existiert mit g ◦ f = idX .
(b) f ist surjektiv genau dann, wenn g : Y −→ X existiert mit f ◦ g = idY .
(c) f ist bijektiv genau dann, wenn g : Y −→ X existiert mit g ◦ f = idX , f ◦ g = idY .
Stand: 9. Februar 2010
39
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweis:
Zunächst eine Vorüberlegung.
−1
−1
Sei y ∈ B . Dann ist f ({y}) 6= ∅ ; wähle xy ∈ f ({y}) . Damit definieren wir
ĝ : B ∋ y 7−→ ĝ(y) := xy ∈ X .
−1
Zu (a). Sei f injektiv. Wir setzen g := ĝ . Da f injektiv ist, gilt f ({y}) = xy für jedes y ∈ B .
Sei x ∈ X, y := f (x) . Dann ist also x = xy und wir haben
(g ◦ f )(x) = g(f (x)) = ĝ(f (xy )) = xy = x = idX (x) für alle x ∈ X .
Sei nun g : B −→ X mit g ◦ f = idX . Seien x, x′ ∈ X mit f (x) = f (x′ ). Dann ist
x = idX (x) = g(f (x)) = g(f (x′ )) = idX (x′ ) = x′ ,
was wir zeigen wollten.
Zu (b). Sei f surjektiv. Wir setzen g := ĝ und beachten B = Y . Dann ist
(f ◦ g)(y) = f (ĝ(y)) = f (xy ) = y = idY (y) .
Die Umkehrung ist trivial.
Zu (c). Gibt es g mit den notierten Eigenschaften, dann ist nach (a) und (b) die Bijektivität
von f klar. Sei nun f bijektiv. Dann ist B = Y und es gibt nach (a) und (b) Abbildungen
ga : Y −→ X und gb : Y −→ X mit ga ◦ f = idX , f ◦ gb = idY . Wir zeigen ga = gb und sind
dann fertig. Unter Verwendung der eben angeführten Identitäten folgt:
ga = ga ◦ idY = ga ◦ (f ◦ gb ) = (ga ◦ f ) ◦ gb = idX ◦ gb = gb .
Im Beweis der Vorüberlegung des Beweises zu Satz 4.2.2 haben wir das so genannte starke
Auswahlaxiom benutzt.3
Definition 4.2.3 Sei f : X −→ Y bijektiv. Die nach Satz 4.2.2 (c) eindeutig bestimmte
Abbildung4 g mit g ◦ f = f ◦ g = id heißt die (zu f ) inverse Abbildung. Wir schreiben dafür
f −1 .
−1
Die Notation f und f −1 passt folgendermaßen zusammen: Ist f : X −→ Y eine bijektive
−1
Abbildung, B ⊂ Y, dann ist f −1 (B) = f (B) .
Beispiel 4.2.4 Sei f : R\{0} ∋ x 7−→ x1 ∈ R\{0} . Dann ist sicherlich f −1 = f . Ein weiteres
Beispiel dieser Art ist f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 . Auch hier gilt f −1 = f .
Lemma 4.2.5 Seien f : X −→ Y , g : Y −→ Z bijektiv. Dann ist auch g ◦ f : X −→ Z
bijektiv und es gilt (g ◦ f )−1 = f −1 ◦ g−1 .
3
Es besagt, dass man zu einer Familie Xα , α ∈ A, von Mengen eine Auswahlfunktion c : A −→ ∪α∈A Xα mit
c(α) ∈ Xα für alle α ∈ A existiert. Dahinter versteckt sich ein Problem, das in den Grundlagen der Mathematik
auf der Basis einer fundierten Mengenlehre seinen Platz hat; hier halten wir an diesem Axiom wie an einem
Glaubenssatz fest.
4
In der Literatur spricht man bei bijektiven Abbildungen oft auch von umkehrbar eineindeutigen Abbildungen.
In Satz 4.2.2 zusammen mit Definition 4.2.1 liegt die Berechtigung für eine solche Sprechweise.
Stand: 9. Februar 2010
40
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweis:
Dies verifiziert man ohne Mühe.
Sei M eine nichtleere Menge. Wir setzen
Abb (M ) := {f : M −→ M } .
In dieser Menge der Selbstabbildungen von M ist eine Multiplikation“ erklärt durch die Kom”
position von Abbildungen:
f • g := f ◦ g , f, g ∈ Abb (M ) .
(G := {f ∈ Abb (M )|f bijektiv } , • := ◦) wird damit zu einer Gruppe. Die Definition dieser
mathematischen Objekte folgt nun.5
Definition 4.2.6 Eine Menge G zusammen mit einer Verknüpfung • : G × G ∋ (a, b) 7−→
a • b ∈ G heißt eine Gruppe genau dann, wenn gilt:
a) Es gibt ein Element e ∈ G mit
a • e = e • a = a für alle a ∈ G .
b) Zu jedem a ∈ G gibt es ein Element ā ∈ G mit
c) Für alle a, b, c ∈ G gilt
a • ā = ā • a = e .
a • (b • c) = (a • b) • c .
Ist zusätzlich noch
d) Für alle a, b ∈ G gilt
a • b = b • a.
erfüllt, so heißt die Gruppe kommutativ.
Sei G eine Gruppe. Die Bedingung a) besagt, dass es ein bezüglich der Verknüpfung “•“
neutrales Element e in G gibt. Ist e′ ein weiteres neutrales Element in G, so lesen wir aus
e′ = e′ • e = e
ab, dass das neutrale Element in einer Gruppe eindeutig bestimmt ist; dabei haben wir a)
zweimal verwendet.
Das in der Bedingung b) eingeführte Element ā heißt das zu a inverse Element. Es ist
ebenfalls eindeutig bestimmt, denn aus
a • ā = ā • a = e , a • ā′ = ā′ • a = e ,
folgt
ā′ = ā′ • e = ā′ • (a • ā) = (ā′ • a) • ā = e • ā = ā .
Die Bedingung c), die wir eben verwendet haben, nennt man das Assoziativgesetz. Es besagt,
dass Klammern bei der Reihenfolge der Verknüpfungen beliebig gesetzt werden dürfen und
deshalb, soweit sie nicht für die Lesbarkeit benötigt werden, weggelassen werden dürfen.
5
Die Gruppen sind von überrragender Bedeutung. Ihre Nutzung hinterließ eine Erfolgsspur in der Mathematik.
Von H. Poincaré ist die Aussage überliefert, Gruppen seien die ganze Mathematik“.
”
Stand: 9. Februar 2010
41
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Wegen der Eindeutigkeit des inversen Elements (siehe oben) können wir nun ein inverses Element in der Bezeichnung auszeichnen.
Bezeichnung: Wir schreiben für das inverse
Element ā von a im abstrakten Rahmen meist
a−1 , in speziellen Fällen weichen wir davon ab.
◦
id τ1 τ2 τ3 τ4 τ5
id
id τ1 τ2 τ3 τ4 τ5
τ1
τ1 id τ3 τ2 τ5 τ4
τ2
τ2 τ4 id τ5 τ1 τ3
τ3 τ3 τ5 τ1 τ4 id τ2
Wir führen nun eine Reihe von Beispielen
an und zeigen damit, dass der Gruppenbegriff
τ4 τ4 τ2 τ5 id τ3 τ1
in der Tat geeignet ist, viele Objekte unter eiτ5 τ5 τ3 τ4 τ1 τ2 id
nem gemeinsamen Gesichtspunkt zu betrachten. Dabei schreiben wir dann Verknüpfung,
Abbildung 4.1: Die Permutationsgruppe S3
Einselement, Inverses immer mit dem Symbol,
das wir in der speziellen Situation bereits kennen. Auf die Verifikation der Assoziativität bzw. Kommutativität verzichten wir meist, da hier
in der Regel kein Problem vorliegt.
Beispiel 4.2.7 (G := Z, • := +) ist eine kommutative Gruppe mit neutralem Element 0 und
Inversem −z für z ∈ Z .
Wenn die Verknüpfung eine Addition ist wie etwa in Beispiel 4.2.7, nennt man das Inverse
eines Elements meist das Negative. Ist die Verknüpfung • in einer Gruppe einer Addition
verwandt“, so nennt man sie, wenn sie kommutativ ist, auch abelsch.6
”
Beispiel 4.2.8 (G := Q, • := +) , (G := R, • := +) sind abelsche Gruppen. Das neutrale
Element ist jeweils 0, das Inverse (Negative) eines Elementes r ist −r.
Beispiel 4.2.9 (G := R∗ := R\{0}, • := ·) ist eine kommutative Gruppe mit neutralem Element
1 und Inversem a−1 für a ∈ R∗ .
Die Rechenregeln einer Gruppe sind uns hier wohlvertraut, ebenso die Potenzregeln. Man beachte,
dass wir das Nullelement aus R entfernen mussten, da dieses Element kein Inverses bezüglich
der Multiplikation besitzt.
Nun haben wir die Gruppenstrukturen in den Zahlen erkannt. Wir finden sie auch beim
Rechnen mit Restklassen, wie wir im Kapitel 6 sehen werden.
Kehren wir zurück zu
G := {f ∈ Abb (M )|f bijektiv } , • := ◦ .
(G, •) ist damit eine (im allgemeinen nicht kommutative) Gruppe; wir bezeichnen sie mit S(M ) .
Das Assoziativgesetz ist klar, das neutrale Element ist die Identität idM , das inverse Element
eines Elements f ∈ G ist f −1 . Beachte auch, dass mit f, g ∈ G auch f ◦ g ∈ G , f −1 ∈ G gilt.
Definition 4.2.10 Ist M eine nichtleere Menge, so nennen wir die Gruppe S(M ) die symmetrische Gruppe von M. Ist M = {1, . . . , m}, dann nennen wir S(M ) Permutationsgruppe
und jedes Element in S(M ) eine Permutation. In diesem Spezialfall schreiben wir kurz Sm .
6
Der Begriff abelsch“ ist vom Namen des norwegischen Mathematikers N.H. Abel abgeleitet. Neben Arbeiten
”
zur Konvergenz von Reihen beschäftigte er sich mit der Lösbarkeit von Gleichungen fünften Grades und bewies
die Unmöglichkeit der Lösung einer allgemeinen Gleichung fünften Grades mit Hilfe von Radikalen (Wurzelausdrücken); siehe dazu Abschnitt 11.7. Seine Ideen hierzu sind eng mit denen des französischen Mathematikers E.
Galois, dessen Theorie in der Algebra eine überragende Rolle spielt, verwandt. Mit ihm teilt er auch das Schicksal,
sehr jung zu sterben, Abel starb an Schwindsucht, Galois in einem Duell.
Stand: 9. Februar 2010
42
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Die Wortwahl Permutationsgruppe wird verständlich, wenn wir beobachten, dass bei der
Menge M = {1, . . . , m} einer Abbildung f in Sm die Umstellung der Elemente in M gemäß
1
2
...
m
f (1) f (2) . . . f (m)
entspricht. Die Wortwahl symmetrische Gruppe rührt daher, daß die Funktionen der Variablen x1 , . . . , xm , die bei allen Permutationen der Variablen invariant bleiben, die symmetrischen Funktionen sind; siehe Abschnitt 7.2.
Beispiel 4.2.11 Wir betrachten S3 . Die sechs Elemente der Gruppe sind dann in obiger Schreibweise
123
123
123
123
123
123
τ0 =
τ1 =
τ2 =
τ3 =
τ4 =
τ5 =
.
123
132
213
231
312
321
Klar, τ0 ist die Identität. Die Gruppentafel ist in Abbildung 4.1 dargestellt. Beispielsweise bedeutet τ4 in Spalte 3, Zeile 4 τ1 ◦ τ2 = τ4 und τ2 in Spalte 7, Zeile 5 τ5 ◦ τ3 = τ2 .
Bemerkung 4.2.12 Einer endlichen Gruppe, d.h. einer Gruppe mit endlich vielen Elementen, kann man durch Blick auf ihre Gruppentafel sofort ansehen, ob sie kommutativ ist. Sie ist
nämlich kommutativ genau dann, wenn ihre Gruppentafel symmetrisch zur Hauptdiagonalen ist.
S3 ist also nicht kommutativ. Daraus folgt, dass Sm , m ≥ 3, nicht kommutativ ist (Beweis!). Sei nun stets Sm für m ≥ 2 betrachtet, S1 ist ja trivial!
Definition 4.2.13 Sei σ ∈ Sm . Wir setzen
a(σ) := #{(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} , ǫ(σ) := (−1)a(σ)
und nennen σ gerade, falls ǫ(σ) = 1 gilt, anderenfalls ungerade. ǫ(σ) heißt Signum/Signatur
von σ und a(σ) die Fehlstandszahl von σ .
Beispiel 4.2.14 Sei
σ=
1 2 3 4 5
3 5 1 4 2
.
Dann gilt a(σ) = 6, denn wir zählen A := {(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} folgendermaßen
ab.
i = 1 : (1, 3), (1, 5) ∈ A ; i = 2 : (2, 3), (2, 4), (2, 5) ∈ A ; i = 3 : Fehlanzeige; i = 4 : (4, 5) ∈ A .
Also ist σ eine gerade Permutation.
Lemma 4.2.15 Für jedes σ ∈ Sm gilt
ǫ(σ) =
Y
1≤i<j≤m
Beweis:
Sei n := a(σ) . Es gilt:
Y
(σ(j) − σ(i)) =
1≤i<j≤m
Y
1≤i<j≤m,σ(i)<σ(j)
=
Y
1≤i<j≤m,σ(i)<σ(j)
n
= (−1)
Y
1≤i<j≤m
Stand: 9. Februar 2010
σ(j) − σ(i)
j−i
(σ(j) − σ(i)) ·
Y
1≤i<j≤m,σ(i)>σ(j)
Y
n
(σ(j) − σ(i)) · (−1)
n
|σ(j) − σ(i)| = (−1)
43
(σ(j) − σ(i))
1≤i<j≤m,σ(i)>σ(j)
Y
|σ(j) − σ(i)|
(j − i)
1≤i<j≤m
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Bei der letzten Gleichung haben wir die Beobachtung verwendet, dass die beiden Produkte bis
auf die Reihenfolge die gleichen Faktoren enthalten, was aus der Bijektivität von σ folgt.
Ein τ ∈ Sm heißt Nachbarvertauschung, wenn
∃i ∈ {1, . . . , m} mit τ (i) = i + 1 , τ (i + 1) = i ; τ (j) = j , j 6= i, i + 1,
gilt. Ein τ = τkl ∈ Sm , k 6= l , heißt Transposition, wenn gilt:
τ (k) = l , τ (l) = k ; τ (j) = j , j 6= k, l ,
gilt. Nachbarvertauschungen sind also spezielle Transpositionen. Man überzeugt sich leicht, dass
für eine Transposition τ ∈ Sm gilt: τ −1 = τ .
Lemma 4.2.16 Sei σ ∈ Sm und sei τ ∈ Sm eine Nachbarvertauschung.
Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) .
Beweis:
ǫ(τ ◦ σ) =
=
Y
1≤i<j≤m
Y
1≤i<j≤m
= ǫ(σ)
τ (σ(j)) − τ (σ(i))
j−i
τ (σ(j)) − τ (σ(i))
·
σ(j) − σ(i)
Y
1≤i<j≤m
Y
1≤i<j≤m
σ(j) − σ(i)
j−i
τ (σ(j)) − τ (σ(i))
= −ǫ(σ) .
σ(j) − σ(i)
Bei der letzten Gleichheit haben wir verwendet, dass im Produkt
Y τ (σ(j)) − τ (σ(i))
1≤i<j≤m
σ(j) − σ(i)
auf Grund der Tatsache, dass τ eine Transposition ist, alle Faktoren den Wert 1 haben mit einer
Ausnahme; dieser Faktor hat den Wert −1.
Korollar 4.2.17 Sei σ ∈ Sm und sei τ ∈ Sm eine Transposition. Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) .
Beweis:
Sei etwa τ = τkl . Setze σ ′ := τ ◦ σ . Betrachte nun
Σ′ : σ ′ (1), . . . , σ ′ (m)
Σ : σ(1), . . . , σ(m)
Hier unterscheiden sich die beiden Anordnungen nur dadurch, dass k und l die Plätze getauscht
haben. Sei s die Anzahl der Zahlen, die in Σ zwischen k und l vorkommen. Dann erhält man
Σ′ aus Σ durch 2s + 1 sukzessive Vertauschung benachbarter Elemente. Nach Lemma 4.2.16 gilt
dann ǫ(σ ′ ) = (−1)2s+1 ǫ(σ) = −ǫ(σ) .
Satz 4.2.18 Jedes σ ∈ Sm läßt sich als Hintereinanderausführung von höchstens m Transpositionen schreiben, d.h. zu jedem σ ∈ Sm gibt es s ≤ m Transpositionen τ1 , . . . , τs mit
σ = τ1 ◦ · · · ◦ τs .
Beweis:
Sei σ ∈ Sm . Für σ = id gilt σ = τ21 ◦ τ12 . Sei σ 6= id . Dann gibt es ein kleinstes i1 mit
σ(i1 ) = j1 6= i1 . Setze σ1 := σ ◦ τi1 j1 . Es ist σ1 (i) = i für 1 ≤ i ≤ i1 . Falls σ1 = id gilt, sind
wir fertig. Anderenfalls gibt es ein i2 > i1 mit σ1 (i2 ) = j2 6= i2 . Setze σ2 := σ1 ◦ τi2 j2 . Dann
gilt σ2 (i) = i für 1 ≤ i ≤ i2 . So fortfahrend erreichen wir ein σs , s ≤ m, mit σs = id . Dann ist
σ = τis js ◦ · · · ◦ τi1 j1 .
Stand: 9. Februar 2010
44
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Korollar 4.2.19 Ist σ ∈ Sm Hintereinanderausführung von r Transpositionen, dann gilt ǫ(σ) =
(−1)r .
Beweis:
Folgt aus Satz 4.2.18 durch mehrmaliges Anwenden von ǫ(τ ◦σ) = −ǫ(σ) (siehe Folgerung 4.2.17)
für jede beteiligte Transposition τ.
Wir haben gesehen, dass unabhängig von der Art der Darstellung einer Permutation als
Produkt von Transpositionen die Anzahl der dabei benötigten Transpositionen bei geraden Permutationen stets gerade und bei ungeraden Permutationen stets ungerade ist.
Korollar 4.2.20 Sei m ≥ 2 . Dann gilt:
(a) ǫ(σ ◦ σ ′ ) = ǫ(σ)ǫ(σ ′ ) , σ, σ ′ ∈ Sm .
(b) ǫ(σ −1 ) = ǫ(σ) , σ ∈ Sm .
(c) #Sm = m! , #Am = m!/2 .
Beweis:
(a) folgt aus Satz 4.2.18 und Folgerung 4.2.19, ebenso (b), da für jede Transposition τ gilt:
τ −1 = τ . Die Aussage #Sm = m! in (d) ist klar, da es sich bei Sm um die Menge der Permutationen handelt, die Ausage #Am = m!/2 folgt aus der Tatsache, dass für jede Nachbarvertauschung τ durch Sm ∋ σ 7−→ τ ◦ σ ∈ Sm eine bijektive Abbildung definiert ist, bei der die
geraden Permutationen auf ungerade und die ungeraden Permutationen auf gerade Permutationen abgebildet werden.
(c) folgt aus der Tatsache, dass für σ ∈ Sm , τ ∈ Am stets ǫ(σ ◦ τ ◦ σ −1 ) = ǫ(σ)ǫ(τ )ǫ(σ −1 ) = 1
gilt.
Definition 4.2.21 Die Menge Am := {σ ∈ Sm |ǫ(σ) = 1} heißt alternierende Gruppe.
4.3
Metriken
Wir bringen nun das Objekt metrische Räume“ ins Spiel. Damit wollen wir modellieren, dass
”
man in einer Menge mehr oder minder gut interpretierbare Abstände zwischen zwei Elementen
dieser Menge erklären kann. Die Nützlichkeit dieses Vorgehens wird sich bald erweisen.
Definition 4.3.1 Sei X eine nichtleere Menge. Eine Abbildung d : X × X
Metrik, wenn folgende drei Bedingungen erfüllt sind:
−→
X heißt
a) d(x, y) = 0 genau dann, wenn x = y gilt;
(Definitheit)
b) d(x, y) = d(y, x) für alle x, y ∈ X ;
(Symmetrie)
c) d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X .
(Dreiecksungleichung)
Die Zahl d(x, y) heißt Abstand von x, y .
Eine Menge X zusammen mit einer Metrik d wird als metrischer Raum (X, d) bezeichnet. Entsprechend der Bezeichnungsweise, dass d(x, y) für den Abstand von x, y steht, sollte man
erwarten, dass d(x, y) stets nichtnegativ ist. Dies ist aber schon in der Definition 4.3.1 enthalten,
wie folgende Zeile zeigt:
0 = d(x, x) ≤ d(x, y) + d(y, x) = 2d(x, y) d.h. d(x, y) ≥ 0 .
Stand: 9. Februar 2010
45
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Beispiel 4.3.2 Jede nichtleere Teilmenge A von R ist zusammen mit dem (euklidischen) Abstand d(x, y) := |x − y| ein metrischer Raum. Die definierenden Eigenschaften sind ohne Mühe
nachzuweisen.
Beispiel 4.3.3 Jede nichtleere Teilmenge A von R2 ist zusammen mit der euklidischen Metrik
p
d(x, y) := (x1 − y1 )2 + (x2 − y2 )2 , x = (x1 , x2 ), y = (y1 , y2 )
ein metrischer Raum. Der Nachweis der Dreiecksungleichung macht etwas Mühe, wir verweisen
auf die Analysis.
Beispiel 4.3.4 Sei S1 := {(x, y) ∈ R2 |x2 + y 2 = 1} der Rand des Einheitskreises. Wir können
zwei verschiedene Metriken wählen:
a) Die Metrik, die sich als Teilmenge von R2 gemäß Beispiel 4.3.3 ergibt.
b) Die Metrik, die man erhält, wenn man den Abstand als Länge des kürzeren Kreisbogens, der
zwei Punkte aus S1 verbindet, erklärt.
Beispiel 4.3.5 Sei X eine nichtleere Menge. Dann wird durch
(
1 , falls x 6= y
∈R
d : X × X ∋ (x, y) 7−→
0 , falls x = y
eine Metrik definiert. Nachrechnen!
Interpretiert man den Abstand d(x, y) als Kosten für eine Straßenbahnfahrt in dem Haltestellennetz X, so bedeutet die Wahl der Metrik gerade, daß für jede Fahrt der Einheitspreis 1 ezu
entrichten ist.
Beispiel 4.3.6 Sei A ein Alphabet und seien An die Wörter der Länge n . Ein Abstand zwischen
zwei Wörtern x = x1 . . . xn , y = x1 . . . yn ist definiert durch
d(x, y) := #{i ∈ {1, . . . , n}|xi 6= yi } .
Diese Metrik heißt Hamming–Abstand .
Der Abstandsbegriff, der durch eine Metrik eingeführt wird, macht es möglich, die wesentlichen Begriffe der Analysis im Zusammenhang mit Folgen sofort auf metrische Räume zu
übertragen. Dies soll nun geschehen. Dabei ist der Begriff der Folge zentral: eine Folge in X
ist eine Abbildung N ∋ n 7−→ xn ∈ X ; wir schreiben dafür (xn )n∈N .
Definition 4.3.7 Sei (X, d) ein metrischer Raum und sei (xn )n∈N eine Folge in X .
a) Die Folge (xn )n∈N heißt Cauchyfolge genau dann, wenn gilt:
∀ ǫ > 0 ∃N ∈ N ∀m, n ≥ N (d(xn , xm ) < ǫ) .
a) Die Folge (xn )n∈N heißt konvergent genau dann, wenn es x ∈ X gibt mit
∀ ǫ > 0 ∃N ∈ N ∀n ≥ N (d(xn , x) < ǫ) ;
x heißt dann Grenzwert oder Limes der Folge und wir schreiben x = lim xn .
n
Stand: 9. Februar 2010
46
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Beispiel 4.3.8 Sei die Metrik in R der übliche Abstand. Sei L ∈ R mit |L| < 1 . Dann gilt
bekanntlich limn Ln = 0 , d.h. (Ln )n∈N ist eine Nullfolge.
Die Dreiecksungleichung und die Definitheitseigenschaft einer Metrik haben sofort die Eindeutigkeit eines Grenzwertes zur Folge. Ebenso schnell sieht man ein, dass eine konvergente
Folge stets eine Cauchyfolge ist. Man liest dies aus d(xn , xm ) ≤ d(xn , x) + d(x, xm ) ab, wenn
(xn )n∈N gegen x konvergiert. Die Umkehrung davon gilt nicht immer, wie uns das Beispiel Q
zusammen mit der Abstandsfunktion in R als Metrik zeigt. Dies ist der Anlass für die folgende
Definition.
Definition 4.3.9 Sei (X, d) ein metrischer Raum.
a) Eine Teilmenge A von X heißt abgeschlossen genau dann, wenn für jede konvergente
Folge (xn )n∈N mit xn ∈ A für alle n ∈ N stets lim xn ∈ A gilt.
n
b) (X, d) heißt vollständig genau dann, wenn jede Cauchyfolge in X konvergiert.
Ist (X, d) ein metrischer Raum, dann ist X nach Definition abgeschlossen. Also gibt es zu
A ⊂ X sicher eine kleinste Menge (bezüglich der Inklusion) A mit A ⊂ A und A abgeschlossen.
Eine solche Menge A heißt der Abschluss von A; beispielsweise ist [a, b] der Abschluss von
[a, b) im metrischen Raum R1 , versehen mit dem euklidischen Abstand.
Klar, der metrische Raum (X, d) aus Beispiel 4.3.3 ist vollständig genau dann, wenn die Menge
X eine abgeschlossene Teilmenge in R ist.
In einem metrischen Raum (X, d) haben wir die Kugeln
Br (x) := {y ∈ X|d(x, y) < r} , B r (x) := {y ∈ X|d(x, y) ≤ r} (r ≥ 0)
um x ∈ X und die Umgebungen
Uǫ (A) := {y ∈ X|d(x, y) < ǫ für ein x ∈ A}
einer Teilmenge A von X zur Verfügung. Die Bezeichnung B r (x) ist passend gewählt, denn es
gilt ja, dass der Abschluss Br (x) gerade B r (x) ist.
Damit haben wir nun die Begriffe bereit, die wir benötigen, um Iterationen in einem metrischen Raum zu betrachten. Iterationen werden benutzt, um Folgen zu konstruieren, die einen
erwünschten Grenzwert besitzen. Meist interessiert man sich für Punkte, die sich unter einer
Abbildung nicht verändern, also für so genannte Fixpunkte.
Definition 4.3.10 Sei (X, d) ein metrischer Raum und sei T : X −→ X eine Abbildung. Ein
Punkt x ∈ X heißt ein Fixpunkt von T, wenn T (x) = x gilt.
Beispiel 4.3.11 De Abbildung f : N ∋ x 7−→ 2x + 1 ∈ N hat keine Fixpunkte.
Die Abbildung f : R\{0} ∋ x 7−→ x1 ∈ R\{0} hat die Fixpunkte 1, −1 .
Die Fixpunktmenge von f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 ist die Diagonale“ {(x, x)|x ∈ Z} . ”
Hier kommt der Satz, der über die Existenz von Fixpunkten und ihrer Berechnung Aufschluss
gibt.
Stand: 9. Februar 2010
47
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Satz 4.3.12 (Banachscher Fixpunktsatz) Sei (X, d) ein vollständiger metrischer Raum und
sei T : X −→ X eine Kontraktion, d.h.
∃ L ∈ [0, 1) ∀ x, y ∈ X (d(T (x), T (y)) ≤ Ld(x, y)) .
(4.8)
Dann gilt:
a) T besitzt einen eindeutig bestimmten Fixpunkt x .
b) Für alle x ∈ X konvergiert die Folge (xn )n∈N , definiert durch
xn+1 := T (xn ) , x0 := x ,
gegen x und es gilt:
d(xm+1 , x) ≤
Lm
d(T (x), x) , m ∈ N .
1−L
Beweis:
Sei x ∈ X . Man beweist mit Hilfe der Voraussetzung (4.8) für n, m, n > m ≥ 1, sofort folgende
Aussagen:
d(T (xn+1 ), T (xn )) ≤ d(T (xn ), T (xn−1 )) ≤ · · · ≤ Ln d(T (x), x) ;
n−1
n−1
X
X
Li d(T (x), x)
d(T (xi+1 ), T (xi )) ≤
d(T (xn ), T (xm )) ≤
(4.9)
i=m
i=m
≤ Lm d(T (x), x)
n−1−m
X
j=0
Lj ≤ Lm
1
d(T (x), x) .
1−L
(4.10)
Aus (4.10) folgt nun die Tatsache, dass in (xn )n∈N eine Cauchyfolge vorliegt, da limm Lm = 0 gilt;
siehe Beispiel 4.3.8. Nach Voraussetzung zur Vollständigkeit gibt es x ∈ X mit x = limn∈N xn .
Daraus folgt mit der Kontraktionseigenschaft und der Konvergenz der Folge (xn )n∈N gegen x
sofort T (x) = x , denn
d(T (x), x) ≤ d(T (x), xn+1 ) + d(xn+1 , x) = d(T (x), T (xn )) + d(xn+1 , x) ≤ Ld(x, xn ) + d(xn+1 , x) .
Grenzübergang n → ∞ in (4.10) ergibt die Aussage in b) . Damit ist die Existenz eines Fixpunktes x und die Abschätzung in b) gezeigt. Bleibt die Eindeutigkeit zu zeigen.
Sei x̂ ∈ X ein weiterer Fixpunkt. Dann folgt aus der Ungleichung
d(x, x̂) = d(T (x), T (x̂)) ≤ Ld(x, x̂)
mit der Tatsache 0 ≤ L < 1 sofort x = x̂ .
Der Banachsche Fixpunktsatz ist ein zentrales Resultat, das vielfältige Anwendungen hat:
Existenz von Lösungen nichtlinearer Gleichungen, Konvergenz von Iterationsverfahren, Existenz
von Lösungen bei Differentialgleichungen, . . . .
Beispiel 4.3.13 Man bestimme die Nullstellen von f (x) := −x+ cos x . Dies ist gleichbedeutend
mit der Berechnung der Fixpunkte von g(x) := cos(x).
Hier kommt eine Schlussweise,
wie sie in der Analysis vorbereitet wird. Wegen f (0) = 1 >
√
1
π
′
0, f ( 4 ) = 4 (−π + 2 2) < 0, besitzt f eine Nullstelle in (0, π
4 ). Wegen f (x) = 1 + sin(x) ≥ 0
π
′
für alle x ∈ R folgt, dass Nullstellen nur in (0, 4 ) liegen können. Da f (x) > 0, x ∈ (0, π
4 ), folgt,
π
dass die einzige Nullstelle von f in (0, 4 ) liegt.
Stand: 9. Februar 2010
48
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.4. ISOMORPHISMEN
∗
Also besitzt g genau einen Fixpunkt x∗ in (0, π
4 ). Näherungswerte für x bestimmen wir mit der
Fixpunktiteration xn+1 := cos xn . Wählt man als Startwert (siehe oben) x0 := π
4 , so ergibt sich
die Zahlenfolge
x0 = 0, 785398 . . . , x1 = 0, 707106 . . . , x2 = 0, 760244 . . . , . . . , x25 = 0, 73908
Von x25 stimmen die angegebenen 5 Ziffern nach dem Komma mit den entsprechenden Dezimalstellen der Lösung überein.
Wir haben oben 0 < x1 ≤ x2 ≤ x0 beobachtet. Da g monoton fallend ist (g′ (x) ≤ 0 für alle x),
schließt man ohne Mühe auf
0 < x2k−1 ≤ x2k+1 ≤ x∗ ≤ x2k+2 ≤ x2k , k ∈ N0 .
Wir wissen daher in jedem Stadium der Rechnung
|x2k+2 − x∗ | ≤ |x2k+2 − x2k+1 | ,
wobei die Schranke |x2k+2 − x2k+1 | bei der Rechnung zur Verfügung steht. Damit können wir
während der Rechnung entscheiden, wann wir mit der erreichten Näherung auf Grund der erreichten Genauigkeit zufrieden sind.
4.4
Isomorphismen
Nun wollen wir einen wichtigen Gesichtspunkt bei der Betrachtung mathematischer Objekte
einführen: wann sind Objekte als gleich anzusehen, auch wenn sie in unterschiedlichem Kleide“
”
daherkommen. Dabei stoßen wir auf den Begriff der Strukturgleichheit“, der durch Isomorphis”
men beschrieben wird. Wir geben 4 Beispiele.
Definition 4.4.1 Zwei Graphen G = G(E, K), G′ = G(E ′ , K ′ ) heißen isomorph, in Zeichen
G∼
= G′ , falls es eine bijektive Abbildung ϕ : E −→ E ′ gibt, so dass gilt: k = {u, v} ist eine
Kante in G genau dann, wenn k′ := {ϕ(u), ϕ(v)} eine Kante in G′ ist.
Beispielsweise sind alle vollständigen Graphen mit n Ecken isomorph. Daher ist es gerechtfertigt,
für solche Graphen eine(!) Bezeichnung zu vergeben: Gn . Zu entscheiden, ob Graphen isomorph
sind, ist so einfach nicht. Hilfreich dabei sind Invarianten“ bei Anwendung eines Isomorphismus:
”
Ecken werden auf Ecken vom selben Grad abgebildet, . . . .
Offensichtlich wird durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine
”
Äquivalenzrelation erzeugt.
Definition 4.4.2 Zwei Gruppen (G, •), (G′ , •′ ) heißen isomorph, in Zeichen G ∼
= G′ , falls es
eine bijektive Abbildung ϕ : G −→ G′ gibt mit ϕ(x) •′ ϕ(y) = ϕ(x • y) für alle x, y ∈ G .
Der Isomorphismus ϕ, wie er in Definition 4.4.2 gefordert ist, ist ein bijektiver Gruppenhomomorphismus. Man kann für einen solchen Isomorphismus ϕ zeigen, dass auch ϕ−1 ein
Isomorphismus ist; siehe dazu unten unter Vektorraumisomorphismen. Offensichtlich wird daher
durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine Äquivalenzrelation
”
erzeugt.
Beispiel 4.4.3 Sei ω3 die dritte Einheitswurzel, d.h.
ω3 = cos(2π/3) + i sin(2π/3) .
Stand: 9. Februar 2010
49
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.5. ÜBUNGEN
Betrachte nun die folgenden Gruppentafeln:
+
0
1
2
0
0
1
2
1
1
2
0
·
1
ω3
ω32
2
2
0
1
1 ω3 ω32
1 ω3 ω32
.
ω3 ω32 1
ω32 1 ω3
Die erste Tafel steht für das additive Rechnen in Restklassen bezüglich des Restes drei (siehe
Kapitel 6), die zweite für das multiplikative Rechnen mit speziellen komplexen Zahlen. Beide
Tafeln definieren eine Gruppe. Wie man sieht, sind sie isomorph.
Definition 4.4.4 Zwei Vektorräume (V, +, ·), (V ′ , +′ , ·′ ) über dem selben Skalarkörper K heißen
isomorph, in Zeichen V ∼
= V ′ , falls es eine bijektive Abbildung ϕ : V −→ V ′ gibt mit
′
ϕ(x + y) = ϕ(x) + ϕ(y), ϕ(α · x) = α ·′ ϕ(x) für alle x, y ∈ V, α ∈ K .
Der Isomorphismus ϕ, wie er in Definition 4.4.4 gefordert ist, ist eine lineare Abbildung, da
er offenbar die Linearkombinationen in Linearkombinationen überführt. (Eine Linearkombination ist etwa αx+βy mit α, β ∈ K.) Eine solche Abbildung wird linear genannt. Die Überraschung
ist, dass auch die per definitionem existierende Umkehrabbildung ϕ−1 diese Eigenschaft hat; man
liest dies aus
ϕ−1 (α ·′ v ′ +′ β ·′ w′ ) = ϕ−1 (α ·′ ϕ(ϕ−1 (v ′ )) +′ β ·′ ϕ(ϕ−1 (w′ )))
= ϕ−1 (ϕ(α · ϕ−1 (v ′ )) +′ ϕ(β · ϕ−1 (w′ )))
= ϕ−1 (ϕ(α · ϕ−1 (v ′ ) + β · (ϕ−1 (w′ )))
= α · ϕ−1 (v ′ ) + β · ϕ−1 (w′ ) , v ′ , w′ ∈ V ′ , α, β ∈ K ,
ab. Beide Abbildungen ϕ, ϕ−1 sind also linear. Offensichtlich wird daher durch die Relation
V ∼ V ′ genau dann, wenn V, V ′ isomorph sind“ eine Äquivalenzrelation erzeugt. Genaueres
”
erfährt man in der Linearen Algebra.
Definition 4.4.5 Zwei metrische Räume (X, d), (X ′ , d′ ) heißen isomorph, in Zeichen X ∼
= X ′,
′
′
falls es eine bijektive Abbildung ϕ : X −→ X gibt mit d (ϕ(x), ϕ(y)) = d(x, y) für alle x, y ∈ X .
Die Abbildung ϕ, wie sie in Definition 4.4.5 gefordert ist, ist eine Isometrie, da sie offenbar
die Abstände gleich lässt. Beachte, dass auch ϕ−1 eine Isometrie ist. Offensichtlich wird daher
durch die Relation X ∼ X ′ genau dann, wenn X, X ′ isomorph sind“ eine Äquivalenzrelation
”
erzeugt.
4.5
Übungen
1.)
Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung
mit dieser Permutation in falscher Reihenfolge stehen.
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl.
2.)
Zeige: Die Isomorphie von Graphen ist eine Äquivalenzrelation auf der Menge der Graphen.
3.)
Finde zwei Beispiele von selbstkomplementären Graphen. Dabei heißt ein Graph selbstkomplementär, wenn G zu seinem Komplementärgraphen G isomorph ist.
Stand: 9. Februar 2010
50
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.)
4.5. ÜBUNGEN
Zeige, dass durch
V4 :=
1234
1234
1234
1234
,
,
,
1234
4321
2143
3412
in S4 eine Gruppe gebildet wird; die Verknüpfung sei die in S4 . Ist V4 eine Teilmenge
von A4 ?
5.)
Zeige, dass R2 ∋ (u, v) 7−→ u + iv ∈ C ein Gruppenisomorphismus ist (jeweils bezüglich
der Addition). Gibt es weitere Isomorphismen?
6.)
Unter der Ordnung einer Permutation σ versteht man die kleinste natürliche Zahl n,
so dass σ n = id . Bestimme die Ordnung von
1234
1234
,
.
2143
2341
Stand: 9. Februar 2010
51
c J.Baumeister
Kapitel 5
Zählen
Wir verschaffen uns die Hilfsmittel, um die Kunst des Zählens“ zu skizzieren. Es sind dies
”
die natürlichen Zahlen und Operationen auf ihnen. Im nächsten Kapitel ewächst daraus das
Rechnen in den ganzen Zahlen.
5.1
Natürliche Zahlen
Die erste mathematische Erfindung“ dürfte wohl das Zählen von Gegenständen gewesen sein: je”
dem Gegenstand einer Familie von Gegenständen wird der Reihe nach ein Strich auf einem Auf”
zeichnungsbrett“ zugeordnet, einer bestimmten Anzahl von Strichen wird ein Zahlwert (Eins,
Zwei,. . . ) bzw. eine Zahl (1,2,. . . ) zugeordnet. Diese Zahlen stehen für die Kardinalzahlen im
Gegensatz zu den sogenannten Ordinalzahlen Erster (erster Strich), Zweiter (zweiter Strich),
. . . . Die Zahlen 1, 2, 3, . . . bezeichnen wir als natürliche Zahlen. Als Fundament für die Mathematik sind die natürlichen Zahlen ausreichend, alle“ anderen konkreten Objekte der Mathematik
”
lassen sich dann mit Definition durch Abstraktion erfinden. Also kommt es darauf an, die natürlichen Zahlen als existierende Menge N sicher zu definieren und zu akzeptieren. Von L. Kronecker1
ist überliefert:
Die natürlichen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk.
Was sind aber nun die strukturellen Eigenschaften der natürlichen Zahlen, auf die es ankommt?
Wir gehen zurück zur Tätigkeit des Zählens. Stets beginnen wir mit einem ersten Gegenstand,
wir ordnen ihm die Nummer 1 zu. Haben wir nun eine Reihe von Gegenständen gezählt und ist n
die Anzahl dieser gezählten Gegenstände, dann entscheiden wir, ob noch ein weiterer Gegenstand
zu zählen ist; wenn ja, ordnen wir ihm die Nummer n′ zu. n′ ist also Nachfolgezahl von n : zur
Strichliste haben wir einen Strich hinzugefügt. Diese Beobachtung führt uns zur Definition der
natürlichen Zahlen, wie G. Peano2 sie gegeben hat:
Definition 5.1.1 (Axiome von Peano) Es gibt eine Menge N und ein Element 1 ∈ N mit
folgenden Eigenschaften:
(P1) Zu jedem n ∈ N gibt es ein n′ ∈ N , genannt Nachfolger von n .
(P2) 1 ist kein Nachfolger, d.h. 1 6= n′ für alle n ∈ N .
(P3) Ist n′ = m′ , so ist n = m .
(P4) Ist M eine Teilmenge von N mit 1 ∈ M und gilt (n ∈ M =⇒ n′ ∈ M ), dann gilt M = N.
1
2
Leopold Kronecker, 1823 - 1891
Giuseppe Peano, 1858 - 1932
52
KAPITEL 5. ZÄHLEN
5.1. NATÜRLICHE ZAHLEN
Diese Menge N heißt Menge der natürlichen Zahlen.
Ist m = n′ (im Sinne der Definition 5.1.1), so heißt n Vorgänger von m. (P2) besagt, dass
das Element 1 keinen Vorgänger hat. Man beachte, dass wir die Definition der natürlichen Zahlen
mit Existenz verknüpft haben und nicht das Zählen zur Definition herangezogen haben.
In den natürlichen Zahlen N sollten wir, wenn die axiomatische Einführung wohlgelungen
ist, die Addition, die Multiplikation und das Vergleichen wiederentdecken können. Dazu einige
Vorbereitungen.
Lemma 5.1.2 Es gilt N = {1} ∪ {n′ |n ∈ N} .
Beweis:
Sei M := {1} ∪ {n′ |n ∈ N}. Es gilt M ⊂ N, 1 ∈ M , und ist n ∈ M, so ist n′ ∈ M . Also ist nach
(P4) M = N.
Das Axiom (P4) lässt sich bestens verwenden, neue Objekte zu definieren. Man nennt das
resultierende Prinzip induktive Definition. Wir führen dies am Beispiel der Definition des
kartesischen Produktes vor. Sei A eine Menge. Wir gehen so vor:
A1 := A , Ak := A × An falls k = n′ ∈ N .
Offenbar ist nun nach Lemma 5.1.2 An definiert für jedes n ∈ N .
Ist x ∈ An , n ∈ N, so gibt es x1 , . . . , xn ∈ A mit x = (x1 , . . . , xn ). Dies ist die Schreibweise als
n-Tupel der Elemente in An . Dabei haben wir die Schreibweise schon naheliegend verkürzt; wir
haben ja früher nur zweistellige Paarklammern (·, ·) definiert. Wir haben diese Definition schon
vorweggenommen bei der Definition von Wörtern über einem Alphabet.
Wir wollen nun die arithmetischen Operationen Addition, Subtraktion, Multiplikation,
Vergleich in den natürlichen Zahlen entdecken. Bei der Einführung bedienen wir uns wieder
der induktiven Definition.
Addition:
(
n′
n + m :=
(n + k)′
, falls m = 1
, n, m ∈ N .
, falls m = k′
Beachte, dass nun wirklich die Definition für alle m, m ∈ N gelungen ist, denn nach Lemma 5.1.2
ist ja für m ∈ N entweder m = 1 oder m = k′ für ein k ∈ N .
Nun ist es an der Zeit, zur üblichen Notation 1, 2, 3, . . . zurückzukehren. Dies geschieht durch
1, 2 := 1′ = 1 + 1, 3 := 2′ = 2 + 1, . . . .
n′ schreiben wir also nun immer als n + 1 .
Wir haben nun also eine (binäre) Verknüpfung “+“, die die Eigenschaften der Addition haben
sollte. Die folgenden Rechenregeln belegen, dass die uns geläufigen Eigenschaften der Addition
in der Tat vorliegen.
Regel 5.1.3 Seien m, n, k ∈ N . Es gilt:
Stand: 9. Februar 2010
(m + n) + k = m + (n + k) ;
(5.1)
m + n = n + m;
(5.2)
m + n = m + k =⇒ n = k .
(5.3)
53
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.1. NATÜRLICHE ZAHLEN
Wir beweisen exemplarisch (5.1).
Sei M := {k ∈ N|(m + n) + k = m + (n + k) für alle m, n ∈ N}. Mit der Definition der Addition
gilt
(m + n) + 1 = (m + n)′ = m + n′ = m + (n + 1) .
Also ist 1 ∈ M . Sei k ∈ M. Dann ist mit der Definition der Addition
(m + n) + k′ = ((m + n) + k)′ = (m + (n + k))′ = m + (n + k)′ = m + (n + k′ ), .
Also ist auch k′ ∈ M . Nach (P4) gilt nun M = N .
Gilt m = k′ , so ist k Vorgänger von m. Also schreiben wir dann k = m − 1 . Damit haben
wir die Subtraktion mit 1 zur Verfügung. Wir wissen ja, dass allgemein in N keine Subtraktion
möglich ist.
Wir sollten nun auch die Multiplikation in den natürlichen Zahlen definieren können. Dies
gelingt mit Hilfe der Addition so:
m · 1 := m ; m · (n + 1) := m · n + m , n ∈ N .
Damit ist die Verknüpfung m · n für m, n ∈ N, die wir Multiplikation nennen, wohldefiniert.
Den Multiplikationspunkt · lassen wir mitunter weg, die Schreibweise m × n für m · n vermeiden
wir vollständig.
Die Potenzschreibweise im Bereich der natürlichen Zahlen können wir nun auch einführen.
Wir setzen für alle a ∈ N
a1 := a , an+1 := a · an .
Es gilt dann
an+m = an · am , (an )m = an·m für alle a, n, m ∈ N .
Die Rechenarten “+, ·“ vertragen sich dann mit der neuen Schreibweise; etwa:
1 + 7 = 8, 15 · 3 = 45, 33 = 11 · 3 = (7 + 4) · 3 = 7 · 3 + 4 · 3 = 21 + 12 = 33, . . . .
Dies ist Inhalt der folgenden Regel, die das Distributivgesetz festhält; der Beweis erfolgt auf
dem üblichen Weg über (P4).
Regel 5.1.4 Seien m, n, k ∈ N . Es gilt:
m(n + k) = mn + mk .
(5.4)
(5.5)
Auch die Kleiner–Beziehung finden wir in N wieder. Dabei lassen wir uns von der Anschauung
leiten, dass einer kürzeren Strichliste einige Striche hinzuzufügen sind, um sie einer gegebenen
längeren Strichliste gleichzumachen.
Definition 5.1.5 Seien m, n ∈ N.
(a) m < n : ⇐⇒ ∃ x ∈ N (m + x = n) ;
(b) m ≤ n : ⇐⇒ m < n oder m = n ;
(c) m > n : ⇐⇒ n < m ;
Stand: 9. Februar 2010
54
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
(d) m ≥ n : ⇐⇒ n ≤ m .
Klar, ist n ∈ N und n 6= 1, dann ist n > 1 , denn dann ist n ein Nachfolger nach Lemma 5.1.2,
also etwa n = k′ = k + 1 mit k ∈ N , und daher n > 1 . Ohne Beweis führen wir an:
Regel 5.1.6
5.2
k ≤ m, m < n
=⇒
k < n.
(5.6)
m<n
=⇒
(5.7)
k<m
=⇒
m + k < n + k für alle k ∈ N .
k + 1 ≤ m.
(5.8)
Induktion
Nun wollen wir das Axiom (P4) einsetzen als Beweismethode. Dieses Prinzip der Induktion
stellt sich so dar:
Sei A(n) für jedes n ∈ N eine Aussage. Diese Aussage gilt für alle n ∈ N, falls
Induktionsbeginn: A(1) ist wahr.
Induktionsschluss: Ist A(n) wahr, dann ist auch A(n + 1) wahr.
verifiziert werden kann. Klar, man hat ja nur die Menge M := {n ∈ N|A(n) ist wahr} einzuführen und darauf (P4) anzuwenden.
Häufig wird Sei A(n) wahr“ als Zwischenschritt Induktionsverankerung oder Induktions”
annahme formuliert; wir verzichten darauf. Damit wird ja nur die Voraussetzung im Induktionsschluss extra herausgestellt.
Beispiel 5.2.1 Über C.F. Gauss3 wird berichtet, dass er die Beschäftigungstherapie seines Lehrers “Addiert mal die ersten 20 Zahlen“ durch folgenden Trick zunichte gemacht hat: Er addiert
die erste und die letzte Zahl: Ergebnis 21; er addiert die zweite und die vorletzte Zahl: Ergebnis
21; er . . . . Also kann man das verlangte Resultat durch
1 + 2 + · · · + 20 = 10 · 21 = 210
erhalten. Man beachte, dass die Lösungsmethode von Gauß auch tiefere“ Einsichten mitliefert:
”
Wann ist das Ergebnis gerade, warum ist die letzte Ziffer im Ergebnis oben eine Null.
Löst man sich von den konkreten Zahlen, ist also zu beweisen:
2
n
X
i = n(n + 1)
i=1
Der Beweis mittels vollständiger Induktion sieht so aus:
Induktionsbeginn: Die Formel ist offenbar richtig für n = 1.
Induktionsschluss: Die Formel sei richtig für n. Wir zeigen damit die Richtigkeit der Formel für
n + 1 so:
n
n+1
X
X
i + 2(n + 1) = n(n + 1) + 2(n + 1) = (n + 1)(n + 2) .
i=2
2
i=1
i=1
3
Gauss, Carl Friedrich (1777 — 1855)
Stand: 9. Februar 2010
55
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
Beispiel 5.2.2 Den Pythagoreern war bekannt, dass die Quadratzahlen die Summe ungerader
Zahlen sind, d. h. dass
n
X
(2i + 1) = (n + 1)2 , n ∈ N ,
1+
i=1
gilt. Sie hatten dafür einen geometrischen Beweis“; lese ihn aus der Figurensequenz in Abbil”
dung 5.1 ab! Der Beweis mittels vollständiger Induktion sieht (in abgekürzter Notation) so aus:
n = 1 : Klar.
n+1 :
1+
n+1
X
(2i + 1) = 1 +
n
X
(2i + 1) + (2(n + 1) + 1) = n2 + 4n + 4 = (n + 2)2
i=1
i=1
Die Aufspaltung 1 +
n
P
(2i + 1) ist der Tatsache geschuldet, dass wir hier noch keine Null (als
i=1
Summationsindex) zur Verfügung haben.
Beispiel 5.2.3 Beweise, dass für jede natürliche Zahl n
(n + 3)2 > 3(n + 3) + n
gilt. Wir betrachten dazu die Aussage
A(n) : (n + 3)2 > 3(n + 3) + n
und beweisen die Gültigkeit der Aussage für jedes n ∈ N nach dem Induktionsprinzip.
Induktionsbeginn: A(1) ist wahr, da (1 + 3)2 = 42 = 16 > 12 + 1 = 3(1 + 3) + 1 ist.
Induktionsschluss: Sei A(n) wahr.
((n + 1) + 3)2 = ((n + 3) + 1)2 = (n + 3)2 + 2(n + 3) + 1
> 3(n + 3) + n + 2(n + 3) + 1 > 3(n + 3) + n + 1 + 3 = 3(n + 4) + n + 1
Also folgt aus der Gültigkeit der Aussage A(n) die Gültigkeit der Aussage A(n + 1).
Die Aussage A(n) ist nach dem Induktionsprinzip nun für alle n ∈ N bewiesen. Die Ungleichung
(n + 3)2 > 3(n + 3) + n , n ∈ N,
kann aber auch ohne den Rückgriff auf das Induktionsprinzip bewiesen werden, da n2 + 2n ≥ 1
ist. Stelle die Verbindung her!
Beispiel 5.2.4 Bei einem Tennisturnier ist die Teilnehmerzahl üblicherweise eine Zweierpotenz
2n (n = 7 bei einem Grand-Slam-Turnier). Die Anzahl der Spiele bei einem K.O.-System beträgt
2n − 1. Dies lässt sich mit Induktion zeigen:
n = 1: Bei zwei Teilnehmern gibt es offenbar 1 = 21 − 1 Spiele.
n + 1: Die 2n+1 Teilnehmer lassen sich in zwei Gruppen zu je 2n Teilnehmern einteilen. Nach
Induktionsvoraussetzung gibt es in jeder Gruppe 2n − 1 Paarungen, also insgesamt 2(2n − 1)
Paarungen. Die Sieger der beiden Gruppen treffen dann in einer letzten Paarung aufeinander,
so dass es
2(2n − 1) + 1 = 2n+1 − 1
Paarungen gibt.
Man kann die Lösung mit einem anderen Argument schneller finden. Wegen des K.O.Systems verliert bis auf den Gewinner jeder Teilnehmer genau einmal. Jedes Spiel hat genau
Stand: 9. Februar 2010
56
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
einen Verlierer. Also gibt es ein Spiel weniger als die Teilnehmerzahl. Dieser Alternativbeweis
lässt sich auf Teilnehmerfelder beliebiger Größe anwenden (z.B. wenn es Freilose gibt). Also gibt
es bei m Teilnehmern m − 1 Spiele.
Diese Gegenüberstellung der beiden Beweise zeigt, dass Induktion nicht immer die kürzeste
Beweismethode ist.
Nun verwenden wir die vollständige
Induktion zur Aufklärung der inneren
”
Struktur“ der natürlichen Zahlen.
Satz 5.2.5 Für m, n ∈ N gilt genau eine
der folgenden Aussagen:
•
•
◦
•
•
• •
◦ ◦
◦ ◦
•
•
•
•
◦
◦
◦
•
◦
◦
◦
•
◦
◦
◦
•
•
•
•
Abbildung 5.1: Quadratzahlen
m < n , m = n , m > n.
Beweis:
Sei n ∈ N . Zu m ∈ N setzen wir Mm := {x ∈ N|n + x = m}. Wir untersuchen die beiden Fälle
Mm 6= ∅ und Mm = ∅ .
Ist Mm 6= ∅, dann gibt es x ∈ N mit n + x = m , also n < m .
Wir beweisen mit vollständiger Induktion (bezüglich m) die folgende Behauptung:
Ist Mm = ∅, dann trifft genau eine der folgenden Aussagen zu: n > m, n = m .
m = 1 : Ist n = m, dann sind wir fertig. Ist n 6= m = 1, dann ist sicher n > 1 = m .
m + 1 : Sei also Mm+1 = ∅. Dann ist auch Mm := {y ∈ N|n + y = m} = ∅, da sonst für y ∈ Mm
sofort x := y + 1 ∈ Mm+1 folgt. Also gilt nach Induktionsvoraussetzung genau eine der Aussagen
n > m, n = m . n = m ist nicht möglich, da sonst 1 ∈ Mm+1 wäre. Also wissen wir nun n > m,
und es gibt daher z ∈ N mit m + z = n. Ist z = 1, dann ist m + 1 = n, ist z > 1, dann ist
1 + u = z mit einem u ∈ N und wir haben (m + 1) + u = m + (1 + u) = n, d. h. n > m + 1 .
Damit ist nun gezeigt, dass eine der Aussagen
m<n, m=n, m>n
jedenfalls eintritt. Bleibt die Unverträglichkeit von zweien der Aussagen zu zeigen, etwa von
m = n und m > n . Wenn m = n und m > n gilt, dann gibt es x ∈ N mit m + x = m. Mit
vollständiger Induktion folgt sofort, dass diese Gleichheit für kein m ∈ N gelten kann.
Satz 5.2.6 (Wohlordnungssatz) Jede nichtleere Teilmenge M von N enthält ein kleinstes
Element (bezüglich ≤).
Beweis:
Sei m ∈ M . Wähle in 1, . . . , m das kleinste Element m∗ aus M (bezüglich ≤ ) aus. Diese Auswahl
ist möglich, da nach Satz 5.2.5 die Elemente 1, . . . , m bezüglich ihrer Größe nach verglichen
werden können. Da die natürlichen Zahlen n ≥ m nicht als kleinste Elemente von M in Frage
kommen, ist m∗ das kleinste Element von M .
Bei der Komplexitätsanalyse – und nicht nur dort – ist eine Notation hilfreich, die einen Vergleich von Funktionen so zulässt, dass ihr Verhalten für große natürliche Zahlen zum Vorschein
kommt.
Stand: 9. Februar 2010
57
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.3. ABZÄHLEN
Definition 5.2.7 Sei f : N −→ N . Dann bezeichnet
O(g) := {f : N −→ N|es gibt c > 0, N ∈ N mit f (n) ≤ cg(n) für alle n ≥ N } .
Gehört eine Funktion f : N −→ N zu O(g), so schreibt man f ∈ O(g) oder f = O(g) und wir
sprechen f ist groß-O von g .“
”
Die Tatsache, dass in der Definition von O(g) nur das Verhalten für große natürliche Zahlen
eine Rolle spielt, drückt man oft so aus: f ist groß-O von g für n −→ ∞ .
Beispiel 5.2.8
n3 = O(n3 ) für n → ∞ .
Pn
2
i=1 i = O(n ) für n → ∞ .
Wenn wir sagen, dass ein Algorithmus einen Aufwand von O(g(n)) hat, dann meinen wir
damit Folgendes: Wenn der Algorithmus auf unterschiedlichen Computern mit den gleichen
Datensätzen läuft, und diese die Größe n haben, dann werden die resultierenden Laufzeiten
immer kleiner sein als eine Konstante mal g(n) .
5.3
Abzählen
Kombinatorik bedeutet Kunst des Zählens“. Sie beschäftigt sich mit Möglichkeiten, die Anzahl
”
der Elemente bei endlichen Mengen zu bestimmen. Die Elemente des kleinen Einmaleins der
”
Kombinatorik“ stellen wir in Kapitel 8 vor. Die Resultate sind interessant und hilfreich etwa
beim Einstieg in die Wahrscheinlichkeitstheorie und bei Anwendungen in der Informatik. Hier
erläutern wir nur, wie wir die Elemente einer Menge zählen wollen.
Als Prototyp“ einer Menge mit n Elementen steht uns Nn := {1, . . . , n} zur Verfügung.
”
Damit wollen wir erklären, wann eine beliebige Menge n Elemente besitzt. Wenn wir zählen/abzählen, ordnen wir den Elementen einer Menge von Objekten sukzessive eine natürliche Zahl,
beginnend bei 1, zu. Wesentlich beim Zählen ist, dass wir zwei verschiedenen Objekten nicht
dieselbe Zahl zuordnen. Dies führt uns dazu, das Zählen mit einer Abbildung, der Zuordnung,
mit Werten in N zu beschreiben, die zusätzlich die eben formulierte Forderung respektiert. Als
Vorbereitung für das Abzählen von Mengen beweisen wir
Satz 5.3.1 Sei A eine Menge, seien m, n ∈ N, und seien φ : A −→ Nn , ψ : A −→ Nm
bijektiv. Dann gilt n = m .
Beweis:
Wir beweisen mit vollständiger Induktion die Aussage
Zu n ∈ N gibt es für 1 ≤ m < n keine injektive Abbildung g : Nn −→ Nm .
n = 1 : Klar, da Nn = {1}, Nm = ∅ für m < n .
n + 1 : Annahme: Es gibt eine injektive Abbildung g : Nn+1 −→ Nm , 1 ≤ m < n + 1 .
Da g injektiv ist und Nn+1 mindestens die Elemente 1,2 enthält, ist 1 < m . Sei k := g(n + 1) .
Offenbar gibt es eine Bijektion f : Nm −→ Nm mit f (i) = i für i 6= k, m und f (k) = m, f (m) =
k . Nun ist (f ◦ g)|Nn : Nn −→ Nm−1 injektiv, wobei also 1 ≤ m − 1 < n gilt. Dies ist im
Widerspruch zur Induktionsannahme.
Nachdem nun die obige Aussage bewiesen ist, ist die Behauptung des Satzes schnell gezeigt.
Annahme: Es gibt bijektive Abbildungen φ : A −→ Nn , ψ : A −→ Nm , n 6= m . O.E. sei etwa
n > m . Da ψ ◦ φ−1 : Nn −→ Nm bijektiv ist nach Lemma 4.2.5, haben wir einen Widerspruch
zur obigen Aussage.
Stand: 9. Februar 2010
58
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.3. ABZÄHLEN
Definition 5.3.2 Sei M eine Menge, M 6= ∅ .
(a) M heißt endlich, wenn es ein N ∈ N und eine bijektive Abbildung ϕ : M −→ {1, . . . , N }
gibt; wir setzen dann #M := N . (Da nach Satz 5.3.1 die Zahl N eindeutig bestimmt ist,
ist die Schreibweise #M := N wohldefiniert.)
(b) M heißt abzählbar unendlich, wenn es eine bijektive Abbildung ϕ : M −→ N gibt. Wir
schreiben dann #M = ∞ .
(c) M heißt abzählbar, wenn M endlich oder abzählbar unendlich ist.
Die obige Definition sagt also, dass wir die Elemente einer (endlichen) Menge M gezählt
haben, wenn wir eine Bijektion φ : M −→ {1, . . . , N } gefunden haben; das Zählergebnis ist
#M := N .
Endliche Mengen haben wir schon viele
kennengelernt. Als ganz einfache Beispiele für
b1
b2
···
bn
abzählbare unendliche Mengen führen wir an:
a
(a
,
b
)
(a
,
b
)
·
·
·
(a
1
1 1
1 2
1 , bn )
A := {10n |n ∈ N} , N × N . Mit der Definitia2 (a2 , b1 ) (a2 , b2 ) · · · (a2 , bn )
on 5.3.2 (a),(b) verträglich ist, dass wir Nn die
..
..
..
..
.
.
.
.
Elementanzahl n zuordnen und dass N abzählam (am , b1 ) (am , b2 ) · · · (am , bn )
bar unendlich ist; die Identität ist ja jeweils
die passende Bijektion. Klar, der leeren Menge ordnen wir die Elementanzahl 0 zu, d. h.
Abbildung 5.2: Abzählschema
#∅ := 0 , und bezeichnen sie ebenfalls als endliche Menge.4 Man beachte, dass es Mengen
gibt, die nicht abzählbar sind. Ein wichtiges
Beispiel ist M := R . Das Cantorsche Diagonalisierungsverfahren, das üblicherweise im
Rahmen der Analysis im Zusammenhang mit der Dezimalbruchentwicklung vorgestellt wird,
belegt dies; wir kommen darauf zurück.
Sind A, B endliche Mengen, dann gilt für das kartesische Produkt die Formel
#(A × B) = #A · #B
(5.9)
Dies liest man etwa am Rechteckschema in Abbildung 5.2 ab (#A = m, #B = n).
Wir können die Situation des kartesischen Produkts in drei Veranschaulichungen festhalten;
siehe Abbildung 5.3 für m = 3 und n = 4 . Die Baumdarstellung“ hat den Vorteil, dass man sie
”
mühelos auf mehr als zwei Faktoren ausdehnen kann; man hat ja nur in die Tiefe weiterzubauen.
Wir halten der besseren Zitierbarkeit wegen die elementaren Zählprinzipien nochmal
kompakt fest:
Gleichheitsregel Existiert eine Bijektion zwischen zwei Mengen M und N , so gilt #M = #N .
Summenregel Sei M = ∪ki=1 Mi eine disjunkte Vereinigung endlicher Mengen. Dann gilt:
P
#M = ki=1 #Mi .
4
Die Definition 5.3.2 ist nicht die von G. Cantor 1895 erstmals gegebene Definition der Unendlichkeit einer
Menge: eine Menge ist unendlich, wenn zwischen ihr und einer ihrer echten Teilmengen eine umkehrbar eindeutige
Zuordnung möglich ist.
Stand: 9. Februar 2010
59
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.4. REKURSION
x
a
y
c
b
u
c
z
b
a
x
(a) Abbildungsmodell
b
c
a
y
u
(b) Gittermodell
z
x
y
u z x
y u
z
x y
u
z
(c) Baumdarstellung
Abbildung 5.3: Veranschaulichung des kartesischen Produkts
Produktregel Sei M = M1 × · · · × Mk ein kartesisches Produkt. Dann gilt #M =
Alle Regeln ergeben sich aus den obigen Ableitungen in offensichtlicher Weise.
k
Q
#Mi .
i=1
Ein einfaches, aber sehr anwendungsreiches Prinzip, in einer Anzahl von Objekten die Existenz eines Objekts mit einem bestimmten Merkmal behaupten zu können, ist das
Schubfachprinzip 5 Verteilt man n Objekte auf r < n Schubfächer, so existiert ein Fach, das
mindestens zwei Objekte enthält.
Dieses Prinzip ist völlig klar, nichts ist zu beweisen. Es ist daher überraschend, dass dieses
Prinzip zu nichttrivialen Ergebnissen führt, wie wir noch sehen werden. Zunächst eine Verallgemeinerung:
Schubfachprinzip/allgemein Verteilt man n = r·k+1 Objekte auf r Schubfächer, so existiert
ein Fach, das mindestens k + 1 Objekte enthält.
Formulieren wir das allgemeine Schubfachprinzip mengentheoretisch:
Schubfachprinzip für Mengen Ist eine Menge M mit Elementanzahl n = r · k + 1 in r
disjunkte Teilmengen zerlegt, so gibt es eine Teilmenge, die mindestens k + 1 Elemente
besitzt.
5.4
Rekursion
Ein Objekt wird als rekursiv bezeichnet, wenn es sich selbst als Teil enthält oder mit Hilfe
von sich selbst definiert ist. Rekursion kommt nicht nur in der Mathematik vor, sondern auch
im täglichen Leben (ein Bild im Spiegel im Spiegel . . . ). Rekursion kommt speziell in mathematischen Definitionen vor. Ein Beispiel haben wir schon kennengelernt: in der Definition der
natürlichen Zahlen kommt die zur Definition anstehende Menge N selbst vor. Ein anderes Beispiel ist die Fakultät einer natürlichen Zahl. Ihre rekursive Definition sieht so aus:
(
1
falls n = 1
n! :=
n · (n − 1)! falls n 6= 1
Es ist nicht überraschend, dass Rekursion sehr oft im Zusammenhang mit Objekten greift, die
mit natürlichen Zahlen im Zusammenhang stehen, da ja die natürlichen Zahlen selbst rekursiv
”
definiert sind“.
5
Es wird im Englischen “pigeonhole principle“, also Taubenschlagprinzip genannt.
Stand: 9. Februar 2010
60
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.4. REKURSION
Das Wesentliche an der Rekursion ist die Möglichkeit, eine unendliche Menge von Objekten
durch eine endliche Aussage zu definieren oder eine unendliche Anzahl von Berechnungsschritten
durch ein endliches Programm zu beschreiben. Allerdings ist Vorsicht geboten, denn rekursive
Anweisungen bergen die Gefahr nicht abbrechender Ausführung; der Terminierung ist also besonderes Augenmerk zu schenken.
Hier führen wir zwei Beispiele an, die keine Hintergrundtheorie benötigen. Später kommen
wir zu einem weiteren Beispiel, nämlich zur rekursiven Behandlung des Problems des größten
gemeinsamen Teilers.
Die Türme von Hanoi
Wir betrachten drei Pfeiler i, j, k, auf die runde Scheiben mit unterschiedlichem Durchmesser
aufgesteckt werden können. Das Problem lautet: Es sind n Scheiben, die auf dem Pfeiler i mit
nach oben abnehmendem Durchmesser aufgesteckt sind unter Zuhilfenahme des Pfeilers k durch
sukzessive Bewegung jeweils einer Scheibe auf den Pfeiler j umzuschichten. Dabei ist darauf
zu achten, dass niemals eine Scheibe mit größerem Durchmesser auf einer mit einem kleinerem
Durchmesser zu liegen kommt.
Man kann dieses Problem folgendermaßen lösen:
Man schichtet die obersten n − 1 Scheiben vom Pfeiler i auf den Pfeiler k unter
Zuhilfenahme von Pfeiler j den Regeln entsprechend; dann bringt man die auf dem
Pfeiler i verbliebene einzige (anfangs unterste) Scheibe auf den Pfeiler j . Nun ist der
Pfeiler i frei und man kann die n − 1 Scheiben vom Pfeiler k auf den Pfeiler j mit
Hilfe des Pfeilers i umschichten.
Es ist klar das rekursive Vorgehen zu erkennen: zur Lösung des Problems der Größe n bedienen
wir uns der Lösung der Größe n − 1 .
Wir benötigen die Bewegungsarten
bewege(m,von,über,nach), bringe(von,nach) .
Hierbei bedeutet bewege(l,a,b,c), dass die l obersten Scheiben vom Pfeiler a nach Pfeiler c den Regeln entsprechend unter Nutzung von b als Hilfspfeiler umzuschichten sind. Mit
bringe(a,b) wird die oberste Scheibe vom Pfeiler a auf den Pfeiler b gelegt. Die rekursive
Lösung für bewege(n,i,j,k) lautet damit:
Solange n > 0
bewege(n-1,i,j,k), bringe(i,j), bewege(n-1,k,j,i).
Beim Lösen der Aufgabe für n Scheiben, wird
Z(n) := 2n − 1 mal eine Scheibe umgelegt
Dies zeigt man induktiv. Der Induktionsbeginn ist trivial, der Induktionsschluss sieht so aus:
Z(n) = 1 + 2Z(n − 1) = 1 + 2(2n−1 − 1) = 2n − 1
Der Aufwand ist enorm: für n = 64 müssen 264 − 1 ∼ 1021 Scheiben umgelegt werden. Allerdings
sind wir ja nicht sicher, ob es nicht einen schnelleren Algorithmus gibt. Dies ist aber nicht der
Fall! (Man kann genauer hinsehen: Die kleinste Scheibe S1 wird bei jedem zweiten Zug bewegt,
die größte Scheibe Sn wird nur einmal bewegt, die Scheibe Sm wird genau 2n−m mal bewegt.)
Stand: 9. Februar 2010
61
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.5. PRIMZAHLEN
Die Ackermann-Funktion Als Beispiel für eine rekursive Funktionsdefinition komplexerer
Art betrachten wir das Beispiel der so genannten Ackermann-Funktion A(m, n) . Die Definition
lautet:

falls m = 0

n + 1
A(m, n) := A(m − 1, 1)
falls m 6= 0, n = 0 , m, n ∈ N0 .


A(m − 1, A(m, n − 1)) falls m 6= 0, n 6= 0
Die Ackermann-Funktion wächst sehr stark:
2
A(0, n) > n , A(1, n) > n + 1 , A(2, n) > 2n , A(3, n) > 2n , A(4, 3) > 22 , A(5, 4) > 1010000
Der Aufwand, um A(m, n) auszurechnen, wächst auch entsprechend. Beispielsweise erfordert die
Berechnung von A(1, 3) bereits folgende Rechenschritte:
A(1, 3) = A(0, A(1, 2)) = A(0, A(0, A(1, 1))) = A(0, A(0, A(0, A(1, 0))))
= A(0, A(0, A(0, A(0, 1)))) = A(0, A(0, A(0, 2))) = A(0, A(0, 3)) = A(0, 4) = 5
Es ist nicht sehr einfach einzusehen, dass die Rekursion terminiert; es ist so!
Satz 5.4.1 Für alle m, n ∈ N terminiert der Aufruf A(m, n) nach endlich vielen Schritten.
Beweis:
Der Beweis erfolgt durch zwei ineinander geschachtelte Induktionen über m (äußere Induktion)
und, bei festem m, über n (innere Induktion). Induktionsanfang: m = 0
Es folgt unabhängig von n nur ein Aufruf.
Induktionsvoraussetzung: Die Behauptung sei richtig für alle k mit 0 ≤ k ≤ m, und für alle
n ∈ N.
Induktionsschluss: m + 1
Induktion über n
n = 0: Hier wird für A(m + 1, 0) der Wert A(m, 1) zurückgegeben. Hierfür terminiert
der Aufruf nach Induktionsvoraussetzung der äußeren Induktion. Induktionsvoraussetzung: Der Aufruf A(m + 1, l) terminiert für (festes) m und alle l ≤ n.
Induktionsschluss: n + 1
Der Aufruf von A(m + 1, n) erzeugt den Aufruf von A(m, A(m + 1, n − 1)). Nach innerer Induktionsvoraussetzung terminiert der Aufruf A(m + 1, n − 1) und liefert eine
Zahl k. Dies erzeugt den Aufruf A(m, k), der nach äußerer Induktionsvoraussetzung
terminiert.
5.5
Primzahlen
Die Bausteine der natürlichen Zahlen sind die Primzahlen. Dies wollen wir nun belegen.
Definition 5.5.1 Eine Zahl p ∈ N, p 6= 1, heißt Primzahl, falls aus p = kl mit k, l ∈ N folgt:
k = 1 oder l = 1 . (Später nennen wir k, l Teiler.)
Über die Existenz unendlich vieler Primzahlen war sich schon Euklid im Klaren. Die größte
Zahl, von der man zur Zeit L. Eulers wusste, dass sie eine Primzahl ist, war 231 − 1, eine Zahl
mit 10 Stellen. Zur Vorbereitung Euklids Beweises von der Existenz unendlich vieler Primzahlen
geben wir an:
Stand: 9. Februar 2010
62
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.5. PRIMZAHLEN
Lemma 5.5.2 Sei n ∈ N, n ≥ 2. Sei
T := {m ∈ N|m ≥ 2, n = km mit k ∈ N} .
Dann besitzt T ein (bezüglich ≤) kleinstes Element p und p ist eine Primzahl.
Beweis:
Sicherlich ist n ∈ T . Klar, nach dem Wohlordnungssatz 5.2.6 besitzt T ein kleinstes Element
p ∈ N, p ≥ 2; also p ≤ m für alle m ∈ T und n = kp mit k ∈ N .
Annahme: p ist keine Primzahl.
Dann gibt es l, j ∈ N, 2 ≤ l < p, mit p = lj . Dann gilt n = pk = l(jk), also l ∈ T, was im
Widerspruch zur Minimalität von p in T ist.
Satz 5.5.3 (Unendlichkeit der Primzahlen/Euklid) Es gibt unendlich viele Primzahlen.
Beweis:
Annahme: Es gibt nur endlich viele Primzahlen.
Seien p1 , . . . , pr diese Primzahlen. Setze N := p1 · · · pr + 1. Dann ist N ∈ N und N ≥ 2. Da
N > pi für jedes i = 1, . . . , r ist, ist N keine Primzahl. Also gibt es nach Lemma 5.5.2 eine
Primzahl p ∈ N mit N = kp, k ∈ N . Also kommt p unter p1 , . . . , pr vor; o.E. p = p1 . Dann folgt:
1 = p(k − p2 . . . pr ) .
Daraus liest man nun p = ab, was ein Widerspruch ist.
Die einzige gerade Primzahl ist 2. Alle anderen Primzahlen sind ungerade. Daraus folgt sofort,
dass diese Primzahlen von der Form 4m + 1 bzw. 4m + 3 mit m ∈ N sind. Also haben wir drei
Schubladen“ von Primzahlen:
”
P2 = {2} , P1 = {p|p Primzahl , p = 4m + 1} , P3 = {p|p Primzahl , p = 4m + 3} .
Nun bleibt die Frage, ob P1 und P3 unendlich viele Zahlen enthält. Dies ist so!
Bemerkung 5.5.4 J. Bertrand stellte die Vermutung auf, dass zwischen n und 2n stets eine
Primzahl liegt; er selbst verifizierte die Vermutung für n < 3000000 . Ein erster Beweis für die
vermutete Tatsache wurde 1850 von P. Tschebyscheff vorgelegt.
Wir geben hier nicht den Beweis
erbracht
werden kann, sondern verifiwieder, der durch eine sorgfältige Abschätzung von 2n
n
zieren die Vermutung nur für n < 4000 (Landau’s Trick): Hier ist eine Folge von Primzahlen,
von denen jeweils die Verdopplung größer als die folgende Zahl ist:
2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001
Beispiel 5.5.5 Lange Zeit glaubte man, dass die so genannten Fermatsche Zahlen
n
Fn := 22 + 1, n ∈ N ,
stets Primzahlen sind. Für n = 0, 1, 2, 3, 4 trifft dies zu:
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537 .
Im Jahre 1733 widerlegte L. Euler mit dem Beispiel F5 = 4294967297 = 641 · 6700417 die
Vermutung. Bisher hat man keine weitere Zahl Fn als Primzahl erkannt, im Gegenteil, die
Vermutung ist nun, dass keine Fermatzahl Fn , n ≥ 5, eine Primzahl ist. Die kleinste Fermatzahl,
von der man derzeit noch nicht weiß, ob sie eine Primzahl ist oder nicht, ist die Zahl F24 .
Beispielsweise ist F18 = 13631489 · k , wobei k eine Zahl mit 78906 Stellen ist.
Stand: 9. Februar 2010
63
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.6. ÜBUNGEN
Wie kann man bei gegebener Zahl n entscheiden, ob es sich um eine Primzahl handelt oder
nicht? Liegt eine große Zahl vor, so ist die Aufgabe schwierig. Die Probiermethode, n sukzessive
auf Teiler zu untersuchen, kann man sehr schnell als sehr zeitraubend“ erkennen. Aktualität
”
erhielt die Frage bei der Suche nach Primzahltests in der Kryptologie. In der Kryptologie
beschäftigt man sich mit der Verschlüsselung von Nachrichten zum Zwecke der Geheimhaltung
und mit der Entschlüsselung zum Zwecke der Aufdeckung von Nachrichten.
5.6
1.)
Übungen
Sei g : N ∋ n 7−→ n(n2 + 11) ∈ N . Zeige:
(a)
g ist injektiv, aber nicht surjektiv.
(b) 6 ist ein Teiler von 3n2 + 3n + 12 für alle n ∈ N .
(c)
6 ist ein Teiler von g(n) für alle n ∈ N .
2.)
Ein deutsches Autokennzeichen besteht aus einer Kombination von ≤ 3 Buchstaben für
den Landkreis oder die Stadt, ≤ 2 weiteren Buchstaben und bis zu einer vierstelligen
Zahl. Bestimme die Anzahl der möglichen Kennzeichen (wenn man von einer Assoziation
mit dem Namen des Landkreises absieht).
3.)
Die Fibonacci-Zahlen Fn sind definiert durch
F0 := F1 := 1 , F n + 1 := Fn + Fn−1 , n ≥ 1 .
(a)
Schreibe ein rekursives Berechnungsschema und mache das rekursive Rechenschema
durch einen binären Baum klar.
(b) Welche überflüssige Rechenschritte lassen sich finden ?
4.)
Die Collatz/Kakutani/Klam/Ulam-Folge ist ausgehend vom Startwert c0 ∈ N folgendermaßen definiert:
(
1
cn
falls n gerade
,
cn+1 := 2
3cn + 1 sonst
wobei die Berechnung abgebrochen wird, wenn cn = 1 eintritt. Es ist bisher nicht gezeigt,
dass die Berechnung für jedes c0 abbricht.
Finde eine rekursive Funktion C : N −→ N , die die Länge der Collatz/Kakutani/Klam/UlamFolge in Abhängigkeit von c0 berechnet.
5.)
Finde einen Algorithmus, der die n-te Fibonacci-Zahl rekursiv berechnet.
Stand: 9. Februar 2010
64
c J.Baumeister
Kapitel 6
Elementare Arithmetik
Arithmetik ist das Teilgebiet der Mathematik, welches auch als Synonym zum Begriff Zahlentheorie verstanden werden kann. Elementare Arithmetik bezeichnet allgemein das Rechnen mit
natürlichen Zahlen und ganzen Zahlen und die Untersuchung der Konsequenzen, die sich daraus
ergeben, dass die Division in den ganzen Zahlen nur eingeschränkt möglich ist.
6.1
Ganze Zahlen
In Abschnitt 5.1 haben wir die natürlichen Zahlen geschaffen“. Skizzieren wollen wir nun den
”
Konstruktionsweg von den natürlichen Zahlen zu den ganzen Zahlen. Wir sehen dabei die Nützlichkeit des Begriffs der Äquivalenzrelation“ ein. Auf N × N läßt sich nämlich eine Äquivalenzrelation durch
R := {((m, n), (k, l)) ∈ N2 × N2 |m + l = n + k} ,
d.h.
(m, n) ∼ (k, l) : ⇐⇒ m + l = n + k ,
einführen. Man bestätigt leicht, dass in der Tat eine Äquivalenzrelation vorliegt. Etwa folgt die
Symmetrie allein schon aus der Kommutativität der Addition in den natürlichen Zahlen; siehe
Rechenregel 5.2.
Die Zuordnung eines Paares (m, n) zu einer Klasse [(k, l)] geschieht unter dem Gesichtspunkt,
dass die Differenz m − n gleich der Differenz k − l ist und dies liefert den Zusammenhang zur
Menge der ganzen Zahlen Z, wenn wir sie schon als bekannt voraussetzten. Also sollte etwa
[(n, n)] für 0 ,
[(n + 1, n)] für 1 , [(n, n + 1)] für − 1 ,
[(n + n, n)] für n , [(n, n + n)] für − n ,
stehen. Der Weg, ausgehend von der Kenntnis der natürlichen Zahlen, die ganzen Zahlen zu
konstruieren, ist also vorgezeichnet:
Man führe Z als Menge der Äquivalenzklassen (N × N)/ R ein.
Vervollständigt wird dieser Schritt durch die Beobachtung, daß durch
[(m, n)] ⊕ [(k, l)] := [(m + k, n + l)]
eine Addition und durch
[(m, n)] ⊙ [(k, l)] := [(m · k + n · l, m · l + n · k)]
65
KAPITEL 6. ELEMENTARE ARITHMETIK
6.1. GANZE ZAHLEN
eine Multiplikation eingeführt wird. Die Anordnung der ganzen Zahlen spiegelt sich in
[(m, n)] ⊳ [(k, l)] : ⇐⇒ m + l < n + k bzw. [(m, n)] [(k, l)] : ⇐⇒ m + l ≤ n + k
wieder. Hierbei ist ja “ < , ≤ “ schon von den natürlichen Zahlen her bekannt. Beachte bei diesen
Definitionen stets, dass [(m, n)] für m−n stehen sollte. Ergänzend sei nun noch die Subtraktion
[(m, n)] ⊖ [(k, l)] := [(m, n)] ⊕ [(l, k)] .
eingeführt.
Bemerkung 6.1.1 Wenn man mit Äquivalenzklassen neue Objekte unter Verwendung von Repräsentanten für die Klassen definiert, hat man sich zu vergewissern, dass die Definition vom
Repräsentanten für die Klasse unabhängig ist. Dies ist oben bei der Definition der Addition,
Multiplikation und Kleiner–Beziehung der Fall. Bei der Addition etwa bedeutet dies, nachzuweisen, dass [(m, n)] ⊕ [(k, l)] = [(m′ , n′ )] ⊕ [(k′ , l′ )] ist, falls [(m, n)] = [(m′ , n′ )] , [(k, l)] = [(k′ , l′ )]
gilt. Dies sieht man mit Hilfe der Identitäten m + n′ = m′ + n , k + l′ = k′ + l sofort ein.
Entsprechend unserer Hinführung finden wir die natürlichen Zahlen wieder als Teilmenge
e := {[(n + n, n)]|n ∈ N} . Auch diese Menge erfüllt nun die Peano–Axiome:
N
e;
• 1̃ := [(n + 1, n)] ∈ N
• n]
+ 1 := [(n + n + 1, n)] Nachfolger von n
e;
• 1̃ ist kein Nachfolger, denn aus 1̃ = [(n+n+1, n)] folgt sofort die widersprüchliche Aussage
1 = n + 1;
f ⊂ N,
e so dass 1̃ ∈ M
f und (ñ ∈ M
f =⇒ n]
f), dann ist offenbar M
f=N
e.
• Ist M
+1∈M
e , n ∈ N und die Null 0̃ := [(n, n)] .
Zusätzlich haben wir die negativen Zahlen [(n, n + n)] ∈ N
Die aufwendige Schreibweise wollen wir nun aber wieder vermeiden. Wir tun dies, indem wir,
statt die Existenz der natürlichen Zahlen axiomatisch zu fordern, die ganzen Zahlen axiomatisch
einführen.
Es gibt Mengen N, Z , ein Element 0 ∈ Z, Abbildungen
Z × Z ∋ (a, b) 7−→ a + b ∈ Z,
Z × Z ∋ (a, b) 7−→ a · b ∈ Z,
und eine Vergleichsoperation ≤ mit folgenden Eigenschaften:
1. (a + b) + c = a + (b + c) für alle a, b, c ∈ Z .
2. a + 0 = 0 + a für alle a ∈ Z .
3. Zu a ∈ Z gibt es genau ein (−a) ∈ Z mit
(a + (−a)) = 0 = ((−a) + a) .
4. a + b = b + a für alle a, b ∈ Z .
5. (a · b) · c = a · (b · c) für alle a, b, c ∈ Z .
6. a · b = b · a für alle a, b ∈ Z .
7. a · (b + c) = a · b + a · c für alle a, b, c ∈ Z .
8. N ⊂ Z , 1 6= 0 , Z = N ∪ {0} ∪ −N .
9. 1 · a = a , 0 · a = 0 für alle a ∈ Z .
10. a ≤ b ⇐⇒ b + (−a) ∈ N ∪ {0} .
Stand: 9. Februar 2010
66
(Addition)
(Multiplikation)
(Assoziativgesetz)
(0 ist neutrales Element)
((−a) ist Negatives von a)
(Kommutativgesetz)
(Assoziativgesetz)
(Kommutativgesetz)
(Distributivgesetz)
(1 ist neutrales Element)
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.2. TEILBARKEIT
Man beachte aber, dass nur die Existenz der natürlichen Zahlen eine wesentliche Forderung ist.
Wir tun dies durch Anführung von Eigenschaften, die das übliche Rechnen in den ganzen Zahlen
möglich machen. (Wir legen dabei nicht Wert auf ein minimales Gerüst von Axiomen.)
Dies deckt sich mit obiger Konstruktion. Zur Abkürzung führen wir noch die Subtraktion
durch
Z × Z ∋ (a, b) 7−→ a − b := a + (−b) ∈ Z
ein, schreiben meist kurz
ab für a · b
und vereinbaren die Schreibweise
a < b für a ≤ b, a 6= b .
Damit können wir nun in Z und N genauso rechnen, wie wir es gewohnt sind.
6.2
Teilbarkeit
Definition 6.2.1 Seien a, b ∈ Z. Wir sagen, dass a die Zahl b teilt, wenn es k ∈ Z gibt mit
b = ka. Wir schreiben dafür a|b .
Ist b nicht durch a teilbar, so schreiben wir a 6 | b.
Srechweisen:
Für a|b: a teilt b, b ist Teiler von a, a ist durch b teilbar.
Für a 6 | b: a teilt b nicht, b ist kein Teiler von a, a ist nicht durch b teilbar.
Korollar 6.2.2 Seien a, b, c, d ∈ Z. Dann gilt:
(1) a|a; a|b und b|a =⇒ a = ±b; a|b und b|c =⇒ a|c.
(2) d|a und d|b =⇒ d|(ax + by) für alle x, y ∈ Z.
(3) a|b und a|(b + c) =⇒ a|c.
Beweis:
Zu 1. a|a, da a = 1 · a.
Es gibt k, l ∈ Z mit b = ka, a = lb. Ist b = 0, dann ist a = 0 und nichts ist mehr zu zeigen. Sei
nun b 6= 0; o.E. b > 0. Dann folgt aus b = klb offenbar kl ∈ N, kl = 1 und damit k = ±1, l = ±1.
Wir haben b = ka, c = lb mit k, l ∈ Z. Daraus folgt c = lb = lka, also a|c.
Zu 2. Wir haben a = kd, b = ld. Seien x, y ∈ Z. Dann gilt ax + by = kdx + ldy = (kx + ly)d;
also d|(ax + by) .
Zu 3. Wir haben b = ka, b + c = la mit k, l ∈ Z. Daraus folgt c = la − b = la − ka = (l − k)a,
also a|c.
Bei Teilbarkeitsfragen in Z können wir uns in der Regel immer auf positive Teiler, d.h. auf
Teiler in N, zurückziehen, da von den zwei Zahlen a, −a stets eine in N liegt, falls a 6= 0; der Fall
a = 0 ist uninteressant, da dann auch b = 0 .
In diesem Abschnitt kommen wir ausschließlich mit den Eigenschaften der ganzen Zahlen
aus, wie sie sich aus der axiomatischen Einführung der natürlichen Zahlen mittels der Peano–
Axiome ergaben; insbesondere haben wir die Rechenarten“ +, −, ·, ≤, < uneingeschränkt zur
”
Stand: 9. Februar 2010
67
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.2. TEILBARKEIT
Verfügung. Nicht zur Verfügung steht die Division ÷, eine Tatsache, die die Reichhaltigkeit der
Resultate bzgl. Teilbarkeit beschert.
Fragt man nach gemeinsamen Teilern zweier ganzer Zahlen a, b, so interessiert insbesondere der größte dieser gemeinsamen Teiler. Dabei können wir uns dann auf positive Teiler beschränken, denn 1 ist stets ein gemeinsamer Teiler von a und b.
Definition 6.2.3 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl d ∈ N heißt größter gemeinsamer Teiler von a, b genau dann, wenn
(1) d|a , d|b
(2) Ist d′ ∈ N ein Teiler von a und b, so teilt d′ auch d
gilt. Wir schreiben d = ggT (a, b) = a ⊓ b .
Der größte gemeinsame Teiler d gemäß Definition 6.2.3 ist eindeutig bestimmt dank der
Tatsache, dass wir d ∈ N gefordert haben.
Es sollte klar sein, wie nun der größte gemeinsame Teiler von endlich vielen ganzen Zahlen
erklärt ist. Beispiel:
6 ⊓ 10 = 2, 6 ⊓ 10 ⊓ 30 = 2, 6 ⊓ 10 ⊓ 15 = (6 ⊓ 10) ⊓ 15 = 6 ⊓ (10 ⊓ 15) = 1 .
Definition 6.2.4 Seien a, b ∈ Z. Gilt a ⊓ b = 1 , so nennen wir a, b teilerfremd.
Lemma 6.2.5 Seien a, b ∈ Z nicht beide Null. Dann gilt a ⊓ b = (−a) ⊓ b = (−a) ⊓ (−b) =
a ⊓ (−b) .
Beweis:
Wir beweisen etwa die erste Gleichheit. Diese folgt aber aus der einfachen Beobachtung, dass d
ein Teiler von a und b genau dann ist, wenn d ein Teiler von −a und b ist.
Wir suchen den größten gemeinsamen Teiler von Zahlen a, b ∈ Z . Beachte, dass es wegen
Lemma 6.2.5 ausreicht, den größten gemeinsamen Teiler für Zahlen in N zu berechnen.
Satz 6.2.6 (Division mit Rest) Für alle a ∈ Z, b ∈ N gibt es eindeutig bestimmte Zahlen
q, r ∈ Z mit
a = bq + r und 0 ≤ r < b.
Beweis:
Wir beweisen zunächst die Existenz von q, r für a ≥ 0 durch vollständige Induktion:
a = 0 : Setze q := r := 0 .
a + 1 : Ist a + 1 < b, so gilt a + 1 = 0b + (a + 1) und wir sind fertig. Ist a + 1 ≥ b, so folgt aus
der Induktionsvoraussetzung a + 1 − b = qb + r mit q ∈ Z, 0 ≤ r < b. Also a + 1 = (q + 1)b + r.
Die Existenz folgt für a < 0 aus der Anwendung der eben bewiesenen Aussage auf −a gemäß
−a = q ′ b + r ′ , 0 ≤ r ′ < b
durch
a=
Stand: 9. Februar 2010
(−q ′ − 1)b + (b − r ′ ) , falls r ′ 6= 0
(−q ′ )b
, falls r ′ = 0
68
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Um die Eindeutigkeit zu beweisen, nehmen wir ein zweites Zahlenpaar q ′ , r ′ mit
a = q′b + r′, 0 ≤ r′ < b ,
wobei o. E. r ≥ r ′ sei. Dann ist 0 ≤ r − r ′ < b, r − r ′ = (q − q ′ )b, q − q ′ ≥ 0, und dies ist nur mit
q ′ = q, r = r ′ verträglich.
Lemma 6.2.7 Sei a ∈ Z und b ∈ N. Dann folgt aus der Darstellung a = qb + r , q ∈ Z, die
Aussage a ⊓ b = b ⊓ r.
Beweis:
Ist d ein Teiler von a, b, dann ist d ein Teiler von b und r und umgekehrt (siehe Folgerung 6.2.2).
6.3
Euklidischer Algorithmus
Algorithm 1 Der euklidische Algorithmus
EIN a, b ∈ Z ; o.E. a ≥ b > 0 .
Schritt 0 a′ := a, b′ := b .
Schritt 1 (a′ , b′ ) := (b′ , r), wobei a′ = qb′ + r mit 0 ≤ r < b′ ist.
Schritt 2 Ist r = 0, gehe zu AUS. Ist r 6= 0, setze a′ := b′ , b′ := r, gehe zu Schritt 1.
AUS d := b′ = a ⊓ b .
Die Aussage, dass d der größte gemeinsame Teiler von a, b ist, falls die Situation r = 0 erreicht
wird, folgt aus dem Lemma 6.2.7. Bleibt noch zu klären, dass die Situation r = 0 in endlich
vielen Schritten wirklich erreicht wird. Dies folgt aber aus der Tatsache, dass für zwei aufeinanderfolgende Durchläufe von Schritt 1 (a′ , b′ ) , (a′′ , b′′ ) sicherlich 0 ≤ b′′ < b′ , b′ , b′′ ∈ N0 gilt.
Also muss schließlich das Verfahren bei r = 0 abbrechen.
Der euklidische Algorithmus gilt als ein recht schneller Algorithmus: um den größten gemeinsamen Teiler d von a, b auszurechnen, ist etwa soviel Aufwand wie für die Multiplikation von a
und b nötig. Er findet vielfältig Anwendung in der mathematischen Informatik.
Wir geben dem Euklidischen Algorithmus, wohlwissend, dass der Schritt 1 nur endlich oft
durchlaufen wird, eine explizite Fassung:
Euklidischer Algorithmus
Kettenbruchentwicklung
a
b
r0
r1
r1
r2
r0 := a , r1 := b,
r0
=
q1 r1 + r2 , 0 < r2 < r1 ,
r1
=
q2 r2 + r3 , 0 < r3 < r2 ,
..
.
..
.
rk−1
=
qk rk + rk+1 , 0 < rk+1 < rk ,
rk
=
qk+1 rk+1 ,
Stand: 9. Februar 2010
..
.
rk−2
rk−1
rk
rk+1
69
=
r0
r1
= q1 + rr12
= q2 + rr3
2
..
.
= qk + r rk
k−1
= qk+1
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
In dieser Darstellung ist rk+1 = rk−1 ⊓ rk = · · · = r0 ⊓ r1 = a ⊓ b nach Lemma 6.2.7.
Beachte: Bei der Spalte Kettenbruchentwicklung“ haben wir Brüche vorweggenommen. Für
”
ein Verständnis der Kettenbruchentwicklung reicht ein elementares Wissen über rationale Zahlen
aus.
Beispiel 6.3.1 a = 104629 , b = 432000 .
104629 = 0 · 432000 + 104629
432000 = 4 · 104629 + 13484
104629 = 7 · 13484 + 10241
13484 = 1 · 10241 + 3243
10241 = 3 · 3243 + 512
3243 = 6 · 512 + 171
512 = 2 · 171 + 170
171 = 1 · 170 + 1
170 = 170 · 1
Also gilt: 104629 ⊓ 432000 = 1 .
Aus der obigen Darstellung des euklidischen Algorithmus lesen wir
r0
r2
1
1
1
a
= ...
(6.1)
=
= q1 +
= q1 + r1 = q1 +
=
q
+
1
r
1
b
r1
r1
q2 + r32
q2 +
r2
r4
q3 +
r3
r
ab; wir wissen dabei, dass stets 0 < k+1
rk < 1 gilt und dass das Schema nach k Schritten abbricht, denn in formaler Interpretation haben wir rk+2 = 0 . Die berechneten Größen q1 , . . . , qk+1
schreiben als
a
[q1 , . . . , qk+1 ] oder = [q1 , . . . , qk+1 ]
b
auf und bezeichnen dies als Kettenbruch. Der Kettenbruch kann mitunter auch sehr lang“
”
sein. In vielen Fällen ist man schon mit einer Näherung [q1 , . . . , ql ] , 1 ≤ l < k + 1 , zufrieden,
d.h. mit der Näherung, die entsteht, wenn man
rl
rl+1
=0
setzt.
Beispiel 6.3.2 Die Zahlen
a = 71755875
b = 61735500
kommen in Berechnungen des Astronomen Aristarchus von Samos vor. Für a verwendet er die
b
43 . Sie ergibt sich, wenn man den Kettenbruch geeignet abbricht:
Näherung 37
a
1
.
∼1+
b
6 + 61
Stand: 9. Februar 2010
70
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Beispiel 6.3.3 Die Umlaufzeit der Erde um die Sonne beträgt ziemlich genau
365 +
104629
Tage .
432000
Aus der Kettenbruchentwicklung
432000
= [0, 4, 7, 1, 3, 6, 2, 1, 170]
104629
ergeben sich Ansätze für Kalender:
[0] = 0
[0, 4] =
Keine Schaltjahre
(Anpassung von Zeit zur Zeit durch Hinzufügen eines Tages)
1
4
[0, 4, 7, 3, 6] =
Alle vier Jahre ein Schalttag
194
801
In 800 Jahren läßt man sechs Schaltjahre ausfallen
(und zwar in den Jahren, deren Jahreszahlen durch 400 teilbar ist.)
Beachte: Da a1 ⊓ a2 ⊓ · · · ⊓ an = a1 ⊓ (a2 ⊓ · · · ⊓ an ) gilt, ist klar, dass wir nun auch ein
Verfahren haben, das den größten gemeinsamen Teiler von a1 , . . . , an bereitstellt: Man hat es
nur mehrmals anzuwenden.
Eine wichtige Konsequenz aus dem Euklidischen Algorithmus ist
Satz 6.3.4 (Lemma von Bezout) Seien a, b ∈ Z. Dann gibt es Zahlen s, t ∈ Z mit a ⊓ b =
sa + tb .
Beweis:
O.E. a ≥ b > 0 .
Die Aussage folgt dadurch, dass wir den euklidischen Algorithmus in der expliziten Fassung
rückwärts lesen. Wir strukturieren dies, indem wir nachrechnen, dass für 0 ≤ i ≤ k + 1 gilt
ri = si a + ti b , mit si , ti ∈ Z.
(6.2)
Dies ergibt sich so: Für i = 0 setze s0 := 1, t0 := 0 und für i = 1 setzte s1 := 0, t1 := 1 . Nun
setzen wir
si+1 := si−1 − qi si , ti+1 := ti−1 − qi ti , 1 ≤ i ≤ k.
(6.3)
Dann gilt offenbar die obige Aussage.
Beispiel 6.3.5 Wir betrachten wieder Beispiel 6.3.1. Für das Tupel (ri , qi , si , ti ) haben wir dann
nach (6.2) und (6.3) die folgende Sequenz (× bedeutet uninteressant oder nicht definiert):
(36667, ×, 1, 0), (12247, 2, 0, 1), (12173, 1, 1, −2), (74, 164, −1, 3), (37, ×, 165, −494).
Also haben wir
37 = 36667 ⊓ 12247 = 165 · 36667 − 494 · 12247
Korollar 6.3.6 Seien a, m ∈ Z, die nicht beide Null sind, mit a ⊓ m = 1 . Dann gibt es b ∈ Z
mit m|(ab − 1) .
Stand: 9. Februar 2010
71
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Beweis:
Wir wissen aus dem Lemma von Bezout 1 = ax + my mit x, y ∈ Z . Setze b := x . Dann ist
ab − 1 = −my = m(−y) .
Die obige Folgerung können wir so lesen, dass bei Teilerfremdheit von a und m zu a eine Zahl
b existiert, die die Gleichung
a·b=1
bis auf ein Vielfaches von m löst.
Bemerkung 6.3.7 Ein Polynom vom Grade n mit ganzzahligen Koeffizienten ist ein Term“
”
der folgenden Form:
p(x) := an xn + an−1 xn−1 + · · · + a1 x + a0 ;
dabei sind a0 , . . . , an−1 ∈ Z die Koeffizienten des Polynoms und n der Grad, wenn n 6= 0 . Dieses
Polynom kann einerseits selbständiges Objekt im Ring Z[X] aller dieser Terme von beliebigem
Grad oder als Abbildung von Z nach Z betrachtet werden. Wir nehmen zunächst den ersten
Standpunkt ein. Ring“ meint, dass man solche Terme (koeffizientenweise) addieren und mit
”
ganzen Zahlen multiplizieren kann. Umgekehrt, kann man nun versuchen, zwei Terme dieser
Art zu dividieren“; man wird zur Division mit Rest bei Polynomen geführt. Auf unserer
”
ganzzahligen Basis können wir diese nicht vorstellen, denn dazu brauchen wir die rationalen
Zahlen; wir kommen im nächsten Kapitel darauf zurück.
Kommen wir nochmals auf Primzahlen zurück. Dies sind natürliche Zahlen p 6= 1, die nur die
Teiler 1 und p haben. Wir wissen schon, dass es unendlich viele Primzahlen gibt.
Maple - Illustration 6.1
Maple kennt die ganzen Zahlen
und die rationalen Zahlen, wobei
die Anzahl der Stellen von Zähler
und Nenner jeweils auf 524279
beschränkt ist. Mit diesen Zahlen rechnet Maple exakt.
Der Befehl ifactor zerlegt eine
ganze Zahl in ihre Primfaktoren.
Hier haben wir mit ‘‘“ das letz”
te Ergebnis aufgerufen.
Mit isprime überprüft man Zahlen auf die Eigenschaft, Primzahl
zu sein.
4
> 2(2 ) ;
65536
> ifactor(‘‘);
(2)16
> seq(k2 -k-41, k= 34..41);
1163,1231,1301,1373,1447,1523,1601,1681
> seq(isprime(k2-k-41), k= 35..41);
true,true,true,true,true,true,true,false
Ein Primzahltest leitet sich aus der Äquivalenz
n Primzahl ⇐⇒ n|((n − 1)! + 1)
ab. Diese Äquivalenz wird als Satz von Wilson bezeichnet.1
1
Schon G.W. Leibniz hat diesen Satz vermutet, der erste vollständige Beweis stammt von J.L. Lagrange2 , etwa
100 Jahre später hat ihn J. Wilson nachentdeckt. Man sieht schnell, dass, was den Rechenaufwand betrifft, nicht
viel gewonnen ist, denn (n − 1)! auszurechnen, ist eine aufwendige Angelegenheit.
Stand: 9. Februar 2010
72
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Die Probiermethode – man probiere alle Primzahlen p ≤ n als mögliche Teiler durch – kann
dahin verbessert werden, dass man nur solche p mit p2 ≤ n durchzuprobieren hat, da bei einer
Zerlegung n = pq, p, q Primzahlen, für einen der beiden Faktoren sicherlich gilt, dass er dem
Quadrate nach nicht grö”ser als n ist. Aber hier hat man das Problem, dass man von allen
Zahlen z mit z 2 ≤ n wissen sollte, ob sie Primzahlen sind. Da aber jede Primzahl p von der
Form p = 6k±1, k ∈ N, ist (Beweis!) können wir dieses Problem umgehen, indem wir mit solchen
6k ± 1 testen. Man hat dann aber immer noch mit einer Anzahl von Zahlen zu testen, die etwa
bei einer 100–stelligen Zahl einen nicht zu bewältigender Aufwand darstellt.
Korollar 6.3.8 (Lemma von Euklid) Teilt eine Primzahl ein Produkt a1 · · · ar natürlicher
Zahlen, so teilt p wenigstens einen der Faktoren a1 , . . . , ar .
Beweis:
O. E. sei r = 2. Also haben wir a1 a2 = kp mit k ∈ N . Teilt p die Zahl a1 nicht, dann ist
p ⊓ a1 = 1, da p eine Primzahl ist, und es gibt nach Satz 6.3.4 s, t ∈ Z mit 1 = sp + ta1 . Daraus
folgt a2 = spa2 + ta1 a2 = p(sa2 + tk). Also teilt p die Zahl a2 .
Bevor wir den Hauptsatz der elementaren Zahlentheorie, die Primfaktorzerlegung, beweisen,
formulieren noch eine Schreibweise/Vereinbarung: Das Produkt von Zahlen a1 , . . . , an+1
definieren wir induktiv
0
Y
ai := 1 (leeres Produkt) ,
1
Y
ai := a1
(einfaches Produkt) ,
i=1
i=1
i=1
n+1
Y
ai := an+1 ·
n
Y
ai .
i=1
Satz 6.3.9 (Primfaktorzerlegung) Jede natürliche Zahl n ≥ 2 läßt sich bis auf die Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellen.
Beweis:
Die Existenz einer Darstellung für n ∈ N beweisen wir induktiv:
Für n = 2 ist dies nach der obigen Vereinbarung über das einfache Produkt klar.
n + 1 : Ist n + 1 eine Primzahl, dann ist nach Vereinbarung über das einfache Produkt nichts
mehr zu zeigen. Anderenfalls gilt n + 1 = pm mit 1 < p, m < n + 1. O.E. können wir nun annehmen nach Lemma 5.5.2, dass m einen Teiler p besitzt, der eine Primzahl ist; also n + 1 = pm
mit 1 < p, m < n + 1 . Nach Induktionsvoraussetzung gilt m = p2 · · · pr , p2 , . . . , pr Primzahlen.
Dann liegt in n + 1 = pp2 · · · pr eine Zerlegung von n + 1 in Primfaktoren vor.
Zur Eindeutigkeit: Sei n = p1 · · · pr = q1 · · · qs mit Primzahlen p1 , . . . , pr , q1 , . . . , qs . Durch Induktion über n zeigen wird, dass r = s und nach Umnumerierung p1 = q1 , . . . , pr = qr gilt.
p1 teilt das Produkt q1 · · · qs und damit einen der Faktoren q1 , . . . , qs . Also etwa nach Umnumerierung p1 |q1 . Da q1 Primzahl ist, ist p1 = q1 . Also (Kürzungsregel) p2 · · · pr = q2 · · · qs =: m .
Da m < n gilt, sagt die Induktionsannahme r = s, p2 = q2 , . . . , pr = qs nach eventueller Umnumerierung und wir sind fertig.
Die Herstellung der Primfaktorzerlegung einer (großen) Zahl ist kein leichtes Unterfangen.
Die Schwierigkeit wird dadurch beleuchtet, dass nahezu gleiche Zahlen eine sehr verschiedene
Primfaktorzerlegung besitzen können:
370273 = 43 · 79 · 109 , 370277 = 17 · 23 · 947 , 370279 = 7 · 13 · 13 · 313 .
Definition 6.3.10 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl k ∈ N heißt kleinstes
gemeinsames Vielfaches von a, b genau dann, wenn gilt:
(1) a|k , b|k .
Stand: 9. Februar 2010
73
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.4. MODULARE ARITHMETIK
(2) Sind a, b Teiler von k′ ∈ N, so ist k ein Teiler von k′ .
Wir schreiben k = kgV (a, b) = a ⊔ b .
Bemerkung 6.3.11 Das kleinste gemeinsame Vielfache von Zahlen a, b ∈ N ist die kleinste
Zahl m ∈ N, für die a|m , b|m gilt. Kennt man die Primfaktorzerlegung von a und b, so kann
man es sehr einfach ablesen(, wie übrigens auch den größten gemeinsamen Teiler).
6.4
Modulare Arithmetik
Die modulare Arithmetik beschreibt das Rechnen im Ring Zm , wobei m ∈ N, m ≥ 2, der gewählte
Modul ist. Der Ring Zm kommt als Menge der Äquivalenzklassen/Restklassen bezüglich der
Äquivalenzrelation Division mit Rest“ bezüglich des Moduls m zustande:
”
Zm := {[0], [1], . . . , [m − 1]} wobei [i] := {n ∈ N|n = qm + i für ein q ∈ Z} .
Beachte, dass etwa die Klasse [1] auch als die Klasse [m + 1] beschrieben werden kann; wir haben
in der Definition von Zm ein naheliegendes Representantensystem gewählt.
Klar, für m = 2 erhalten wir gerade die Einteilung der natürlichen Zahlen in die Klassen gerade Zahlen und ungerade Zahlen. Für diese Klassen hat man in natürlicher Weise eine Addition
und eine Multiplikation:
gerade + gerade = gerade , ungerade + gerade = ungerade
gerade · gerade = gerade , ungerade · gerade = gerade
Diese Beobachtung schreiben wir nun fort auf Zm :
Addition: [i] + [j] := [i + j] , i, j ∈ {0, 1, . . . , m − 1} ;
Multiplikation: [i] · [j] := [ij] , i, j ∈ {0, 1, . . . , m − 1} .
Damit dies wohldefiniert ist, muss noch gezeigt werden: aus [i] = [j], [i′ ] = [j ′ ] folgt [i+j] = [i′ +j ′ ]
und [ij] = [i′ j ′ ] . Wir beweisen dies am Beispiel der Multiplikation. [i] = [j], [i′ ] = [j ′ ] bedeutet
i′ = pm + i, j ′ = qm + j für p, q ∈ Z . Daraus folgt
i′ j ′ = (pm + i)(qm + j) = (iqm + jpm + pqm)m + ij also [ij] = [i′ j ′ ] .
[0] ist das neutrale Element für die Addition, [1] ist das neutrale Element für die Multiplikation:
[i] + [0] := [i] , [i] · [1] = [i] , i, j ∈ {0, 1, . . . , m − 1} .
Weiterhin ist leicht zu sehen, dass [m − i] das Inverse von [i] bezüglich der Addition ist. Nun
fassen wir zusammen: Zm ist bezüglich der Addition eine kommutative Gruppe. Dieses Ergebnis
gilt unabhängig von m.
Für die Multiplikation ist die Situation nicht so einfach, denn es gibt die Situation, dass
Nullteiler auftreten; etwa
[2] · [2] = [2 · 2] = [0] in Zm für m = 4 .
Also kann hier [2] kein Inverses bezüglich der Multiplikation haben. Ist nun m eine Primzahl,
dann ist, wie wir wissen, die Klasse [1] ein neutrales Element und aus dem Lemma von Bezout
6.3.4 folgern wir, dass es zu jeder Zahl k = 1, . . . , m − 1 ein l ∈ N gibt mit m teilt kl − 1;
d.h. [k] · [l] = [1] . Somit hat man für jedes Element in Zm \{[0]} ein Inverses. Nun fassen wir
zusammen: Zm \{[0]} ist bezüglich der Multiplikation eine kommutative Gruppe, falls m eine
Stand: 9. Februar 2010
74
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
+
[0] [1] [2] [3] [4]
[0]
[0] [1] [2] [3] [4]
·
[1] [2] [3] [4]
[1]
[1] [2] [3] [4] [0]
[1]
[1] [2] [3] [4]
[2]
[2] [3] [4] [0] [1]
[2]
[2] [4] [1] [3]
[3]
[3] [4] [0] [1] [2]
[3]
[3] [1] [4] [2]
[4]
[4] [0] [1] [2] [3]
[4]
[4] [3] [2] [1]
(b)
(a)
Abbildung 6.1: Gruppentafeln zu Z5
+
0 1 a b
·
0 1 a b
0
0 1 a b
0
0 0 0 0
1
1 0
b
a
1
0 1 a b
a
a b
0 1
a
0 a b
b
b a 1 0
b
0 b
(a)
1
1 a
(b)
Abbildung 6.2: Gruppentafeln zu einem Körper mit 4 Elementen
Primzahl ist.
Die Gruppentafeln – so bezeichnen wir eine vollständige Auflistung der Verknüpfungen der
Gruppenelemente – zu m = 5 sehen wie in 6.1 aufgeführt aus.
Man beachte, dass sowohl in der Gruppentafel zur Addition als auch in der Gruppentafel zur
Multiplikation in jeder Zeile und Spalte jede Klasse genau einmal vertreten ist. Beachte ferner,
dass die Potenzen des Elements [2] alle Elemente von Z∗5 := Z5 \{[0]} durchlaufen:
[2]0 = [1] , [2]1 = [2] , [2]2 = [4] , [2]3 = [3] , [2]4 = [1] .
Man nennt eine Gruppe, die ein solches zyklisches Element besitzt, eine zyklische Gruppe.
Bemerkung 6.4.1 Für beliebiges m ∈ N, m ≥ 2, ist (Zm , +, ·) ein Ring mit Einselement. Ist
p ∈ N eine Primzahl, so ist (Zm , +, ·) sogar ein Körper, ein endlicher, denn Zp hat ja (nur)
p Elemente. Damit kennen wir zu jeder Primzahl p einen Körper mit p Elementen. Wie sieht
es aber mit den Lücken m = 4, m = 6, m = 8, . . . aus? Es gibt das diese Frage abschließende
Resultat, dass es einen Körper mit m Elementen genau dann gibt, wenn m eine Primzahlpotenz
ist. In 6.2 findet man einen Körper mit 4 Elementen in abstrakter, d.h. nicht in einer schon
durch bekannte Objekte beschriebene Form.
Wo werden endliche Körper benötigt? Allgemein in der Diskreten Mathematik, der Mathematischen Informatik und speziell in der Verschlüsselung von Daten.
6.5
Pseudozufallszahlen
Um die umständliche Verwendung von Tabellen zu vermeiden, werden Folgen von Zufallszahlen
verwendet, die im Allgemeinen durch Iterationen hergestellt werden; wir sprechen von Pseudozufallszahlen. Darunter versteht man mathematisch wohldefinierte Zahlenfolgen, die als Folgen
Stand: 9. Februar 2010
75
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
von Zufallszahlen angesehen werden sollen. Diese Zufallszahlen haben den Vorteil, dass sie reproduzierbar sind, und haben den Nachteil, dass sie deterministischen Charakter besitzen. Alles,
was wir hier zur Sprechweise Zufallszahl“ sagen können, ist, dass jedenfalls kein Muster, keine
”
Struktur in der Folge erkennbar sein soll. Die Wahrscheinlichkeitstheorie und Statistik stellt
Hilfsmittel bereit, solche Folgen auf ihre Zufälligkeit zu testen.
Zunächst einige allgemeine Bemerkungen. Sei M eine endliche Menge. Pseudozufallszahlen,
deren Konstruktionsmethode wir hier besprechen wollen, ergeben sich als Iterierte einer Funktion
f : M −→ M
in folgender Weise:
xn+1 := f (xn ) , n ∈ N0 .
(6.4)
Der Startwert x0 heißt Samen der Pseudozufallsfolge (xn )n∈N die Folge selbst heißt auch Orbit
und die Funktion f heißt der Generator.
Die Folge ist durch die Wahl von f und x0 vollständig bestimmt; es handelt sich also um keine
echte Zufallsfolge. Durch geschickte Wahl von f – gewünscht wird eine gute Durchmischung von
M – kann man jedoch erreichen, dass sich die Folge für viele Anwendungen wie eine Zufallsfolge
verhält.
Da die Menge M endlich ist, können nicht alle Folgenglieder xn verschieden sein. Es gibt
also Indizes k, l mit xk = xl ; o. E. k > l . Seien k, l die ersten Indizes, für die dies eintritt.
Sei damit r := k − l . Da xk = xl gilt, folgt xn+r = xn für alle n ≥ l . Also wird der Orbit
(xn )n∈N periodisch mit Periode r ; wir haben einen Zyklus der Länge r . Verlangt man, dass
jedes Element der Menge M die Chance hat im Orbit aufzutauchen, muss der Zyklus ganz M
umfassen. Daraus folgt, dass die Abbildung f surjektiv sein muss. Da M endlich ist, hat f also
sogar bijektiv zu sein. Wir werden unten sehen, dass die Bijektivität keineswegs dafür schon
ausreicht, ein guter Generator zu sein.
Die Pseudozufallszahlengeneratoren, die wir hier besprechen wollen, sind ausschließlich affine
Generatoren; also
M := Zm ; f : Zm ∋ [x] 7−→ ([ax] + [b]) ∈ Zm ,
(6.5)
mit einem Modul m . Hier sind a.b ∈ Z .
Wir bezeichnen (6.5) auch als Kongruenz–Generator, denn Rechnen in Kongruenzen ist
nichts anderes als das Rechnen in Restklassen. Wir führen die zugehörige Schreibweise ein.
Mit u, v ∈ Z schreiben wir:
u=v
mod m : ⇐⇒ [u] = [v] ⇐⇒ m|(u − v) .
Damit lautet die Rechenvorschrift für den Kongruenz–Generator
M := {0, . . . , m − 1} ; f : M ∋ x 7−→ ax + b
mod m ∈ M .
(6.6)
Bemerkung 6.5.1 Durch die Generatoren in (6.5) werden Zufallszahlen in M := {0, 1, . . . , m−
1} erzeugt. Aus einer Zufallszahl y ∈ {0, . . . , m − 1} ergibt sich eine Zufallszahl z in [0, 1] ganz
y
einfach so: z := m .
Damit die Abbildung f aus (6.5) bijektiv wird, muss a ein invertierbares Element in Zm sein,
d.h. a muss zu m teilerfremd sein. Für die Klärung der Frage, unter welchen Bedingungen dieser
Typ von Generatoren einen Zyklus maximaler Länge erzeugt, schauen wir uns Beispiele an.
Stand: 9. Februar 2010
76
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Beispiel 6.5.2 Betrachte die spezielle Wahl m = 10, a = b = 7 . Hier ist der erzeugte Zyklus
7, 6, 9, 0, 7, 6, 9, 0, . . .
ziemlich kurz, obwohl natürlich a = 7 ein invertierbares Element in Z10 ist.
Beispiel 6.5.3 Betrachte die spezielle Wahl m = 231 , a = 65539, b = 0 . Dies ist der Zufallsgenerator RANDU, wie er von IBM in den Computern in den 60er Jahren verwendet wurde.
Die maximal erreichbare Zykluslänge r ist hier nicht ganz maximal, aber mit r = 229 nahezu
maximal. Wir kommen später auf die Güte dieses Generators noch zu sprechen.
Lemma 6.5.4 Für a ∈ Z und k ∈ N0 setzen wir
Sk (a) := 0 , falls k = 0 , Sk (a) := 1 + a + · · · + ak−1 , falls k ≥ 1 .
(6.7)
Damit gilt (in Z) :
Srk (a) := Sr (ak )Sk (a) , r ∈ N .
(6.8)
Beweis:
Dies rechnet man mittels vollständiger Induktion so nach:
r = 1 : Srk (a) = Sk (a) = S1 (ak )Sk (a), da S1 (ak ) = 1 ist.
r+1:
S(r+1)k (a) = Srk+k (a) = Srk (a) + ark + · · · + ark+k−1
= Sr (ak )Sk (a) + ark Sk (a) = Sk (a)(Sr (ak ) + ark ) = Sk (a)Sr+1 (ak ) .
Lemma 6.5.5 Sei p eine Primzahl und a eine ganze Zahl mit a = 1 mod p bzw. a = 1 mod 4,
falls p = 2 . Dann gilt für alle n, k ∈ N :
n
n
(a) Sp (ap ) = 0 mod p , Sp (ap ) 6= 0 mod p2 .
(b)
(c)
Spn (a) = 0 mod pn , Spn (a) 6= 0 mod pn+1 .
Sk (a) = 0 mod pn ⇐⇒ pn |k .
Beweis:
Zu a). Wir führen den Beweis nur für p > 2 .
Wir haben auf Grund der Voraussetzung a = 1 + jp mit j ∈ Z . Mit der Binomialformel erhält
man at − 1 = tjp + cp2 mit einer Konstante c . daher
p−1
X
n
1
(akp − 1) = pn jp p(p − 1) + c̃p2 ,
Sp (a ) − p =
2
pn
k=0
mit einer weiteren Konstanten c̃ . Daraus liest man die Behauptung ab.
Zu b). Wir beweisen die Behauptung durch Induktion nach n .
n = 1 . Der Fall p = 2 ist trivial. Sei also p ungerade. Nach Voraussetzung ist a = 1 + jp mit
einer ganzen Zahl j , also ak = 1 + kjp mod p2 , k ∈ N . Dann ist
Sp (a) − p =
Stand: 9. Februar 2010
p−1
p−1
X
X
p(p − 1)
= 0 mod p2 .
(ak − 1) =
kjp = jp
2
k=0
k=0
77
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Damit ist der Induktionsbeginn schon klar.
n + 1 . Der Induktionsschluss ergibt sich aus der Formel
n
Spn+1 (a) = Sp (ap )Spn (a) ,
die sich aus (6.8) ergibt, und a).
Zu c).
Sei pm die höchste Potenz von p mit pm |k, also k = pm l mit p 6 | l . Nach (6.8) ist
m
Sk (a) = Sl (ap )Spm (a) .
m
m
Es gilt Sl (ap ) = l mod p , Sl (ap ) 6= 0 mod p ; dies verifiziert man wie oben. Daraus schließt
man
pn |Sk (a) ⇐⇒ pn |Spm (a) ,
und mit Lemma 6.5.5
pn |Sk (a) ⇐⇒ n ≤ m d.h. pn |Sk (a) ⇐⇒ pn |k ;
beachte dabei a).
Bevor wir das Hauptergebnis über lineare Kongruenz–Pseudozufallsgeneratoren beweisen,
noch ein wichtiges Resultat für das Rechnen in Kongruenzen, das man oft zur Vereinfachung
von Argumentationen verwenden kann.
Satz 6.5.6 (Chinesischer Restsatz) Ist m = pk11 · · · · · pkr r die Primfaktorzerlegung von m,
so ist Zm isomorph zu Zpk1 × · · · × Zpkr r , d.h. es gibt eine bijektive Abbildung g : Zm −→
1
Zpk1 × · · · × Zpkr r , für die gilt:
1
g([u] + [v]) = g([u]) + g([v]) , g([u] · [v]) = g([u]) · g([v]) , u, v ∈ Z .
(6.9)
Dabei wird sowohl Addition als auch Multiplikation in Zpk1 ×· · ·×Zpkr r komponentenweise erklärt.
1
Beweis:
Offenbar haben Zm und Zpk1 × · · · × Zpkr r gleich viele Elemente. Also genügt es zeigen, dass g
1
injektiv ist. Dazu reicht nun zu zeigen, dass aus g([u]) = ([0], . . . , [0]) folgt: [u] = [0] .
Aus g([u]) = ([0], . . . , [0]) folgt pki i |u, i = 1, . . . , r . Dann folgt aber m = pk11 · · · pkr r |u . Also
[u] = [0] .
Satz 6.5.7 Mit m, a, b ∈ Z, m ≥ 2 betrachte die Abbildung
f : {0, . . . , m − 1} ∋ x 7−→ ax + b
mod m ∈ {0, . . . , m − 1} .
(6.10)
Für beliebiges x0 ∈ {0, . . . , m − 1} sei die Folge (xn )n∈N definiert durch
xn+1 := f (xn ) , n ∈ N 0 .
Genau dann ist diese Folge periodisch mit der maximalen Periodenlänge m, wenn folgende Bedingungen erfüllt sind:
a) p|(a − 1) für alle Primteiler p von m ;
b) 4|(a − 1) falls 4|m ;
c) b und m sind teilerfremd.
Stand: 9. Februar 2010
78
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Beweis:
Ist m = pk11 ·· · · ·pkr r die Primfaktorzerlegung von m, so hat man nach dem chinesischen Restsatz,
dass Zm isomorph zu Zpk1 × · · · × Zpkr r vermöge der Abbildung g in Satz 6.5.6mit den Eigen1
schaften aus (6.9) ist. Es ist daher leicht einzusehen, dass es genügt, den Satz für den Fall zu
beweisen, dass m eine Primzahlpotenz pk ist. Vorüberlegung: Es gilt
xi+1 − xi = f (xi ) − f (xi−1 ) = a(xi − xi−1 ) , i = 1, 2, . . . ,
und daher
xn − x0 =
n−1
X
i=0
ai (x1 − x0 ) = Sn (a)(x1 − x0 ) , xn − x0 = Sn (a)(x1 − x0 )
mod m , n ∈ N . (6.11)
Wir zeigen nun die Notwendigkeit der Bedingungen. Es sei also vorausgesetzt, dass f einen
Zyklus der maximalen Länge m erzeugt. Beachte: m = pk .
Falls p nicht a − 1 teilt, sind m, a − 1 teilerfremd und die Gleichung (a − 1)x = b ist in Zm lösbar,
d.h. f besitzt einen Fixpunkt. Dann kann aber kein Zyklus der Länge m existieren. a) ist damit
gezeigt.
Es teile 4 die Zahl m, also m = 2k mit k ≥ 2 . Nach a) wissen wir schon, dass 2|(a − 1)
gilt; a ist also ungerade. Es muß also noch gezeigt werden, dass der Fall a = 3 mod 4 nicht
auftreten kann. Wäre dies doch der Fall, so würde S2 (a) = 1 + a = 0 mod 4 sein und daher
mit S2i (a) = Si (a2 )S2 (a) (siehe Lemma 6.5.5) schließlich S2i (a) = 0 mod 4 für alle i gelten.
Mit (6.11) folgt daraus x2i = x0 mod 4 und x2i+1 = x1 mod 4 für alle i ; es könnte also keinen
Zyklus maximaler Länge m geben. b) ist damit gezeigt.
In einem Zyklus der Länge m muß insbesondere das Element 0 vorkommen; wir dürfen daher o.
E. x0 = 0 und daher x1 = b voraussetzen. Dann sagt (6.11), dass xn = Sn (a)b gilt. Ist b nicht
invertierbar mod m, kann das Element 1 niemals im Zyklus auftreten. Damit ist auch c) klar.
Wir zeigen nun die Hinlänglichkeit der angeführten Bedingungen. Beachte m = pk .
Ist m = 2, dann ist b = 1 wegen c) und ein Zyklus der Länge 2 existiert. Im Fall p = 2 dürfen
wir also 4|m annehmen und die Voraussetzungen von Lemma 6.5.5 sind erfüllt. Es genügt zu
zeigen, dass für x0 = 0 ein Zyklus der Länge m erzeugt wird. Aus x0 = 0 folgt mit (6.11), dass
xn = Sn (a)b mod m gilt. Da b invertierbar mod m ist, ist dann xn = x0 = 0 gleichbedeutend
mit Sn (a) = 0 mod m . Aus Lemma 6.5.5 c) folgt m|n und damit die Behauptung.
Satz 6.5.7 nen nt uns die Bedingungen für einen affinen Kongruenz–Generator, damit er der
Minimalforderung, einen Zyklus maximaler Länge zu erzeugen, genügt. Jedoch garantieren diese
Bedingungen noch lange keinen guten Zufallsgenerator, wie nachfolgendes Beispiel zeigt.
Beispiel 6.5.8 Betrachte für einen beliebigen Modul m den Generator f (x) := x + 1 mod m .
Kein Zweifel, die Zykluslänge ist maximal, nämlich m, aber die erzeugte Folge 0, 1, 2, . . . , m −
1, 0, 1 . . . kann sicherlich nicht den Anspruch einer Zufallsfolge erheben.
In der Praxis wird häufig ein Modul der Form m = 2k verwendet (und dazu in der Regel der
√
√
Multiplikator a im Bereich m < a < m − m). In diesem Fall bedeuten die Bedingungen des
Satzes 6.5.7 einfach
a = 1 mod 4 und b ungerade .
(6.12)
Im Beispiel 6.5.3 sind diese Bedingungen offenbar verletzt (a = 216 + 3 und b = 0) und Konsequenz ist ein verkürzter maximaler Zyklus.
Beispiel 6.5.9 In der Programmiersprache C++ gibt es einen Generator namens drand48:
Modul = 248 , a = 25214903917 , b = 11 .
Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfült sind.
Stand: 9. Februar 2010
79
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.6. ÜBUNGEN
Beispiel 6.5.10 Von D. Knuth wurde der Generator
Modul = 216 , a = 137 , b = 187
vorgeschlagen. Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind.
Beispiel 6.5.11 Ein weiterer Generator:
Modul = 216 , a = 193 , b = 73 .
Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind.
Wie soll man nun gute und weniger gute Generatoren auseinanderhalten? Es liegt nahe, Paare,
Trippel,. . . von Zufallszahlen zu betrachten und deren geometrische Verteilung zu untersuchen.
Wir skalieren“ dazu die Zufallszahlen mit Modul m gemäß
”
X i :=
xi
∈ [0, 1] , i ∈ N0 .
m
Vergleichen wir die geometrische Verteilung der Paare (X i+1 , X i ) in [0, 1] × [0, 1] für die Generatoren aus Beispiel 6.5.10 und Beispiel 6.5.11. Man kann Geraden entdecken, worauf alle
Zufallszahlen liegen, 21 im ersten Fall, 8 im zweiten Fall; die Streifen dazwischen sind frei von
den erzeugten Zufallspaaren. Der maximale Abstand von solchen Streifen ist bei beiden Gene1
bei Beispiel 6.5.10, √132 bei Beispiel 6.5.11.
ratoren dementsprechend ziemlich verschieden: √274
Dies bedeutet, dass der Generator 6.5.10 größeres Vertrauen genießen sollte.
Betrachtet man für den Generator 6.5.3 Tripel (X i+2 , X i+1 , X i ) in [0, 1] × [0, 1] × [0, 1], so stellt
1
haben.
man fest, dass diese Tripel auf genau 15 Ebenen liegen, die jeweils einen Abstand √118
Neben der mangelnden Maximalität der Zykluslänge ein weiterer Nachteil dieses Generators.
6.6
1.)
Übungen
Betrachte die Zahlen
H := {3j + 1|j ∈ N} .
Bestimme in dieser Menge nichtzerlegbare Elemente. Bestimme in dieser Menge eine Art
Primfaktorzerlegung von 100. Ist diese eindeutig bestimmt?
Stand: 9. Februar 2010
80
c J.Baumeister
Kapitel 7
Polynome und ihre Nullstellen
In diesem Kapitel greifen wir die algebraischen Konzepte auf, die u.a. im Zusammenhang mit
dem Gruppenbegriff stehen. Zentral sind Polynome über Körpern. Die Frage nach den Nullstellen von Polynomen wird diskutiert, insbesondere auch der zusammenhang mit klassischen
Fragestellungen.
7.1
Polynome
Zur Erinnerung:
Definition 7.1.1 Eine Menge K mit zwei Verknüpfungen
+ : K × K ∋ (a, b) 7−→ a + b ∈ K ,
(Addition)
· : K × K ∋ (a, b) 7−→ a · b ∈ K
(Multiplikation)
heißt ein Körper, wenn gilt:
a) (K, +) ist eine abelsche Gruppe mit neutralem Element 0.
b) (K∗ := K\{0}, ·) ist eine abelsche Gruppe mit neutralem Element 1 .
c) Für alle a, b, c ∈ K gilt: a · (b + c) = a · b + a · c .
Eine Eigenschaft, die in der Definition verborgen ist, ist die Nullteilerfreiheit. Sie besagt, dass
aus a · b = 0 in einem Körper (den Multiplikationspunkt unterdrücken wir meist) stets a = 0
oder b = 0 folgt.
Wir kennen aus der Analysis die Körper Q (rationale Zahlen), R (reelle Zahlen) und C
(komplexe Zahlen). Sie enthalten unendlich viele Elemente, insbesondere ist
1| + ·{z
· · + 1} 6= 0 für alle m ∈ N .
(7.1)
1| + ·{z
· · + 1} = 0 .
(7.2)
m−mal
Dies ist im Gegensatz zur Situation in endlichen Körpern. Wir kennen die Körper Zp , wobei p
eine Primzahl ist. Ohne Beweis sei hier zunächst angemerkt, dass es endliche Körper zu jedem
q ∈ N mit q = pn , n ∈ N, gibt, wobei p eine Primzahl ist. Diese Körper bezeichnen wir (der
Literatur entsprechend) Fq . In endlichen Körpern kann die Eigenschaft (7.1) nicht zutreffen.
Also gibt es ein kleinstes n ∈ N mit
m−mal
81
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
Dieses m heißt die Charakteristik char(Fq ) des Körpers Fq . Zur Ergänzung setzen wir char(K) =
0 für unendliche Körper K . Es ist nicht allzu schwer einzusehen, dass char(Fq ) = p, falls q = pn
gilt.
Sei K ein Körper. Betrachte
p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn =
n
X
ak xk ,
(7.3)
k=0
Ein Ausdruck dieser Art heisst ein Polynom mit Koeffizienten a0 , . . . , an in K . Ist an 6= 0 und
n ≥ 1, so sagen wir, dass das Polynom den Grad n hat, anderenfalls den Grad 0 .
Wir fassen die Polynome zusammen in K[x]:
K[x] := {p|p Polynom} .
(7.4)
Eine Teilmenge davon bilden die Polynome vom Grad höchstens n:
Kn [x] := {p|p Polynom vom Grad ≤ n} .
(7.5)
Ohne genauer darauf einzugehen halten wir fest: Beide Zusammenfassungen stellen Vektorräume
über dem Skalarkörper dar. Addition und skalare Multiplikation werden definiert, indem wir auf
dem Koeffizientenvektor (a0 , . . . , an ) operieren:
ap(a0 ,...,an ) + bp(b0 ,...,bn ) := p(aa0 +bb0 ,...,aan +bbn ) .
Eine Basis des Vektorraums Kn [x] ist gegeben durch die Monome 1, x, . . . , xn , falls char(K) = 0 .
Beispiel 7.1.2 Sei K := Z2 . Dann ist das Polynom p : x 7−→ x2 +x offenbar die Nullabbildung,
denn es gilt p(0) = p(1) = 0 . Offenbar ist das Polynom nicht das Nullpolynom, denn es hat ja den
Grad 1. Dies macht deutlich, dass wir zwischen Polynomen und Polynomfunktion unterscheiden
müssen.
Bemerkung 7.1.3 Polynome mit Koeffizienten in Z sind auch interessant. Wir kommen im
Zusammenhang mit algebraischen Zahlen darauf zurück; siehe Bemerkung 7.2.4.
Mit den obigen Feststellungen ist die algebraische Bedeutung der Polynome bei weitem noch
nicht erschöpft, im Gegegenteil, sie spielen in der Körpertheorie eine große Rolle; wir deuten
dies an.
Definition 7.1.4 Ein Polynom p ∈ Fq [x] vom Grade n ∈ N heißt irreduzibel (über Fq ), falls
eine Zerlegung p = f g in Polynome f, g ∈ Fq [x] mit Grad ≤ n − 1 nicht möglich ist.
Die Zerlegung von Polynomen führt zur Teilbarkeit von Polynomen.
Definition 7.1.5 Sei K ein Körper und seien p, g ∈ K[x] . Wir sagen, dass g das Polynom p
teilt, wenn es f ∈ K[x] gibt mit p = f g .
Wir schreiben dafür g|p . Ist p nicht durch g teilbar, so schreiben wir g 6 | p .
Teilbarkeit führt wieder zu einer Äquivalenzrelation in der Menge der Polynome über einem
Körper. Noch wichtiger, auch Division mit Rest ist möglich. Damit ist auch die Rechenart“
”
mod erklärt. Ohne Beweis geben wir an:
Satz 7.1.6 Sei p ∈ Fq [x] ein irreduzibles Polynom vom Grad m ∈ N . Führt man in (Fq )m−1 [x]
die Additon und Multiplikation modulo p durch, dann ist (Fq )m−1 [x] ein Körper mit q m Elementen.
Stand: 9. Februar 2010
82
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
+
0
1
x
1+x
·
0
1
x
x+1
0
0
1
x
x+1
0
0
0
0
0
1
1
0
x+1
x
1
0
1
x
x+1
x
x
x+1
0
1
x
0
x
x+1
1
x+1
x+1
x
1
0
x+1
0
x+1
1
x
(a)
(b)
Abbildung 7.1: Gruppentafeln zu (Fq )n−1 [x]
Beispiel 7.1.7 Sei K := F2 . Betrachte das Polynom p(x) := x2 + x + 1 . Diese Polynom ist
irreduzibel, denn eine Zerlegung in Linearfaktoren“ ist nicht möglich, wie man durch einfache
”
Rechnung bestätigt. Also bilden die Polynome 0, 1, x, x + 1 (beachte x2 = −x − 1 = x + 1 über F2 )
einen Körper mit 4 Elementen. Wir haben ihn in Abbildung 6.2 schon kennengelernt, allerdings
können wir die dortigen Objekte a, b nun mit x, x + 1 identifizieren; siehe Abbildung 7.1.
Sei p ∈ K[x] . Dieses Polynom kann auch als Abbildung interpretieren:
K ∋ x 7−→ p(x) ∈ K[x] .
Die Auswertung von p in einem Punkt z ∈ K kann durch Auswertung der Monome und Aufsummierung der Terme erfolgen. Man muss folgenden Aufwand betreiben:
n Additionen und 1 + 2 + · · · + n = 21 n(n + 1) Multiplikationen.
Ein effizientere Methode basiert auf der Beobachtung, dass jedes Polynom p mit p(x) = a0 +
a1 x + · · · + an xn als
p(x) = a0 + x(a1 + x(a2 + · · · + x(an−1 + an x) · · · )).
(7.6)
geschrieben werden kann. Diese Schreibweise eines Polynoms führt zur Horner–Methode zur
Auswertung von Polynomen. Wir lesen ab, dass die Auswertung von p in z dieser Weise mit
Hilfe von
n Additionen und n Multiplikationen
erfolgen kann.1 Die Horner Methode kann realisiert werden in folgendem Fragment eines Algorithmus:
Horner–Methode:
bn−1 := an ;
for j = n − 2, n − 3, . . . , 0
bj := aj+1 + zbj+1 ;
p(z) = a0 + zb0
1
Die Horner–Methode kann als optimal angesehen werden, was den Aufwand zur Auswertung eines Polynoms
für allgemeine Körper und allgemeine Polynome betrifft. Dieses Result kann als Geburtsstunde der Komplexitätstheorie für Algorithmen angesehen werden.
Stand: 9. Februar 2010
83
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
Lemma 7.1.8 Sei p(x) = a0 + a1 x + · · · + an−1 xn−1 + an xn ein Polynom mit Koeffizienten
in C vom Grad n und sei p ausgewertet in z Mit Hilfe des obigen Fragments. Sei q(y) :=
b0 + b1 y + · · · + bn−1 y n−1 das Polynom mit den Koeffizienten b0 , b1 , . . . , bn−1 , die man dabei
erhält. Dann haben wir
p(x) = q(x)(x − z) + p(z) , p′ (z) = q(z) .
(7.7)
Beweis:
Die zweite Behauptung p′ (z) = q(z) ist eine Konsequenz der ersten Aussage p(x) = q(x)(x −
z) + p(z) .
Wir wissen aus dem obigen Fragment aj = bj−1 − zbj , j = 1, 2, . . . , n − 1, und a0 = p(z) − zb0 .
Deshalb
p(x) =
n−1
X
j=0
=
n
X
j=0
bj xj (x − z) + p(z) =
bj−1 xj − z
= an xn +
n−1
X
n−1
X
n−1
X
j=0
bj xj+1 − z
n−1
X
bj xj + p(z)
j=0
bj xj + p(z) = bn−1 xn +
n−1
X
j=1
j=0
aj xj + a0 =
n
X
(bj−1 − zbj )xj − zb0 + p(z)
aj xj = p(x)
j=0
j=1
Maple - Illustration 7.1
Die Koeffizienten a0 , . . . , an des
Polynoms werden im Vektor a
gespeichert. Der Wert p(z) ist
pval zugewiesen.
≫
≫
≫
≫
≫
n=length(a);
pval= a(n);
for i=n-1:-1:1
pval= z*pval + a(i);
end
Hier
ist
eine
VektorImplementierung
im
Fall,
dass das Polynom in mehreren
Punkten ausgewertet werden
soll. Die Auswertungspunkte
z1 , . . . , zm werden im Vektor
zz gespeichert, die Ergebniss
werden pVal zugewiesen.
≫
≫
≫
≫
≫
n=length(a);
pVal = a(n) * ones(size(zz));
for k=n-1:-1:1
pVal= zz.*pVal + a(k);
end
Polynome sind in der Angewandten Mathematik als Bausteine für Approximationen von
Funktionen von großem Wert und großer Attraktivität, da sie sehr einfach gespeichert (Koeffizienten) und ausgewertet (Horner-Verfahren) werden können. Sie sind involviert bei der Interpolation von Funktionen, bei Splines, Bezier-Kurven und Finiten Elementen. Die zentrale Stütze
dabei ist der Approximationssatz von Weierstrass, der besagt, dass jede stetige Funktion
auf einem beschränktem und abgeschlossenen Intervall I ⊂ R durch Polynome mit vorgegebener
Genauigkeit approximiert werden kann.
Stand: 9. Februar 2010
84
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
Nullstellen von Polynomen formelmäßig
Wir betrachten nun das Problem der Auflösbarkeit von polynomialen Gleichungen mit Koeffizienten in einem Körper K ∈ {Q, R, C}. Aus den Lösungsformeln kann man dann ablesen, wann
diese Auflösbarkeit in Q bzw. R bzw. C gelingt. In diesem Sinne sprechen wir von Lösungen.
Eine Gleichung der Form
x−c=0
(7.8)
heißt eine lineare Gleichung. Der einzige Lösung ist x = c .
Gegeben sei die quadratische Gleichung
ax2 + bx + c = 0
(7.9)
b , denn für y ergibt sich die
für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 2a
Gleichung
b2 − 4ac
,
(7.10)
y2 =
4a2
deren Lösungskandidaten auf der Hand liegen:
1p 2
b − 4ac .
y=±
2a
Die Lösungskandidaten von (7.9) werden damit mit
b
1p 2
x=− ±
b − 4ac
(7.11)
2a 2a
beschrieben. Aus der Gleichung (7.11) liest man auch die Methode der quadratischen Ergänzung
ab:
b
b2
b2
c
b
(x + )2 = x2 + x + 2 = − + 2 .
2a
a
4a
a 4a
Über Q liegt also Lösbarkeit vor, wenn a, b, c rational sind und b2 − 4ac ein Quadrat einer
rationalen Zahl ist. Über R liegt Lösbarkeit vor, wenn a, b, c reell sind und b2 − 4ac ≥ 0 ist. Die
Lösbarkeit über C liegt universell vor. Insbesondere hat die Gleichung x2 + 1 = 0 die Lösungen
(Wurzeln) x = ±i.
Bemerkung 7.2.1 Aus der Formel (7.11) lesen wir ab, dass das Produkt der Lösungen der
quadratischen Gleichung (7.9) für a = 1 gleich dem Koeffizienten c ist. Diese Tatsache bezeichnet
man als Vietaschen Wurzelsatz.
Betrachte die kubische Gleichung
ax3 + bx2 + cx + d = 0
(7.12)
b , denn für y ergibt sich die
für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 3a
Gleichung
y 3 = py + q,
wobei p, q gewisse rationale Ausdrücke in a, b, c, d sind. Diese Gleichung ist immer noch nicht
einfach, aber folgende Substitution y = u + v 2 hilft weiter, denn es entsteht
3uv(u + v) + u3 + v 3 = p(u + v) + q.
2
Die Idee mit den Hilfsgrößen u, v hatte wohl Scipione del Ferro, der er vorzeitig verstarb, ausgearbeitet hat sie
dann Tartaglia. Er teilte die Lösung einer kubischen Gleichung Cardano in Form eines Sonetts mit. Die wesentliche
Zeile lautete: Trovan dui altri“ (Finde zwei andere Größen). Diese Idee läßt sich geometrisch aus einer Zerlegung
”
eines Einheitswürfels ableiten.
Stand: 9. Februar 2010
85
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
Wir spalten auf in
3uv = p , u3 + v 3 = q,
p
setzen v := 3u , und lösen
u3 + (
p 3
p
) = q , d.h. (u3 )2 − qu3 + ( )3 = 0 .
3u
3
Dies ist eine quadratische Gleichung in u3 und wir haben mit (7.11)
r
q
p
q
3
u = ± ( )2 − ( )3 .
2
2
3
Die Symmetrie der Formeln in u und v hat zur Folge, dass sich für v nichts wesentlich Neues
ergibt. Wir erhalten
r
r
q
p 3 3
q
p
q 2
q
3
u = + ( ) − ( ) , v = − ( )2 − ( )3 ,
2
2
3
2
2
3
und daher
x=
s
3
q
+
2
r
q
p
( )2 − ( )3 +
2
3
s
3
q
( −
2
r
q
p
b
( )2 − ( )3 −
.
2
3
3a
(7.13)
b gefunFür die ursprüngliche Gleichung (7.12) haben wir so einen Lösungskandidaten x = y − 3a
den. Durch Division mit Rest reduzieren wir dann die Gleichung 3. Grades auf eine Gleichung 2.
Grades und behandeln diese nach dem schon vorgestellten Verfahren für Gleichungen 2. Grades
weiter.
Beispiel 7.2.2 Betrachte die Gleichung
x3 − 7x − 6 = 0 .
Sie hat die Lösungen x1 = −1, x2 = −2, x3 = 3 (in Q) . Die obige Vorgehensweise liefert in C
die Lösung
s
s
r
r
100
100
3
3
∗
+ 3−i
.
x = 3+i
27
27
Man stellt fest, dass es sich dabei um die Lösung x3 handelt.
Betrachte die Gleichung
x3 + 3x − 4 = 0 .
Sie hat die Lösung x1 = 1 (in Q) . Die obige Vorgehensweise liefert in C die Lösung
q
q
√
√
3
3
∗
x = 2 + i 5+ 2 − i 5.
Man stellt fest, dass es sich dabei um die Lösung x1 handelt.
Hier sind drei Probleme, die schon im Altertum formuliert wurden und die alle mit polynomialen Gleichungen zu tun haben.
1. Dreiteilung des Winkels (Teilung eines Winkels in drei gleiche Teile.)
2. Verdoppelung des Würfels (Konstruktion der Seite eines Würfels, dessen Volumen
zweimal so groß ist wie das gegebene Dreieck.) Es wird das Delische Problem genannt.
Stand: 9. Februar 2010
86
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
3. Quadratur des Kreises (Konstruktion eines Quadrates mit einer Fläche, die der Fläche
eines gegebenen Kreises gleich ist.)
Die Herausforderung bei der Beschäftigung mit den Problemen besteht darin, dass als Han”
dicap“ verlangt wird, dass die Lösungen der Probleme mit Zirkel und Lineal konstruierbar
sein sollen. Ob dies möglich ist, kann nun mit der algebraischen Theorie der Körpererweiterung
beantwortet werden. Bezogen auf die Probleme bedeutet dies, dass gewisse den Problemen zugeordneten Polynome Nullstellen in Körpern besitzen, die aus Q problembezogen in durchsichtiger
Weise abgeleitet werden.
Die Quadratur des Kreises kann nicht gelingen, da man nun weiß, dass die Zahl π transzendet
ist, also keine Nullstelle eines Polynoms mit rationalen Koeffizienten sein kann.
Das Delische Problem besitzt keine Lösung mit Zirkel und Lineal, denn die Gleichung x3 −2 =
0, die das Problem beschreibt, hat in C die drei Lösungen
√
3
2,
√
3
2(cos(
2π
4π
2π √
4π
3
) + i sin ), 2(cos( ) + i sin( )) .
3
3
3
3
Das Problem der Winkeldreiteilung mit Zirkel und Lineal besitzt im allgemeinen keine Lösung.
Wir können etwa speziell fragen, ob der Winkel 31 π gedrittel werden kann. Dazu haben wir dann
zu zeigen, dass die Gleichung 4x3 − 3x − 12 = 0 keine Lösung in Q besitzt, denn für x := cos θ
gilt ja die allgemeine Identität 4x3 − 3x = cos θ .
Bemerkung 7.2.3 Wir können aus dem Zwischenwertsatz, den wir aus der Analysis kennen,
ablesen, dass jede kubische Gleichung mit Koeffizienten in R eine Lösung in R besitzt. Man hat
dabei nur zu beachten, dass für ein kubisches Polynom p limx→∞ p(x) = ∞, limx→−∞ p(x) = −∞
oder limx→∞ p(x) = −∞, limx→−∞ p(x) = ∞ gilt.
Betrachte die quartische Gleichung
ax4 + bx3 + cx2 + dx + e = 0
(7.14)
b vereinfacht zu
für a 6= 0. Diese Gleichung wird durch die Substitution y = x + 4a
y 4 + py 2 + qy + r = 0,
wobei p, q, r gewisse rationale Ausdrücke in a, b, c, d, e sind. Wir schreiben sie um zu
(y 2 + p)2 = py 2 − qy + p2 − r
– dieser Reduktionsschritt geht wohl auf R. Descartes zurück – und erweitern
(y 2 + p + u)2 = (py 2 − qy + p2 − r) + 2u(y 2 + p) + u2
mit beliebigem u ∈ K. Wähle nun u so, dass
py 2 − qy + p2 − r + 2u(y 2 + p) + u2 = Ay 2 + By + C
ein Quadrat wird; hierbei ist A := p + 2u, B := −q, C := p2 − r + 2up + u2 . Dies gelingt dann,
wenn
B 2 − 4AC = 0
gilt. Dies ist eine kubische Gleichung für u, die nach dem obigen Verfahren behandelt werden
kann. Nach Wahl von u ziehen wir nun die Wurzel und lösen die resultierende quadratische
Stand: 9. Februar 2010
87
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.3. DETERMINANTEN UND EIGENWERTE
b ergibt Lösungen für die Gleichung
Gleichung für y. Einsetzen in die Substitution x = y − 4a
(7.14).
Eine gemeinsame Beobachtung bei den obigen Vorgehensweisen ist, dass die Lösungen, wenn
sie denn existieren – dies ist eine Frage nach dem gewählten Körper – Ausdrücke in den Koeffizienten der Gleichungen sind, die nur die Operationen
+, −, ·, ÷,
√
m
mit m ≤ 2 (quadratische Gleichung) bzw. m ≤ 3 (kubische Gleichung) bzw. m ≤ 4 (quartische
Gleichung) verwenden. Allgemein sagt man, daß eine polynominale Gleichung
an xn + an−1 xn−1 + · · · + a1 x + a0 = 0
lösbar durch Radikale ist, wenn eine Lösung als rationaler Ausdruck in den Koeffizienten
a0 , . . . , an existiert, in der nur die Operationen
+, −, ·, ÷,
√
m
, m ≤ n,
verwendet werden.3
Bemerkung 7.2.4 Irrationalität einer Zahl z kann auch so definiert werden: Es gibt kein lineares Polynom mit ganzzahligen Koeffizienten, dessen Nullstelle z ist. Als Verallgemeinerung haben
wir die folgende Definition: Eine Zahl z ∈ R heisst algebraisch, wenn es ein Polynom mit ganzzahligen (gleichbedeutend mit rationalen) Koeffizienten gibt, dessen Nullstelle z ist; anderenfalls
heis̈t sie transzendet. Es ist nun ganz einfach einzusehen, dass die Menge der algebraischen
Zahlen abzählbar ist. Dazu führen wir als Höhe eines Polynoms
p(x) := a0 + · · · + an xn
die Zahl
Np := n − 1 + |a0 | + · · · + |an |
ein. Zu jeder natürlichen Zahl N ∈ N gibt es nur endlich viele Polynome p mit Höhen Np ≤ N .
Jedes dieser Polynome hat höchstens endlich viele Nullstellen. Damit ist die Aussage klar.
Transzendente Zahlen können als besonders irrational“ angesehen werden. Die bekanntesten
”
transzendenten Zahlen sind e, π. Der Beweis, dass π irrational ist, ist etwa in [1] enthalten.4 7.3
Determinanten und Eigenwerte
Die Bestimmung von Nullstellen eines Polynoms mit Koeffizienten in einem Körper ist von
großer Relevanz bei der Untersuchung von Endomorphismen endlichdimensionaler Vektorräume.
Stellt man einen solchen Endomorphismus durch eine Matrix A ∈ Kn,n dar, dann hat man die
Abbildung
A : Kn ∋ x 7−→ Ax ∈ Kn .
3
Nach der Lösung der kubischen und quartischen (Ferrari) Gleichungen durch Radikale — Cardano hat die
Ergebnisse gesammelt — , ließen viele erfolglose Versuche, die quintische Gleichung (m = 5) durch Radikale zu
lösen, die Vermutung keimen, dass dies prinzipiell unmöglich sein könnte. Viète (1591) bestärkte dies durch die
Entdeckung, daß die Frage der Lösbarkeit der quintischen Gleichung durch Radikale äquivalent zur Winkeldreiteilung ist. Der Beweis, dass die Vermutung zutrifft, gelang Abel (1826) und Galois (1831) im Rahmen einer
grandiosen Theorie über Körpererweiterungen (Galoistheorie).
4
Der Transzendentbeweis zu e wurde 1873 von C. Hermite, der zu π 1882 von F. Lindemann erbracht.
Stand: 9. Februar 2010
88
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.3. DETERMINANTEN UND EIGENWERTE
Die Frage, ob diese Abbildung bijektiv ist, d.h., ob das Gleichungssystem
Ax = y
(7.15)
eindeutig lösbar ist, kann mit der Determinante der Matrix A entschieden werden. Verschwindet
det(A) nicht, dann liegt in (7.15) eindeutige Lösbarkeit vor. Ein lineares Gleichungssystem der
Form (7.15) tritt in vielfältige Anwendungen auf: Ressourcen-Bilanz in der Ökonomie, Diskretisierung bei linearen Differenzialgleichungen, . . . .
Definition 7.3.1 Sei A ∈ Kn,n , A = (aij )i=1 (1 )n , j =1 (1 )n . Wir definieren (siehe Abschnitt 8.2)
det(A) :=
X
σ∈Sn
ε(σ)a1 σ(1) · · · an σ(n) .
Die Determinante det(A) ∈ K einer Matrix A ∈ Kn,n ist somit eine Multilinearform auf den
Spalten der Matrix A .
Das Studium von Endomorphismen hat unter anderem auch das Ziel, Normalformen von solchen Morphismen zu finden, die dann, weil sie einfache Struktur haben, leichter zu analysieren
sind. Wir formulieren dies für die darstellenden Matrizen. Hier kommen dann die Normalformen dadurch zustande, dass man im Vektorraum Kn geeignete Basen wählt. Eine allgemeine
Normalform ist die Jordansche Normalform. Hier nutzt man die Basis, die durch die (verallgemeinerten) Eigenvektoren erzeugt wird. Weitere Normalformen sind die Schurzerlegung,
die die Singulärwertzerlegung, die QR-Zerlegung und die LU-Zerlegung.
Definition 7.3.2 Sei A ∈ Kn,n . Ein Skalar λ ∈ K ist ein Eigenwert von A, falls es einen
nicht verschwindenden Vektor x ∈ Kn gibt mit
Ax = λx .
(7.16)
x heißt dann Eigenvektor zum Eigenwert λ .
Die Existenz von Eigenwerten ist verknüpft mit der polynomialen Gleichung
det(A − λE) = 0
(7.17)
wobei E ∈ Kn,n die Einheitsmatrix ist. Dass durch
K ∋ x 7−→ det(A − λE) ∈ K
ein Polynom definiert wird, sieht man mit Definition 7.3.1 leicht ein; dieses Polynom heißt
charakteristisches Polynom von A . Was ist gewonnen, wenn Eigenwerte und Eigenvektoren
existieren/bestimmt sind? Bilden die Eigenvektoren eine Basis in Kn , dann hat man eine Basis
gefunden, die zu einer Normalform führt. Man kann dies daran erkennen, dass eine Matrix auf
einem Eigenvektor sehr einfach operiert:
Ax = λx , d.h. Ax ist eine Streckung“ von x .
”
Die Jordansche Normalform setzt dies in verallgemeinerten Form um. Eine Verallgemeinerung ist
nötig, da nicht immer gesichert ist, dass eine Basis von Kn , bestehend aus lauter Eigenvektoren,
existiert.
Stand: 9. Februar 2010
89
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
Achtung: Die Eigenwerte einer Matrix berechnet man in der Regel nicht als Nullstellen des
charakteristischen Polynoms. Es gibt (numerische) Methoden, die effizienter sind.
Für viele Anwendungen sind qualitative Aussagen (einfache, nur reelle Eigenwerte, nur positive, nur negative Eigenwerte) und quantitative Aussagen (wie klein, wie groß, wie sensitiv
gegenüber änderungen gegenüber Variationen der Einträge in der Matrix) von großer Bedeutung. Hier ist ein Resultat, das sowohl qualitative und quantitative Schlüsse erlaubt.
Satz 7.3.3 (Gerschgorin–Kreise) Sei A = (aij )1≤i,j≤n ∈ Cn,n . Ist λ ∈ C ein Eigenwert von
A, dann gibt es ein i ∈ {1, . . . , n} mit
|λ − aii | ≤ ri :=
n
X
j=1,j6=i
|aij | .
Beweis:
Die Eigenwertgleichung lautet mit dem Eigenvektor z zum Eigenwert λ
Az = λz , d.h. (λ − aii )zi =
n
X
j=1,j6=i
aij zi , 1 ≤ i ≤ n .
Sei i derjenige Index, für den
|zi | = max |zk |
1≤k≤n
gilt. Mit diesem Index i gilt dann die behauptete Abschätzung.
Wir setzen zu einer Matrix A = (aij )1≤i,j≤n ∈ Cn,n
σ(A) := {λ ∈ C|λ Eigenwert von A}
und nennen σ(A) das Spektrum von A . Damit können wir das obige Resultat auch so formulieren:
σ(A) ⊂ ∪ni=1 B ri (aii ) ,
P
mit ri := nj=1,j6=i |aij | , i = 1, . . . , n . Damit erklärt sich die Bezeichung Kreise“.
”
Die Existenz von Eigenwerten hat nun mit dem zugrundliegenden Körper zu tun. Dies diskutieren wir im folgenden Abschnitt.
7.4
Fundamentalsatz der Algebra
Betrachte das Polynom
n−1
p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 x
n
+ an x =
n
X
ak xk .
(7.18)
k=0
Wenn wir alle Nullstellen kennen, dann können wir das Polynom hinschreiben als Produkt der
Linearfaktoren:
k
X
m1
mk
p(x) = an (x − z1 ) · · · (x − zk ) ,
ml = n
l=1
wobei zi bzw. mi die i-te Nullstelle von p bzw. ihre Mehrfachheit bezeichnet.
Stand: 9. Februar 2010
90
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
Die Aussage, dass jedes nicht konstante Polynom mit Koeffizienten in C eine Nullstelle besitzt, wird der Fundamentalsatz der Algebra genannt. Alle bekannten Beweise dieses Satzes5
benützen offen oder versteckt auch das Konzept Stetigkeit“ aus der Analysis. Wir geben einen
”
Beweis, der nur wenige über die Analysis der reellen Zahlen hinausgehende Fakten verwendet.
Lemma 7.4.1 Ist p ein nichtkonstantes Polynom mit Koeffizienten in C und ist |p(z0 )| =
6 0,
dann gibt es zu jedem r > 0 ein z1 ∈ Br (z0 ) mit |p(z1 )| < |p(z0 )|.
Beweis:
Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 , z ∈ C , und r > 0. Nach einer Multiplikation mit
einem Skalar können wir annehmen: p(z0 ) = 1 .
Dann haben wir mit w ∈ C
p(z0 + w) = 1 + As ws + · · · + An wn ,
wobei As , . . . , An ∈ C, As 6= 0, und 1 ≤ s gilt. Diese Aussage folgt sofort durch Betrachtung der
Differenz p(z0 + w) − p(z0 ) und Aufsammlung der Potenzen von w . Da p nicht konstant ist, ist
nach Wahl von s sicher As 6= 0 . Wir wollen nun w ∈ C so wählen, dass z0 + w ∈ Br (z0 ) und
|p(z0 + w)| < |p(z0 )| gilt. Mit einem solchen w setzen wir dann z1 := z0 + w und wir sind fertig.
π − φ0
und setzen w damit als w := ρeiφ
Sei As = rs eiφs mit rs = |As | > 0 . Wir wählen φ :=
s
an; es bleibt noch ρ geeignet zu wählen. Wir haben nun
p(z0 + w) = 1 − r s ρs + ρs+1 g(ρ)
mit einem Polynom g . Da die Funktionen h : ρ 7−→ ρg(ρ) stetig in 0 mit h(0) = 0 ist, gibt es
√
δ ∈ (0, r) mit |ρg(ρ)| < 21 rs für |ρ| ≤ δ . Setze α := min(δ, r, s rs ) . Für jedes ρ mit 0 ≤ ρ ≤ α ist
nun
1
|p(z0 + w)| ≤ |1 − rs ρs + ρs ρg(ρ)| ≤ 1 − rs ρs + rs ρs < 1 = |p(z0 )| .
2
Bemerkung 7.4.2 Das obige Lemma 7.4.16 ist im Reellen falsch, wie man sofort an dem Polynom p(x) := x2 + 1 sieht. Dass sie im Komplexen gilt, hängt wesentlich an der Tatsache, dass
die Abbildung K ∋ z 7−→ z s ∈ K für K = C stets surjektiv ist, dass dies für K = R aber bei
geradem s sicher nicht zutrifft.
Satz 7.4.3 Sei p ein nicht konstantes Polynom mit Koeffizienten in C . Dann gibt es ein z0 ∈ C
mit p(z0 ) = 0.
Beweis:
Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 . Wähle R > 0 so, dass
f : C\BR ∋ z 7−→ |p(z)| ∈ R
monoton wachsend mit |z| ist, d.h.
R ≤ |z| ≤ |z1 | =⇒ f (z) ≤ f (z1 ) .
Dies ist möglich, da der Term z 7−→ |an z n | den Term z −→ |an−1 z n−1 + · · · + a1 z + a0 | für |z|
genügend groß überwiegt. Da die Abbildung
q : C ∋ z 7−→ |p(z)| ∈ R
5
6
C.F. Gauß publizierte 1799 den ersten strengen Beweis, später gab er einige weitere Beweise dafür.
Dieses Lemma geht auf J.B. d’Alembert (1717 — 1783) zurück.
Stand: 9. Februar 2010
91
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
stetig ist — dies bedeutet: lim zn = z̄ =⇒ lim q(zn ) = q(z̄) für alle z̄ ∈ BR — gibt es z0 ∈ BR
n
n
mit
q(z0 ) = min q(z) .
z∈B R
Ist q(z0 ) = |p(z0 )| = 0, d.h. p(z0 ) = 0, sind wir fertig. Zur Aussage q(z0 ) = |p(z0 )| =
6 0 erhalten
wir mit Lemma 7.4.1 einen Widerspruch wie folgt: Es gibt z1 ∈ C mit |p(z1 )| < |p(z0 )|. Ist dieses
z1 in BR , so haben wir einen Widerspruch zur Wahl von z0 , ist dieses z1 nicht in BR , so haben
wir einen Widerspruch zur Monotonie von q in C\BR ; beachte hierzu, dass es ein z2 ∈ B R \BR
gibt mit |p(z2 )| ≥ |p(z0 )| .
Korollar 7.4.4 Jedes Polynom n–ten Grades p, p(z) = a0 + · · · + an z n , z ∈ C, n ≥ 1, mit
Koeffizienten in C besitzt in C genau n Nullstellen und das Polynom zerfällt in Linearfaktoren,
d.h.
p(z) = an (z − z1 ) · · · · · (z − zn ) , z ∈ C .
(7.19)
Beweis:
Nach Satz 7.4.3 besitzt p eine Nullstelle z1 . Mit Division mit Rest spalten wir den Linearfaktor
z 7−→ z − z1 ab – siehe nachfolgendes Lemma 7.4.5 – und erhalten ein Polynom (n − 1)–ten
Grades. So fortfahrend erhalten wir das Ergebnis.
Lemma 7.4.5 (Division mit Rest) Sei K ein Körper und seien f, g ∈ K[x] mit g 6= θ . Dann
existieren q, r ∈ K[x] mit
f = qg + r und grad(r) < grad(g) .
Beweis:
Wir beweisen die Behauptung durch Induktion nach grad(f ) . Dabei sei zunächst grad(f ) <
grad(g) . Dann setze q := θ und r := f . Wir können also grad(f ) ≥ grad(g) annehmen.
Sei f (x) = a0 + · · · + an xn und g(x) = b0 + · · · + bn xm , wobei n = grad(f ) und m = grad(f )
n−m g(x) . Dann ist h ∈ K[x] und grad(h) < grad(f ) . Nach
sei. Setze h(x) := f (x) − an b−1
m x
Induktionsvoraussetzung ist h = q1 g + r1 mit grad(r1 ) < grad(g) . Nun ist
n−m
f (x) = (an b−1
+ q1 (x))g(x) + r1 (x) .
m x
Beispiel 7.4.6 Von Gauss stammt das umfassende Resultat über die Lösbarkeit der Kreisteilungsgleichung
xn − 1
= xn−1 + · · · + x + 1 .
x−1
Etwa leitet er ab, dass eine Wurzel x1 = cos( 2π
17 ) folgende Darstellung
r
q
q
q
√
√
√
√
1√
1
1
1
x1 = − +
17 +
34 − 2 17 +
17 + 3 17 − 34 − 2 17 − 2 34 + 2 17
16 16
16
8
hat. Damit ist das regelmäßige 17–Eck durch Zirkel und Lineal konstruieren, da ja Quadratwurzeln durch Zirkel und Lineal konstruierbar sind.
Ohne Beweis sei noch angemerkt, daß die Konstruktion eines regelmäßigen n−Ecks mit Zirkel
und Lineal genau dann möglich ist, wenn die Primfaktorzerlegung von n die Form n = 2m p1 · · · pr
k
hat, wobei p1 , . . . , pr paarweise verschiedene Primzahlen der Form 22 +1 (Fermatsche Zahlen)
sind. Für k = 0, 1, 2, 3, 4 erhält man die Primzahlen 3, 5, 17, 257, 65537.7
7
Diese Erkenntnis verdanken wir C. F. Gauß, der eine erste Entdeckung zu diesem Thema bereits einen Monat
vor seinem 18. Geburtstag machte.
Stand: 9. Februar 2010
92
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.5
1.)
7.5. ÜBUNGEN
Übungen
Sei K := F2 . Zeige, dass das Polynom p(x) := x4 + x + 1 über F2 irreduzibel ist.
Stand: 9. Februar 2010
93
c J.Baumeister
Kapitel 8
Zufall
Stochastik beschäftigt sich mit der mathematischen Beschreibung und Analyse zufälliger Vorgänge. Die beiden Hauptgebiete der Stochastik sind Wahrscheinlichkeitstheorie und Statistik.
In diesem einführenden Kapitel über den Zufall stellen wir elementare Fragestellungen vor und
erläutern sie an Hand von interessanten Problemstellungen. Das Modellierungsinstrument –
Modellierung besprechen wir im nächsten Kapitel – Markov–Ketten wird skizziert.
8.1
Laplace–Häufigkeiten
Wie reden wir über den Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche Defini”
tionsschnipsel“:
Zufall ist das Eintreten unvorhergesehener und unbeabsichtigter Ereignisse.
Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein).
Jemandem fällt etwas (unverdientermaßen) zu.
Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip läßt nicht Determiniertes nicht
zu. Ein Ausweg ist, dass wir die Umstände (Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig kennen können.
Beispiele für das Wirken von Zufall“:
”
• Ergebnis beim Münzwurf
• Eintreten von Augenzahlen beim Würfeln
• Radioaktiver Zerfall
• Männlicher oder weiblicher Nachwuchs
Die Folge von Zahlen, die wir etwa beim Würfeln (mit einem fairen Würfel) erhalten nennen wir
Zufallszahlen; siehe 6. Es drängt sich sofort die Problematik des Tests auf Zufälligkeit auf. Ist
1, 2, 2, 6, 5, 6, 6, 6, 3, 6, 6
Teil einer Folge von Würfelergebnissen? Klar, dass dies sein kann, aber als Basis für eine Simulation des Zufalls ist sie ungeeignet.
Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments zu quantifizieren: Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet werden, die uns gestattet, die Unsicherheit über den Ausgang anzugeben: 1 sollte für Sicherheit, 0 für vollständige Unsicherheit
94
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
stehen. Wir tun dies nun in einer einfachen Situation, nämlich in einer Situation, in der alle Elementarereignisse, was die Unsicherheit über ihr Eintreten betrifft, gleichberechtigt sind. Dazu
führen wir die Begriffe Laplace–Experiment und Laplace–Wahrscheinlichkeit ein. Der Begriff der
Laplace–Wahrscheinlichkeit hat den Vorteil, dass ihm die Vorstellung eines konstruktiven Vorgehens zugrunde liegt, nämlich die Vorstellung von der rein zufälligen Wahl“. Wir stellen uns
”
hierunter vor, dass es gelingt, aus einer endlichen Menge von Elementarereignissen Ω ein Element
so auszuwählen, dass jedes Element diesselbe Chance hat, ausgewählt zu werden. Einen Mechanismus, der eine solche Zufallswahl bewerkstelligt, nennen wir einen Laplace–Mechanismus.
Ein beliebtes Bild von einem Laplace–Mechanismus ist das Urnenmodell (ein Gefäß, in dem
Gegenstände versteckt“ werden, die man dann herausholen kann) eine weitere Vorstellung von
”
einem Laplace–Mechanismus ist der Würfelwurf.
Definition 8.1.1 Sei Ω eine endliche Menge. Für jede Teilmenge A von Ω ist die Laplace–
Wahrscheinlichkeit definiert durch
P (A) :=
#A
.
#Ω
Man nennt P (A) die Wahrscheinlichkeit, dass ein (rein zufällig ausgewähltes) Element ω ∈ Ω
in A liegt. Die Abbildung
P : P OT (Ω) ∋ A 7−→ P (A) ∈ R
heißt (auch) Laplace–Wahrscheinlichkeit.
Das Tripel (Ω, P OT (Ω), P ) nennen wir (in Anlehnung an den allgemeinen Fall in der Wahrscheinlichkeitstheorie) einen (Laplace-)Wahrscheinlichkeitsraum
Bemerkung 8.1.2 Die Konzepte einer Wahrscheinlichkeitstheorie mit einem unendlichen Ereignisraum Ω wurden abschließend ausformuliert von Kolmogorov1 . Sie passen zu unserem Herangehen für einen endlichen Ereignisraum. Im folgenden lassen wir das Vorwort Laplace“ meist
”
weg.
Beispiel 8.1.3 Den Münzwurf betrachten wir als Laplace–Mechanismus. Hier ist
1
.
2
Beim Würfelexperiment, betrachtet als Laplace–Mechanismus, haben wir
Ω = {K, Z} ; P ({K}) = P ({Z}) =
Ω = {1, . . . , 6} ; P ({i}) =
1
, 1 ≤ i ≤ 6.
6
Für das zusammengesetzte“ Ereignis A := {1, 2, 3} errechnen wir P (A) = 21 .
”
Beim Würfeln mit zwei Würfeln, betrachtet als Laplace–Experiment, haben wir:
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; P ((i, j)) =
1
, 1 ≤ i, j ≤ 6 .
36
Daraus errechnet sich:
6
=
36
15
P (A) =
=
36
Für das zusammengesetzte Ereignis
P (A) =
1
für A := {(i, j) ∈ Ω|i + j ≥ 10},
6
5
für A := {(i, j) ∈ Ω|i > j}.
12
A := {(i, j) ∈ N × N|i = 1 oder (i ≥ 4 und j = 1) oder (i ≥ 4 und j ≥ 4)}
ist die Laplace–Wahrscheinlichkeit schon etwas mühsam auszurechnen. Sie ist
1
13
36 .
A.N. Kolmogorov, 1903-1987
Stand: 9. Februar 2010
95
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
Es ist nun offensichtlich, dass bei der Berechnung von Laplace–Wahrscheinlichkeiten das
Einmaleins der Kombinatorik äußerst hilfreich ist; dazu kommen wir in Abschnitt 8.2.
Bemerkung 8.1.4 Beachte, dass ein Laplace–Experiment ein Modell für eine konkrete reale
Situation ist. Unsere Definition der Laplace–Wahrscheinlichkeit ist innerhalb dieses Modells
gegeben und nicht für die reale Situation. Der Übergang von der Wirklichkeit zum Modell ist in
den hier exemplarisch betrachteten Fällen meist naheliegend, in allgemeineren Situationen ( Wie
”
wahrscheinlich ist ein Supergau in einem russischen Kernkraftwerk“/ Wie wahrscheinlich ist
”
es, dass auf einem Stern der Milchstraße Leben existiert“) ist dieser sicher sehr viel schwieriger
zu vollziehen.
In der Bemerkung 8.1.4 haben wir den Begriff Modell erwähnt. Nehmen wir hier die Gelegenheit wahr, den Begriff schon mal zu beleuchten, genauer gehen wir darauf in Kapitel 9 ein.
. . . Deshalb vertrete ich die Auffassung, die man als schlicht oder naiv bezeichnet hat, daß
eine physikalische Theorie nur ein mathematisches Modell ist, mit dessen Hilfe wir die Ergebnisse unserer Beobachtungen beschreiben. Eine Theorie ist eine gute Theorie, wenn sie
ein elegantes Modell ist, wenn sie eine umfassende Klasse von Beobachtungen beschreibt und
wenn sie die Ergebnisse weiterer Beobachtungen vorhersagt. Darüber hinaus hat es keinen
Sinn zu fragen, ob sie mit der Wirklichkeit übereinstimmt, weil wir nicht wissen, welche
Wirklichkeit gemeint ist.
. . . Es hat keinen Zweck, sich auf die Wirklichkeit zu berufen, weil wir kein modellunabhängiges Konzept der Wirklichkeit besitzen.2
Legen wir uns nun einige einfache Aussagen zurecht.
Korollar 8.1.5 Sei Ω eine endliche Menge. Wir haben zur Laplace–Wahrscheinlichkeit
P : P OT (Ω) ∋ A 7−→
#A
∈R
#Ω
die folgenden Aussagen:
(a) P (A) ∈ [0, 1] ∩ Q für alle A ⊂ Ω.
(b) P ({x}) = 1 für alle x ∈ Ω.
#Ω
(c) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) für alle A, B ∈ P OT (Ω).
(d) P (Ω\A) = 1 − P (A) für alle A ⊂ Ω.
(e) P (∅) = 0.
Beweis:
(a) und (b) sind trivial. Die Aussage (c) ist einfach einzusehen. Damit sind nun auch (d) und
(e) klar.
In einer Urne liegen drei schwarze Kugeln und eine weisse Kugel. Auf gut Glück werden
zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer, zwei schwarze Kugeln
oder eine weisse und eine schwarze Kugel herauszunehmen? Man ist auf Grund der Tatsache,
dass dreimal soviele schwarze wie weisse Kugeln in der Urne liegen zu vermuten, dass die erste
Möglichkeit wahrscheinlicher ist. Dem ist aber nicht so, denn es gibt drei Möglichkeiten, zwei
2
Aus: St. W. Hawkin, Einsteins Traum, Rowohlt, 1993
Stand: 9. Februar 2010
96
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
schwarze Kugeln herauszunehmen und drei Möglichkeiten eine schwarze und eine weisse Kugel
herauszunehmen. Es läßt sich das auch rechnerisch begründen:
Wahrscheinlichkeit für das Ziehen zweier schwarzer Kugeln = 34 · 23 = 12 ;
Wahrscheinlichkeit für das Ziehen einer weissen und einer schwarzer Kugel = 14 · 1 + 34 · 13 = 21 .
Betrachten wir ein Würfelexperiment und nennen wir es das Augensummenparadoxon.
G.W. Leibniz hat sich bei der Analyse dieses Experimentes einen kleinen Schnitzer erlaubt:
Es sei ihm unbegreiflich, wie ihm erfahrene Würfelspieler versicherten, warum bei zwei Würfeln die
”
Augensumme 9 wahrscheinlicher sei als die Augensumme 10, aber bei drei Würfeln die Augensumme
10 wahrscheinlicher als die Augensumme 9. Denn schließlich könne die Summe 9 wie die Summe 10
in beiden Fällen auf gleich viele Arten anfallen, also müßten die Augensummen in beiden Fällen gleich
wahrscheinlich sein.“.
Wir betrachten das Würfeln mit zwei Würfeln als Laplace–Experiment. Wir unterstellen
damit, dass die Würfel unterscheidbar sind und es einen ersten und einen zweiten Würfel gibt.
Wir haben
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6},
und interessieren uns also für die Laplace–Wahrscheinlichkeiten der Ereignisse
A9 := {(i, j) ∈ Ω|i + j = 9} , A10 := {(i, j) ∈ Ω|i + j = 10} .
Wir haben dazu A9 , A10 abzuzählen. Es gilt
A9 = {(3, 6), (6, 3), (4, 5), (5, 4)} , A10 = {(4, 6), (6, 4), (5, 5)} .
und daher
1
3
1
4
= , P (A10 ) =
=
36
9
36
12
Bei drei Würfeln zeigt eine einfache Aufzählung (bei entsprechender Bezeichnung)
P (A9 ) =
P (A9 ) =
19
24
, P (A10 ) =
.
216
216
Leibniz hat übersehen, dass die Reihenfolge der Summanden hier wichtig ist. Modelliert man
das Experiment mit zwei ununterscheidbaren Würfeln, dann hat man statt 36 Möglichkeiten
nur noch 21 mögliche Ausgänge, aber kein Laplace–Experiment mehr, da etwa die Ausgänge
1–1 und 1–2 verschiedene Wahrscheinlichkeiten haben.
Der Fehler, der hier Leibniz unterlaufen ist, ist Basis für einen Jahrmarkttrick, der nach J.
Bertrand Bertrandsches Schachtelparadoxon genannt wird:
Drei nicht unterscheidbare Schachteln enthalten zwei Goldmünzen (1. Schachtel),
zwei Silbermünzen (2. Schachtel) und eine je eine Gold- und eine Silbermünze (3.
Schachtel). Jetzt entnimmt man einer Schachtel eine Münze. Der Veranstalter des
Spiels bietet nun eine Wette an: Die zweite Münze in der Schachtel ist aus demselben
Metall!
Man ist versucht, zu vermuten, dass die Wette fair ist, da man geneigt ist, zu vermuten, dass die
Beschaffenheit der zweiten Münze gleichwahrscheinlich ist. Dies ist nicht der Fall. Analysieren
wir die Situation, dass G(old) gezogen wurde. Wir vermuten richtig, dass nicht aus der Schachtel
mit den zwei Silbermünzen gezogen wurde und schließen daraus irrig, dass mit Wahrscheinlichkeit 21 beide Münzen in der Schachtel, aus der gezogen wurde, aus Gold sind. In Wahrheit sind
mit einer Wahrscheinlichkeit von 32 beide Münzen aus Gold, weil in zwei von 3 Fällen die beiden
Stand: 9. Februar 2010
97
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
Münzen in der Schachtel aus Gold sind; später kommen wir darauf zurück..
Betrachten wir nun das Geburtstags–Pardoxon. Für eine Gruppe von n Personen ist die
Wahrscheinlichkeit“ zu ermitteln, dass mindestens ein Paar unter diesen Personen existiert, das
”
am gleichen Jahrestag Geburtstag hat. Wir nehmen an:
• Das Jahr wird mit 365 Tagen angesetzt, wir sehen also vom Auftreten von Schaltjahren ab.
• Geburtstage sind über die Jahrestage gleichverteilt.
Damit liegt ein Laplace–Experiment vor und jede Person hat mit
einem bestimmten Jahrestag Geburtstag. Wir setzen
1
365
Wahrscheinlichkeit an
Ω := {(ω1 , . . . , ωn ) ∈ Nn |1 ≤ ωi ≤ 365, 1 ≤ i ≤ n}.
Das zu betrachtende Ereignis ist
A := {(ω1 , . . . , ωn ) ∈ Ω|ωi = ωj für mindestens ein Paar (i, j), i 6= j}
und die gesuchte Wahrscheinlichkeit ist
Pn∗ :=
#A
365n
Betrachten wir zunächst einige Spezialfälle.
n ≥ 365
n=2
Pn∗ = 1 .
Die erste Person hat freie Auswahl, für die zweite Person ist die Wahrscheinlichkeit, am gleichen Tag wie die erste Person Geburtstag zu ha1
. Also
ben, 365
1
Pn∗ =
365
n=3
Die erste Person hat freie Auswahl, die zweite Person hat einen ver364
schiedenen Geburtstag mit Wahrscheinlichkeit 365
, die dritte Person
wiederum einen von den beiden Tagen verschiedenen Geburtstag mit
Wahrscheinlichkeit 363
365 . Also gilt
Pn∗ = 1 −
365 364 363
·
·
≈ 0, 009
365 365 365
Am Beispiel n = 3 sehen wir zweierlei. Erstens wird das günstige Vorgehen deutlich: Statt
Pn∗ haben wir zunächst die Wahrscheinlichkeit ausgerechnet, dass das Ereignis nicht eintritt.
Zweitens sehen wir einen multiplikativen Ansatz für zusammengesetzte Ereignisse. Wir kommen
darauf zurück.
Allgemein erhalten wir
365!
Pn∗ = 1 −
(365 − n)!365n
und damit die ergebnisse aus Tabelle
Stand: 9. Februar 2010
98
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Wir sehen also, dass bei einer Gruppengrößen von 23 Personen die Wahrn
20
22
23
30
40
50
scheinlichkeit, dass darunter ein Paar
Pn∗ 0,411 0,476 0,507 0,706 0,891 0,970
mit gleichem Geburtstag ist, bereits
größer als 21 ist.
Abbildung 8.1: Zum Geburtstagsproblem
Die Annahme über das Schaltjahr
beeinflußt die obigen Ergebnisse nur unwesentlich, etwa bleibt es bei der Aussage bezüglich der Gruppengröße n = 23. Die Annahme
über die Gleichverteilung der Geburtstage ist auch kein Einwand zur Qualität der obigen Ergebnisse, denn die Wahrscheinlichkeiten werden eher größer; man mache sich dies etwa daran
klar, dass alle Personen an einem bestimmten Tag Geburtstag haben.
Die Überraschung mit dem Ergebnis ist: ein Ereignis, dessen Eintreten für uns als Individuum
höchst unwahrscheinlich ist, ist für eine Gruppe bei weitem nicht mehr unwahrscheinlich. Der
Grund ist der, dass wir nicht auf einen bestimmten Geburtstagszwilling“ warten, sondern auf
”
irgendeinen.
8.2
Kombinatorische Überlegungen
Sei M eine Menge mit n Elementen. Wir wollen für den Sachverhalt
Wähle Elemente von M unter den Gesichtspunkten Anzahl und/oder Reihenfolge“
”
aus
die damit verbundenen Anzahlprobleme – auf wieviele Arten ist dies möglich? – studieren.
Definition 8.2.1 Eine r–Permutation (ohne Wiederholung) der Elemente einer n–elementigen Menge M ist eine injektive Abbildung von {1, . . . , r} nach M. Ist r = n, so sprechen
wir kurz von einer Permutation.
Sei M = {x1 , . . . , xn } mit #M = n. Aus der Definition 8.2.1 folgt sofort, dass r ≤ #M sein
muss, wenn es r−Permutationen geben soll, weil das Bild von {1, . . . , r} unter einer injektiven
Abbildung sicher r Elemente besitzt.
Ist σ eine r–Permutation, so entspricht dieser Abbildung σ das geordnete Tupel (xσ(1) , . . . , xσ(r) ) .
Umgekehrt, hat man eine Menge B := {xi1 , . . . , xir } mit #B = r, so gehört dazu die r–
Permutation σ : {1, . . . , r} ∋ j 7−→ xij ∈ M . Damit ist wohl klar, dass die Definition 8.2.1
unserer Anschauung von der Auswahl von r Elementen unter Berücksichtigung der Reihenfolge
entspricht.
Satz 8.2.2 Sei M eine Menge mit n Elementen. Die Anzahl P (n, r) der r–Permutationen ist
P (n, r) = n(n − 1) · · · (n − r + 1) =
n!
, 0 ≤ r ≤ n.
(n − r)!
Beweis:
Sei M := {x1 , . . . , xn } . Wie können wir eine r–Permutation σ hinschreiben? Für das Bild σ(1)
stehen n Elemente zur Verfügung. Sind die Bilder σ(1), . . . , σ(r − 1) festgelegt, so stehen für σ(r)
wegen der geforderten Injektivität nur die Elemente in M \{xσ(1) , . . . , xσ(r−1) } zur Verfügung,
also n − (r − 1) Elemente. Dies bedeutet nun:
P (n, 1) = n ; P (n, r) = P (n, r − 1) · (n − r + 1) .
Daraus folgt durch sukzessives Ausmultiplizieren oder induktiv P (n, r) = n(n − 1) · · · (n − r + 1) .
Stand: 9. Februar 2010
99
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Das schnelle Anwachsen der Ziffernstellen bei den Fakultäten3 ist Grund für die große Komplexität für Aufgaben, bei denen etwa eine große Anzahl von Objekten nach einem bestimmten
Merkmal in eine Ordnung gebracht werden sollen; siehe Abschnitt 3.3.
Im Spezialfall M = {1, . . . , n} kennen wir schon folgende Bezeichnung:
Sn := {σ : M −→ M |σ Permutation}
Eine Permutation σ ∈ Sn können wir dann schlicht durch die Abfolge (σ(1) . . . σ(n)) hinschreiben. Etwa bedeutet σ = (231) ∈ S3 , dass σ(1) = 2, σ(2) = 3, σ(3) = 1 gilt.
Beispiel 8.2.3 Man bestimme die Anzahl m der vierziffrigen Zahlen, deren Ziffern alle verschieden sind; 0 darf als erste Ziffer nicht vorkommen.
Für die erste Ziffer gibt es 9 Möglichkeiten: 1, 2, . . . , 9 . Für die Besetzung der verbleibenden
drei Ziffern gibt es dann jeweils noch P (9, 3) Möglichkeiten. Also m = 9 · P (9, 3) = 4536 .
Für das eben diskutierte Objekt Permutation“ gibt es die Interpretation durch ein Urnenex”
periment:
In einer Urne befinden sich n Objekte, nämlich die n Elemente von M . Man nimmt
der Reihe nach jeweils ein Element aus der Urne, ohne es wieder zurückzulegen.
Dann bilden r gezogene Elemente in der Reihenfolge, in der sie gezogen wurden, eine
r−Permutation der Menge M .
Eine duale Interpretation als Schachtelexperiment ist:
Jedem Element von M entspricht eine Schachtel; wir haben also n Schachteln. Es
werden nun der Reihenfolge nach r Objekte auf die n Schachteln verteilt und zwar
so, dass eine Schachtel höchstens ein Objekt enthält.
Definition 8.2.4 Eine r−Permutation mit Wiederholung einer Menge M ist eine Abbildung τ : {1, . . . , r} −→ M.
Die Anzahl W (n, r) der r−Permutationen mit Wiederholungen ist
W (n, r) = nr .
Der Beweis dafür ist leicht zu erbringen.
Die Interpretation der r−Permutationen mit Wiederholung als Urnenexperiment ist folgende:
Man nimmt der Reihe nach — die Reihenfolge spielt daher eine Rolle – jeweils ein Element aus
der Urne, insgesamt r Elemente, legt sie aber jeweils nach dem Ziehen wieder in die Urne
zurück. Die duale Interpretation als Schachtelexperiment ist die Verteilung von r Objekten auf
n Schachteln, wobei jede Schachtel beliebig viele Elemente aufnehmen kann.
Bisher haben wir Auswahlen betrachtet, so dass die Reihenfolge der Elemente von Relevanz
war und verschiedene Reihenfolgen verschieden zu zählen waren. Wenn wir nun keine Rücksicht
auf die Anordnung nehmen, kommen wir zum Begriff der Kombination (der Elemente).
Definition 8.2.5 Eine r–Kombination von M ist die Auswahl einer Teilmenge von M, bestehend aus r Elementen.
3
G.W. Leibniz liebte es, zahlenmäßige Zusammenhänge in Form von Tabellen und Tafeln darzustellen. Beispielsweise fügte er seiner Arbeit Dissertatio de Arte Combinatoria“aus dem Jahre 1666, in der mit seinem Titel
”
auch die Bezeichnung Kombinatorik vorprägte, eine Tabelle der Fakultäten 1! bis 24! = 620448401733239439360000
an.
Stand: 9. Februar 2010
100
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Die Anzahl C(n, r) der r–Kombinationen einer Menge M mit n Elementen ist
C(n, r) =
n!
.
r!(n − r)!
Die Interpretation als Urnenexperiment kann man etwa so sehen: Man ziehe r Elemente ohne Zurücklegen und vergesse die Reihenfolge der gezogenen Elemente. Die Interpretation als
Schachtelexperiment ist so: Man verteile r Objekte auf n Schachteln, so dass in jeder Schachtel
höchstens ein Objekt liegt. Einordnungen heißen äquivalent (oder werden nicht unterschieden),
wenn sie durch eine Permutation der Objekte ineinander übergeführt werden können.
Wir nennen
n
n!
(n, r ∈ N, r ≤ n)
:=
r!(n − r)!
r
Binominalkoeffizienten. n
r kann interpretiert werden als die Anzahl der binären Wörter mit
r Einsen und n − r Nullen. Aus dieser Interpretation oder aus der Definition folgt sofort
n
n
n
n
n
n
=
=1,
=
=n,
=
(8.1)
0
n
1
n−1
r
n−r
Sortiert man die Teilmengen der n–elementigen
Menge M nach der Anzahl ihrer Elemente, so
liefert die Summenregel
n
n
n
+
+ ··· +
= 2n ,
(8.2)
0
1
n
1
1
1
1
1
1
3
4
5
1
2
1
3
6
10
1
4
10
1
5
1
da links und rechts der Identität die Anzahl
...
...
...
aller Teilmengen von
M steht.
Sortieren wir die nr Wörter der Länge n mit
r Einsen und n − r Nullen nach der 1. Ziffer:
Abbildung 8.2: Pascalsches Dreieck
n−1
Mit 1 beginnen r−1 Wörter der Länge n, mit
0 beginnen n−1
n−Wörter. Also
r
n
n−1
n−1
=
+
.
(8.3)
r
r−1
r
n
n
Zusammen mit der Randbedingung“
=
= 1, stellt man dies im Pascalschen Dreieck 4
0
n
”
dar. Die Bezeichnung von nr als Binomialkoeffizient hängt zusammen mit dem folgenden Satz.
Satz 8.2.6 (Binomialformel) Für a, b ∈ R und n ∈ N gilt:
n
(a + b) =
n X
n
j=0
j
aj bn−j .
Beweis:
Die Multiplikation der n Faktoren (a + b), . . . , (a + b) kann so erfolgen, dass man für
jedes
j, 0 ≤ j ≤ n, aus j Klammern a und aus n − j Klammern b auswählt; dies kann auf n
j Arten
n
j
n−j
geschehen. Daher ist der Koeffizient von a b
im ausgerechneten Produkt j .
Der Beweis mittels vollständiger Induktion sieht so aus:
n = 1 : Klar.
4
Diese Anordnung der Binomialkoeffizienten findet sich wohl erstmals bei B. Pascal.
Stand: 9. Februar 2010
101
c J.Baumeister
KAPITEL 8. ZUFALL
n+1 :
8.3. BEDINGTE WAHRSCHEINLICHKEITEN
(a + b)n+1 = (a + b)(a + b)n = (a + b)
=
n X
n
j=0
=
=
=
=
j
n X
n
j=0
aj+1 bn−j +
n X
n
j=0
j
j
aj bn−j
aj bn−j+1
n X
n j n−j+1
n
k n−(k−1)
ab
a b
+
j
k−1
j=0
k=1
n n n+1 X
n
n
n n+1
k n+1−k
b
+
+
a b
+
a
0
k−1
k
n
k=1
n n + 1 n+1 X n + 1 k n+1−k
n + 1 n+1
b
+
a b
+
a
0
k
n+1
k=1
n+1
X n + 1
ak bn+1−k
k
n+1
X
k=0
Beispiel 8.2.7 Beim Bridge–Spiel
erhält ein Spieler 13 Karten aus einem Spiel aus 52 Karten.
12 Kartenzusammenstellungen möglich. Die Chance“ eine
≈
10
Für einen Spieler sind also 52
13
”
ganz bestimmte Hand“ zu erhalten, ist für einen Spieler also etwa 1 : 1012 .
”
Beispiel 8.2.8 Beim Lotto wird bei einer Ziehung aus der Menge {1, . . . , 49} eine 6–elementige
Teilmenge ausgewählt. Daher ist die Anzahl der möglichen Ziehungen
49
= 13983816 .
6
8.3
Bedingte Wahrscheinlichkeiten
Häufig steht, bevor der Ausgang eines Zufalls–Experiments bekannt ist, schon die Information
zur Verfügung, dass der Ausgang zu einer bestimmten (möglicherweise eingeforderten) Teilmenge
des Ereignisraumes gehört. Was läßt sich dann über Wahrscheinlichkeiten sagen? Diese Fragestellung wollen wir nun untersuchen.
Zur Motivation des folgenden greifen wir auf den Begriff der relativen Häufigkeiten zurück. Sei
V ein Zufallsexperiment mit zugehörigem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ). Seien A, B
Ereignisse in (Ω, P ). Der Versuch V werde nun n–mal (unabhängig) wiederholt. Die relativen
Häufigkeiten von A unter der Bedingung B sind dann definiert durch
hn (A|B) :=
n#{ Es tritt A ∩ B ein }
hn (A ∩ B)
#{ Es tritt A ∩ B ein }
=
=
, n ∈ N.
#{ Es tritt B ein }
n#{ Es tritt B ein }
hn (B)
Dabei haben wir hn (B) > 0, n ∈ N, unterstellt. Analog zu dieser Formel kommen wir nun zu
einer entsprechenden Begriffsbildung im Wahrscheinlichkeitsraum (Ω, P ) .
Definition 8.3.1 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A, B ⊂ Ω
mit P (B) > 0. Dann heißt
P (A ∩ B)
P (A|B) :=
P (B)
die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B.
Stand: 9. Februar 2010
102
c J.Baumeister
KAPITEL 8. ZUFALL
8.3. BEDINGTE WAHRSCHEINLICHKEITEN
Korollar 8.3.2 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Sei B ⊂ Ω mit
P (B) > 0. Dann ist (Ω, P OT (Ω), PB ) mit
PB (A) := P (A|B) , A ⊂ Ω,
ein endlicher Wahrscheinlichkeitsraum.
Beweis:
Verifiziert man unmittelbar.
Satz 8.3.3 (Satz von der totalen Wahrscheinlichkeit) Sei (Ω, P OT (Ω), P ) ein endlicher
Wahrscheinlichkeitsraum. Seien B1 , . . . , Bk ⊂ Ω mit
Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k .
Dann ist
P (A) =
k
X
i=1
P (Bi )P (A|Bi ) , A ⊂ Ω .
(8.4)
Beweis:
Ergibt sich aus der Additivität von P und der Tatsache, dass A disjunkte Vereinigung von
A ∩ B1 , . . . , A ∩ Bk ist.
Satz 8.3.4 (Satz von Bayes ) Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum.
Seien B1 , . . . , Bk ⊂ Ω mit
Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k .
Ist P (A) > 0, so gilt für j = 1, . . . , k :
k
X
P (Bi )P (A|Bi ))−1
P (Bj |A) = P (Bj )P (A|Bj )(
(8.5)
i=1
Beweis:
Folgt aus Satz 8.3.3 zusammen mit P (Bj ∩ A) = P (Bj )P (A|Bj ), 1 ≤ j ≤ k .
In beiden Fällen ist man mit der Forderung nicht verschwindender Wahrscheinlichkeiten
(P (Bi ) > 0, 1 ≤ i ≤ n) konfrontiert. In der Formel in (a) kann man dies aber überspielen, da
das Nennerproblem nun in der Definition bedingter Wahrscheinlichkeit angelegt ist.
Aus der bedingten Wahrscheinlichkeit leitet sich der Begriff der Unabhängigkeit ab, der
für die Bewertung von Beobachtungen von Zufallsexperimenten von überragender Bedeutung
ist. Wir lassen uns dabei davon leiten, dass in einem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P )
zwei Ereignisse A, B (nach Wahrscheinlichkeit) als unabhängig voneinander zu betrachten sind,
wenn P (A) mit der bedingten Wahrscheinlichkeit P (A|B) übereinstimmt. Dass P (A|B) nur für
P (B) > 0 erklärt ist, hat dabei keinen Einfluss mehr.
Definition 8.3.5 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Zwei Ereignisse
A, B ⊂ Ω heißen unabhängig, wenn P (A ∩ B) = P (A)P (B) gilt.
Unabhängigkeit ist ein in A, B symmetrischer Begriff. Sind A, B ⊂ Ω unabhängig, dann sind
es auch A, Ω\B und Ω\A, B und Ω\A, Ω\B. Die Verallgemeinerung der Unabhängigkeit auf
mehr als zwei Ereignisse liegt auf der Hand.
Stand: 9. Februar 2010
103
c J.Baumeister
KAPITEL 8. ZUFALL
8.4. DAS ZIEGENPROBLEM
Definition 8.3.6 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A1 , . . . , Ak
Ereignisse. Diese Ereignisse heißen unabhängig, wenn für jede Wahl 1 ≤ i1 < · · · < il ≤ k
gilt:
P (Ai1 ∩ · · · ∩ Ail ) = P (Ail ) · · · P (Ail ).
Beispiel 8.3.7 Betrachte im Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) mit
Ω = {ω1 , ω2 , ω3 , ω4 }, P ({ωi }) =
1
, i = 1, . . . , 4,
4
die Ereignisse
A = {ω1 , ω2 }, B = {ω2 , ω3 }, C = {ω1 , ω3 }.
Wir haben
P (A ∩ B) = P (A)P (B) , P (A ∩ C) = P (A)P (C) , P (B ∩ C) = P (B)P (C),
aber
1
P (A ∩ B ∩ C) = 0, P (A) · P (B) · P (C) = .
8
Dieses Beispiel beleuchtet die Definition 8.3.6.
8.4
Das Ziegenproblem
Betrachten wir nun das sogenannte Ziegenproblem.5 In einer Spielshow wird ein Kandidat
vom Moderator vor drei geschlossene Türen geführt. Hinter diesen Türen sind ein Auto (Preis)
und jeweils eine Ziege (Niete) versteckt. Der Kandidat darf nun eine Tür bestimmen, die geöffnet
werden soll. Um die Spannung zu erhöhen, öffnet der Moderator aber vor der Öffnung dieser
Tür — zufällig, aber mit der Vorgabe, dass dahinter kein Auto ist — eine andere Tür; hinter
dieser Tür ist eine Ziege. Nun erlaubt der Moderator dem Kandidaten seine ursprügliche Wahl
zu überdenken und gegebenenfalls seine Entscheidung zu ändern. Wie soll er sich entscheiden?
Gibt es aus stochastischer Sicht berechtigte Gründe, die Tür zu wechseln?
Ja, er soll wechseln! Dies wollen wir mit bedingten Wahrscheinlichkeiten erklären. Bevor wir dies
tun, spielen wir die Situation mit 100 Türen, einem Auto und 99 Ziegen durch; sie vermeidet die
1
haben wir die Tür mit dem Auto
1 : 1 : 1 Situation bei drei Türen. Mit Wahrscheinlichkeit 100
99
gewählt und mit Wahrscheinlichkeit 100 ist das Auto hinter den verbleibenden Türen. Jetzt
öffnet der Moderator 98 der verbleibenden Türen, hinter jeder eine Ziege. Natürlich würde jeder
99
wechseln, denn mit Wahrscheinlichkeit 100
ist das Auto hinter der noch verschlossenen Tür.
Bevor wir ein mathematisches Modell betrachten, noch eine andere Argumentation, die den
Wechsel stützen kann. Der Standhafte gewinnt das Auto genau dann, wenn sich dieses hinter
der ursprünglich gewählten Tür befindet; die Wahrscheinlichkeit dafür ist 13 . Ein Wechselnder
gewinnt das Auto genau dann, wenn er zuerst auf eine der beiden Ziegentüren zeigt – die Wahrscheinlichkeit dafür ist 32 –. denn nach dem Öffnen der anderen Ziegentür durch den Moderator
führt die Wechselstrategie in diesem Fall automatisch zur Autotür.
Hier geben wir nun eine Erklärung für den Ratschlag Wechseln“ unter Nutzung elementarer
”
Wahrscheinlichkeiten.
5
G.v. Randow: Das Ziegenproblem, Reinbek, 1992, und I. Stewart: Mathematische Unterhaltungen, Spektrum
11/91, 12 – 16 . Dieses Problem hat beträchtlichen Wirbel verursacht, da selbst “gestandene“ Mathematiker
falsche Schlüsse zogen. Das Problem ist auch als Monty-Hall-Dilemma“ bekannt (nach dem Moderator der US”
amerikanischen Spielshow Let’s make a deal.
Stand: 9. Februar 2010
104
c J.Baumeister
KAPITEL 8. ZUFALL
8.4. DAS ZIEGENPROBLEM
Wir nehmen an, dass das Auto hinter Tür 1 steht. Wir können dies tun ohne Beschränkung
der Allgemeinheit: es ist ja nur ein Nummerierungsproblem. Der Kandidat hat drei Möglichkeiten
der Wahl, die er zufällig trifft, denn er hat ja keine zusätzliche Information. Der Moderator trifft
seine Wahl der Tür ebenfalls zufällig, sofern ihm auf Grund seiner Informationslage eine Wahl
bleibt. Dies führt zu folgender Tabelle für die Wahrscheinlichkeit der 4 möglichen Ereignisse vor
der Wechselmöglichkeit:
Wahl des Kandidaten
Tür 1
Tür 1
Tür 2
Tür 3
Wahl des Moderators
Tür 2
Tür 3
Tür 3
Tür 2
p (Wahrscheinlichkeit)
1 1
1
6 = 3 · 2
1 1
1
6 = 3 · 2
1
1
3 = 3 ·1
1
1
3 = 3 ·1
Die folgende Tabelle listet nun die Gewinn/Verlust–Wahrscheinlichkeiten auf:
Wahl/Kandidat
Tür 1
Ohne Wechsel
Wahl/Moderator Wahl/Kandidat
Tür 2
Tür 1
Gewinn
JA
Tür 1
Tür 3
Tür 1
JA
Tür 2
Tür 3
Tür 2
NEIN
Tür 3
Tür 2
Tür 3
NEIN
Wahl/Kandidat
Tür 1
Mit Wechsel
Wahl/Moderator Wahl/Kandidat
Tür 2
Tür 3
Gewinn
NEIN
Tür 1
Tür 3
Tür 2
NEIN
Tür 2
Tür 3
Tür 1
JA
Tür 3
Tür 2
Tür 1
JA
p
1
6
1
6
1
3
1
3
p
1
6
1
6
1
3
1
3
Es ist nun klar, dass der Wechsel zu einer Gewinnwahrscheinlichkeit von 2/3 führt, während
kein Wechsel nur eine Gewinnwahrscheinlichkeit von 1/3 realisiert.
Nun zu einer Darstellung des Dreitüren–Problems, die mit bedingten Wahrscheinlichkeiten
arbeitet.
O.E. öffne der Kandidat die erste Tür. Sei
Ω := {(azz, 2), (azz, 3), (zaz, 3), (zza, 2)}.
Hierbei steht etwa (azz, 2) für: Auto hinter der 1. Tür, Ziegen hinter Tür 2 und Tür 3; 2
bezeichnet die Türwahl des Moderators.
Setze
A1 := {(azz, 2), (azz, 3)}, A2 := {(zaz, 3)}, A3 := {(zza, 2)}.
Wir haben als Wahrscheinlichkeiten
P (A1 ) = P (A2 ) = P (A3 ) =
und ferner
P ({(azz, 2)}) =
Stand: 9. Februar 2010
1
,
3
1
1
, P ({(azz, 3)}) = .
6
6
105
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Wir analysieren etwa den Fall, dass der Moderator Tür 3 öffnet. Setze
B := {(azz, 3), (zaz, 3)}.
Wir haben dann P (B) = 21 und P (A1 ∩ B) = 16 , P (A2 ∩ B) = 31 , P (A3 ∩ B) = 0. Also P (B|A1 ) =
1
2 , P (B|A2 ) = 1, P (B|A3 ) = 0. Damit erhalten wir:
P (A1 |B) =
1
P (A1 )P (B|A1 )
= ,
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
3
P (A2 |B) =
P (A2 )P (B|A2 )
2
=
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
3
Nun liegt der Beleg für den Ratschlag Wechsel“ vor !
”
8.5
Markov–Ketten
Gegeben sei ein System, welches unterschiedliche Zustände annehmen kann. Zu sukzessiven
diskreten Zeitpunkten ändert das System auf zufällige Weise seinen Zustand. Der zeitliche
Ablauf der Systemzustände ist dann eine Folge von Zuständen. Will man Aussagen über alle möglichen Zustandfolgen herleiten, so muß man Annahmen über die Wahrscheinlichkeiten
von Zustandsänderungen machen.6
Definition 8.5.1 Eine Markov–Kette ist ein (stochastischer) Prozess, der die zeitliche Entwicklung eines Systems unter den folgenden Bedingungen beschreibt:
(1) Endlichkeit: das System nimmt nur eine endliche Anzahl n von Zuständen an;
(2) diskrete Zeit: das System ändert seinen Zustand nur in diskreten Zeitabständen;
(3) Gedächtnislosigkeit: die Wahrscheinlichkeit pij des Übergangs vom i-ten zum j-ten Zustand innerhalb eines Zeitschrittes ist unabhängig davon, im wie vielten Schritt das System
gerade betrachtet wird.
Die Übergangsmatrix eines Markovprozesses mit k Zuständen ist die k × k-Matrix P, deren
Einträge gerade die Übergangswahrscheinlichkeiten pij sind.
Bemerkung 8.5.2 Wir vermeiden hier den Begriff der Zufallsvariablen, der in der Wahrscheinlichkeitstheorie von überrragender Bedeutung ist. Dies ist möglich, weil wir einen sehr
naiven Wahrscheinlichkeitsbegriff zugrundelegen und nur sehr einfache Zufallsexperimente“ be”
trachten.
Die Einträge in einer Übergangsmatrix P einer Markov–Kette können nicht beliebige Zahlen
sein: falls sich der Prozess zum Zeitpunkt n im Zustand xi befindet, muß er sich mit Wahrscheinlichkeit 1 zum Zeitpunkt n + 1 in irgendeinem Zustand befinden. Diese Wahrscheinlichkeit ist
gleich pi1 + · · · + pik und wir erhalten die Bedingung
0 ≤ pij ≤ 1, i, j = 1, . . . , k ,
k
X
pij = 1 für alle i = 1, . . . , k .
j=1
Eine Matrix P, die diese Eigenschaft hat, nennen wir zeilenstochastisch.
6
A.A. Markov, 1856-1922
Stand: 9. Februar 2010
106
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Eine Markovsche Kette stellt man graphisch häufig dadurch dar, dass man die verschiedenen Zustände als Punkte in der Ebene markiert und dann jeweils vom i-ten zum j-ten Punkt
einen mit der Übergangswahrscheinlichkeit pji beschrifteten Pfeil einzeichnet. Das so entstehende
Schaubild heißt Graph der betrachteten Markovschen Kette; beachte Schleifen sind zuzulassen.
Beispiel 8.5.3 Betrachte die Matrix
P := (pij )1≤i,j≤3


q p 0


:= q 0 p
q p 0
Der Eintrag p23 = p etwa bedeutet, dass der Zustand 2 mit Wahrscheinlichkeit p in den Zustand
3 übergeht. Damit hier eine Übergangsmatrix vorliegt, benötigen wir q + p = 1 .
Beispiel 8.5.4 Das Wetter in einer bestimmten Gegend werde jeweils durch einen der zwei
Zustände R (regnerisch) und T (trocken) charakterisiert; der Übergang von einem Tag auf den
nächsten sei durch folgende Tabelle bestimmt, aus dem dann die Übergangsmatrix P abgeleitet
wird:
!
R
T
0.662 0.338
R 0.662 0.338
P :=
0.250 0.750
T 0.250 0.750
Beispiel 8.5.5 Wir betrachten die Irrfahrt eines Betrunkenen. Ein Betrunkener will aus einem
Gasthaus heimkehren. Das Gasthaus liegt an einer geraden Straße, an einem Ende befindet sich
ein See, am anderen das Wohnhaus des Betrunkenen. Der Betrunkene erinnert sich nicht an die
richtige Richtung. Er macht einen Schritt nach links oder rechts mit gleicher Wahrscheinlichkeit
1/2, dann hält er inne. Ohne sich zu erinnern, woher beim letzten Schritt gekommen war, irrt
er in dieser Weise weiter: einen Schritt dem See zu, einen Schritt dem Wohnhaus zu, immer
mit Wahrscheinlichkeit 1/2. Erreicht er den See, fällt er hinein, erreicht er das Wohnhaus,
bleibt er dort (und schläft den Rausch aus). Frage: mit welcher Wahrscheinlichkeit ertrinkt der
Betrunkene und mit welcher Wahrscheinlichkeit erreicht er sein Haus?
Wir machen hier nicht weiter, sondern verweisen auf die Literatur.
Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P := (pij )1≤i,j≤k . Mit
(n)
(n)
einem Vektor π (n) = (π1 , . . . , πk ) ∈ R wollen wir die Wahrscheinlichkeit beschreiben, dass
(n)
sich die Markovkette zum Zeitpunkt n mit Wahrscheinlichkeit πi im Zustand i befindet. Wir
fordern also für jedes u := π (n) :
0 ≤ uj ≤ 1, j = 1, . . . , k ,
k
X
uj = 1 .
(8.6)
j=1
Es ist einfach nachzurechnen, dass mit u := π (n) auch u := π (n+1) die Bedingung (8.6) erfüllt.
Nun gilt:
π (n+1) = π (n) P
π
(n)
P
n
(P n )ij
Stand: 9. Februar 2010
= π
(0)
P
(8.7)
n
n−r
(8.8)
r
= P
P
Xk
=
(P n−r )il (P r )lj
l=1
107
(8.9)
(8.10)
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Hierbei sind P l die Potenzen der Matrix P . Die Gleichungen (8.7),(8.8),(8.9) heißen ChapmanKolmogorov-Gleichungen. Die Interpretation von (8.9),(8.10) ist die, dass die Wahrscheinlichkeit, in n Schritten vom Zustand i in den Zustand j zu gelangen, gleich der Summe der
Wahrscheinlichkeiten, zunächst von i in r Schritten zu einem Zwischenzustand l und von dort
in den restlichen n − r Schritten nach j zu gelangen, wobei die Summe über alle möglichen
Zwischenzustände l auszuführen ist.
Definition 8.5.6 Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P :=
(pij )1≤i,j≤k . Seien i, j zwei Zustände der Markovkette. Wir sagen i führt zu j, falls die Wahr(n)
scheinlichkeit, von i nach j zu gelangen, strikt positiv ist, d.h. wenn es n ∈ N gibt mit Pij > 0 .
Führt i zu j und j zu i, dann sagen wir, dass i, j miteinander kommunizieren.
In der Darstellung der Markovkette durch einen Graphen bedeutet i führt zu j“ nichts anderes,
”
als dass es einen Weg entlang der Pfeile von i nach j gibt.
Die Relation kommunizieren miteinander“ ist zwar keine Äquivalenzrelation – die Reflexi”
vität ist nicht notwendigerweise gegeben – trotzdem wird die Markovkette in disjunkte Klassen
eingeteilt, wenn wir das Problem mit Reflexivität dadurch beheben, dass wir jedem Zustand,
der mit keinem anderen kommunizieren, eine eigene Klasse zuordnen.
Lemma 8.5.7 Jeder Zustand gehört genau einer Klasse an.
Beweis:
Offenbar gehört jeder Zustand einer Klasse an. Sei i ein Zustand, der den Klassen K1 und K2
angehört. Seien u ∈ K1 und v ∈ K2 , dann gilt wegen der Transitivität der Relation kommuni”
zieren miteinander“, dass u mit v kommuniziert. Also kommunizieren alle Zustände von K1 mit
allen von K2 , und folglich muß K1 gleich K2 sein.
Definition 8.5.8 Eine Markovkette mit Übergangsmatrix heißt M-regulär, falls es ein N ∈ N,
so dass P N nur strikt positive Einträge enthält.
Offenbar zieht Regularität“ nach sich, dass alle Zustände miteinander kommunizieren; also gibt
”
es nur eine Klasse. Diese Eigenschaft nennt man Ergodizität. Hinreichend für die Eigenschaft
Ergodizität“ sind Irreduzibilität“ und Aperiodizität“; wir verweisen auf die Literatur.
”
”
”
Satz 8.5.9 Sei P die Übergangsmatrix einer M-regulären Markovkette mit k Zuständen. Dann
gilt:7
(a) Der Grenzwert W := limn P n existiert.
(b)
Die Matrix W ist zeilenstochastisch und alle Zeilenvektoren von W sind gleich.
(c)
Die Matrix W hat einen Eigenwert 1 und für den zugehörigen Eigenvektor π = (π1 , . . . , πk )
gilt
πi > 0, i = 1, . . . , k , π1 + · · · + πk = 1 ;
π ist der Zeilenvektor von W .
(d) Für jeden Vektor π 0 , der (8.6) erfüllt, gilt limn π (0) P (n) = π .
Beweis:
Die Minima und Maxima in den Spalten von P n spielen die Hauptrolle:
m(j, n) := min(P n )ij , M (j, n) := max(P n )ij .
i
7
i
Konvergenz bei einer Folge von Matrizen ist definiert über die Konvergenz aller Einträge.
Stand: 9. Februar 2010
108
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Sei j ∈ {1, . . . , k} .
Wir zeigen, dass die Folge (m(j, n))n∈N monoton nicht fallend ist. Dies liest man ab aus
m(j, n + 1) = min(P
n+1
i
≥ min
i
)ij = min
i
k
X
k
X
Pil (P n )lj
l=1
Pil (min(P n )lj ) = m(j, n) min
i
l
l=1
k
X
Pil = m(j, n) .
l=1
Analog beweist man, dass die Folge (M (j, n))n∈N monoton nicht wachsend ist.
Also ist auch die Folge (M (j, n) − m(j, n))n∈N monoton nicht wachsend und daher auch konvergent. Setze µ(j, n) := limn (M (j, n) − m(j, n)) . Es gilt offenbar µ(j, n) ≥ 0 . Wir wollen
limn µ(j, n) = 0 zeigen. Wegen der Monotonie der Folge reicht es zu zeigen, dass eine Teilfolge
von (µ(j, n))n∈N gegen Null konvergiert.
Nach Voraussetzung über die M-Regularität können wir N ∈ N so wählen, dass P N nur strikt
positive Einträge hat. Setze d := mini,j (P N )ij ) ; es gilt d ∈ (0, 1] . Sei n ∈ N . Dann gilt
(P n+N )ij
=
=
=
k
X
l=1
k
X
l=1
k
X
l=1
(P N )il (P n )lj
N
n
n
((P )il − d(P )jl )(P )lj + d
k
X
(P n )jl (P n )lj
l=1
((P N )il − d(P n )jl )(P n )lj + d(P 2n )jj
≥ m(j, n)
k
X
((P N )il − d(P n )jl ) + d(P 2n )jj
l=1
= m(j, n)(1 − d) + d(P 2n )jj .
Durch Minimumbildung erhalten wir
m(j, n + N ) ≥ m(j, n)(1 − d) + d(P 2n )jj .
Analog leitet man her:
M (j, n + N ) ≤ M (j, n)(1 − d) + d(P 2n )jj .
Folglich haben wir
µ(j, n + N ) ≤ (1 − d)µ(j, n) .
Betrachte nun für ein n ∈ N die Teilfolge (µ(j, n + lN ))l∈N . Wir haben
µ(j, n + lN ) = µ(j, n + (l − 1)N + N ) ≤ (1 − d)µ(j, n + (l − 1)N )
und nach Iteration
µ(j, n + lN ) ≤ µ(j, n)(1 − d)l .
Da 1 − d < 1 gilt, folgt die Konvergenz von (µ(j, n + lN ))l∈N gegen Null.
Nun kommen wir zum Beweis der Aussagen in der Formulierung des Satzes.
Aus der Existenz von limn m(j, n) = limn M (j, n) , j = 1, . . . , k , folgt die Existenz von wij :=
limn (P n )ij = limn m(j, n) für alle i, j = 1 . . . , k , und die Unabhängigkeit von wij von i für alle
j = 1, . . . , k . Setze W := (wij )1≤i,j≤k . W hat nun gleiche Zeilenvektoren; sei π = (π1 , . . . , πk )
Stand: 9. Februar 2010
109
c J.Baumeister
KAPITEL 8. ZUFALL
8.6. ÜBUNGEN
der Zeilenvektor von W .
Da (m(j, n))n∈N monoton
P
Pk nicht fallend und m(j, N ) positiv ist, ist jedes ist πi positiv. Aus
k
n
l=1 (P )ij = 1 folgt
l=1 πl = 1 .
Aus
k
k
X
X
πj = lim(P n+1 )ij = lim( (P n )il plj ) =
πl plj = (πP )j , j = 1, . . . , k ,
n
n
l=1
l=1
folgt die Eigenwertgleichung.
Zu (d).
Offenbar konvergiert (π (0) P n )n∈N gegen π (0) W . Da u := π (0) die Bedingung (8.6) erfüllt und
alle Zeilen von W gleich sind, ist π (0) W = π .
Damit sind alle Aussagen gezeigt.
Die Gleichung
πP = π
(8.11)
ist nun der Ansatz zur Analyse einer regulären Markovkette: bestimme den Eigenvektor zum
größten Eigenwert von P . Dann ist das Langzeitverhalten ablesbar. Der Vektor π heißt Gleichgewichtsverteilung.
Beispiel 8.5.10 Wir betrachten das Beispiel 8.5.4 mit der Übergangsmatrix
!
0.662 0.338
P :=
0.250 0.750
Wir erhalten in numerischer Rechnung
!
0.432
0.568
P5 =
, P 10 =
0.420 0.580
0.425 0.575
0.425 0.575
!
, P 20 =
0.425 0.575
0.425 0.575
!
.
Der Eigenvektor zum Eigenvektor 1 ist
α = (0.425, 0.575) .
Auf lange Sicht ist also das Wetter in der Gegend unabhängig von einer beliebigen Startverteilung
π (0) : es ist in 42.5% der Tage regnerisch und in 57.5% der Tage trocken.
8.6
Übungen
1.)
Stand: 9. Februar 2010
110
c J.Baumeister
Kapitel 9
Modellierung
Modellierung ist der Versuch, eine Wirklichkeit durch ein Modell der Wirklichkeit zu ersetzen.
Mathematische Modellierung bedeutet, Modelle in der Sprache der Mathematik zu formulieren
und Theorien zu ihrer Analyse zu entwickeln/anzuwenden. Modellierung ist eng mit Simulation
verknüpft und damit auch mit dem Einsatz von Computern.
9.1
Wissenschaft
Bevor wir über Modelle reden können, die ja mathematische Modelle sein sollen, ist über die
Wissenschaft Mathematik zu reden. Sie soll ja hier mit seinen Entwicklungen, Resultaten, Ordnungsinstrumenten, . . . herangezogen werden.
Was ist Wissenschaft, was ist eine Wissenschaft, was ist die Wissenschaft Mathematik? Darum
geht es hier, aber etwas weniger umfassend. Wir fragen nach dem Gemeinsamen einer wissenschaftlichen Theorie.1
Es ist offenbar, dass eine Darlegung dazu hier nur sehr laienhaft angelegt sein kann. Aber
die folgenden Thesen scheinen doch richtungsweisend zu sein für eine spätere Einordnung des
Vorgangs der Modellierung.
• Die Aussagen einer wissenschaftlichen Theorie beziehen sich nicht auf konkrete
Objekte sondern auf bestimmte theoretische Begriffe
• Eine wissenschaftliche Theorie hat eine streng deduktive Struktur.
• Anwendungen einer wissenschaftlichen Theorie auf die wirkliche Welt basieren
auf Korrespondenzregeln zwischen theoretischen Gebilden und konkreten Objekten.
Anders als die internen Aussagen der Theorie2 enthalten die Korrespondenzregeln keine absolute
Garantie für ihre Gültigkeit. Die grundlegende Methode, um ihre Gültigkeit – und damit die
Anwendbarkeit der Theorie – zu überprüfen, ist die experimentelle Methode. Der Bereich, in
dem die Korrespondenzregeln gültig sind, ist in jedem Falle begrenzt.
Der ungeheuere Nutzen exakter Wissenschaften – dies ist die Gesamtheit aller wissenschaftlichen Theorien – besteht darin, dass sie Modelle der Wirklichkeit liefern. Diese Modelle ermöglichen
die Darstellung und Vorhersage natürlicher Phänomene, indem man sie mittels Korrespondenzregeln auf die theoretische Ebene überträgt, die so erhaltenen Übungsaufgaben“ löst und die
”
Lösungen auf die wirkliche Welt zurücküberträgt.
1
Die folgenden Ausführungen sind geleitet von den Gedanken und Ausführungen in L. Russio, Die vergessene
Revolution, Springer, 2003, das sehr interessant und mit überraschenden Einsichten das hellenistische Zeitalter
des antiken Wissens darstellt.
2
L. Russio schreibt davon, dass eine Theorie nur dann wissenschaftlich genannt werden kann, wenn man
Übungsaufgaben zu ihr erstellen kann.
111
KAPITEL 9. MODELLIERUNG
9.2. MODELLE
In jeder reinen Naturlehre ist nur so viel an eigentlicher Wissenschaft enthalten, als
Mathematik in ihr angewandt werden kann.
I. Kant
9.2
Modelle
Wenn wir nun von Modellen für etwas sprechen wollen, haben wir zu klären, was dieses etwas sein
soll: ein reales Problem?, ein Phänomen?, ein räselhaftes Verhalten?, . . . . Wir wollen uns dabei
des Begriffs des Systems bedienen und unter einem System einen wohlumschriebenen Teilbereich
der Wirklichkeit verstehen. Zugegeben, nicht viel ist gewonnen mit dieser Definition“, in kon”
kreten Situation wird sie uns aber schon helfen können. Beispiele für solche Wirklichkeitsbereiche
könnten sein:
Mechanische Systeme, chemische Reaktoren, Biotope, Lebensgemeinschaft gewisser
Spezies, Körperorgane, Handelsbetriebe, Volkswirtschaften, Klimasysteme
Die Beschreibung von Systemen umfasst die Angabe der Objekte (Bestandteile), die zum System
gehören, legt die Beziehungen unter den Objekten offen, erklärt mögliche Interaktionen unter
den Bestandteilen und gibt die Umstände an, unter denen die Beschreibungen gültig sein sollten.
Die Wechselwirkung eines Systems mit der Systemumgebung erfolgt über so genannte Eingangsund Ausgangsgrößen.
In grober Einteilung sprechen wir von zeitunabhängigen (stationären) Systemen und zeitabhängigen (dynamischen) Systemen. Manchmal ist Zeit“ auch eine fiktive Zeit. Unter einem
”
Experiment an einem System versteht man den Prozess, durch Aufschalten“ spezieller Ein”
gangsgrößen aus gemessenen Ausgangsgrößen Aussagen über das System zu gewinnen.
Ein Modell ist ein Abbild eines Systems, einer Wirklichkeit in einem anderen Kontext. Der
Physiker Hertz3 scheint erstmals das Wort Modell“ in einem Sinne verwendet zu haben, der
”
unserem Verständnis entspricht. Wir werden uns auf mathematische Modelle beschränken, d.h.
auf solche, die im Kontext der Mathematik betrachtet werden; siehe unten. Es ist nicht zwingend,
nur mathematische Modelle zu betrachten, z. B. kann man für die Lebensgemeinschaft gewisser
”
Spezies“ auch ein sozialwissenschaftliches Modell aufstellen; möglicherweise landet man aber bei
der Modellierung dieses Models wieder bei einem mathematischen.
Die Modellbildung, der Modellierungsprozess umfasst
(1) die Identifikation der Bestandteile (des zu modellierenden Systems),
(2) die Aufdeckung von Zusammenhängen im Beziehungen im System,
(3) die Annahmen, unter denen das Modell schließlich betrachtet werden soll,
(4) die Festlegung der Modellierungsebene.
Mit Modellierungsebene meinen wir hier: sozialwissenschaftlich, physikalisch, mathematisch, . . . .
Typische methodische Elemente der Modellbildung sind
• Vereinfachung, Idealisierung,
• Festlegung des Wesentlichen, Weglassung von Unwesentlichem, Abstraktion,
• schrittweises Vorgehen von einfach zu komplex,
3
Heinrich Hertz, 1857-1894, Physiker
Stand: 9. Februar 2010
112
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.3. MATHEMATISCHE MODELLIERUNG
• Versuch und Irrtum.
Im Allgemeinen wird man Modellsequenzen betrachten, beginnend mit einfachen Grundmodellen, fortschreitend unter Einbeziehung der Ergebnisse der vorangegangenen Modellanalyse.
Simulation ist das Nachbilden eines Systems (mit seinen dynamischen Prozessen) in einem experimentierfähigen Modell, um zu Erkenntnissen zu gelangen, die auf die Wirklichkeit übertragbar
sind; siehe Abschnitt 9.4.
Die Schwierigkeit bei der konzeptuellen Modellbildung liegt darin, das Beobachtete zu vereinfachen und zu abstrahieren ohne die wesentlichen Aspekte auszulassen oder zu verfälschen.
Dabei spielt die Fragestellung, die das Ziel für die Analyse vorgibt, eine wesentliche Rolle. Neben diesen konzeptuellen Modellen, die unser Anliegen sind, werden in den Naturwissenschaften
auch deskriptive Modelle benötigt. Sie sind in höchstem Maße nützlich für die Aufbereitung von
großen Datenmengen/Meßdaten. Dem Anspruch, den Simulationsmodelle mitunter erheben, ein
wirklichkeitstreues Abbild einer komplexen Realität wiederzugeben, können diese Modelle im
Allgemeinen nicht gerecht werden: die hohe Komplexität eines Simulationsmodells, die ja gerade den engen Realitätsbezug herstellen sollte, führt oft dazu, dass sie undurchschaubar werden
in ihrer Aussagekraft.
Modellen liegen Gedankenexperimente zugrunde unter Idealbedingungen, allenfalls
geeignet, wirkliche Experimente nach ihnen zu entwerfen. Wo das, wie meist in
den Sozialwissenschaften, nicht möglich ist,
kann die Lösung“, die Wirklichkeit ein”
fach mit den Modellen zu identifizieren,
nur Verwirrung stiften, vor allem dann,
wenn man nicht akzeptieren will, dass Modelle nicht als richtig oder falsch, sondern als mehr oder weniger passend anzusehen sind. Die Rolle kann in Problemfeldern, in denen es keine Laborversuche gibt,
nicht dieselbe sein wie etwa in der Physik.
9.3
Ingenieurwisschensachaften
I
n
f
o
r
m
a
t
i
k
Naturwissenschaften
Mathematik
Theorie
Experiment
Berechnung
Ö
k
o
n
o
m
i
e
Life sciences
Abbildung 9.1: Mathematik und Modellierung
Mathematische Modellierung
Mathematische Modellierung/Modellbildung meint – siehe Abschnitt 9.1 – die Korrespondenzregeln zwischen den konkreten Objekten und den theoretischen mathematischen Gebilden herzustellen. Von Galileo Galilei stammt die Metapher vom Buch der Natur, das in der Sprache der
”
Mathematik“ geschrieben sei. Sie beschreibt den Zugang zur Natur, den die Naturwissenschaften
seit Galilei gewählt haben. Mathematische Modellierung ist demnach der Versuch, das Nachdenken über eine Fragestellung in mathematische Termini zu übersetzen und sich der (Stringenz
der) Mathematik für die Behandlung von Problemen außerhalb der Mathematik zu bedienen.
A. Alexandrov schreibt:4
Die Mathematik ist ein mächtiges und universelles Instrument der Erkenntnis und
der Lösung von Aufgaben überall dort, wo sich genügend klar definierte Strukturen
abzeichnen.
4
A. Alexandrov, Mathematik und Dialektik, Ideen des exakten Wissens, 4 (1971), 251-257.
Stand: 9. Februar 2010
113
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.4. SIMULATION
Dies ist sicher der Fall in den klassischen Anwendungsgebieten Physik und Ingenieurwissenschaften. Der Erfolg der mathematischen Modellierung bei der Behandlung physikalischer und
technischer Systeme hat diesen Zugang auch in die Lebenswissenschaften, Wirtschaftswissenschaften und und Sozialwissenschaften hineingetragen.
Mathematische Modelle dienen dem Verständnis grundlegender Mechanismen, sind jedoch
meist stark vereinfachend und lassen dann nur allgemeine, qualitative Aussagen zu. Die Theoriebildung aus mathematischen Modellen heraus ist dementsprechend auch stark auf grundlegende
Aussagen über das modellierte System eingeschränkt. Der springende Punkt der Brauchbarkeit
eines mathematischen Modells für den angepeilten Zweck ist die Güte des Modells: eine Beobachtung des Systems liefert qualitative und quantitative Daten, die Güte des mathematischen
Modells wird an Hand des Grades der Übereinstimmung der Vorhersagen“ des Modells mit den
”
Daten bewertet.
Mathematische Modellierung realer Phänomene kann mit unterschiedlichen Werkzeugen der
Mathematik erfolgen. Phänomene, die sich so modellieren lassen, finden sich u.a. in den Anwendungsgebieten
• Informatik
• Wirtschaftswissenschaften, Finanzmathematik
• Biologie, Biophysik
• Mechanik, (Mathematische) Physik
In der Informatik werden diskrete Strukturen durch Graphen, Gitter, Automaten, . . . abgebildet;
in den Wirtschaftswissenschaften werden Entscheidungs– und Optimierungsprobleme umgesetzt
in mathematische Aufgaben; in der Biologie werden Wachstumsmodellle betrachtet; In der Biophysik werden (dynamische) Mdelle zum Beispiel für die Aktivität des Gehirns erarbeitet; in der
Mechanik werden Konsequenzen aus den Bewegungsgesetzen für starre Körper gezogen; Modelle
der mathematischen Physik beschreiben kontinuierliche Systeme mittels partieller Differentialgleichungen; in der Finanzmathematik ist ein zentrales Problem die Bewertung von Optionen,
modelliert in erster Näherung“ durch die Black-Scholes-Differentialgleichung. In jedem Falle
”
stehen Modellannahmen am Anfang: sie dienen zum Einen, ein Modell auf der jeweiligen mathematischen Basis herleiten zu können und zum anderen dieses Modell so einfach zu gestalten,
dass eine stringente mathematische Untersuchung“ möglich wird.
”
9.4
Simulation
Was ist Simulation? Hier ist der Versuch einer Definition:
Unter Simulation versteht man in der Wissenschaft die Nachbildung eines realen
Objektes oder Vorganges als Modell und die Nutzung dieses Modells an Stelle des
Objekts.
Ein Beispiel dafür ist der maßstabsgetreue Nachbau eines Autos für ein Experiment im Windkanal. Seit dem Siegeszug des Rechners als technisches Werkzeug werden solche Modelle jedoch in
der Regel nicht mehr physikalisch, sondern virtuell in Form von Computerprogrammen realisiert
und benutzt.
Das bekannteste Beispiel einer Simulation durch einen Computer ist wohl die Wettervorhersage, welches das Ergebnis aufwändiger Rechnungen auf leistungsfähigen Supercomputern ist.
Aus der Sicht, die wir einnehmen wollen, beginnt die Geschichte wohl in den vierziger Jahren
Stand: 9. Februar 2010
114
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE
des letzten Jahrhunderts. Im Vordergrund standen Simulationen von Flugkörpern, radioaktiven Stoffen, elektrischen Schalkreisen und schlies̈lich von Satelliten. In den Universitäten sind
sogar Fachgebiete wie Modellierung, Simulation“ entstanden. Heutzutage kann Jedermannn
”
Simulationsreisen machen, die PC’s sind leistungsstark genug, allerdings ist der Grat zwischen
wissenschaftlicher Simulation und Beispielsanwendungen schmall.
Simulation ist im Allgemeinen eine interdisziplinäre Tätigkeit, ein interdisziplinäres Fach. Es
ist angesiedelt im Überlappungsbereich von Informatik, Mathematik und den Anwendungsgebieten, wie beispielsweise der Physik, der Medizin und Biologie. Stichworte zu Gründen für den
Einsatz von Simulation können sein: Kosten, Gefahrenpotential, Beobachtbarkeit, Beinflussbarkeit, Störungsfreiheit.
Anwendungen der Simulation sind vielfältig. Bereiche sind:
Wissenschaft Hier wird Simulation eingesetzt, um Theorien zu entwickeln und zu verfeinern.
Dies geschieht durch einen Vergleich zwischen Simulationsergebnissen und theoretischen
Prognosen.
Technik Für den Ingenieur ist die Simulation ein Entwurfs- und Optimierungswerkzeug. Mit
ihrer Hilfe kann er seine Ideen für ein Produkt oder System testen, lange bevor der erste
Prototyp gebaut wird.
Gesellschaft Für die Gesellschaft liegt der Nutzen der Simulation in den Prognosen von Ereignissen und Erklärungen von realem Geschehen. Beispiele sind Märkte, Wahlverhalten,
....
Unterhaltung Simulationen haben Einzug gehalten bei den Unterhaltungsmedien in der Entwicklung von Filmen, . . . . Anwendungen in der Medizin profitieren davon.
Simulation bedarf im Allgemeinen der Entwicklung von (schnellen) Algorithmen, um die
Zwecke der Simulation zu erreichen. Hier ist heutzutage der Ansatz für Forschung und Weiterentwicklung. Man unterscheidet deterministische und stochastische Ansätze für Algorithmen.
Beispiele sind:
Deterministisch Lineare Optimierung/Simplexverfahren, Differenzengleichungen, Differentialgleichungen, Gröbnerbasen,. . . .
Stochastisch Approximationsalgorithmen, Monte-Carlo-Methoden, Markovketten, stochastische Differentialgleichungen, . . . .
9.5
Zur Mendelschen Vererbungslehre
Eine der ersten systematischen Arbeiten zur Vererbungslehre wurde im 19. Jahrhundert von
Gregor Mendel5 geleistet. Unter anderem untersuchte Mendel die Vererbung einer Eigenschaft
von Erbsen, nämlich ob die Erbsen eine glatte oder runzelige Oberfläche besitzen. Wie bei allen
Pflanzen besitzt dabei jedes Individuum zwei Eltern.
Durch Kreuzung von Erbsen mit glatter Oberfläche und runzeliger Oberfläche erhält jede
Erbse in der Tochtergeneration das Genmaterial je eines Elternteils mit glatter und je eines
Elternteils mit runzeliger Oberfläche. Überraschenderweise gab es bei den Nachkommen der
Erbsen in der ersten Tochtergeneration nur noch glatte Erbsen. Noch überraschender waren die
Ergebnisse bei der nachfolgenden Tochtergeneration, bei der nun beide Elternteile aus der ersten
5
Gregor Mendel, 1822 - 1884, Augustinermönch
Stand: 9. Februar 2010
115
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE
Tochtergeneration stammten. Hier kamen sowohl glatte als auch wieder runzelige Erbsen zum
Vorschein. Interessanterweise waren jedoch die glatten Erbsen im Übergewicht, und zwar im
Verhältnis 3 zu 1. Mendel suchte nach einer Erklärung und fand sie.
Bei diploiden“ Organismen, z. B. bei Menschen, Pflanzen,. . . , sind entlang der Chromo”
somen Gene wie in einer Kette nebeneinander aufgereiht. Ein Gen kann in zwei oder mehr
Zustandsformen auftreten, die man Allele nennt. Am Genort der Erbsen, der für die Oberfläche verantwortlich ist, gibt es zwei allele Gene, bezeichnet mit G (glatte Oberfläche) und g
(runzelige Oberfläche). Damit gibt es drei verschiedene Genotypen: GG, Gg, gg (Gg und gG
können wir identifizieren). Hier ist die Mendelsche Vererbung:
Elterngeneration:
Erste Tochtergeneration:
Zweite Tochtergeneration:
GG, gg
Gg, Gg
GG, Gg, gG, gg
Hier geht man also davon aus, dass in der Elterngeneration die Genotypen GG und gg vorliegen.
Wieso kommt es zu den Genotypen in der ersten und zweiten Tochtergeneration und was soll
nun Gg eigentlich sein? Wir wissen nur, dass GG glatt und gg runzelig bedeutet. Ein Organismus, der bezüglich einer Ausprägung dieselbe Erbinformation trägt, wird als reinerbig oder
homozygot bezeichnet.6 Wir haben nun mit Gg eine mischerbige oder heterozygote Erbinformation vorliegen. Soll daher die Ausprägung ein wenig runzelig“ vorliegen oder soll eine
”
der beiden Allele zufällig die Ausprägung bestimmen? Bei anderen Pflanzen gibt es durchaus
die Beobachtung, dass Nachfahren eine gemischte Ausprägung“ haben: rote Blume + weisse
”
Blume = rosa Blume als Nachfahre. Dies ist aber hier, wie die Experimente gezeigt haben,
nicht der Fall: alle Erbsen der ersten Tochtergeneration werden als glatt beobachtet.
Die Interpretation dieses Sachverhalts ist, dass beide Allele gegeneinander konkurrieren und
in Abhängigkeit der Gene sich immer eines der beiden als dominant behauptet. Dies legt es
nahe, der Unterscheidung Genotyp (Zusammensetzung der Erbinformation) die Unterscheidung
Phänotyp (sichtbare Ausprägung) zur Seite zu stellen. Damit erklärt sich die Ausprägung der
ersten Tochtergeneration dadurch, dass Gg, gG und GG denselben Phänotyp besitzen.
Wie kann man nun die Erscheinung in der zweiten Tochtergeneration erklären? Nimmt
man an, dass Eltern des Genotyps Gg eines seiner Gene mit gleich großer Wahrscheinlichkeit
an seine Kinder weitergibt, dann gibt es für die Erbsen der zweiten Tochtergeneration vier
Möglichlichkeiten, wie sie in der obigen Tabelle aufgelistet ist. Davon sind drei der vier Kombinationen, die im Genotyp möglich sind, im Phänotyp gleich, nämlich glatt; nur der Genotyp gg
liefert eine runzelige Erbse. Dabei ist offenbar angenommen, dass eine nachfolgende Generation
durch zufällige Paarung gebildet wird, ohne Rücksicht auf den Genotyp der Eltern.
Beispiel 9.5.1 In der Mendelschen Vererbung haben wir die Genotypen D: GG, H: Gg, R: gg .
Wir gehen nun so vor: Wir nehmen irgendein Individuum, kreuzen es mit einem Individuum
des gewählten Typs, wählen zufällig einen Abkömmling aus, kreuzen diesen wieder mit einem
Individuum des gewählten Typs, und so weiter. Beobachtet man die Genotypen der so erzeugten Abkömmlinge durch die Generationen, so erhält man eine Markovkette. Dazu gehören die
Übergangsmatrizen

1 1




0 0 0
1 12 0
2
4 0






PD := 0 21 1 , PH :=  12 21 12  , PR := 1 21 0 .
0 0 0
0 21 1
0 41 12
Studiere nun das Langzeitverhalten der Generationen im Kontext von Satz 8.5.9.
6
Die Annahme, dass eine Situation vorliegt, in der die Elterngeneration reinerbig ist, läst sich durchaus rechtfertigen.
Stand: 9. Februar 2010
116
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.6
9.6. DAS FALLGESETZ VON GALILEI
Das Fallgesetz von Galilei
Das Gesetz des freien Falls steht am Beginn der neuzeitlichen Physik. Es besagt, dass
(1) alle Körper gleich schnell fallen,
(2) bei einem freien Fall aus der Ruhelage die zurückgelegten Wege sich verhalten
wie die Quadrate der Zeiten.
Um die Entdeckung dieses Gesetzes rankt sich die Legende, Galilei7 hätte es gefunden im Experiment, Körper vom schiefen Turm in Pisa fallen zu lassen. Es handelt sich wirklich nur um eine
Legende.8 Hätte er dieses Experiment wirklich durchgeführt und wäre er von den Beobachtungen ausgegangen, so wäre er nie auf das Fallgesetz gekommen, denn der störende Einfluss des
Luftwiderstands hätte sich bemerkbar gemacht.
Wie läßt sich nun etwa das erste Fallgesetz beweisen“? Zwei gleiche Kugeln müssen aus Sym”
metriegründen gleich schnell fallen. An der gemeinsamen Fallgeschwindigkeit wird sich nichts
ändern, wenn man die beiden Kugeln durch einen festen, masselosen“ Stab miteinander ver”
bindet. Dabei handelt es sich dann aber um einen Körper der doppelten Masse, der mit der
gleichen Geschwindigkeit fällt. Durch Anwendung dieser Überlegung auf drei, vier, . . . Kugeln
ergibt sich die Unabhängigkeit der Fallgeschwindigkeit von der Masse des Körpers.
Welche Annahme liegt der Überlegung zugrunde? Es ist die
Annahme: Auf die Gestalt des Körpers kommt es nicht an.
Man könnte diese Annahme als willkürlich bezeichen, sie ist aber hilfreich, eine wunderbare
mathematische Theorie für die Mechanik starrer Körper zu entwickeln.
Wie verhält es sich nun beim zweiten Teil des Fallgesetzes? Es ergibt sich bei Galilei als mathematischer
Satz über die gleichförmig beschleunigte Bewegung,
nachdem er eine Definition von gleichförmiger und
gleichförmig beschleunigter Bewegung gegeben hat.
Die Empirie kommt nur insofern ins Spiel, als festgestellt wird, dass ein schwerer Körper (nach unten)
fällt, und dass nachträglich in einem Versuch mit
einer schiefen Ebene das Gesetz verifiziert“ wird.
”
Wir wollen die Definitionen nicht wiederholen,
wollen aber ein Zwischenergebnis“ angeben. Galilei
”
schreibt:
Die Zeit, in welcher irgendeine Strecke
von einem Körper von der Ruhelage aus mittelst einer gleichförmigen
beschleunigten Bewegung zurückgelegt
wird, ist gleich der Zeit, in welcher dieselbe Strecke von demselben
Abbildung 9.2: Erstes Fallgesetz
Körper zurückgelegt würde mittelst einer
gleichförmigen Bewegung, deren Geschwindigkeit gleich wäre dem halben Betrage des
höchsten und letzten Geschwindigkeitswertes bei jener ersten beschleunigten Bewegung.
7
8
Galileo Galilei, 1564-1642, it. Wissenschaftler
Die Episode wird erst 60 Jahre nach der Entdeckung des Gesetzes erstmals beschrieben.
Stand: 9. Februar 2010
117
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.6. DAS FALLGESETZ VON GALILEI
Hier werden zwei verschiedene Bewegungen einander gegenübergestellt: eine gleichförmig beschleunigte, bei der im Zeitintervall [0, t1 ] die Geschwindigkeit gleichmäßig von 0 auf einen
maximalen Wert v1 zunimmt, und eine gleichförmige mit der konstanten Geschwindigkeit 21 v1 .
Offenbar sind die Flächen unter den beiden verschiedenen Geschwindigkeitsprofilen gleich; siehe
Abbildung ??. Aus der Integralrechnung wissen wir, dass der Weg s, der im Interval [0, t1 ] bei
gegebener Geschwindigkeit v durchlaufen wird als
Z t1
v(t)dt
s=
0
gegeben ist. Dies ist das Zwischenergebnis von Galilei. Galilei hat das Argument der Integralrechnung durch ein geometrisches Argument ersetzt.
Betrachte nun eine gleichförmig beschleunigte Bewegung, die zum Zeitpunkt t1 bzw. t2 die
Geschwindigkeit v1 bzw. v2 besitzen. Dann gilt also für die durchlaufenen Wege
1
1
s1 = v1 t1 und s2 = v2 t2
2
2
und auf Grund der Annahme der Gleichförmigkeit der Bewegung
t1
v1
=
.
v2
t2
Daraus folgt
s1
t2
= 21 ,
s2
t2
also das zweite Fallgesetz.
Wir sehen in den obigen Darlegungen schon die Begriffe der Newtonschen Mechanik und im
Schlepptau die Anfänge der Infinitesmal– und Integralrechnung aufscheinen. In der modernen
Sprache der Infinitesmal– und Integralrechnung ist die Annahme der gleichförmigen Beschleunigung gleichbedeutend mit der Aussage, dass die Ableitung der Geschwindigkeitsfunktion konstant ist:9
v̇(t) = a für alle t .
Daraus ergibt sich zunächst
ẋ(t) = v(t) = v0 + a(t − t0 ) für alle t ,
wobei t0 , v0 der Anfangszeitpunkt bzw. die Anfangsgeschwindigkeit sind. Daraus leitet sich dann
mit t0 = 0, v0 = das Fallgesetz
1
x(t) = at2 für alle t ≥ 0
2
ab. Hier wird deutlich, welchen Stellenwert die Entwicklung der Infinitesmal– und Integralrechnung, genauer der Theorie der gewöhnlichen Differentialgleichungen, bei der Begründung der
klassischen Mechanik einnehmen musste.
In einem Brief von Galilei wird Mathematische Modellierung versus Erfahrung mit der Wirklichkeit treffend beschrieben:
9
Die Schreibweise ẋ, ẍ ist die bei den Physikern gebräuchliche, wenn es um Zeitableitungen in der Mechanik
geht.
Stand: 9. Februar 2010
118
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.7. GUTGESTELLTHEIT – WELLPOSEDNESS
Zeigt die Erfahrung nunmehr, dass solche Eigenschaften, wie wir sie abgeleitet haben,
im freien Fall der Naturkörper ihr Bestätigung finden, so können wir ohne Gefahr des
Irrtums behaupten, dass die konkrete Fallbewegung mit derjenigen, die wir definiert
und vorausgesetzt haben, identisch ist; ist dies nicht der Fall, so verlieren doch unsere
Beweise, da sie einzig und allein für unsere Voraussetzung gelten wollten, nichts von
ihrer Kraft und Schlüssigkeit.
Newton10 betrachtet den Fall der beschleunigten Bewegung unter der
Annahme, dass ein Widerstand im Verhältnis seiner Geschwindigkeit“ geleistet
”
wird.
Dies bedeutet unter der zusätzlichen Annahme eines linearen Ansatzes, dass nun die Differentialgleichung
v̇ = b − cv
mit positiven Konstanten b, c zu untersuchen ist. Wir kennen alle Lösungen davon. Hier sind sie:
v(t) =
b
b
+ (v0 − ) exp(−ct) für alle t,
c
c
wobei v0 die Geschwindigkeit zur Zeit t0 = 0 ist. Wir leiten die Formel aus der Beobachtung
d ct
(e v) = ect b
dt
ab.
Wir stellen also fest, dass dieses Modell für t → ∞ eine gleichförmige Geschwindigkeit prognostiziert. Diese letzte Aussage ist eine Aussage vom Typ qualitative Aussage, während eine
Aussage zu der Geschwindigkeit, mit der sich der Grenzwert limt→∞ = cb einstellt, nämlich
exponentiell schnell, eine quantitative Aussage ist.
9.7
Gutgestelltheit – Wellposedness
Mathematischen Modelle (für eine physikalische Fragestellung) haben meist die Form einer Gleichung/Differentialgleichung, die gewisse Parameter enthält, und in die weitere Größen einzubringen sind. Siehe etwa das Fallgesetz aus dem letzten Abschnitt: die Differentialgleichung ist v̇ = b
und im Gefolge sind einzubringen t0 , v0 . Eine beliebte Beschreibung eines solchen Modells ist
der Problembeschreibung in der Systemtheorie abgeschaut: es enthält eine
Systemgleichung
und die Größen
Input, System-Parameter, Output.
Die Analyse eines solchen Modells kann dann in drei Typen von Problemen eingeteilt werden:
(A) Das direkte Problem: Gegeben sind Input und System-Parameter, bestimme den Output, der in Übereinstimmung damit ist.
(B) Das Rekonstructionsproblem: Gegeben sind Output und System-Parameter, bestimme
den Input, der in Übereinstimmung damit ist.
10
Isaac Newton, 1642-1727, engl. Wissenschaftler
Stand: 9. Februar 2010
119
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.8. ÜBUNGEN
(C) Das Identifikationsproblem: Gegeben sind Input und Output, finde die System-Parameter,
die in Übereinstimmung damit sind.
Wir nennen ein Problem vom Typ (A) ein direktes Problem, da aus bekannten Ursachen eine
Wirkung zu bestimmen ist. Damit in Übereinstimmung ist dann, Probleme vom Typ (B) und
(C) inverse Probleme zu nennen: es sind ja aus Wirkungen Ursachen zu bestimmen. Wir kommen
auf die Begriffe bei konkreten Modellen wieder zurück.
Bei einem mathematischen Modell läuft es meist darauf hinaus, eine Gleichung zu lösen.
Damit sollte eine umfassende Untersuchung eines solchen mathematischen Modells folgende
Fragen klären:
(1) Festlegung der Daten des Problems und ihrer quantitativen Beschreibung,
(2) Existenz und einer Lösung,
(3) Eindeutigkeit einer Lösung,
(4) Stabilität, d.h. die stetige“ Abhängigkeit der Lösung von den Daten,
”
(5) Berechnung einer Lösung.
Die Festlegung der Daten des Problem ist eigentlich Teil der Modellbildung, die quantitative
Beschreibung ist verbunden damit, in welchem mathematischen Kontext eine Lösung anstreben läßt. Die Frage der Existenz und Eindeutigkeit ist von Bedeutung, wenn es darum geht,
Modellannahmen zu hinterfragen. Nichteindeutigkeit etwa könnte ein Indiz sein, dass die Modellbeschreibung nicht ausreichend viele Annahmen formuliert, um sicherzustellen, dass nur eine
mathematische Lösung“ existiert. In der Frage der Stabilität soll geklärt werden, wie sich Va”
riationen in den Parametern und den Modellannahmen auf die Lösung auswirken. Die Forderung
(5) ist selbsterklärend. Als beispielhaft kann man sich immer eine lineare Gleichung vorstellen:
hier sind die obigen Fragen im Rahmen der linearen Algebra vollständig diskutierbar.
Dieses Konzept der Modellbewertung“ wurde von Hadamard 1902 im Zusammenhang mit
”
dem Studium von Randwertpoblemen der mathematischen Physik eingeführt. Hadamard bezeichnet ein mathematisches Problem schlechtgestellt/ill-posed, wenn es hinsichtlich der Forderungen (1),(2),(3) nicht überall eine positive Antwort gegeben werden kann, im entgegegesetzten
Fall als gutgestellt/well-posed.11 Es ist in der Natur der Problemstellung, dass inverse Probleme
im Allgemeinen schlechtgestellt sind (Irreversibilität, Kausalität, . . . ).
9.8
Übungen
1.)
11
Hadamard glaubte – viele Mathematiker tun dies heute noch – dass schlechtgestellt Probleme nicht sachgemäß
gestellt sind und daher als künstlich zu bezeichnen sind.
Stand: 9. Februar 2010
120
c J.Baumeister
Herunterladen