Grundlagen der Computernutzung - Goethe

Grundlagen der Computernutzung Mathematik
WiSe 2007/08
J. Baumeister1
9. Februar 2010
1
Dies sind Aufzeichnungen, die kritisch zu lesen sind, da sie noch nicht endgültig korrigiert sind.
Hinweise auf Fehler und Verbesserungsvorschläge an [email protected]
Inhaltsverzeichnis
Vorwort
i
Literatur
ii
1 Aussagen und Mengen
1.1 Aussagen und ihre Verknüpfungen
1.2 Mengen . . . . . . . . . . . . . . .
1.3 Alphabete . . . . . . . . . . . . . .
1.4 Relationen . . . . . . . . . . . . . .
1.5 Übungen . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
9
11
13
2 Graphen
2.1 Definition und Diagramme . .
2.2 Wege, Kreise, Zusammenhang
2.3 Planare Graphen . . . . . . .
2.4 Bäume . . . . . . . . . . . . .
2.5 Übungen . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
19
22
24
25
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Algorithmen und Programme
3.1 Algorithmen . . . . . . . . . . . . . . .
3.2 Programme und Programmiersprachen
3.3 Ordnung und Listen . . . . . . . . . .
3.4 Sortieren . . . . . . . . . . . . . . . . .
3.5 Computerzahlen . . . . . . . . . . . .
3.6 Übungen . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
27
27
28
30
31
33
36
4 Abbildungen
4.1 Definitionen . .
4.2 Permutationen
4.3 Metriken . . . .
4.4 Isomorphismen
4.5 Übungen . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
39
45
49
50
5 Zählen
5.1 Natürliche Zahlen .
5.2 Induktion . . . . .
5.3 Abzählen . . . . .
5.4 Rekursion . . . . .
5.5 Primzahlen . . . .
5.6 Übungen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
52
52
55
58
60
62
64
.
.
.
.
.
1
6 Elementare Arithmetik
6.1 Ganze Zahlen . . . . . . .
6.2 Teilbarkeit . . . . . . . . .
6.3 Euklidischer Algorithmus
6.4 Modulare Arithmetik . . .
6.5 Pseudozufallszahlen . . .
6.6 Übungen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7 Polynome und ihre Nullstellen
7.1 Polynome . . . . . . . . . . . . . . . . .
7.2 Nullstellen von Polynomen formelmäßig
7.3 Determinanten und Eigenwerte . . . . .
7.4 Fundamentalsatz der Algebra . . . . . .
7.5 Übungen . . . . . . . . . . . . . . . . . .
8 Zufall
8.1 Laplace–Häufigkeiten . . . . . .
8.2 Kombinatorische Überlegungen
8.3 Bedingte Wahrscheinlichkeiten
8.4 Das Ziegenproblem . . . . . . .
8.5 Markov–Ketten . . . . . . . . .
8.6 Übungen . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
65
65
67
69
74
75
80
.
.
.
.
.
81
81
85
88
90
93
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
94
94
99
102
104
106
110
9 Modellierung
9.1 Wissenschaft . . . . . . . . . . .
9.2 Modelle . . . . . . . . . . . . . .
9.3 Mathematische Modellierung . .
9.4 Simulation . . . . . . . . . . . . .
9.5 Zur Mendelschen Vererbungslehre
9.6 Das Fallgesetz von Galilei . . . .
9.7 Gutgestelltheit – Wellposedness .
9.8 Übungen . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
111
111
112
113
114
115
117
119
120
2
Vorwort
Die Lehrveranstaltung Grundlagen der Computernutzung“ ist ein Teil des Moduls Rechnerun”
”
terstützung in der Mathematik“ im 1. Studienjahres des Bachelorstudiengangs Mathematik“,
”
der im Wintersemester 2006/07 an der Johann Wolfgang Goethe-Universität neu aufgenommen
wurde. Es ist die zweite Auflage einer Lehrveranstaltung dieses Titels, dieser Art und Form.
Inhalt und Umsetzung sind daher noch mehr oder minder im Experimentierstadium.
Die Lehrveranstaltung beinhaltet in einem mathematischen Teil Grundlagen für die Analyse, algorithmische Aufbereitung und Simulation einfacher Sachverhalte der Analysis, Linearen
Algebra und damit in Verbindung stehender Anwendungen. Mit der Vorlesung sollen mehrere
Ziele verfolgt werden:
(1) Erlernen algorithmischen Handelns
(2) Kennenlernen von einfachen Algorithmen im Kontext der Analysis und der Linearen Algebra
(3) Zuhilfenahme des Computer-Algebra-Systems Maple
(4) Einbeziehung des Mathematik-tauglichen“ Textverarbeitungssystems LATEX
”
(5) Erste Schritte bei der Anwendung von Mathematik als Modellierungsinstrument
Aus den Zielen sollte klar werden, dass es sich bei der Vorlesung weder um einen Programmierkurs noch um einen die Vorlesungen Analysis, Lineare Algebra“ begleitenden Rezeptkurs
”
handelt. Es werden wesentliche Inhalte der Analysis und Linearen Algebra algorithmisch aufbereitet und Konzepte vorbereitet, die in Vorlesungen zur Numerischen und Diskreten Mathematik
und über schnelle Algorithmen im Zentrum stehen.
Wie oben angedeutet, ist algorithmisches Handeln und Modellierung ein Teil der Betrachtungen. Algorithmen sind sequentielle Handlungsanweisungen“ zur Lösung eines (in mathemati”
scher Sprache formulierten) Problems. Die Abarbeitung der Handlungsanweisungen erfolgt meist
mit dem Computer unter Nutzung von Programmiersprachen und Programmpaketen; hier nutzen wir ausschließlich Maple. Wir werden keine Theorie von Algorithmen formulieren sondern
die wesentlichen Aspekte algorithmisches Handeln ausschließlich an Beispielen erläutern.
Modelle sind mathematische Abstraktionen einer Fragestellung/eines Phänomens mit dem
Ziel, mathematische Methoden zur Analyse und Algorithmen zur Lösung anwenden zu können.
Wir skizzieren dies an Hand einfacher Beispiele; Literatur zu diesem Aspekt [13, 8, 14, 17, 12].
Dieses Skriptum erfasst den mathematischen Teil der Lehrveranstaltung, die Skripten zu
Maple und LATEX finden sie hier:
www.math.uni-frankfurt.de/∼mkreth/gnr
www.math.uni-frankfurt.de/∼pbauer/gnr
Frankfurt, im Oktober 2007
Johann Baumeister
i
Literaturverzeichnis
[1] Aigner, M., Ziegler, G.M., Proofs from THE BOOK Springer, New York, 1998
[2] Argyris, J., Faust, G., Haase, M. Die Erforschung des Chaos Vieweg–Verlag, 1993
[3] Aulbach, B. Gewöhnliche Differentialgleichungen Spektrum, 1997
[4] Bamberg, P., Sternberg, S. A Course in Mathematics for Students of Physics
Cambridge University Press, 1990
[5] Braun, M., Meise, R. Analysis mit Maple Vieweg, 1995
[6] Braun, M. Differential Equations and Applications Springer, 1996
[7] Ebbinghaus, H.D., u.a. Zahlen Springer, New York, 1988
[8] Ebenhöh, W. Einführung in die mathematische Modellierung
[9] Forster, O., Analysis 1 Vieweg, Braunschweig, 1976
[10] Forster, O., Analysis 2 Vieweg, Braunschweig, 1976
[11] Forster, O., Algorithmische Zahlentheorie Vieweg, Braunschweig, 1979
[12] Fulford, G., Forrester, P., Jones, A., Modelling with Differential and Difference
Equations Cambridge University Press, Cambridge 1997
[13] Grüne, L. Modellierung mit Differentialgleichungen
http://www.math.uni-bayreuth.de/departments/math/∼lgruene/
[14] Ortlieb, C.P. Exakte Naturwissenschaft und Modellbegriff Hamburger Beiträge zur
Modellierung und Simulation, Universität Hamburg, 2000
[15] Russio, L. Die vergessene Revolution Springer, 2003
[16] Scheid, H., Einführung in die Zahlentheorie Klett Verlag, Stuttgart, 1972
[17] Sonar, T., Angewandte Mathematik, Modellbildung und Informatik Vieweg, Braunschweig 2001
[18] Walter, W. Gewöhnliche Differentialgleichungen Springer, 1972
[19] Werner, W., Mathematik lernen mit Maple 1 dpunkt–Verlag, 1996
[20] Werner, W., Mathematik lernen mit Maple 2 dpunkt–Verlag, 1998
ii
Kapitel 1
Aussagen und Mengen
Für die Formulierung von Aussagen von mathematischem Gehalt benötigen wir Verabredungen,
Sprechweisen, Symbole und eine griffige Notation. Dabei wollen wir aber nicht in die Tiefen der
mathematischen Grundlagen (Mengenlehre, Logik) eintauchen, sondern geben uns mit einem
naiven“ Standpunkt zufrieden. Er führt zu keinerlei Konflikten, solange wir uns mit konkret
”
definierten Objekten beschäftigen.
1.1
Aussagen und ihre Verknüpfungen
Argumentationen in der Mathematik beruhen darauf, dass ein Zusammenhang zwischen Aussagen hergestellt wird, dass Aussagen verknüpft werden. Was eine Aussage sein soll, halten wir in
einer Definition fest, die umgangssprachlich formuliert ist.
Definition 1.1.1 Eine Aussage ist eine sprachliche Feststellung, die entweder wahr oder falsch
ist. Falsch bzw. wahr charakterisiert man dabei durch einen Wahrheitswert: (w) steht für wahr,
(f ) steht für falsch.
In der obigen Definition“ spiegelt sich das aristotelische1 Prinzip des tertium non datur
”
wieder: eine Aussage ist entweder wahr oder falsch, eine dritte Möglichkeit gibt es nicht. Beispiele:
1.
2.
3.
4.
5.
6.
2 ist eine gerade Zahl
1004 ist durch 3 teilbar
Brasilien ist ein Entwicklungsland
Die Straße X ist nass
Das Dreieck ABC ist gleichschenklig
2999999991 − 1 ist eine Primzahl
Die erste Aussage ist wahr, die zweite Aussage ist falsch, wenn wir eine Definition von Teilbarkeit
unterstellen; der Wahrheitsgehalt der dritten Aussage hängt von einer Definition eines Entwicklungslandes ab; die vierte Aussage kann auf ihren Wahrheitsgehalt mit physikalischen“ Mitteln
”
geprüft werden; ob die fünfte Aussage wahr ist, ist offen, solange keine exakte Definition und
Beschreibung des konkreten Dreiecks vorliegt; der Wahrheitsgehalt der letzten Aussage ist offen:
2999999991 − 1 ist eine Primzahl oder sie ist keine, die Instanz“, die dies (schnell) entscheiden
”
kann, ist wohl noch zu finden.
Als erstes Aussagenkonstrukt betrachten wir die Verneinung/Negation einer Aussage.
Konkret: Ist P eine Aussage, so bezeichnen wir mit ¬P die Negation der Aussage P ; es ist
1
Aristoteles von Stagira (384-322 v. Chr.)
1
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
also P wahr genau dann, wenn ¬P falsch ist. Man bezeichnet die Negation als einstellige
Verknüpfung“, benötigen wir doch dabei nur eine Aussage. Logische Verknüpfungen, bei denen
”
zwei Aussagen beteiligt sind, nennen wir zweistellige oder binäre Aussageverknüpfungen.
Die Aussageverknüpfungen werden – in streng mathematischen Sinne – in der boolschen2 Algebra
zusammengefasst. In der folgenden Tabelle fügen wir logische Operatoren, wie sie in Maple
nutzbar sind, ein.
Durch logische VerOperation
Sprechweise
Symbol
Maple
knüpfung zweier Aussagen P,Q ensteht eiNegation
nicht . . .
¬
&not
ne dritte Aussage R,
Konjunktion
. . . und . . .
∧
&and
eine sogenannte verbundene Aussage.
Alternative
. . . oder . . .
∨
&or
Um den WahrheitsgeImplikation
wenn . . ., dann . . .
=⇒
&implies
halt dieser verbundenen Aussage geht es
. . . genau dann, wenn . . .
⇐⇒
&iff
Äquivalenz
dann. Bestimmt wird
die Aussage R dadurch, welcher Wahrheitswert ihr für die verschiedenen Belegungen mit (w) und (f) der Aussagen
P und Q zukommt. Die folgende Wahrheitstafel zeigt, wie die oben angeführten Aussageverknüpfungen definiert sind:
P
Q
P ∧ Q
P ∨ Q
P =⇒ Q
P ⇐⇒ Q
(w)
(w)
(w)
(w)
(w)
(w)
P
¬P
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(f)
(f)
(w)
(w)
Man beachte insbesondere die Wahrheitstafel zu P =⇒ Q: Ist P falsch, so ist die Implikation
P =⇒ Q wahr, unabhängig vom Wahrheitsgehalt von Q. Die Wahrheitstafel der Negation ist
angefügt.
Maple - Illustration 1.1
Maple kennt den Datentyp
boolsche Variable und hat die
einfachen logischen Operationen
&and, &or, &not ständig verfügbar. Eine Aussage ist eine
Tautologie, wenn sie unabhängig
vom Wahrheitswert der zu Grunde liegenden Literale“ immer
”
wahr wird.
> with(logic):
> x:=3: evalb(5*xˆ3-200>0);
false
> tautology((&and(a,b) &or (&not a) &or
(&not b));
true
Mit den nun eingeführten Verknüpfungen stehen uns schon eine große Anzahl von Aussagenkonstrukten zur Verfügung. Halten wir einige logische Gesetze fest:
2
George Boole, 1815-1864, Mathematiker
Stand: 9. Februar 2010
2
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
Regel 1.1.2 Seien P, Q Aussagen.
(P =⇒ Q)
¬(P ∧ Q)
¬(P ∨ Q)
(P =⇒ Q)
⇐⇒
(¬Q =⇒ ¬P )
⇐⇒
¬P ∧ ¬Q
⇐⇒
(1.1)
¬P ∨ ¬Q
⇐⇒
(1.2)
(1.3)
(¬P ∨ Q)
(1.4)
Von der Richtigkeit dieser Aussagen überzeugen wir uns, indem wir die Wahrheitstafeln erstellen.
Etwa zu (1.1):
P =⇒ Q ¬ Q ¬ P ¬ Q =⇒ ¬ P
(P =⇒ Q) ⇐⇒ (¬ Q =⇒ ¬ P)
P
Q
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(f)
(f)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(w)
(w)
(w)
(w)
(w)
Die Wahrheitstafel zu P =⇒ Q ist identisch mit der Wahrheitstafel zu ¬ P ∨ Q, wie man
leicht verifiziert. Die Aussage ¬ P ∨ Q vermeidet also das der Umgangssprache nahestehende
“folgt“ in P =⇒ Q.
Regel 1.1.3 Seien P,Q,R Aussagen.
P ∧ Q
P ∨ Q
⇐⇒
Q ∧ P
⇐⇒
(1.5)
Q ∨ P
(1.6)
(P ∧ Q) ∧ R
⇐⇒
P ∧ (Q ∧ R)
(1.7)
P ∧ (P ∨ Q)
⇐⇒
P
(1.9)
P
(1.10)
(P ∧ Q) ∨ (P ∧ R)
(1.11)
(P ∨ Q) ∨ R
P ∨ (P ∧ Q)
P ∧ (Q ∨ R)
P ∨ (Q ∧ R)
⇐⇒
P ∨ (Q ∨ R)
⇐⇒
⇐⇒
⇐⇒
(1.8)
(P ∨ Q) ∧ (P ∨ R)
(1.12)
Die Gültigkeit von (1.5) , . . . , (1.12) belegt man wieder mit Hilfe von Wahrheitstafeln. Etwa zu
(1.11) in nicht vollständiger Aufzählung:
P
Q
R
Q ∨ R
P ∧ (Q ∨ R)
P ∧ Q
P ∧ R
(P ∧ Q) ∨ (P ∧ R)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(w)
(w)
(f)
(w)
(w)
(w)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
(f)
Sprechweisen:
(1.5), (1.6)
(1.7), (1.8)
(1.9), (1.10)
(1.11), (1.12)
Stand: 9. Februar 2010
Kommutativgesetze
Assoziativgesetze
Verschmelzungsgesetze
Distributivgesetze
3
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.1. AUSSAGEN UND IHRE VERKNÜPFUNGEN
In Definitionen weisen wir mathematischen Objekten manchmal Eigenschaften mit einem
definierenden Äquivalenzzeichen “ : ⇐⇒ ,“ zu, etwa:
Objekt O hat Eigenschaft E : ⇐⇒
Eine Aussage A über das Objekt O , die äquivalent
mit dem Eintreten der Eigenschaft E ist, ist wahr (gilt).
Ein Satz, Lemma, eine Folgerung, . . . ist die Ausformulierung einer mathematischer Aussage, die wahr ist. Meist stellt sich diese Ausformulierung so dar, dass aus einer Voraussetzung
V eine Behauptung B gefolgert werden soll; V, B sind selbst mathematische Aussagen.
Ein Beweis eines Satzes mit Voraussetzung V und Behauptung B ist also eine Kette
von Implikationen, ausgehend von der Aussage V bis zur Aussage B:
V
=⇒ . . . =⇒ B
Die Regel (1.1) sagt uns, dass wir den Beweis auch führen können, indem wir die Gültigkeit von
V =⇒ B dadurch zeigen, dass wir ¬B =⇒ ¬V nachweisen; Beweis durch Kontraposition).
Der Widerspruchsbeweis basiert auf der Regel (1.4) zusammen mit (1.3). Er stellt sich so
dar:
V ∧ ¬B =⇒ . . . =⇒ Q
Hierbei ist mit Q dann eine Aussage erreicht, die nicht wahr ist.
Der Beweis durch Fallunterscheidung kann angewendet werden, wenn sich die Voraussetzung
V als V1 oder V2 formulieren läßt. Dann reicht es die Fälle V1 =⇒ B und V2 =⇒ B zu zeigen,
wie eine Wahrheitstafel sofort zeigt.
Dem Nachweis von Euklid3 , dass
spruchbeweises zugrunde:
√
2 nicht rational ist, liegt die Beweistechnik des Wider-
V : a ist eine Zahl mit a2 = 2
B: a ist eine Zahl, die nicht rational ist
√
Aus der Annahme V ∧ ¬B, also der Annahme, dass 2 eine rationale Zahl ist, leiten wir durch
logisches Schließen (gültige Aussageverknüpfungen) eine Aussage ab, die nicht wahr ist. Also
kann die Annahme V ∧ ¬B nicht wahr sein; V =⇒ B ist also wahr. Wir kommen auf diesen
Beweis zurück, wenn wir etwas mehr über rationale und irrationale Zahlen Bescheid wissen.
Bemerkung 1.1.4 Beweise führt man, u. a. dazu,
(-) sich selbst zu überzeugen, dass man richtig überlegt hat;
(-) andere Mathematiker zu überzeugen, dass die Aussage eines Satzes, Lemmas, . . . zutrifft;
(-) den inneren Aufbau eines mathematischen Gebäudes zu erläutern.
Einen Beweis zu finden, erfordert oft ein großes Maß an Intuition und Vorstellungsvermögens.
3
Euklid, 365(?) – 300(?), Mathematiker“
”
Stand: 9. Februar 2010
4
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2
1.2. MENGEN
Mengen
Den Begriff der Menge wollen und können wir hier ebenso wie die obige Aussagenlogik“ nicht
”
im strengen Sinne der mathematischen Grundlagen einführen. Er dient uns nur als Hilfsmittel
für eine möglichst kurze Notation von konkreten Mengen. Von G. Cantor,4 dem Begründer der
Mengenlehre, haben wir folgende Definition:
Eine Menge ist eine Zusammenfassung bestimmter wohlunterschiedener Objekte unserer Anschauung oder unseres Denkens – welche Elemente der Menge genannt werden – zu einem
Ganzen.
Diese Begriffsbildung hat die Mathematik tief beeinflusst.
Eine Menge besteht also aus Elementen, kennt man alle Elemente der Menge, so kennt man
die Menge. Beispiele, die wir noch genauer studieren werden, sind:
N := Menge der natürlichen Zahlen Z := Menge der ganzen Zahlen
Q := Menge der rationalen Zahlen R := Menge der reellen Zahlen .
Mit den natürlichen Zahlen 1, 2, 3, . . . sind wir schon (aus der Schule) wohlvertraut. Später gehen
wir etwas struktureller darauf ein.
Man kann eine Menge dadurch bezeichnen, dass man ihre Elemente zwischen zwei geschweifte
Klammern (Mengenklammern) schreibt. Die Zuordnung eines Elements zu einer Menge erfolgt
mit dem Zeichen “ ∈ “. Gehört ein Objekt x nicht zu einer Menge M, so schreiben wir x ∈
/ M.
Es hat sich als zweckmäßig erwiesen, den Mengenbegriff so aufzufassen, dass eine Menge aus
gar keinem Element bestehen kann. Dies ist dann die leere Menge, das Zeichen dafür ist ∅ .
Beispielsweise ist die Menge der rationalen Zahlen, deren
Quadrat gleich 2 ist, leer. Dies wissen
√
wir aus der Anmerkung über die Irrationalität von 2 .
Das Hinschreiben der Elemente einer Menge kann auf zweierlei Weisen geschehen.
Hat die Menge nur ganz wenige Elemente, so kann man sie einfach alle hinschreiben, durch
Kommata getrennt, auf die Reihenfolge kommt es dabei nicht an und eine Mehrfachnennung ist
nicht von Bedeutung, etwa:
{1, 2, 3} = {2, 3, 1} = {3, 3, 1, 2} .
Abgekürzt verfährt man oft auch so: Elemente, die man nicht nennt aber gut kennt, werden
durch Punkte angedeutet, etwa:
{1, 2, 3, 4, 5, 6, 7, 8} = {1, 2, . . . , 8} = {1, . . . , 8} .
Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Umfangsdefinition.
Die zweite Möglichkeit besteht darin, Objekte einer Menge als Elemente dadurch zuzuordnen,
dass man ihnen eine charakterisierende Eigenschaft zuweist. Ist E eine Eigenschaft, die jedes
Objekt x einer Menge M hat oder nicht hat, so bezeichne
{x ∈ M |x hat die Eigenschaft E}
die Menge aller Elemente von M , die die Eigenschaft E haben; etwa
KO := {x ∈ Obst|x Kernobst}
UNO := {x ∈ Länder|x Mitglied der UNO}
4
Georg Cantor, 1845-1918, Mathematiker
Stand: 9. Februar 2010
5
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Man nennt diese Art, Mengen hinzuschreiben, zu definieren, die Inhaltsdefinition.
Wichtig beim Hinschreiben von Mengen ist, dass stets nachgeprüft werden kann, ob ein
spezielles Objekt einer in Frage stehenden Menge angehört oder nicht; in der Definition von
Cantor ist dies festgehalten. Dies korrespondiert mit dem ausgeschlossenen Dritten bei Aussagen.
Bei J.A. Poulos5 lesen wir:
... Ähnlich ist es mit der Notation der Mengenlehre. Sie ist so einfach, dass sie schon an
der Grundschule gelehrt werden kann. Was manchmal seitenlang in einem Vorwort zu einem
Lehrbuch steht, passt schon in ganz wenige Sätze: Mit p ∈ F wird ausgedrückt, dass p ein
Element der Menge F ist, und mit F ⊂ G, dass jedes Element von F ebenso ein Element
von G ist. Haben wir zwei Mengen A und B, dann ist A ∩ B die Menge, die jene Elemente
enthält, die sowohl zu A als auch zur Menge B gehören; mit A ∪ B ist die Menge gemeint,
die jene Elemente enthält, die zur Menge A, B oder zu beiden gehören; und A′ ist die Menge
jener Elemente, die nicht zu A gehören. Eine Menge, die keine Elemente enthält, ist eine
leere Menge und wird mit ∅, manchmal auch mit {} angegeben, geschweifte Klammern ohne
Inhalt. Ende des Mini-Kurses.
Was uns von den Begriffen aus dem obigen Minikurs noch nicht begegnet ist, bringen wir
noch in eine anständige“ Form:
”
Definition 1.2.1 Seien A, B Mengen und sei z irgendein Objekt.
(a) A ⊂ B : ⇐⇒ (x ∈ A =⇒ x ∈ B)
Damit ist die Teilmengeneigenschaft/Inklusion ⊂ definiert.
(b) A = B : ⇐⇒ (A ⊂ B und B ⊂ A)
(c) z ∈ A ∩ B : ⇐⇒ (z ∈ A und z ∈ B) .
Damit ist der Durchschnitt A ∩ B definiert: A ∩ B := {x|x ∈ A und x ∈ B}
(d) z ∈ A ∪ B : ⇐⇒ (z ∈ A oder z ∈ B) .
Damit ist die Vereinigung A ∪ B definiert: A ∪ B := {x|x ∈ A oder x ∈ B}
Das Symbol “ := “ haben wir als definierendes Gleichsetzen von Mengen eingeführt. Es korrespondiert mit dem Symbol “: ⇐⇒ “.
Definition 1.2.2 Sei A eine Menge. Die Potenzmenge von A ist die Menge der Teilmengen
von A einschließlich der leeren Menge:
P OT (A) := {B|B ⊂ A} .
Beispiel 1.2.3 Sei A := {p, q, r}. Wie sieht die Potenzmenge P OT (A) aus? Wir haben
P OT (A) = {∅, {p}, {q}, {r}, {p, q}, {q, r}{p, r}, {p, q, r}}
Wir stellen fest, dass die Menge A drei und die Menge P OT (A) 8 = 23 Elemente enthält. Dies
hat dazugeführt, dass man P OT (A) auch als 2A schreibt, und die Bezeichung Potenzmenge“
”
leitet sich daraus ab.
5
Poulos, J.A.: Von Algebra bis Zufall, Campus, Frankfurt, 1992
Stand: 9. Februar 2010
6
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Maple - Illustration 1.2
> M:= {2,3,rot,Hahn,rot} ; A:={Hut,Hahn,†};
Maple kennt den Datentyp Menge. Eine Menge ist
eine in geschweifte Klammern
eingeschlossene
Folge
von
Ausdrücken, Objekten;
Mehrfachnennungen
werden
unterdrückt. Die gängigen Operationen mit endlichen Mengen
sind durchführbar. Aufzählende
Definition, Element von, Durchschnitt und Vereinigung von
Mengen sind handhabbar.
M:= {2,3,rot,Hahn}
A:={Hut,Hahn,†}
> member(rot,M);
true
> M intersect A;
{Hahn}
Mitunter wollen wir eine Bezeichnung für diejenigen Elemente haben, die eine gewisse Eigenschaft nicht haben. Dies ist Inhalt von
Definition 1.2.4 Seien A, B Teilmengen von U .
(a) A\B := {x ∈ A|x ∈
/ B} heißt das relative Komplement von B in A .
(b) ∁A := U \A heißt das Komplement von A (in U ).
(In der Definition (b) steht U für die (universelle) Grundmenge, auf die wir uns bei der Komplementbildung beziehen.)
Ein bequemes Hilfsmittel beim Nachdenken über Mengen sind die Venn–Diagramme, bei
denen in der Zeichenblattebene Gebiete zur Darstellung von Mengen benutzt werden: Durch
Kurven umschlossene Gebiete stellen Mengen A, B, . . . dar. Solche Darstellungen sind gut geeignet, formale Argumente für einen zu beweisenden Sachverhalt zu finden.
A
B
(a) Teilmenge
A
B
(b) Vereinigung
A
B
(c) Durchschnitt
Abbildung 1.1: Venn–Diagramme
Die Nützlichkeit der leeren Menge ∅ wird deutlich bei der Definition des Durchschnitts. Hier
ist ja der Fall, dass A ∩ B kein Element enthält, sicherlich nicht auszuschließen, wie uns ein
geeignetes Venn–Diagramm sofort lehrt. Zwei Mengen, deren Durchschnitt leer ist, heissen disjunkt.
Stand: 9. Februar 2010
7
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.2. MENGEN
Regel 1.2.5 Seien A, B, C Mengen.
A ⊂ B, B ⊂ C
A ∪ (B ∪ C)
=⇒
=
A∩B
=
A∪B
=
A ∩ (B ∪ C)
=
A ∪ (B ∩ C)
(A ∪ B) ∪ C
=
A ∩ (B ∩ C)
A⊂C
(1.14)
(A ∩ B) ∩ C
(1.15)
B∩A
(1.17)
B∪A
(1.16)
(A ∩ B) ∪ (A ∩ C)
(1.18)
(A ∪ B) ∩ (A ∪ C)
=
(1.13)
(1.19)
Beweis von (1.18):
Wir haben zu zeigen: A ∩ (B ∪ C) ⊂ (A ∩ B) ∪ (A ∩ C), (A ∩ B) ∪ (A ∩ C) ⊂ A ∩ (B ∪ C) .
Sei x ∈ A ∩ (B ∪ C). Dann gilt: x ∈ A, x ∈ B ∪ C . Daraus folgt: x ∈ A ∩ B oder x ∈ A ∩ C,
je nachdem, ob x ∈ B und/oder x ∈ C. Daraus schließen wir: x ∈ (A ∩ B) ∪ (A ∩ C). Für den
Beweis der anderen Inklusion lese man die eben vorgeführten Beweisschritte rückwärts.
Sprechweisen:
(1.13)
(1.14), (1.15)
(1.16), (1.17)
(1.18), (1.19)
Transitivität
Assoziativgesetze
Kommutativgesetze
Distributivgesetze.
Definition 1.2.6 Seien A, B Mengen.
(a) Sind a ∈ A, b ∈ B, so heißt (a, b) das damit gebildete geordnete Paar (bezogen auf die
Reihenfolge “zuerst A, dann B“).
(b) Zwei Paare (a, b), (a′ , b′ ) mit a, a′ ∈ A, b, b′ ∈ B, heißen gleich genau dann, wenn a =
a′ , b = b′ gilt.
(c) Die Menge A × B := {(a, b)|a ∈ A, b ∈ B} heißt das kartesische Produkt der Faktoren
A, B .
Mit geordneten Paaren notieren wir etwa die kartesischen Koordinaten (Vielfache der Einheitsstrecke) eines Punktes in der Ebene: wir kommen darauf zurück.6
Beispiel 1.2.7 Z2 := {(x, y)|x, y ∈ Z} ist die Menge aller Punkte der Ebene mit ganzzahligen
Koordinaten. Solche Punkte heißen auch Gitterpunkte“ der Ebene. Analog ist Z n die Menge
”
aller Gitterpunkte des Rn .
Regel 1.2.8 Seien A, B, C Mengen:
A × (B ∪ C) = (A × B) ∪ (A × C) .
A × (B ∩ C) = (A × B) ∩ (A × C) .
(1.20)
(1.21)
6
Da René Descartes, 1596-1650, sehr erfolgreich die Koordinatisierung algebraischer Probleme betrieben hat,
ist die Bezeichnung kartesisch“ wohl angebracht.
”
Stand: 9. Februar 2010
8
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.3. ALPHABETE
Diese Regeln bestätigt man ganz leicht. Nehmen wir uns die Regel (1.20) vor und beweisen eine
der Inklusionen, die es zu beweisen gilt: A × (B ∪ C) ⊂ (A × B) ∪ (A × C) .
Sei x ∈ A × (B ∪ C) . Dann gibt es a ∈ A, d ∈ B ∪ C mit x = (a, d) . Nach Definition von B ∪ C
bedeutet dies
x = (a, d) mit a ∈ A, d ∈ B, oder x = (a, d) mit a ∈ A, d ∈ C .
Also x ∈ A × B oder x ∈ A × C .
Es ist klar, dass wir das kartesische Produkt auf mehr als zwei Faktoren“ ausdehnen können.
”
Etwa korrespondiert ein (gültiger) Lottoschein mit den Elementen der Menge
{x = (x1 , x2 , x3 , x4 , x5 , x6 ) ∈ Z × · · · × Z|x1 , . . . , x6 sind paarweise verschieden};
dabei ist Z = {1, 2, 3, . . . , 49}. Ein Element (x1 , . . . , x6 ) der Menge nennt man ein 6-Tupel.
Das mehrfache kartesische Produkt einer Menge A erhält eine Kurzschreibweise, nämlich
An := A
· · × A} := {x = (x1 , . . . , xn )| alle xi ∈ A} .
| × ·{z
n−mal
Ein Element x = (x1 , . . . , xn ) der Menge An nennt man ein n-Tupel.
Eine Menge kann endlich viele Elemente haben oder unendlich viele. Hier begnügen wir uns
mit einer Definition der Endlichkeit“, die aus unserer Erfahrung heraus sehr wohl geeignet ist;
”
später, wenn wir uns mit Abbildungen beschäftigt haben, bessern wir nach:
Eine Menge heißt endlich, wenn jedem Element der Menge der Reihe nach die Zahlen
1, 2, . . . , N zugeordnet werden kann, wobei mit N dann allen Elementen eine Zahl
zugeordnet ist. Eine Menge heißt unendlich, wenn sie nicht endlich ist.
Eine endliche Menge {x1 , . . . , xn } hat somit n Elemente, wenn alle xi paaarweise verschieden
sind.
Die Anzahl der Elemente einer Menge M bezeichnen wir so: #M .
1.3
Alphabete
Alphabete sind ein zentraler Begriff der theoretischen Informatik im Zusammenhang mit Grammatiken und Verschlüsselungsverfahren.
Definition 1.3.1 Sei A eine nichtleere Menge. A∗ bezeichne die Menge der endlichen Tupel
von Elementen von A, also x ∈ A∗ genau dann, wenn x = () oder x ∈ An für ein n ∈ N, .
Die Elemente von A∗ werden A–Wörter – in der Informatik A–Strings – genannt, das Symbol
() bezeichnet das so genannte leere Wort (leeres Tupel). (Wörter sind Bausteine von Sprachen.)
Die Menge A wird in diesem Zusammenhang ein Alphabet genannt; die Elemente von A sind
der Zeichenvorrat für die Wörter.
Einem Element w ∈ A∗ mit w ∈ An wird die Länge n zugesprochen; wir nennen es ein n–Wort;
das leere Wort () hat die Länge 0.
Im Spezialfall A = {0, 1} spricht man bei A∗ von binären Worten.
In der obigen Definition haben wir Wörter als Tupel definiert. Im Kontext von Alphabeten
und deren Wörter läßt man in der Tupel-Schreibweise begrenzende runde Klammern und trennende Kommata weg: x = x1 x2 . . . xn ist ein Wort der Länge n . Damit ist die Bezeichnung
String“ in der Informatik auch erklärt.
”
Stand: 9. Februar 2010
9
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
Beispiel 1.3.2
BAUM
1234
01001
− − •−
:
:
:
:
1.3. ALPHABETE
Deutsches Alphabet {A,B,C, . . . , X,Y,Z,Ä,Ü,Ö}
Dezimalziffern-Alphabet {0,1,2,3,4,5,6,7,8,9}
Binäres Alphabet {0, 1}
Morsealphabet {−, •, ⊔} (− − •− steht für “q“)
Bemerkung 1.3.3 Sei X = {x1 , . . . , xn } eine Menge mit n Elementen. Jeder Teilmenge A
von X, d.h. jedem Element der Potenzmenge von X, entspricht eindeutig ein n−Wort aus dem
Alphabet {0, 1} :
1 , falls xi ∈ A
A ←→ b1 b2 . . . bn , wobei bi =
0 , falls xi 6∈ A
Also ist die Anzahl der Elemente von P OT (X) gleich der Anzahl der möglichen binären n−Worte.
Diese können wir so abzählen:
Es gibt wn n−Wörter und wn+1 (n + 1)−Wörter. Wir sortieren“ die (n + 1)−Wörter nach dem
”
1. Buchstaben: genau wn Wörter beginnen mit 0, genau wn Wörter beginnen mit 1. Daher gilt:
wn+1 = 2 · wn , w1 = 2 . Daraus folgt die Formel wn = 2n , n ∈ N, .
(Wir haben hier eine Art Induktionsbeweis“ aufgeschrieben; dazu später.)
”
Bemerkung 1.3.4 Es gilt heute als gesicherte Tatsache, dass die Erbanlagen von Pflanzen und
Tieren durch die DNS (Desoxyribonukleinsäure) in den Chromosomen übertragen werden. Man
konnte zeigen, dass die DNS aus einer langen Kette besteht, die aus 4 Bausteinen, die durch die
Buchstaben A,T,G,C dargestellt werden, aufgebaut ist. Hier ist ein Ausschnitt:
ATGGCAAGTTACA. . .
Vererbung besteht daher aus langen Nachrichten, die in Worten (Strängen) aus einem Vierbuchstabenalphabet geschrieben werden können; das Ergebnis einer Genom–Analyse ist also so
hinschreibbar.
Die Übertragung von Nachrichten geschieht mittels durch Hardware realisierter mechanischer
oder elektronischer Impulse. Telefon, Morseapparat, Telegraph, Funkgerät sind Instrumente der
Nachrichtenübermittlung. Die Strecke (physikalische Verbindung), auf der die Übermittlung vor
sich geht, bezeichnet man als Kanal. Zur Übertragung werden die Nachrichten in besonderer
Weise vorbereitet. Eine erste Vorbereitung ist die sogenannte Quellencodierung, bei der eine
Nachricht (einer natürlichen Sprache), die ein Sender an einen Empfänger übermitteln will, in
einem vorgegebenen System, Code genannt, dargestellt wird. Quellencodierung bedeutet in der
Regel, einer Nachricht x einer Gesamtheit X von Nachrichten ein Wort w, geschrieben in einem
Alphabet A zuzuordnen.
Ein eventuell so codiertes Wort des Senders geht
nun über den Kanal an den Empfänger. Hier ergeben sich zwei wesentliche Probleme. Zum einen kann
der Kanal Störungen ausgesetzt sein (atmosphärische Störungen bei Satelliten, . . . ), zum anderen
können beabsichtigte Eingriffe (Lauschen, Stören,
gezieltes Abändern, . . . ) von Unbefugten vorgenommen werden. Der erste Aspekt erfordert eine Technik, die Fehler erkennt und korrigiert, der zweite
Stand: 9. Februar 2010
10
ASCII–Zeichen
Codewort
⊔ (Zwischenraum)
00100000
0
00110000
1
00110001
2
00110010
!
00100001
A
01000001
c J.Baumeister
B
01000010
C
01000011
KAPITEL 1. AUSSAGEN UND MENGEN
1.4. RELATIONEN
Aspekt eine Technik, die die Nachrichten für Unbefugte unlesbar macht. Die Methode für Abhilfe
ist bei beiden Aspekten die gleiche: die Nachricht
im Quellencode wird vor der Sendung über den Kanal einer Sicherheitsmaßnahme unterzogen; sie wird
nochmals codiert. Diesen zweiten Schritt fasst man
unter dem Stichwort Kanalcodierung zusammen.
Auf der Empfängerseite hat man dann entsprechend
zwei Decodierungsmaßnahmen zu treffen, die Kanaldecodierung und die Quellendecodierung.
Beispiel 1.3.5 Beispiele für in der Praxis verwendete Codes sind:
• ASCII–Code (American Standard Code for Information Interchange)
Damit wird ein Alphabet, das aus Buchstaben, Ziffern und Sonderzeichen besteht, über dem
Alphabet {0, 1} mit Wortlänge 8 codiert. Ein Ausschnitt ist in Abbildung 1.2 zu sehen.
• Lochstreifencode
Damit wird ein Alphabet aus Buchstaben und Sonderzeichen über dem Alphabet {0, 1} mit
Wortlänge 5 dargestellt, physikalisch realisiert als Fünferkombination von gestanzten Löchern
und ungestanzten Leerstellen im Lochstreifen.
• Zeichensatzcode etwa bei LATE X.
Damit wird ein Alphabet aus Buchstaben, Ziffern und Sonderzeichen über dem Alphabet der
Ziffern {0, 1, . . . , 7} (oktal) mit Wortlänge 3 dargestellt. Ein Beispiel: 046 steht für & im Zeichensatz cmr10. Dabei ist cmr10 selbst wieder ein Codewort, dessen Bauart sich so erklärt:
“cm“ steht für “Computer Modern“, “r“ steht für die Schriftart “Roman“, “10“ steht für die
Entwurfsgröße.
• ISBN (International Standard Book Number)
Beispiel: 3 – 127 – 01901 – 7
(Die Zahl 3 steht für den deutschsprachigen Raum, 127 steht für den Verlag, 01901 steht für die
Nummer des Buches in der internen Zählung des Verlages, 7 ist eine Prüfziffer, die so zustande
kommt:
1 · 3 + 2 · 1 + 3 · 2 + 4 · 7 + 5 · 0 + 6 · 1 + 7 · 9 + 8 · 0 + 9 · 1 hat Rest 7 bei Teilung durch 11
Eine Prüfziffer 10 wird als X (römische 10) geschrieben.)
• E A N (European Article Number/Strichcode)
Beispiel: | ||| | || || |
1.4
Relationen
Das Gleichheitszeichen “ = “ verwenden wir in einer Menge unter der stillschweigenden Annahme
der folgenden Regeln:
x = x ; (x = y =⇒ y = x) ; (x = y, y = z =⇒ x = z) .
Dies nehmen wir zum Anlass für
Definition 1.4.1 Sei X eine Menge. Eine Teilmenge R ⊂ X × X heißt Äquivalenzrelation
auf X, falls
(i) (x, x) ∈ R für alle x ∈ X
(Reflexivität)
(ii) (x, y) ∈ R =⇒ (y, x) ∈ R
(Symmetrie)
Stand: 9. Februar 2010
11
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.4. RELATIONEN
(iii) (x, y), (y, z) ∈ R =⇒ (x, z) ∈ R
(Transitivität)
gilt.
R
Liegt mit R auf X eine Äquivalenzrelation vor, so schreiben wir für (x, y) ∈ R x ∼ y oder
kurz x ∼ y , wenn R uns aus dem Zusammenhang klar ist.
Die Bedeutung einer Äquivalenzrelation R auf X liegt darin, dass man damit die Menge
X in Teilmengen (Klassen, Bündel) einteilen kann, eine Einteilung, die eventuell gröber ist,
als die Aufteilung in einelementige Mengen, und die bezüglich eines Merkmales“ doch noch
”
aussagekräftig ist. Die Einteilung geschieht durch
R
[x] := {y ∈ X|y ∼ x} , x ∈ X , und X/ R := {[x] | x ∈ X} .
Die Objekte [x] heißen Äquivalenzklassen, x heißt Repräsentant der Klasse [x] . Man beR
achte, dass jedes y ∈ X mit y ∼ x als Repräsentant für [x] Verwendung finden kann.
Beispiel 1.4.2 Blutgruppen werden grob eingeteilt in A, AB, B, 0. Sei K eine Gruppe von
Kindern. Wir erklären darauf eine Relation durch
x ∼ y : ⇐⇒ x, y haben dieselbe Blutgruppe
In der Tat liegt eine Äquivalenzrelation vor. Dadurch wird die Gruppe der Kinder in 4 Klassen
eingeteilt.
Beispiel 1.4.3 Man überlege sich, in welcher Weise, die Geraden in der Ebene durch eine
Äquivalenzrelation in Klassen eingeteilt werden können.
Lemma 1.4.4 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann sind mit
x, y ∈ X folgende Bedingungen äquivalent:
R
(a) y ∼ x .
(b)
y ∈ [x] .
(c)
[y] ∩ [x] 6= ∅ .
(d) [y] = [x] .
(e)
x ∈ [y] .
(f )
x ∼ y.
R
Beweis:
Wollten wir alle Äquivalenzen einzeln zeigen, müssten wir 10 Implikationen beweisen. Dies
können wir wesentlich abkürzen durch einen Ringschluss: es genügt zu zeigen:
(a) =⇒ (b) =⇒ (c) =⇒ (d) =⇒ (e) =⇒ (f ) =⇒ (a) .
Dies tun wir nun. Beachte dabei, dass wegen der Reflexivität stets z ∈ [z] .
(a) =⇒ (b)
Dies folgt aus der Definition der Klasse [x] .
(b) =⇒ (c)
Klar, y ∈ [y] ∩ [x] .
(c) =⇒ (d)
Stand: 9. Februar 2010
12
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
Sei z ∈ [y] ∩ [x] , d.h. z ∼ x, z ∼ y . Wir zeigen [z] = [x] = [y] . Es genügt dazu [z] = [y] zu zeigen,
der Beweis der anderen Aussage verläuft völlig analog.
Sei u ∈ [z] . Dann gilt u ∼ z, z ∼ y und daher mit der Transitivität u ∈ [y] .
Sei v ∈ [y] . Dann gilt v ∼ y, z ∼ y und daher mit der Symmetrie und Transitivität u ∈ [z] .
(d) =⇒ (e)
Klar, denn x ∈ [x] .
(e) =⇒ (f )
Dies folgt aus der Definition der Klasse [y] .
(f ) =⇒ (a)
Symmetrie von ∼ .
R
Das folgende Lemma zeigt, dass X durch “ ∼“ in disjunkte Klassen zerlegt wird.
Lemma 1.4.5 Sei X eine Menge und sei R eine Äquivalenzrelation auf X. Dann gilt:
(a) Für jedes x ∈ X gibt es [y] ∈ X/ R mit x ∈ [y] .
(c) Zwei Äquivalenzklassen besitzen genau dann nichtleeren Durchschnitt, wenn sie gleich sind.
Beweis:
Zu (a). Klar: x ∈ [x] für alle x ∈ X wegen der Reflexivität von “∼“.
Zu (b). Siehe Lemma 1.4.4.
1.5
1.)
Übungen
Verneine folgende Aussagen:
(a) Wenn es regnet, ist die Straße nass.
(b) Es gibt kein Tier, das genau ein Ohr und genau zwei Augen hat.
(c) Alle Quadrate von ganzen Zahlen sind gerade.
Was läßt sich über den Wahrheitsgehalt der Aussagen in (a), (b), (c) sagen?
2.)
A, B, C, D sind vier Tatverdächtige. Genau einer unter ihnen ist der Täter. Beim Verhör
machen sie folgende Aussagen:
A: B ist der Täter
B: D ist der Täter
C,D: Ich bin nicht der Täter
Wer ist der Täter, wenn
(a) genau einer lügt,
(b) genau einer die Wahrheit sagt ?
3.)
Seien P, Q Aussagen. Stelle die Wahrheitstafel zu
(a) ¬(P ∨ Q) ⇐⇒ ¬P ∧ ¬Q
(b) P ∧ (P ∨ Q) ⇐⇒ P
auf.
4.)
(a)
Fülle die folgende Wahrheitstabelle aus:
P
(w)
(w)
(f)
(f)
Stand: 9. Februar 2010
Q
(w)
(f)
(w)
(f)
¬P
¬Q
(¬ P ∨ Q)
13
¬ (¬ P ∨ Q)
P ∧ ¬Q
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
Was schließt man aus den beiden letzten Spalten?
(b) Fülle die folgende Wahrheitstabelle aus:
P
(w)
(w)
(f)
(f)
Q
(w)
(f)
(w)
(f)
P =⇒ Q
(P =⇒ Q) ∨ P
Was schließt man aus der letzten Spalte?
5.)
Seien A, B Mengen. Zeige:
(a)
Zeige: P OT (A ∩ B) = P OT (A) ∩ P OT (B)
(b) Zeige: P OT (A) ∪ P OT (B) ⊂ P OT (A ∪ B)
(c)
Ist sogar P OT (A ∪ B) = P OT (A) ∪ P OT (B) richtig ?
6.)
Seien A, B Mengen. Welche Beziehung besteht zwischen A und
B, falls A ∩ B = A oder A ∪ B = B gilt?
7.)
Seien G, M Mengen und sei I ⊂ G × M . Zu A ⊂ G setze
Aˆ:= {m ∈ M |(a, m) ∈ I für alle a ∈ A} .
Zeige:
(a)
Bˆ⊂ Aˆ falls A ⊂ B .
(b) A ⊂ Aˆˆ, Aˆ= Aˆˆˆ.
(In der Literatur heisst ein solches Tripel (G, M, I) auch Kontext mit Gegenstandsmenge
G, Merkmalen M und Inzidenz I .)
8.)
Beweise für Mengen A, B, C : A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) .
9.)
Die symmetrische Differenz von Mengen A und B ist definiert durch
A △ B := {x ∈ A|x ∈
/ B} ∪ {x ∈ B|x ∈
/ A}
Beweise für Mengen A, B, C : A △ (B △ C) = (A △ B) △ C.
10.) Seien A, B Mengen und definiere
((a, b)) := {{a}, {a, b}} , a ∈ A, b ∈ B .
Zeige für a, p ∈ A, b, q ∈ B: ((a, b)) = ((p, q)) ⇐⇒ a = p, b = q .
(Damit haben wir geordnete Paare neu definiert.)
11.) Zeige für Mengen A, B die Äquivalenz der folgenden beiden Aussagen:
(a)
A=B.
(b) A ∪ B = A ∩ B .
12.) MAPLE: Was schliesst man aus der folgenden Sequenz?
> with(logic) :
> bequal((p &nand q) &nand r, p &nand (q &nand r));
false
Stand: 9. Februar 2010
14
c J.Baumeister
KAPITEL 1. AUSSAGEN UND MENGEN
1.5. ÜBUNGEN
13.) MAPLE: Gegeben seien die Mengen A := {a, b, c} und B := {c, d} . Berechne die Potenzmenge von A und teste, ob B eine Teilmenge von A ist. Hinweis: Berechne die
Potenzmenge in einer Schleife.
14.) MAPLE: Zeige:
(a)
p &or q genau dann, wenn &nand (&nand(p, p), &nand(q, q)) .
(b) &not p genau dann, wenn &nand(p, p) .
15.) MAPLE: Ermittle die Arbeitsfunktion des boolschen Operators &xor durch Erstellen
einer Wahrheitstafel.
Stand: 9. Februar 2010
15
c J.Baumeister
Kapitel 2
Graphen
Graphen bilden eine fundamentale Datenstruktur in der Diskreten Mathematik. Entstehung
und Entwicklung der Graphentheorie waren weitgehend durch das Bemühen, eine Lösung des
4–Farbenproblems anzugeben, gekennzeichnet; siehe unten. Die Informatik ist heutzutage Motor der Entwicklung und erfolgreicher Abnehmer von Resultaten der diskreten Mathematik und
insbesondere der Graphentheorie. Hier entwerfen wir eine kleine Skizze interessanter Fragestellungen.1
2.1
Definition und Diagramme
Die einfachste Struktur auf endlichen Mengen wird von einer zweistelligen Relation erzeugt:
Zwei Elemente einer Menge stehen in einer vorgegebenen Beziehung oder nicht. Mit dem Begriff
des Graphen erfassen wir gerade diese Situation, wie wir noch sehen werden.
Beginnen wir mit einem bestens bekannten Gra”
phen“. Er hat 5 Ecken (◦) und 8 Kanten (—) und
ist im Rythmus von
Dies ist das Haus vom Ni–ko–laus
in einem Zug auf das Papier zu zaubern, ohne zweimal eine Kante nachziehen zu müssen. Damit sind
schon wesentliche Begriffe der Graphentheorie angesprochen.
Definition 2.1.1 Ein Graph G = G(E, K) besteht aus einem Paar (E, K), wobei E eine nichtlee- Abbildung 2.1: Das Haus vom Nikolaus
re Menge von Ecken und K eine Menge von Kanten ist und einer Vorschrift, die jeder Kante k ∈ K
genau zwei (verschiedene oder gleiche) Ecken a, b ∈ E zuordnet, die wir Endecken von k nennen; ist a = b, so nennen wir k eine Schlinge bei a.
Im Allgemeinen haben wir endliche Graphen im Blick, also Graphen, deren Eckenmenge eine
endliche Menge ist. (Im englischen Sprachgebrauch spricht man bei Kanten von vertices oder
nodes und bei Kanten von edges; daher G = G(V, E).)
1
Im Internet findet man ein ziemlich umfangreiches Skriptum unter:
www2.informatik.hu-berlin.de/alcox/lehre/skripte/ga/
16
KAPITEL 2. GRAPHEN
2.1. DEFINITION UND DIAGRAMME
Ist G = G(E, K) ein Graph, so sagen wir, dass k ∈ K die Ecken a und b verbindet, wenn a, b
Endecken von k sind; oft schreiben wir dafür k = {a, b} oder kurz k = ab . Ecken, die durch eine
Kante verbunden sind, nennen wir benachbart. Eine Ecke, die zu keiner Kante Endecke ist,
nennen wir isoliert. Sind zwei Ecken durch Kanten k1 , k2 , . . . , kn , n ≥ 2, verbunden, so heißen
die Kanten k1 , . . . , kn Mehrfachkanten. Wir betrachten im Folgenden ausschließlich einfache
Graphen, also solche, die weder Schlingen noch Mehrfachkanten besitzten.
Abbildung 2.2: Vollständige Graphen
Einen Graph veranschaulicht man sich am besten durch ein Diagramm, indem man die Ecken
als Punkte der (Zeichen–)Ebene zeichnet und die Kanten als Kurven zwischen den Endpunkten
zeichnet; hier wird die zweistellige Relation, die abstraktes Kernstück eines Graphen ist, deutlich.
Dadurch ist auch die Bezeichnung Graph“ erklärt: das Ecken–Kanten–System erinnert an die
”
graphische Darstellung von Funktionen.
Beispiel 2.1.2 Hat man bei einem Graphen G(E, K) als Eckenmenge E = {1, . . . , n}, so kann
man offenbar insgesamt 12 n(n−1) verschiedene Kanten einzeichnen. Da man nun zu jeder Kante
1
die Auswahl treffen kann, ob sie im Graphen vorkommen soll ja oder nein, gibt es 2 2 n(n−1)
verschiedene Graphen.
Die Anzahl der Ecken eines Graphen G =
G(E, K) wird üblicherweise als Ordnung von G
bezeichnet, die Anzahl seiner Kanten als Größe.
Einen Graph nennt man dann dicht, wenn das
Verhältnis d von Größe zu Ordnung groß ist; bei
einer Veranschaulichung in der Ebene kann man
Dichte“ sehen.
”
Beispiel 2.1.3 Betrachte ein Beispiel einer
endlichen Geometrie“:
”
P := {A, B, C} , G := {{A, B}, {A, C}, {B, C}}
(a)
(b)
Abbildung 2.3: Bipartite Graphen
P steht für die Punkte, G steht für die Menge der
Geraden.
Dies ist ein Graph G(P, G). Endecken etwa der Kante k := {A, B} sind A und B.
Einige einfache Graphen sind so wichtig, dass sie eigene Namen tragen. Z.B. heißen die
einfachen Graphen Gn := G(E, K) mit Eckenanzahl n und einer Kante zwischen jedem Paar
von Ecken vollständige Graphen. In Abbildung 2.2 sind Diagramme dazu für n ≤ 5 enthalten.
Weitere Graphen spezieller Struktur sind die bipartiten Graphen G = G(E, K), bei denen
es eine Zerlegung der Eckenmenge E gibt derart, dass
E = U ∪ V , U ∩ V = ∅,
Stand: 9. Februar 2010
17
c J.Baumeister
KAPITEL 2. GRAPHEN
2.1. DEFINITION UND DIAGRAMME
und jede Kante hat eine Ecke in U und eine Ecke in V . Ist jede Ecke aus U mit einer Ecke aus
V verbunden, so sprechen wir von einem vollständigen bipartiten Graphen; wir bezeichnen
sie mit Gm,n , wobei hier die Zerlegung so möglich ist, dass U m und V n Ecken hat. Der
vollständige bipartite Graph G3,3 ist in Abbildung 2.3 (a) skizziert. Abbildung 2.3 (b) gibt einen
unvollständigen bipartiten Graphen wieder.
Beispiel 2.1.4 Geplant ist ein Tennisturnier mit fünf Teilnehmern a, b, c, d, e . Die Turnierbedingungen seien:
(1) Es steht nur ein Tennisplatz zur Verfügung.
(2) Jeder Teilnehmer spielt gegen jeden anderen Teilnehmer genau einmal.
(3) Kein Teilnehmer spielt in zwei aufeinanderfolgenden Spielen.
a
ab
ce
e
b
cd
bc
ae
ad
c
be
d
(a) Der zugehörige Graph
de
bd
ac
(b) Ein erlaubter Spielplan
Abbildung 2.4: Graph für ein Tennisturnier
In der Abbildung 2.4 (a) stellt jede der zehn Verbindungslinien eines der Spiele dar. In der
Abbildung 2.4 (b) ist auch ein Spielplan aufgezeichnet: Die zehn Punkte repräsentieren die Spiele,
und zwei Punkte sind genau dann verbunden, wenn sie keinen gemeinsamen Spieler haben; die
zugehörige Abbildung ist also ein Graph mit 10 Ecken und 15 Kanten. Der fett eingezeichnete
Weg“ liefert eine Lösung für die obigen Bedingungen (1), (2), (3).
”
Das Diagramm haben wir nicht willkürlich gestaltet, sondern eine ästhetisch ansprechende
und einprägsame Form dafür gewählt. Der Graph in Abbildung 2.4 (b) ist der berühmte Petersengraph. Seine Bedeutung liegt in der Liste von Eigenschaften, die er besitzt oder nicht besitzt.
Definition 2.1.5 Sei G(E, K) ein Graph. Eine Ecke e hat Grad d = d(e), wenn die Anzahl der
Kanten, die e als Endecke haben, d ist. Eine Ecke e mit d(e) = 1 heißt Blatt.
Lemma 2.1.6 (Handschlaglemma) Sei G = G(E, K) ein Graph mit k Kanten. Dann gilt:
X
2k =
d(v) .
v∈E
Beweis:
Wir zählen die Paare (v, k), v ∈ E, k ∈ K, ab, für die v Endecke von k ist. Da jede Kante genau
2 Endecken hat, ist die Anzahl einerseits 2k, andererseits trägt jede Ecke v ∈ E mit d(v) zu
dieser Anzahl bei.
Die Wortwahl für das obige Lemma kommt von der Interpretation, dass man sich K als
die Paare von Personen (E) vorstellen kann, die sich per Handschlag begrüßen. Z.B. lesen wir
Stand: 9. Februar 2010
18
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
daraus ab, dass die Anzahl der Personen, die auf einer Party eine ungerade Anzahl von Gästen
mit Handschlag begrüßt haben, gerade ist.
Graphentheorie hat vielfältige Anwendungen; etwa
(-) Reise- oder Transportplanung
(-) Datenstrukturen in der Informatik
(-) Computernetzwerke
(-) Strukturformeln in der Chemie
(-) Anwendungen in der Mathematik
2.2
Wege, Kreise, Zusammenhang
Mit den nun folgenden Begriffen Kantenzug, Weg, Kreis“ können wir etwas über die Feinstruk”
tur von Graphen herausfinden.
Definition 2.2.1 Sei G(E, K) ein Graph.
(a) Sind v0 , v1 , . . . , vl ∈ E, so dass vi mit vi+1 für jedes i = 0, . . . , l − 1 verbunden ist, so
nennen wir W := [v0 , . . . , vl ] einen Kantenzug von v0 nach vl der Länge l .
(b) Ein Kantenzug W = [v0 , . . . , vl ] heißt Weg, falls alle zugehörigen Kanten vi vi+1 paarweise
verschieden sind.
(c) Ein Weg W = [v0 , . . . , vl ] heißt Kreis, falls v0 = vl gilt.
Ohne Beweis führen wir an, dass aus jedem Kantenzug von v0 nach vl ein Weg von v0 nach
vl gemacht werden kann durch Weglassung von Kanten (Beachte die Absprache, dass wir nur
endliche Graphen betrachten).
Beispiel 2.2.2 Betrachte den vollständigen Graphen G4 ; siehe Abbildung 2.2: er hat 4 Ecken
und 6 Kanten; die Dichte ist also 32 . Er enthält Kreise der Länge 3 und 4. Intuitiv sollte man
erwarten, dass ein dichter Graph lange“ Kreise enthalten sollte. Dazu gibt es auch eine präzise
”
Aussage, nämlich den Satz von Dirac (1952), der diese Erwartung bestätigt: gilt für die Dichte
d ≥ 2, so gibt es einen Kreis der Länge größer als d .
Definition 2.2.3 Ein Graph G(E, K) heißt zusammenhängend, wenn je zwei Ecken durch
einen Kantenzug verbindbar sind.
Offenbar ist Verbindbarkeit“ eine Äquivalenzrelation auf der Eckenmenge eines Graphen. Die
”
Äquivalenzklassen bezüglich dieser Relation heißen Zusammenhangskomponenten des Graphen.
Bemerkung 2.2.4 Wir betrachten stets ungerichtete Graphen, d.h. solche, deren Kanten
beim Durchlaufen keine Richtung auszeichnen. Ungerichtete Graphen sind solche, deren Kanten mit einem Pfeil“ dargestellt werden; sie können nur in Pfeilrichtung durchlaufen werden.
”
Gewichtete Graphen sind Graphen, bei denen Kanten ein Gewicht tragen, das die Kosten“
”
angibt, wenn die Kante durchlaufen wird.
Stand: 9. Februar 2010
19
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
Definition 2.2.5 Sei G(E, K) ein Graph.
(a) Ein Weg W = [v0 , . . . , vl ] heißt ein Eulerweg, wenn der Weg jede Kante des Graphen
genau einmal enthält.
(b) Ein Eulerweg heißt ein Eulerkreis, wenn er ein Kreis ist.
(c) Der Graph heißt Eulergraph, falls er einen Eulerkreis enthält.
D
D
a
a
d
e
A
b
e
A
C
C
c
c
B
g
d
g
b
f
f
B
(a) Skizze der Landkarte
(b) Der zugehörige Graph
Abbildung 2.5: Das Königsberger Brückenproblem
Der Begriff Eulerkreis“ stammt von dem vermutlich ältesten graphentheoretisch erfassten
”
Problem, nämlich dem Königsberger Brückenproblem, das seine Lösung durch L. Euler2 im
Jahre 1736 fand. Die Abbildung 2.5 zeigt 4 Landstücke A, B, C, D und 7 Verbindungsbrücken
a, b, . . . , g.
Frage: Ist es möglich, von der Insel A aus einen Spaziergang zu machen, bei dem
man alle Brücken genau einmal passiert und schließlich nach A zurückkehrt?
Übersetzen wir dies in die Graphensprache, so resultiert der Graph aus Abbildung 2.5 (b).
Euler hat die Frage nach einer zulässigen Tour im Königsberger Brückenproblem negativ
beantworten können, indem er zeigte, dass kein Eulerkreis existiert. Dafür gibt es eine sehr
einfache Argumentation. Sie geht so: In jeder Ecke kann man die Anzahl der Kanten zählen,
die dort enden; diese Anzahl ist der Grad der Ecke. Soll es einen Eulerkreis geben, dann muss
jede Ecke offenbar geraden Grad haben. Beim Königsberger Brückenproblem gibt es aber Ecken
ungeraden Grades.
Korollar 2.2.6 Ist G ein Eulergraph, dann hat jede Ecke geraden Grad.
Beweis:
Dies ist die Argumentation von Euler.
Gilt auch die Umkehrung in Korollar 2.2.6? Ja, sie gilt, wenn mann nur zusammenhängende
Graphen betrachtet! Dies ist das Resulat von Hierholzer (1873). Damit ist auch klar, dass Eulergraphen schnell ( in linearer Zeit“) anhand der geraden Eckengrade erkannt werden können.
”
Aber wie konstruiert man einen Eulerweg? Darüber gibt auch das Resultat von Hierholzer Auskunft. Die sehr befriedigende Zusatznachricht ist, dass dies auch sehr schnell ( in linearer Zeit“)
”
bewerkstelligt werden kann.
2
Euler, Leonhard (1707 — 1783)
Stand: 9. Februar 2010
20
c J.Baumeister
KAPITEL 2. GRAPHEN
2.2. WEGE, KREISE, ZUSAMMENHANG
Definition 2.2.7 Sei G(E, K) ein Graph.
(a) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonweg, wenn der Weg W jede Ecke des Graphen
genau einmal enthält.
(b) Ein Weg W = [v0 , . . . , vl ] heißt Hamiltonkreis, wenn W ′ := [v0 , . . . , vl−1 ] ein Hamiltonweg ist und v0 = vl gilt.
Das Problem der Hamiltonkreise ist ungleich tiefliegender als das der Eulerkreise, für Anwendungen aber sehr viel interessanter: es gibt keine Charakterisierungen für Hamiltonkreise, für
Eulerkreise schon.3
(a) Dodekaeder
(b) Tetraeder
(c) Würfel
Abbildung 2.6: Hamiltonkreise
Bekanntlich gibt es fünf reguläre Körper/platonische Körper: Tetraeder, Würfel, Oktaeder, Dodekaeder, Ikosaeder. Dies zu zeigen, ist die Theorie der Graphen ein entscheidendes
Hilfsmittel, ebenso dafür, das bekannte Färbungsproblem, das wir unten noch kennenlernen
werden, zu lösen. Hamilton fragte nach einem Hamiltonkreis im Graphen, der dem Kantenweg
auf dem Dodekaeder entspricht. Die Abbildung 2.6 (a) gibt die Antwort. In Abbildung 2.6 (b),
(c) finden wir Hamiltonkreise zu anderen regulären Körpern. Dabei verwenden wir die sogenannten Schlegel–Diagramme für die platonischen Körper: Projektionen der Körper auf eine
Zeichenebene von einem Punkt über dem Körper.
Euler behandelte schon das Problem des
Rösselsprungs auf einem n × n–Schachbrett.
Gefordert ist, dass der Springer von einem
Feld beginnend mit kontinuierlichen Zügen alle Felder genau einmal berührt (und dann
eventuell wieder zu seinem Ausgangspunkt
zurückkehrt).
Nehmen wir ein (quadratisches) Schachbrett mit n2 Feldern und verbinden wir zwei
Ecken, wenn sie durch einen Springerzug verbunden sind; es resultiert ein Graph. Dann ist
die Frage nach einem Hamiltonweg bzw. Hamiltonkreis klar.4 In Abbildung 2.7 ist ein Hamiltonweg für den Rösselsprung auf einem 9 ×
9–Schachbrett aufgeführt.
5
2
7
80
77
74
11
16
13
8
79
4
1
10
81
14
75
18
3
6
9
78
73
76
17
12
15
32
29
34
69
66
63
24
19
22
35
68
31
72
27
70
21
64
25
30
33
28
67
62
65
26
23
20
39
36
41
56
71
58
47
52
49
42
55
38
61
44
53
50
59
46
37
40
43
54
57
60
45
48
51
Abbildung 2.7: Rösselsprung
3
Spezielle Aufgaben, die sich mit der Problematik Hamiltonweg/Hamiltonkreis beschäftigen, sind viel älter als
die Graphentheorie.
4
Das Studium der Hamiltonwege und Hamiltonkreise wurde 1856, etwa gleichzeitig, von Kirkmann und Hamilton angeregt.
Stand: 9. Februar 2010
21
c J.Baumeister
KAPITEL 2. GRAPHEN
2.3. PLANARE GRAPHEN
Wie oben schon angemerkt, Hamiltongraphen lassen sich nicht so einfach charakterisieren wie
Eulergraphen. Da die Ordnung n eines Graphen stets die Länge eines Hamiltonkreises angibt,
kann man einen Hamiltonkreis dadurch finden, dass man alle n-elementigen Teilmengen der
Kantenmenge daraufhin überprüft, ob sie einen Hamiltonkreis darstellen. Dies ist bei dichten
Graphen ein sehr aufwändiges Verfahren. Es ist aber kein sehr viel schnelleres Verfahren bekannt,
ja es sieht so aus, als gebe es kein sehr viel schnelleres Verfahren; siehe nächstes Kapitel.
Die Suche nach notwendigen und hinreichenden Bedingungen für die Existenz eines Hamiltonweges hat ein umfangreiches Gebäude von neuen Begriffen und Fragestellungen hervorgebracht.
2.3
Planare Graphen
Wir haben schon darauf hingewiesen, dass wir üblicherweise einen Graphen G(E, K) durch
ein Punkt–Linien–System in der Ebene veranschaulichen. Gibt es eine Darstellung, in der die
Kanten von G sich nur an Ecken treffen aber niemals dazwischen, so sagen wir, der Graph G ist
plättbar und nennen den so darstellbaren Graphen einen ebenen Graphen (enbettbar in die
Ebene). Isolierte Ecken spielen dabei keine Rolle, sie können ja irgendwohin platziert werden,
allerdings darf keine Kante über eine isolierte Ecke laufen. In Abbildung 2.8 sind einige ebene
Graphen dargestellt. Dort sieht man auch, wie der Graph zum Haus vom Nikolaus plättbar ist.
Ist G(E, K) ein ebener Graph, so zerlegen die Kanten die Ebene in endlich viele (topologisch)
zusammenhängende Gebiete, von denen genau eines, das äußere“ Gebiet, nicht beschränkt ist.
”
Zusammenhängend bedeutet hier (etwas oberflächlich): Wir können zwischen je zwei Punkten
des Gebietes mit Bleistift (ohne abzusetzen) eine Linie ziehen, die das betreffende Gebiet nicht
verläßt. Der Grund dafür ist der berühmte Jordansche Kurvensatz:
Eine geschlossene Jordankurve γ zerlegt die Ebene in zwei topologisch zusammenhängende Gebiete, von denen genau eines nicht beschränkt ist.
Dies heißt: Zwei Punkte der Ebene können genau dann durch eine Jordan–Kurve
verbunden werden, die γ nicht trifft, wenn sie entweder beide im Inneren oder beide
im Äußeren von γ liegen.
So einleuchtend dieser Satz auch ist, sein Beweis ist alles andere als leicht.
6
1
3
4
2
5
(a)
(b)
(c)
Abbildung 2.8: Beispiele für ebene Graphen
Wir wollen nun erläutern, wie das Färbungsproblem für Landkarten mit den Resultaten der
Graphentheorie zusammenhängt.
Wir können also unterstellen, dass bei einem ebenen Graphen die Linien (die für die Kanten stehen) die Ebene in endlich viele topologisch zusammenhängende Gebiete zerlegen. Diese
Gebiete wollen wir Länder nennen.
Stand: 9. Februar 2010
22
c J.Baumeister
KAPITEL 2. GRAPHEN
2.3. PLANARE GRAPHEN
Haben wir umgekehrt eine reale Landkarte“ L gegeben, so können wir L sofort einen ebenen
”
Graphen G(E, K) zuordnen: Die Ecken E sind die Schnittpunkte verschiedener Grenzen und die
Kanten sind die zwischen Schnittpunkten verlaufenden Grenzlinien; eine Insel wird als Punkt
und seine Grenze als Schlinge dargestellt. Wir halten ausdrücklich fest: Länder grenzen entlang
einer Grenzlinie aneinander, nicht nur in einem Punkt, und die Länder sind zusammenhängend,
d.h. je zwei Punkte eines landes sind durch einen Streckenzug verbindbar, der das Land nicht
verlässt.
Definition 2.3.1 Eine Landkarte L(E, K, L) ist ein ebener Graph G = G(E, K) zusammen
mit den zu G gehörenden Ländern L . Länder, die eine gemeinsame Grenze haben, nennen wir
benachbart.
Definition 2.3.2 Eine Färbung einer Landkarte L(E, K, L) ist eine Färbung der Länder mit
endlich vielen verschiedenen Farben, und zwar so, dass Länder, die eine gemeinsame Grenzkante
besitzen, stets verschiedene Farben erhalten.
Mit diesen Begriffen können wir nun den 4–Farben–Satz formulieren:
Für jede Landkarte reichen 4 Farben für eine Färbung aus.
Der 4–Farben–Satz hat eine interessante Geschichte, die Beweisversuche dazu haben viel zur
Entwicklung der Graphentheorie beigetragen. Schon 1878 legte A. Kempe einen Beweisversuch
für den 4–Farben Satz vor. Obwohl Kempes Beweis einen Fehler enthielt – er wurde 1890 von
Heawood entdeckt –, so vereinigte er doch nahezu alle Ideen, die zur endgültigen Lösung 100
Jahre später geführt haben. Der 5–Farbensatz von Heawood aus dem Jahre 1898 sagt, dass stets 5
Farben ausreichen. Ein korrekter Beweis für den 4–Farbensatz wurde 1976 von Appel und Haken
vorgelegt. Allerdings wurde der Beweis von der mathematischen Welt mit gemischten Gefühlen
aufgenommen, denn der Beweis wurde geführt unter massivem Einsatz von Computern. Es gibt
nun einen Beweis, der zwar immer noch nicht ohne Computer auskommt, der diesen aber schon
reduziert einsetzt.
Nach der Skizzierung des 4–Farbensatzes liegt es auf der Hand, was Färbungen von Graphen
sein sollen: benachbarte Ecken sollen unterschiedliche Farben erhalten. Wir werden diese Frage
im Kapitel über Abbildungen wieder aufgreifen. Hier nur ein Beispiel, das einen Anwendungshintergrund der Problematik aufzeigt.
Beispiel 2.3.3 In einem Zoo soll der Aquariumsbereich umgebaut werden und dazu Notbecken
aufgestellt werden. Dabei ist zu berücksichtigen, dass gewisse Fischarten sich nicht vertragen
und daher nicht in ein gemeinsames Becken eingebracht werden dürfen. Es ist das Ziel, mit
möglichst wenig Notbecken auszukommen.
Seien 1, . . . , N die unterschiedlichen Fischarten; sie dienen als Ecken eines Graphen. Zwei
Fischarten sind durch eine Kante verbunden, wenn sie sich nicht vertragen. Es entsteht ein
Graph. Jeder Fischart soll nun eine Farbe – sie steht für ein Becken – so zugeordnet werden,
dass Knoten, die mit einer Kante verbunden sind, eine unterschiedliche Farbe erhalten.
Kommen wir zu planaren Graphen zurück. Jedem planaren Graphen können Fächen zugeordnet werden; eines davon ist die Außenfläche.
Stand: 9. Februar 2010
23
c J.Baumeister
KAPITEL 2. GRAPHEN
2.4. BÄUME
Satz 2.3.4 (Eulerscher Polyedersatz) Sei G = G(E, K) ein planarer zusammenhängender
Graph mit n = #E, m = #K und f Flächen. Dann gilt:
n+f −m = 2
(2.1)
Beweis:
Den Beweis können wir hier noch nicht führen. Er bedient sich im Allgemeinen der vollständigen
Induktion und der speziellen Graphen Bäume“; siehe unten. Für m = 0 können wir die Rich”
tigkeit aber erkennen. Hier muß nämlich n = f = 1 sein (Zusammenhang!).
2.4
Bäume
Eine weitere einfache, aber wichtige Graphenklasse ist die der Bäume. Bäume sind beispielsweise
als Datenstrukturen in der Informatik und bei der Betrachtung von elektrischen Netzwerken von
großer Bedeutung.5
Definition 2.4.1 Ein Graph heißt Baum, wenn er zusammenhängend ist und keine Kreise
enthält.
Ein Baum heis̈t Binärbaum, wenn der Grad einer jeden Ecke höchstens zwei ist.
In Abbildung 2.9 sind im wesentlichen alle“ Bäume mit höchstens 6 Ecken aufgeführt.
”
(a) Alle Bäume mit höchstens 5 Ecken
(b) Alle Bäume mit 6 Ecken
Abbildung 2.9: Alle Bäume mit höchstens 6 Ecken
Ein Ereignisbaum ist ein Hilfsmittel, das es uns erlaubt, alle möglichen Ergebnisse einer
Folge von Experimenten abzuzählen, wenn bekannt ist, dass jeweils nur endlich viele Ergebnisse
möglich sind. Wir erläutern dies an folgendem Beispiel.
Beispiel 2.4.2 Mark und Erich bestreiten eine Tennisauseinandersetzung: Wer zuerst zwei
Sätze hintereinander oder insgesamt drei Sätze gewonnen hat, gewinnt die Auseinandersetzung.
Alle möglichen Ergebnisse des Wettkampfes entsprechen den Worten
MM,MEMM,MEMEM,MEMEE,MEE,EMM,EMEMM,EMEME,EMEE,EE .
Der Weg von der Wurzel des Baumes bis zum Endpunkt gibt an, wer jeweils den Wettkampf
gewonnen hat.
Bäume lassen sich ziemlich einfach charakterisieren. Wir geben drei äquivalente Charakterisierungen ohne vollständigen Beweis an.
5
Historisch gesehen, stammt das Interesse aus der Chemie im Zusammenhang mit der Darstellung von Kohlenwasserstoffverbindungen.
Stand: 9. Februar 2010
24
c J.Baumeister
KAPITEL 2. GRAPHEN
2.5. ÜBUNGEN
Fisch
1
2
3
4
5
6
7
8
9
10
11
12
Satz 2.4.3 Sei G ein Graph mit n Ecken. Es sind
äquivalent:
(a) G ist ein Baum.
(b)
Je zwei Ecken des Graphen sind durch genau
einen Weg verbunden.
(c)
G ist zusammenhängend, aber für jede Kante k
von G ist der Graph G′ := G(E, K\{k}) nicht
zusammenhängend.
(d) G ist zusammenhängend und besitzt genau n −
1 Kanten.
(e)
G besitzt keinen Kreis und besitzt genau n − 1
Kanten.
Unverträglich mit
3,6,7
1,3,6,7
6,8,9,10
1,2,6
11,12
3,7
1,2,3,4
3,6,7,9,10,11
3,6,7
1,3,6,7
1,3,6,7
5,6,8
Abbildung 2.10: Fischbeckenproblem
Beweis:
Wir beweisen nicht alle Implikationen.
a) =⇒ b).
Da ein Baum zusammenhängend ist, gibt es stets einen Weg, der zwei beliebige Ecken verbindet.
Annahme, es gibt mindestens zwei Wege, die ein gegebenes Paar e, e′ von Ecken verbindet. Wenn
beide Wege keine Kante gemeinsam haben, bilden sie einen Kreis: wir laufen den einen Weg von
e nach e′ und laufen nun den zweiten Weg von e′ nach e . Enthalten die beiden Wege eine
gemeinsame Kante, dann finden wir wieder einen Kreis, denn die beiden Wege treffen sich nun
in einer Ecke e′′ , die beide Wege gemeinsam haben. In jedem Falle haben wir, dass der Graph
einen Kreis enthält. Widerspruch!
b) =⇒ c).
Es ist klar, dass G zusammenhängend ist. Sei k = uv eine Kante mit Endecken u, v . Dann ist
[u, v] der einzige Weg, der u, v verbindet; in G′ := G(E, K\{k}) können also u, v nicht durch
einen Weg verbunden sein. Also kann G′ nicht zusammenhängend sein.
c) =⇒ d).
Auf Graphen kennen wir die Äquivalenzklassen der Zusammenhangskomponenten; siehe oben.
Der zusammenhängende Graph G hat eine Zusammenhangskomponente. Nimmt man eine Kante
{k} weg, entsteht ein Graph G′ := G(E, K\{k}), der zwei Zusammenhangskomponenten hat.
Nach Wegnahme aller Kanten hat der entstandene Graph n keine Kante ist mehr und daher n
Zusammenhangskomponenten. Also muss es n − 1 Kanten im Graphen geben.
2.5
Übungen
2.)
Sei G = G(E, K) ein Graph. Der Komplementgraph G von G hat als Eckenmenge
E und als Kantenmenge alle möglichen Kanten zwischen den Ecken, mit Ausnahme der
Kanten in G . Finde den Komplementgraph zum Haus vom Nikolaus“.
”
Jeder Graph mit mindestens zwei Ecken desselben Grades.
3.)
Mindestens einer der Graphen G, G ist zusammenhängend.
4.)
Sei G ein Graph mit n Ecken. Zeige: Gilt d(e) ≥
zusammenhängend.
5.)
Zeige: Ein Kreis in einem Graphen ist bipartit genau dann, wenn alle Ecken gerade sind.
1.)
Stand: 9. Februar 2010
25
1
2 (n
− 1) für alle Ecken, dann ist G
c J.Baumeister
KAPITEL 2. GRAPHEN
2.5. ÜBUNGEN
6.)
Zeige: Jeder endliche Baum hat mindestens zwei Blätter.
7.)
Beweise in Satz 2.4.3 die Implikation a) =⇒ b) .
8.)
Ist der vollständige bipartite Graph Gn,n+1 ein Hamiltongraph?
9.)
Ist der Petersengraph ein Hamiltongraph?
10.) Gibt es einen interessanten“ Graphen, der zugleich eulersch und hamiltonsch ist?
”
11.) Versuche den arithmetischen Ausdruck (in Maple-Schreibweise)
((a+b) * (c-d-7))/(23 * e)
als Binärbaum darzustellen. Wieviele Blätter hat eine solche Darstellung.
12.) Sei G = G(E, K) ein Graph. Zeige, dass die Anzahl der Ecken von ungeradem Grad
stets gerade ist.
Hinweis: Handschlaglemma und Aufspaltung“ des Graphen in Ecken mit geradem Grad
”
und Ecken mit ungeradem Grad.
13.) Betrachte die Graphen
a
b
c
d
e
b
a
e
h
g
f
c
(a)
d
(b)
(a)
Bestimme einen Eulerkreis im Graphen (a).
(b) Gibt es einen Eulerkreis im Graphen (a), wenn man die Kante, die f mit e verbindet,
wegnimmt?
(c)
Bestimme einen Hamiltonkreis im Graphen (b).
14.) Betrachte das Fischbeckenproblem aus Beispiel 2.3.3 für N = 12 Fische. Die Unverträglichkeiten gibt die Tabelle 2.10 wieder. Zeichne mit Maple einen Graphen, der das
Problem beschreibt und finde eine Lösung.
Stand: 9. Februar 2010
26
c J.Baumeister
Kapitel 3
Algorithmen und Programme
Für die Formulierung von Lösungsverfahren, die auf einem Computer realisiert werden sollen,
bedient man sich des Algorithmus“. Hier skizzieren wir, worauf es bei Algorithmen ankommt,
”
und geben erste Beispiele. Für die Analyse von Algorithmen ist der Begriff Abbildung“ hilfreich.
”
Die zuletzt betrachtete Struktur Graphen“ ist beim Studium von Algorithmen von Bedeutung.
”
3.1
Algorithmen
Ein Computer ist ein Werkzeug zur Verarbeitung und Speicherung von Information. Um ihn zu
nutzen, ist er mit Verarbeitungsvorschriften zu füttern“. Wir formulieren solche Vorschriften
”
in der Regel unter dem Stichwort Algorithmus.
Ein Algorithmus1 für eine vorgegebene bestimmte Art von Aufgaben ist eine endliche
Abfolge von wohldefinierten, ausführbaren Vorschriften, die bei Abarbeitung, ausgehend von einem Eingangszustand (Input) nach einer endlichen Anzahl von Verarbeitungsschritten einen Ausgangszustand (Output) bestimmen, der als Lösung der durch
den Eingangszustand charakterisierten Aufgabe angesehen werden kann.
Algorithmen sind unabhängig von einer konkreten Programmiersprache und einem konkreten
Computertyp, auf denen sie ausgeführt werden.
Beispiel 3.1.1 Betrachte folgende Liste von Anweisungen:
EIN: Natürliche Zahl n .
step 1 k := 1, a := n .
step 2 Ist a (
= 1, dann gehe zu AUS.
3a + 1 falls a ungerade
step 3 a :=
a/2
falls a gerade
step 4 k := k + 1, gehe zu step 2.
AUS: Mit k die Länge der erzeugten Zahlenfolge.
Die Rechenschritte erklären sich selbst: ausgehend von n wird eine Folge von natürlichen
Zahlen erzeugt, eine so genannte Collatz/Uhlam/Warring-Folge.
Ist dies ein Algorithmus? NEIN, denn es ist nicht sichergestellt, dass die Abfrage
”
Ist a = 1, dann gehe zu AUS“
1
Die Bezeichnung leitet sich aus dem Namen Al–Khwarizmi (Al–Khwarizmi,780? — 850?), einem der bedeutensten Mathematiker des anfangenden Mittelalters, ab.
27
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.2. PROGRAMME UND PROGRAMMIERSPRACHEN
irgendwann zur Beendigung führt.
ABER: Bisher hat man keine natürliche Zahl gefunden, bei der die obige Liste von Anweisungen
nicht endet.
Unterschiedliche Algorithmen können entworfen werden zur Lösung ein und derselben Aufgabe. Leistungsunterschiede lassen sich herausarbeiten, wenn man ihren Aufbau und ihre Wirkungsweise analysiert. Fragestellungen dafür sind:
• Entwurf von Algorithmen: Wie soll ein Algorithmus zur Lösung einer bestimmten
Aufgabe aussehen?
• Berechenbarkeit: Gibt es Aufgaben, für die kein Algorithmus existiert?
• Komplexität: Wie läßt sich der Aufwand, der betrieben werden muss, um eine Problemklasse von Aufgaben zu lösen, bestimmen/abschätzen?
• Korrektheit: Wie läßt sich nachweisen, ob ein vorliegender Algorithmus die Aufgabe
korrekt löst?
• Robustheit/Zuverlässigkeit: Wie groß ist die Problemklasse von Aufgaben, die der
Algorithmus löst?
• Genauigkeit: Was ist die Qualität der Lösung, wenn numerisches Rechnen nötig ist?
Hauptziel der Analyse ist die Effizienzuntersuchung und die Entwicklung effizienterer Algorithmen. Diese Analyse sollte aber rechnerunabhängig durchgeführt werden. Dazu benötigt
man ein geeignetes Rechnermodell. Solche Modelle stehen zur Verfügung! Wir wollen hier nicht
darauf eingehen, unsere Analyseuntersuchungen stützen wir auf die Ermittlung des Rechenaufwands, ausgedrückt durch die Anzahl von elementaren Operationen. Hierbei kann man drei
Ansätze unterscheiden:
– Worst-case-Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit
vom Input.
– Mittlere Komplexität: Dies ist eine obere Schranke für den Aufwand in Abhängigkeit
vom Input bei gewissen Annahmen über das Auftreten des Inputs in der Problemklasse.
– Untere Komplexität: Hierunter versteht man die Ermittlung unterer Schranken für den
zu betreibenden Aufwand.
Diese Ansätze können rechnerunabhängig und a-priori erfolgen, d.h. ohne den Algorithmus zu
testen. Unter einer a-posteriori–Analyse versteht man das Testen des Algorithmus an Aufgaben
mit (hinreichend) großem Input.
3.2
Programme und Programmiersprachen
Die konkrete Ausführung eines Algorithmus nennt man einen Prozess. Die Einheit, die den
Prozess ausführt, ist ein Prozessor. Beim Kuchenbacken ist der Algorithmus das Rezept, der
Prozess die Abarbeitung des Rezepts, der Prozessor der Koch. Hier denken wir natürlich an
den Prozessor Computer“. Um eine Analyse des Ablaufs eines Algorithmus auf diesem Pro”
zessor vornehmen zu können, ist ein geeignetes Modell für den Computer (Maschinenmodell)
Stand: 9. Februar 2010
28
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.2. PROGRAMME UND PROGRAMMIERSPRACHEN
bereitzuhalten. Die Informatik studiert u.a. die Turing-Maschine und die Random-AccessMaschine (RAM), welche in gewissem Sinne sogar äquivalent sind. Die Analyse von Algorithmen auf einem abstrakten Niveau ist eine Disziplin der Informatik und/oder mathematischen
Informatik.
Die Hardware-Komponenten eines Computers sind
• Zentraleinheit (CPU)
• Speicher (Memory)
• Ein- Ausgabegeräte (Input, Output Devices)
Die Merkmale, die einen Computer bezüglich Hardware kennzeichnen sind Geschwindigkeit,
Speichergröße, Zuverlässigkeit, Kosten, Vernetzbarkeit.
Die Ausführung eines Algorithmus auf einem Prozessor setzt voraus, dass der Computer den
Algorithmus interpretieren können muss, d.h. er muss
• verstehen, was jeder Abarbeitungsschritt bedeutet,
• die jeweilige Operation ausüben können.
Dies leisten die Programmiersprachen. Die Algorithmen werden damit in Programmen aufgeschrieben; die einzelnen Schritte heißen nun (Programm–)Anweisung, Befehl. Bei einfachen Programmiersprachen (Maschinensprachen) kann jede Anweisung direkt vom Computer interpretiert werden. Da nur elementare Operationen damit erfaßt werden, muß man sehr
lange Programme schreiben. Zur Vereinfachung der Programmierung wurden höhere Programmiersprachen entwickelt. Programme in solchen Programmiersprachen können nicht direkt
durch den Computer interpretiert werden, sie werden durch Übersetzungsprogramme in die
Maschinensprache überführt. Der Übergang von Maschinensprachen zu höheren Programmiersprachen ist fließend. Es gibt eine ganze Hierarchie von Programmiersprachen:
• Basic, Fortran
• Algol
• Pascal, C, C++, Java
Auf Computern kann man Programme auf Vorrat“ für bestimmte Aufgaben ablegen. Diese
”
Sammlung von Programmen nennt man Software. Man unterscheidet
• Anwendungssoftware (Textverarbeitungssoftware, Statistiksoftware, . . . )
• Systemsoftware (Betriebssystem, Editor, Compiler, . . . )
Besonderen Stellenwert nehmen Software-Pakete ein wie Maple, Mathematica, Derive,
Matlab, Cinderella, die alle eine spezielle Ausrichtung haben: symbolisches Rechnen die
ersten drei, numerisches Rechnen Matlab und geometrisches Rechnen das letzte.
Stand: 9. Februar 2010
29
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.3
3.3. ORDNUNG UND LISTEN
Ordnung und Listen
Bei den natürlichen Zahlen 1,2,3,. . . – und nicht nur dort – verwenden wir das Ungleichungszeichen “≤“. Es hat die Eigenschaften (x, y, z ∈ N)
x ≤ x;
x ≤ y und y ≤ x =⇒ y = x ;
x ≤ y und y ≤ z =⇒ x ≤ z ;
x ≤ y oder y ≤ x .
Wir nehmen dies zum Anlaß für
Definition 3.3.1 Sei X eine Menge. Eine Teilmenge O ⊂ X × X heißt Halbordnung von X,
falls gilt:
(i) Für alle x ∈ X gilt (x, x) ∈ O.
(ii) (x, y) ∈ O , (y, x) ∈ O =⇒ y = x .
(iii) (x, y), (y, z) ∈ O =⇒ (x, z) ∈ O .
Ist zusätzlich noch
(iv) Für alle x, y ∈ X gilt (x, y) ∈ O oder (y, x) ∈ O
erfüllt, dann heißt O eine Ordnung von X.
O
Meist schreibt man bei Vorliegen einer Halbordnung O statt (x, y) ∈ O auch x ≤ y oder kurz
x ≤ y , wenn der Zusammenhang klar ist.
Beispiel 3.3.2 Ist X eine Menge, dann ist in P OT (X) eine Halbordnung O definiert durch
(A, B) ∈ O : ⇐⇒ A ≤ B : ⇐⇒ A ⊂ B .
Beachte, dass nur in trivialen Fällen eine Ordnung vorliegt.
Beispiel 3.3.3 Sei A ein (endliches) Alphabet und seien An die Wörter der Länge n über dem
Alphabet A . Sei in A eine Ordnung ≤ gegeben.
Wir setzen für a = a1 . . . an , b = b1 . . . bn ∈ An :
a ≤ b : ⇐⇒ a = b oder ak ≤ bk für das kleinste k mit ak 6= bk .
lex
Dann ist ≤ eine Halbordnung in An . Man nennt sie die lexikographische Halbordnung. Als
lex
Anwendung ordne man
0002, 0008, 0013, 0029, 0132, 1324
als Worte über dem in natürlicher Weise angeordneten Alphabet A := {0, 1, 2, . . . , 9} .
Eine Liste besteht aus einer Sammlung von wohlbestimmten und wohlunterscheidbaren Objekten und ihrer Anordnung nach einem Prinzip; die leere Liste ist zugelassen.
Stand: 9. Februar 2010
30
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.4. SORTIEREN
Die Anordnung kann nach dem chronologischen Prinzip, nach einem alphabetischen Prinzip oder
allgemein mit einer Ordnung erfolgen. Kennt man alle Objekte der Liste, so kennt man die Liste;
Hat die Liste nur ganz wenige Elemente, so kann man sie einfach alle innerhalb einer eckigen
Klammer – damit machen wir den Unterschied zu Mengen klar – hinschreiben, durch Kommata
getrennt, auf die Reihenfolge kommt es hierbei offenbar an.
Maple - Illustration 3.1
Maple kennt den Datentyp Liste. Eine Liste ist eine in eckige
Klammern eingeschlossene Folge von Ausdrücken, Objekten.
Die Zahl der Einträge in einer
Liste erhält man mit dem Befehl nops. Das k-te Element einer Liste kann man sich durch
Anhängen des Index k an den Listennamen besorgen.
3.4
> L1:= [2,3,rot,Hahn,rot] ;
L1:= [2,3,rot,Hahn,rot]
> nops(L1);
5
> L1[4];
Hahn
Sortieren
Sei M eine endliche Menge mit n Elementen und versehen mit einer Ordnung ≤ . Sortieren heißt, die Elemente von M so anzuordnen, daß sie bzgl. der Ordnung ≤ eine aufsteigende
Elementfolge bilden. Sortierverfahren werden benötigt etwa bei: Einordnen von Schlüsseln im
Werkzeugkasten, Ordnen der erhaltenen Karten beim Skatspiel, Sortieren von Dateien der Größe
nach. Gesichtspunkte für die Leistungsfähigkeit eines Sortierverfahrens sind:
Schnelligkeit. Wieviele Rechenoperationen (Vergleiche, Umstellen in einer Liste) in Abhängigkeit von n sind nötig? Dieser Aufwand wird Laufzeitkomplexität des Verfahrens genannt.
Speicherplatz. Im allgemeinen kann man sich die Elemente der Menge abgelegt in Fächern
vorstellen. Beim Sortieren kann es sinnvoll sein, Zusatzfächer zu benutzen. Der Bedarf an
Fächern in Abhängigkeit von n ist die Speicherplatzkomplexität des Verfahrens.
Sei nun eine Menge M = {a1 , . . . , an } vorgegeben. Wir denken uns die Elemente a1 , . . . , an
jeweils einzeln in einer Liste (Feld von Fächern) abgelegt. Wir sortieren diese Liste, indem wir
die Objekte in den Fächern irgendwie solange austauschen, bis sie angeordnet in den Fächern
liegen.
Sortieren durch Auswählen (Selection–sort).
Hier geht man folgendermaßen vor:
• Finde das kleinste Element und tausche es gegen das an der ersten Stelle befindliche Element (1. Schleife).
• Fahre in dieser Weise jeweils auf dem Rest des Feldes, das noch nicht sortiert ist fort (i–te
Schleife).
Man stellt leicht fest, dass in der i–ten Schleife n − i Vergleiche und eventuell ein Austausch
anfallen: Wegen
n−1
X
i=1
(n − i) =
Stand: 9. Februar 2010
n−1
X
j=1
1
1
j = ((1 + · · · + n − 1) + (n − 1 + · · · + 1)) = n(n − 1)
2
2
31
(3.1)
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.4. SORTIEREN
gilt für die Komplexität: Es fallen etwa n2 /2 Vergleiche und etwa n Austausche an. Auf den
Aufwand“ −n/2 bei den Vergleichen und −1 beim Austauschen kann man für große n verzich”
ten; etwa“ bedeutet diese Vernachlässigung, wir schreiben dafür meist ∼. Hierzu ein Beispiel,
”
wobei hier die Elemente die Buchstaben des Alphabets in ihrer alphabetischen Ordnung sind.
Anwendung von Selection–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (a).
EXAMPLE
AXEMPLE
AEXMPLE
AEEMPLX
AEELPMX
AEELMPX
EXAMPLE
EXAMPLE
AEXMPLE
AEMXPLE
AEMPXLE
AELMPXE
AEELMPX
EXAMPLE
EAXMPLE
AEXMPLE
AEMXPLE
AEMPXLE
AEMPLXE
AEMLPXE
AELMPXE
AELMPEX
AELMEPX
AELEMPX
AEELMPX
EXAMPLE
EEAMPLX
EEALPMX
EEALMPX
EEAL
EEA
AEE
A
E
E
AEELMPX
(a) Selection–sort
(b) Insert–sort
(c) Bubble–sort
(d) Quick–sort
M
L
L
L
PX
M P X
M P X
M
P
X
Sortieren durch Einfügen (Insert–sort). Betrachte die Listenelemente der Reihe nach und
füge jedes an seinem richtigen Platz zwischen den bereits betrachteten ein, wobei diese sortiert
bleiben. Das gerade bestimmte Element wird eingefügt, indem die größeren Elemente um eine
Position nach rechts geschoben werden und das betrachtete Element auf dem frei gewordenen
Platz eingefügt wird.
Anwendung von Insert–sort auf unser Beispiel EXAMPLE ergibt die Sequenz (b). Man stellt
fest, dass für die Laufzeitkomplexität gilt: ∼ n2 /2 Vergleiche , ∼ n2 /4 Austausche .
Sortieren durch Austausch (Bubble–sort). Durchlaufe immer wieder das Feld und vertausche jedesmal, wenn es notwendig ist, benachbarte Elemente; wenn beim Durchlauf kein
Austausch mehr nötig ist, ist das Feld sortiert. Anwendung von Bubble–sort auf unser Beispiel
EXAMPLE ergibt die Sequenz (c). Man stellt fest, dass für die Laufzeitkomplexität gilt:
∼ n2 /2 Vergleiche , ∼ n2 /2 Austausche .
Sortieren nach Quick–sort. Dies ist der wohl am meisten angewendete Sortieralgorithmus.
Seine Idee geht auf C.A.R. Hoare (1960) zurück. Es ist ein Vorgehen, das vom Typ Teile und
Herrsche (divide et impera, divide and conquer) ist und auf einem Zerlegen des Feldes in zwei
Teile und anschließendem Sortieren der Teile unabhängig voneinander beruht. Auf die Teile
kann nun diese Idee wieder angewendet werden: Das Verfahren ist rekursiv, d.h. es ruft sich
selbst (auf kleinerer Stufe) wieder auf. Wir kommmen im nächsten Kapitel auf das Prinzip
Rekursivität“ zurück.
”
Eine entscheidende Bedeutung kommt der Zerlegung eines Feldes zu. Es soll (zweckmäßigerweise) so erfolgen, dass gilt: Wird das Feld mit Hilfe des Elements ar zerlegt, so soll dies bedeuten:
(1) ar befindet sich an seinem endgültigen Platz;
(2) für alle j < r gilt aj ≤ ar ;
(3) für alle j > r gilt aj ≥ ar .
Bei jedem rekursiven Schritt wird eine solche Zerlegung benötigt. Wie findet man eine solche
Zerlegung? Hier ist die Realisierung:
Stand: 9. Februar 2010
32
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
• Wähle irgendein ar .
• Durchsuche das Feld von links, bis ein Element gefunden ist, das nicht kleiner als ar ist,
und durchsuche das Feld von rechts, bis ein Element gefunden ist, das nicht größer als ar
ist. Tausche die so gefundenen Elemente.
• Wiederhole den obigen Suchprozess solange, bis sich die Suche von links und rechts bei
einem Element trifft. Nun ist das Element ar mit dem Element zu tauschen, bei dem sich
die Suche von links und rechts getroffen hat.
Ist das Feld nun zerlegt (Start), das Startfeld ist also nun a1 , . . . , ar , . . . , an , wird das Sortierverfahren auf die Teile a1 , . . . , ar−1 und ar+1 , . . . , an angewendet; als trennende Elemente
können nun etwa die Elemente ar−1 und an verwendet werden. Anwendung von Quick–sort auf
unser Beispiel EXAMPLE ergibt die Sequenz (d) (M ist beim Start das trennende Element).
Das Beste, was bei Quick–sort passieren könnte, ist, dass durch jede Zerlegung das Feld
genau halbiert wird. Dann würde die Anzahl Cn der von Quick–sort benötigten Vergleiche der
rekurrenten Beziehung vom Typ Teile und Herrsche“ genügen (n gerade!): Cn = 2C n2 + n .
”
Dabei ist 2C n2 der Aufwand für das Sortieren der zwei halbierten Felder und n der Aufwand für
die Zerlegung. Man kann zeigen, dass Cn = n log2 n gilt; wir kommen im Zusammenhang mit der
(vollständigen) Induktion darauf zurück. Für den allgemeinen Fall zeigt eine etwas aufwendigere
Analyse Cn = 2n ln n . log2 n ist der Logarithmus zur Basis 2, d.h. log2 ist die Umkehrfunktion
der Funktion a 7−→ 2a . ln n ist der natürliche Logarithmus, d.h. ln ist die Umkehrfunktion der
Funktion a 7−→ ea mit der Eulerschen Zahl e . Es gilt: 2n ln n ∼ 1.38n log2 n .
Eine wichtige Begriffsbildung ist die Laufzeitkomplexität im Mittel eines Verfahrens.
Damit ist hier gemeint, wieviele Rechenschritte ein Sortierverfahren benötigt, wenn es auf ein
zufällig“ vorsortiertes Feld angewendet wird. Diese Begriffsbildung können wir erst diskutieren,
”
wenn wir wissen, was zufällig“ heißen soll, und wie ein zufällig“ vorsortiertes Feld hergestellt
”
”
werden kann. Hier spielen Zufallszahlengeneratoren eine Rolle, wie wir sie in Abschnitt ?? besprechen werden.
3.5
Computerzahlen
In einer Grundvorlesung über Analysis beweist man folgenden Satz:
Satz 3.5.1 Sei g eine Zahl in N mit g ≥ 2 . Für jedes x ∈ R, x 6= 0, gibt es genau eine
Darstellung der Gestalt
∞
X
n
x = σg
x−k g−k
(3.2)
k=1
mit σ ∈ {+, −}, n ∈ Z und x−k ∈ {0, 1, . . . , g−1}, wenn man von den Zahlen x−k noch zusätzlich
fordert, dass x−1 6= 0 und dass zu jedem n ∈ N ein Index k ≥ n existiert mit x−k 6= g − 1 .
Wichtige Spezialfälle von Satz (3.5.1) sind g = 10 (Dezimalsystem), g = 2 (Dualsystem), g =
8 (Oktalsystem) und g = 16 (Hexadezimalsystem). Beim Hexadezimalsystem benötigen wir
zusätzlich Ziffern“, da man etwa 12 nicht als Ziffer verwenden will. Man wählt
”
0, 1, . . . , 9, A, B, C, D, E, F .
In (3.2) ist also die Zahl x durch eine Reihe dargestellt, wobei der ganze Anteil“ (gn ) abge”
spaltet wurde, die Forderung x−1 6= 0“ macht diese Abspaltung eindeutig. g heißt Basis der
”
Darstellung, welche im Allgemeinen eine gerade Zahl ist. σ steht für das Vorzeichen der Zahl.
Stand: 9. Februar 2010
33
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
Die Forderung x−k 6= g − 1“ für fast alle k schließt aus, dass eine Nichteindeutigkeit, wie wir
”
sie vom Dezimalsystem in Form von
0.99999 · · · = 1.00000 . . .
kennen, zugelassen ist.
Die positionelle Schreibweise sieht so aus:
(x)g := σ0.a−1 a−2 · · · gn .
(3.3)
Der Punkt zwischen 0 und a−1 wird Dezimalpunkt genannt, wenn g = 10, Binärpunkt, wenn
g = 2.
Eine Zahl x kann eine endliche Anzahl von Ziffern haben bezüglich einer Basis und eine
unendliche Anzahl von Ziffern in einer anderen Basis. Zum Beispiel gilt für x = 1/3:
(x)10 = +0.3 , (x)3 = +0.1 .
Für x := 103 3/4 haben wir
(x)10 = +[103.75] , (x)2 = +[1100111.11] , (x)16 = +[67.C] .
Um jede Ziffer in der Darstellung (3.3) im Dualsystem darstellen zu können, benötigen wir einen
Code. Für das Oktalsystem (g = 8) kann man etwa nutzen:
Ziffer
0
1
2
3
4
5
6
7
Codewort 000 001 010 011 100 101 110 111
Für die Zahlen, die wir oben beschrieben haben, benötigen wir im Allgemeinen unendlich viele
Speicherplätze. Daher müssen wir die Darstellung (3.3) einschränken. Dies geschieht dadurch,
dass die Reihe bei einem t ∈ N, der Mantissenlänge, abgebrochen wird und der Exponent n
eingeschränkt wird. So gelangen wir zur Darstellung
(x)g = σ0.x−1 . . . x−t ge
wobei t ∈ N die Anzahl der erlaubten signifikanten Ziffern x−i ∈ {0, 1, . . . , g − 1} ist; e ∈ Z
wird Exponent genannt, welcher in einem Bereich emin , emax variieren kann. Damit gelangen
wir zur Menge der Computerzahlen/Fließkommazahlen
x−1 , . . . x−t ∈ {0, 1, . . . , g − 1}, x−1 6= 0,
e
F := F(g, t, emin , emax ) := σ 0.x−1 . . . x−t g |
∪{0} .
e ∈ Z, emin ≤ e ≤ emax , σ ∈ {+, −}
Es ist einfach, diese Zahlen zu zählen:
#F(g, t, emin , emax ) = 2(g − 1)gt−1 (emax − emin + 1)
In F(g, t, emin , emax ) sind größte und kleinste Zahl gegeben durch
xmin := +[10 . . . 0] gemin −t = gemin −1 , xmax := +[δ . . . δ] gemax −t = gemax (1−g−t ) wobei δ = g−1 .
Offenbar gilt für alle Computerzahlen x 6= 0 g−emin −1 ≤ |x| ≤ gemax . Gilt |x| < g−emin −1 , so
wird im Allgemeinen x durch Null ersetzt. Zahlen x mit |x| > gemax können nicht verarbeitet
werden. Treten diese Fälle auf, so spricht man von Exponentenüberlauf. In jedem Intervall
[ge−1 , ge ], emin ≤ e ≤ emax , finden wir µ = gt − gt−1 + 1 gleichförmig verteilte Zahlen:
F ∩ [ge−1 , ge ] = {ge−1 , ge−1 + ge−t , . . . , ge−1 + µge−t } .
(3.4)
Beachte, dass der Zuwachs ge−t anwächst, wenn e von emin auf emax anwächst.
Stand: 9. Februar 2010
34
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.5. COMPUTERZAHLEN
Lemma 3.5.2 Betrachte das System F(g, t, emin , emax ) . Sei x eine reelle Zahl mit xmin ≤ |x| ≤
xmax . Dann gilt:
|z − x|
1
min
≤ g−t+1 .
(3.5)
z∈F
|x|
2
Beweis:
Ohne Einschränkungen können wir annehmen: x ist positiv. Wir können annehmen, dass mit
einem e mit emin ≤ e ≤ emax gilt: x ∈ [ge−1 , ge ] . Aus (3.4) erhalten wir, dass eine Zahl z ∈
[ge−1 , ge ] mit |z − x| ≤ 21 ge−t existiert. Wegen ge−1 ≤ x ist die Behauptung bewiesen.
Die Zahl eps := 12 g−t+1 heißt Maschinengenauigkeit. Beachte, sie hängt nur von der
Mantissenlänge t ab.
Auf einem Computer sind üblicherweise zwei Formate von Fließkommazahlen verfügbar: einfache und doppelte Genauigkeit. Im IEEE-Standard mit einfacher Geneauigkeit haben wir
eps = 2−23 ≈ 10−7 .
Wegen des nötigen Übergangs von einer reellen Zahl x zu einer Computerzahl, muß x im Allgemeinen durch eine Approximation ersetzt werden. Dieser Prozeß wird als Runden bezeichnet.
Sei F das obige System der Computerzahlen. Es werden zwei Wege beschritten, eine gegebene reelle Zahl x durch eine Computerzahl f l(x) zu ersetzen: Runden und Abschneiden. Betrachte
die positive reelle Zahl x dargestellt durch
x = σ0.x−1 . . . d−t d−t−1 . . . ge .
Abschneiden:
ch(x) := σ0.x−1 . . . d−t ge .
Rundung:
(
σ0.x−1 . . . (1 + d−t ) ge
rd(x) :=
σ0.x−1 . . . d−t ge
, falls dt+1 ≥ g/2
.
, sonst
Der Fehler, der ensteht, wenn man x durch f l(x) ersetzt, wird Rundungsfehler genannt.
Definition 3.5.3 Sei x eine reelle Zahl, x 6= 0 . Der absolute Fehler von x ist gegeben durch
|x − f l(x)| und der relative Fehler durch |x − f l(x)|/|x| .
Korollar 3.5.4 Sei das System F(g, t, emin , emax ) gegeben und sei x eine reelle Zahl mit xmax ≤
|x| ≤ xmin . Dann folgt für den relativen Rundungsfehler:
|ch(x) − x|
|rd(x) − x|
≤ eps ,
≤ 2eps .
|x|
|x|
(3.6)
Die Grundoperationen der Arithmetik sind +, −, ·, / . Wie sind diese Operationen realisiert
in einem Fließkommasystem F := F(g, t, emin , emax )? Sei eine der Operationen +, −, ·, / . Wir
bezeichnen die entsprechende Operation, realisiert in F mit ∗ . Wir nehmen an, dass sie so
realisiert sei:
x∗ y := f l(xy) für x, y ∈ F mit xmin ≤ |x∗ y| ≤ xmax .
(3.7)
Klar, im Fall = / haben wir anzunehmen, dass y 6= 0 .
Stand: 9. Februar 2010
35
c J.Baumeister
KAPITEL 3. ALGORITHMEN UND PROGRAMME
3.6. ÜBUNGEN
Als Konsequenz haben wir:
x∗ y = (xy)(1 + τ ) mit |τ | ≤ κ eps .
Hier ist κ eine Konstante, die nicht von x, y abhängt.
Probleme der Computer-Arithmetik sind:
Überlauf Siehe oben.
Unterlauf Siehe oben.
Auslöschung Addition etwa gleich großer Zahlen mit entgegengesetztem Vorzeichen führt zu
einer starken Verringerung der Tahl der gültigen Ziffern.
Rechenregeln Selbst in Fällen, wo weder Überlauf noch Unterlauf eintritt, gelten die Rechenregeln der reellen Zahlen nicht mehr.
3.6
1.)
Übungen
S
Sei A ein (endliches) Alphabet, sei A∗ := {()} ∪ n∈N An die Menge der Wörter (beliebiger Länge) über dem Alphabet A .
Für zwei Worte u = (u1 , . . . , uk ) ∈ Ak , v = (v1 , . . . , vl ) ∈ Al setzen wir:
uv := (u1 , . . . , uk , v1 , . . . , vl ) ∈ Ak+l .
Wir definieren für u, v ∈ A∗ :
u ≤ v : ⇐⇒ Es gibt z ∈ A∗ mit uz = v .
(a)
Zeige: ≤ ist eine Halbordnung in A∗ .
(b) Ist ≤ stets eine Ordnung in A∗ ?
(c)
Gibt es in A∗ ein Wort w, so dass gilt:
w ≤ u für alle u ∈ A∗ .
2.)
Maple
Eine Armstrong-Zahl ist eine n-stellige natürliche Zahl, deren Wert gleich der Summe der
n-ten Potenzen ihrer Ziffern ist. Ermitteln Sie mit Maple eine Liste aller dreistelligen
Armstrong-Zahlen.
3.)
Maple: Eine Permutation der Zahlen 1, 2, . . . , n ist eine Umstellung dieser Zahlen.
(a)
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 8 .
(b) Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung mit dieser Permutation in falscher Reihenfolge stehen.
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl.
Stand: 9. Februar 2010
36
c J.Baumeister
Kapitel 4
Abbildungen
Hier stellen wir zum Einen das Handwerkszeug beim Umgang mit Abbildungen dar, zum Anderen skizzieren wir zwei konkrete Abbildungsklassen, die für Anwendungen interessant sind.
Dabei begegnen wir auch dem Gruppenbegriff. Abschließend wollen wir mit dem Begriff des
Isomorphismus andeuten, was eine Struktur ausmacht. Am Ende dieses Kapitels haben wir
dann die wesentlichen Objekte kennengelernt, mit denen weitere Begriffe definiert und Theorien
entwickelt werden.
4.1
Definitionen
Mit Abbildungen drücken wir den mathematischen Sachverhalt aus, dass es zwischen zwei Objekten eine klar definierte Abbhängigkeit gibt. Wiederum behandeln wir den Begriff auf der Ebene
einer naiven Auffassung, auf der Ebene einer fundierten Mengenlehre lässt sich der Begriff der
Abbildung ebenso wie der Umgang mit Mengen auf eine sicherere Basis stellen.
Definition 4.1.1 Seien A, B, C, D Mengen.
(a) Eine Abbildung f von A nach B ist eine Vorschrift, durch die jedem a ∈ A genau ein
Bild f (a) ∈ B zugeordnet wird; A heißt Definitionsbereich, B heißt Wertebereich
von f. Wir schreiben f : A −→ B .
(b) Zwei Abbildungen f : A −→ B, g : C −→ D heißen gleich, wenn gilt:
A = C, B = D, f (x) = g(x) für alle x ∈ A .
Wir werden später auch von Funktionen sprechen. In unserem Verständnis ist eine Funktion
ein Spezialfall einer Abbildung: wir sprechen dann von einer Funktion, wenn wir eine Abbildung
zwischen Zahlbereichen haben, d.h. wenn Definitions– und Wertebereich der Abbildung Mengen
von Zahlen sind.1
Beispiel 4.1.2 Sei A eine Menge. Dann nennt man die Abbildung
idA : A ∋ x 7−→ x ∈ A
die Identität auf A. (Manchmal lassen wir den Index A weg und schreiben einfach id, wenn
klar ist, um welches A es sich handelt.)
1
Der Abbildungsbegriff, wie wir ihn hier eingeführt haben, konnte erst nach G. Cantor in Mode“ kommen,
”
da nun Mengen handhabare Objekte waren.
37
KAPITEL 4. ABBILDUNGEN
4.1. DEFINITIONEN
Beispiel 4.1.3 Seien A, B Mengen. Dann heißt die Abbildung
π1 : A × B ∋ (a, b) 7−→ a ∈ A
die Projektion auf den ersten Faktor.2 Es sollte klar sein, dass entsprechend auch die
Projektionen auf beliebige Faktoren in einem kartesischen Produkt erklärt sind.
Beispiel 4.1.4 Sei A eine Menge.
Jede Abbildung
N ∋ n 7−→ xn ∈ A
nennt man eine Folge mit Folgengliedern aus A . Meist schreiben wir dafür kurz (xn )n∈N .
Jede Abbildung
{1, . . . , m} × {1, . . . , n} ∋ (i, j) 7−→ aij ∈ A
nennen wir eine Matrix mit m Zeilen und n Spalten mit Einträgen aus A . Meist schreiben wir
dafür kurz (aij )1≤i≤n,1≤j≤m .
Wenn wir A := {0, 1, . . . , 255} wählen, können wir eine solche Matrix als Pixelbild mit m · n
Pixeln und 28 = 256 Grauwertstufen interpretieren.
Definition 4.1.5 Sei f : A −→ B eine Abbildung. Die Menge
graph(f ) := {(a, b) ∈ A × B|a ∈ A, b = f (a)}
heißt der Graph von f .
Definition 4.1.6 Sei f : X −→ Y eine Abbildung und seien A ⊂ X, B ⊂ Y . Dann heißt die
Menge
f (A) := {f (x)|x ∈ A}
die Bildmenge von A oder das Bild von A, und die Menge
−1
f (B) := {x ∈ X|f (x) ∈ B}
heißt die Urbildmenge von B oder einfach das Urbild von B.
Beispiel 4.1.7 Sei f : N ∋ n 7−→ 2n + 1 ∈ N . Dann ist das Bild von f die Menge aller
ungeraden natürlichen Zahlen mit Ausnahme von 1 .
Regel 4.1.8 Sei f : X −→ Y, A1 , A2 ⊂ X, B1 , B2 ⊂ Y .
A1 ⊂ A2
f (A1 ∪ A2 )
f (A1 ∩ A2 )
−1
B1 ⊂ B 2
f (B1 ∪ B2 )
=⇒
f (A1 ) ⊂ f (A2 )
f (A1 ) ∪ f (A2 )
=
⊂
=⇒
(4.2)
f (A1 ) ∩ f (A2 )
(4.3)
f (B1 ) ⊂ f (B2 )
(4.4)
f (B1 ) ∪ f (B2 )
(4.5)
−1
−1
=
(4.1)
−1
−1
2
Die Wortwahl wird verständlich, wenn wir uns A × A als Koordinatensystem realisiert denken. Dann wird
von einem Punkt durch Beleuchtung parallel zur zweiten Koordinatenachse auf der ersten Achse der projezierte
Punkt sichtbar.
Stand: 9. Februar 2010
38
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweisen wir etwa (4.5).
Da eine Gleichheit von Mengen behauptet wird, sind zwei Inklusionen zu verifizieren.
−1
−1
−1
Zu f (B1 ∪ B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
Sei x ∈ f (B1 ∪ B2 ) . Also gilt f (x) ∈ B1 ∪ B2 . Ist f (x) ∈ B1 , dann ist x ∈ f (B1 ) ⊂
−1
−1
−1
−1
−1
f (B1 ) ∪ f (B2 ) . Ist f (x) ∈ B2 , dann ist x ∈ f (B2 ) ⊂ f (B1 ) ∪ f (B2 ) .
−1
−1
−1
Zu f (B1 ) ∪ f (B2 ) ⊂ f (B1 ∪ B2 ) .
−1
−1
−1
−1
Sei x ∈ f (B1 ) ∪ f (B2 ) . Ist x ∈ f (B1 ), dann ist f (x) ∈ B1 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
−1
−1
Ist x ∈ f (B2 ), dann ist f (x) ∈ B2 ⊂ B1 ∪ B2 , d.h. x ∈ f (B1 ∪ B2 ) .
Definition 4.1.9 Seien f : X −→ Y , g : Y −→ Z Abbildungen. Die Hintereinanderausführung oder Komposition g ◦ f der Abbildungen f, g ist erklärt durch
g ◦ f : X ∋ x 7−→ g(f (x)) ∈ Z .
Regel 4.1.10 Seien f : X −→ Y, g : Y −→ Z, h : Z −→ W Abbildungen.
idY ◦ f
= f ◦ idX
(4.6)
h ◦ (g ◦ f ) = (h ◦ g) ◦ f
(4.7)
Die Identität in (4.7) nennt man das Assoziativgesetz. Man beachte, dass für die Hintereinanderausführung von Abbildungen ein Kommutativgesetz ( f ◦ g = g ◦ f ) im allgemeinen nicht
gilt.
4.2
Permutationen
Definition 4.2.1 Sei f : X −→ Y eine Abbildung.
(i) f injektiv genau dann, wenn für alle x, x′ ∈ X x 6= x′ =⇒ f (x) 6= f (x′ ) gilt.
(ii) f surjektiv genau dann, wenn für alle y ∈ Y ein x ∈ X existiert mit y = f (x) .
(iii) f bijektiv : ⇐⇒ f injektiv und surjektiv
Wir charakterisieren die Eigenschaften von Abbildungen aus Definition 4.2.1 in einer Weise,
die uns dann weiterbringt.
Satz 4.2.2 Sei f : X −→ Y eine Abbildung und sei B := f (X). Dann gilt:
(a) f ist injektiv genau dann, wenn g : B −→ X existiert mit g ◦ f = idX .
(b) f ist surjektiv genau dann, wenn g : Y −→ X existiert mit f ◦ g = idY .
(c) f ist bijektiv genau dann, wenn g : Y −→ X existiert mit g ◦ f = idX , f ◦ g = idY .
Stand: 9. Februar 2010
39
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweis:
Zunächst eine Vorüberlegung.
−1
−1
Sei y ∈ B . Dann ist f ({y}) 6= ∅ ; wähle xy ∈ f ({y}) . Damit definieren wir
ĝ : B ∋ y 7−→ ĝ(y) := xy ∈ X .
−1
Zu (a). Sei f injektiv. Wir setzen g := ĝ . Da f injektiv ist, gilt f ({y}) = xy für jedes y ∈ B .
Sei x ∈ X, y := f (x) . Dann ist also x = xy und wir haben
(g ◦ f )(x) = g(f (x)) = ĝ(f (xy )) = xy = x = idX (x) für alle x ∈ X .
Sei nun g : B −→ X mit g ◦ f = idX . Seien x, x′ ∈ X mit f (x) = f (x′ ). Dann ist
x = idX (x) = g(f (x)) = g(f (x′ )) = idX (x′ ) = x′ ,
was wir zeigen wollten.
Zu (b). Sei f surjektiv. Wir setzen g := ĝ und beachten B = Y . Dann ist
(f ◦ g)(y) = f (ĝ(y)) = f (xy ) = y = idY (y) .
Die Umkehrung ist trivial.
Zu (c). Gibt es g mit den notierten Eigenschaften, dann ist nach (a) und (b) die Bijektivität
von f klar. Sei nun f bijektiv. Dann ist B = Y und es gibt nach (a) und (b) Abbildungen
ga : Y −→ X und gb : Y −→ X mit ga ◦ f = idX , f ◦ gb = idY . Wir zeigen ga = gb und sind
dann fertig. Unter Verwendung der eben angeführten Identitäten folgt:
ga = ga ◦ idY = ga ◦ (f ◦ gb ) = (ga ◦ f ) ◦ gb = idX ◦ gb = gb .
Im Beweis der Vorüberlegung des Beweises zu Satz 4.2.2 haben wir das so genannte starke
Auswahlaxiom benutzt.3
Definition 4.2.3 Sei f : X −→ Y bijektiv. Die nach Satz 4.2.2 (c) eindeutig bestimmte
Abbildung4 g mit g ◦ f = f ◦ g = id heißt die (zu f ) inverse Abbildung. Wir schreiben dafür
f −1 .
−1
Die Notation f und f −1 passt folgendermaßen zusammen: Ist f : X −→ Y eine bijektive
−1
Abbildung, B ⊂ Y, dann ist f −1 (B) = f (B) .
Beispiel 4.2.4 Sei f : R\{0} ∋ x 7−→ x1 ∈ R\{0} . Dann ist sicherlich f −1 = f . Ein weiteres
Beispiel dieser Art ist f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 . Auch hier gilt f −1 = f .
Lemma 4.2.5 Seien f : X −→ Y , g : Y −→ Z bijektiv. Dann ist auch g ◦ f : X −→ Z
bijektiv und es gilt (g ◦ f )−1 = f −1 ◦ g−1 .
3
Es besagt, dass man zu einer Familie Xα , α ∈ A, von Mengen eine Auswahlfunktion c : A −→ ∪α∈A Xα mit
c(α) ∈ Xα für alle α ∈ A existiert. Dahinter versteckt sich ein Problem, das in den Grundlagen der Mathematik
auf der Basis einer fundierten Mengenlehre seinen Platz hat; hier halten wir an diesem Axiom wie an einem
Glaubenssatz fest.
4
In der Literatur spricht man bei bijektiven Abbildungen oft auch von umkehrbar eineindeutigen Abbildungen.
In Satz 4.2.2 zusammen mit Definition 4.2.1 liegt die Berechtigung für eine solche Sprechweise.
Stand: 9. Februar 2010
40
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Beweis:
Dies verifiziert man ohne Mühe.
Sei M eine nichtleere Menge. Wir setzen
Abb (M ) := {f : M −→ M } .
In dieser Menge der Selbstabbildungen von M ist eine Multiplikation“ erklärt durch die Kom”
position von Abbildungen:
f • g := f ◦ g , f, g ∈ Abb (M ) .
(G := {f ∈ Abb (M )|f bijektiv } , • := ◦) wird damit zu einer Gruppe. Die Definition dieser
mathematischen Objekte folgt nun.5
Definition 4.2.6 Eine Menge G zusammen mit einer Verknüpfung • : G × G ∋ (a, b) 7−→
a • b ∈ G heißt eine Gruppe genau dann, wenn gilt:
a) Es gibt ein Element e ∈ G mit
a • e = e • a = a für alle a ∈ G .
b) Zu jedem a ∈ G gibt es ein Element ā ∈ G mit
c) Für alle a, b, c ∈ G gilt
a • ā = ā • a = e .
a • (b • c) = (a • b) • c .
Ist zusätzlich noch
d) Für alle a, b ∈ G gilt
a • b = b • a.
erfüllt, so heißt die Gruppe kommutativ.
Sei G eine Gruppe. Die Bedingung a) besagt, dass es ein bezüglich der Verknüpfung “•“
neutrales Element e in G gibt. Ist e′ ein weiteres neutrales Element in G, so lesen wir aus
e′ = e′ • e = e
ab, dass das neutrale Element in einer Gruppe eindeutig bestimmt ist; dabei haben wir a)
zweimal verwendet.
Das in der Bedingung b) eingeführte Element ā heißt das zu a inverse Element. Es ist
ebenfalls eindeutig bestimmt, denn aus
a • ā = ā • a = e , a • ā′ = ā′ • a = e ,
folgt
ā′ = ā′ • e = ā′ • (a • ā) = (ā′ • a) • ā = e • ā = ā .
Die Bedingung c), die wir eben verwendet haben, nennt man das Assoziativgesetz. Es besagt,
dass Klammern bei der Reihenfolge der Verknüpfungen beliebig gesetzt werden dürfen und
deshalb, soweit sie nicht für die Lesbarkeit benötigt werden, weggelassen werden dürfen.
5
Die Gruppen sind von überrragender Bedeutung. Ihre Nutzung hinterließ eine Erfolgsspur in der Mathematik.
Von H. Poincaré ist die Aussage überliefert, Gruppen seien die ganze Mathematik“.
”
Stand: 9. Februar 2010
41
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Wegen der Eindeutigkeit des inversen Elements (siehe oben) können wir nun ein inverses Element in der Bezeichnung auszeichnen.
Bezeichnung: Wir schreiben für das inverse
Element ā von a im abstrakten Rahmen meist
a−1 , in speziellen Fällen weichen wir davon ab.
◦
id τ1 τ2 τ3 τ4 τ5
id
id τ1 τ2 τ3 τ4 τ5
τ1
τ1 id τ3 τ2 τ5 τ4
τ2
τ2 τ4 id τ5 τ1 τ3
τ3 τ3 τ5 τ1 τ4 id τ2
Wir führen nun eine Reihe von Beispielen
an und zeigen damit, dass der Gruppenbegriff
τ4 τ4 τ2 τ5 id τ3 τ1
in der Tat geeignet ist, viele Objekte unter eiτ5 τ5 τ3 τ4 τ1 τ2 id
nem gemeinsamen Gesichtspunkt zu betrachten. Dabei schreiben wir dann Verknüpfung,
Abbildung 4.1: Die Permutationsgruppe S3
Einselement, Inverses immer mit dem Symbol,
das wir in der speziellen Situation bereits kennen. Auf die Verifikation der Assoziativität bzw. Kommutativität verzichten wir meist, da hier
in der Regel kein Problem vorliegt.
Beispiel 4.2.7 (G := Z, • := +) ist eine kommutative Gruppe mit neutralem Element 0 und
Inversem −z für z ∈ Z .
Wenn die Verknüpfung eine Addition ist wie etwa in Beispiel 4.2.7, nennt man das Inverse
eines Elements meist das Negative. Ist die Verknüpfung • in einer Gruppe einer Addition
verwandt“, so nennt man sie, wenn sie kommutativ ist, auch abelsch.6
”
Beispiel 4.2.8 (G := Q, • := +) , (G := R, • := +) sind abelsche Gruppen. Das neutrale
Element ist jeweils 0, das Inverse (Negative) eines Elementes r ist −r.
Beispiel 4.2.9 (G := R∗ := R\{0}, • := ·) ist eine kommutative Gruppe mit neutralem Element
1 und Inversem a−1 für a ∈ R∗ .
Die Rechenregeln einer Gruppe sind uns hier wohlvertraut, ebenso die Potenzregeln. Man beachte,
dass wir das Nullelement aus R entfernen mussten, da dieses Element kein Inverses bezüglich
der Multiplikation besitzt.
Nun haben wir die Gruppenstrukturen in den Zahlen erkannt. Wir finden sie auch beim
Rechnen mit Restklassen, wie wir im Kapitel 6 sehen werden.
Kehren wir zurück zu
G := {f ∈ Abb (M )|f bijektiv } , • := ◦ .
(G, •) ist damit eine (im allgemeinen nicht kommutative) Gruppe; wir bezeichnen sie mit S(M ) .
Das Assoziativgesetz ist klar, das neutrale Element ist die Identität idM , das inverse Element
eines Elements f ∈ G ist f −1 . Beachte auch, dass mit f, g ∈ G auch f ◦ g ∈ G , f −1 ∈ G gilt.
Definition 4.2.10 Ist M eine nichtleere Menge, so nennen wir die Gruppe S(M ) die symmetrische Gruppe von M. Ist M = {1, . . . , m}, dann nennen wir S(M ) Permutationsgruppe
und jedes Element in S(M ) eine Permutation. In diesem Spezialfall schreiben wir kurz Sm .
6
Der Begriff abelsch“ ist vom Namen des norwegischen Mathematikers N.H. Abel abgeleitet. Neben Arbeiten
”
zur Konvergenz von Reihen beschäftigte er sich mit der Lösbarkeit von Gleichungen fünften Grades und bewies
die Unmöglichkeit der Lösung einer allgemeinen Gleichung fünften Grades mit Hilfe von Radikalen (Wurzelausdrücken); siehe dazu Abschnitt 11.7. Seine Ideen hierzu sind eng mit denen des französischen Mathematikers E.
Galois, dessen Theorie in der Algebra eine überragende Rolle spielt, verwandt. Mit ihm teilt er auch das Schicksal,
sehr jung zu sterben, Abel starb an Schwindsucht, Galois in einem Duell.
Stand: 9. Februar 2010
42
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Die Wortwahl Permutationsgruppe wird verständlich, wenn wir beobachten, dass bei der
Menge M = {1, . . . , m} einer Abbildung f in Sm die Umstellung der Elemente in M gemäß
1
2
...
m
f (1) f (2) . . . f (m)
entspricht. Die Wortwahl symmetrische Gruppe rührt daher, daß die Funktionen der Variablen x1 , . . . , xm , die bei allen Permutationen der Variablen invariant bleiben, die symmetrischen Funktionen sind; siehe Abschnitt 7.2.
Beispiel 4.2.11 Wir betrachten S3 . Die sechs Elemente der Gruppe sind dann in obiger Schreibweise
123
123
123
123
123
123
τ0 =
τ1 =
τ2 =
τ3 =
τ4 =
τ5 =
.
123
132
213
231
312
321
Klar, τ0 ist die Identität. Die Gruppentafel ist in Abbildung 4.1 dargestellt. Beispielsweise bedeutet τ4 in Spalte 3, Zeile 4 τ1 ◦ τ2 = τ4 und τ2 in Spalte 7, Zeile 5 τ5 ◦ τ3 = τ2 .
Bemerkung 4.2.12 Einer endlichen Gruppe, d.h. einer Gruppe mit endlich vielen Elementen, kann man durch Blick auf ihre Gruppentafel sofort ansehen, ob sie kommutativ ist. Sie ist
nämlich kommutativ genau dann, wenn ihre Gruppentafel symmetrisch zur Hauptdiagonalen ist.
S3 ist also nicht kommutativ. Daraus folgt, dass Sm , m ≥ 3, nicht kommutativ ist (Beweis!). Sei nun stets Sm für m ≥ 2 betrachtet, S1 ist ja trivial!
Definition 4.2.13 Sei σ ∈ Sm . Wir setzen
a(σ) := #{(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} , ǫ(σ) := (−1)a(σ)
und nennen σ gerade, falls ǫ(σ) = 1 gilt, anderenfalls ungerade. ǫ(σ) heißt Signum/Signatur
von σ und a(σ) die Fehlstandszahl von σ .
Beispiel 4.2.14 Sei
σ=
1 2 3 4 5
3 5 1 4 2
.
Dann gilt a(σ) = 6, denn wir zählen A := {(i, j) ∈ Nm × Nm |i < j, σ(i) > σ(j)} folgendermaßen
ab.
i = 1 : (1, 3), (1, 5) ∈ A ; i = 2 : (2, 3), (2, 4), (2, 5) ∈ A ; i = 3 : Fehlanzeige; i = 4 : (4, 5) ∈ A .
Also ist σ eine gerade Permutation.
Lemma 4.2.15 Für jedes σ ∈ Sm gilt
ǫ(σ) =
Y
1≤i<j≤m
Beweis:
Sei n := a(σ) . Es gilt:
Y
(σ(j) − σ(i)) =
1≤i<j≤m
Y
1≤i<j≤m,σ(i)<σ(j)
=
Y
1≤i<j≤m,σ(i)<σ(j)
n
= (−1)
Y
1≤i<j≤m
Stand: 9. Februar 2010
σ(j) − σ(i)
j−i
(σ(j) − σ(i)) ·
Y
1≤i<j≤m,σ(i)>σ(j)
Y
n
(σ(j) − σ(i)) · (−1)
n
|σ(j) − σ(i)| = (−1)
43
(σ(j) − σ(i))
1≤i<j≤m,σ(i)>σ(j)
Y
|σ(j) − σ(i)|
(j − i)
1≤i<j≤m
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.2. PERMUTATIONEN
Bei der letzten Gleichung haben wir die Beobachtung verwendet, dass die beiden Produkte bis
auf die Reihenfolge die gleichen Faktoren enthalten, was aus der Bijektivität von σ folgt.
Ein τ ∈ Sm heißt Nachbarvertauschung, wenn
∃i ∈ {1, . . . , m} mit τ (i) = i + 1 , τ (i + 1) = i ; τ (j) = j , j 6= i, i + 1,
gilt. Ein τ = τkl ∈ Sm , k 6= l , heißt Transposition, wenn gilt:
τ (k) = l , τ (l) = k ; τ (j) = j , j 6= k, l ,
gilt. Nachbarvertauschungen sind also spezielle Transpositionen. Man überzeugt sich leicht, dass
für eine Transposition τ ∈ Sm gilt: τ −1 = τ .
Lemma 4.2.16 Sei σ ∈ Sm und sei τ ∈ Sm eine Nachbarvertauschung.
Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) .
Beweis:
ǫ(τ ◦ σ) =
=
Y
1≤i<j≤m
Y
1≤i<j≤m
= ǫ(σ)
τ (σ(j)) − τ (σ(i))
j−i
τ (σ(j)) − τ (σ(i))
·
σ(j) − σ(i)
Y
1≤i<j≤m
Y
1≤i<j≤m
σ(j) − σ(i)
j−i
τ (σ(j)) − τ (σ(i))
= −ǫ(σ) .
σ(j) − σ(i)
Bei der letzten Gleichheit haben wir verwendet, dass im Produkt
Y τ (σ(j)) − τ (σ(i))
1≤i<j≤m
σ(j) − σ(i)
auf Grund der Tatsache, dass τ eine Transposition ist, alle Faktoren den Wert 1 haben mit einer
Ausnahme; dieser Faktor hat den Wert −1.
Korollar 4.2.17 Sei σ ∈ Sm und sei τ ∈ Sm eine Transposition. Dann gilt ǫ(τ ◦ σ) = −ǫ(σ) .
Beweis:
Sei etwa τ = τkl . Setze σ ′ := τ ◦ σ . Betrachte nun
Σ′ : σ ′ (1), . . . , σ ′ (m)
Σ : σ(1), . . . , σ(m)
Hier unterscheiden sich die beiden Anordnungen nur dadurch, dass k und l die Plätze getauscht
haben. Sei s die Anzahl der Zahlen, die in Σ zwischen k und l vorkommen. Dann erhält man
Σ′ aus Σ durch 2s + 1 sukzessive Vertauschung benachbarter Elemente. Nach Lemma 4.2.16 gilt
dann ǫ(σ ′ ) = (−1)2s+1 ǫ(σ) = −ǫ(σ) .
Satz 4.2.18 Jedes σ ∈ Sm läßt sich als Hintereinanderausführung von höchstens m Transpositionen schreiben, d.h. zu jedem σ ∈ Sm gibt es s ≤ m Transpositionen τ1 , . . . , τs mit
σ = τ1 ◦ · · · ◦ τs .
Beweis:
Sei σ ∈ Sm . Für σ = id gilt σ = τ21 ◦ τ12 . Sei σ 6= id . Dann gibt es ein kleinstes i1 mit
σ(i1 ) = j1 6= i1 . Setze σ1 := σ ◦ τi1 j1 . Es ist σ1 (i) = i für 1 ≤ i ≤ i1 . Falls σ1 = id gilt, sind
wir fertig. Anderenfalls gibt es ein i2 > i1 mit σ1 (i2 ) = j2 6= i2 . Setze σ2 := σ1 ◦ τi2 j2 . Dann
gilt σ2 (i) = i für 1 ≤ i ≤ i2 . So fortfahrend erreichen wir ein σs , s ≤ m, mit σs = id . Dann ist
σ = τis js ◦ · · · ◦ τi1 j1 .
Stand: 9. Februar 2010
44
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Korollar 4.2.19 Ist σ ∈ Sm Hintereinanderausführung von r Transpositionen, dann gilt ǫ(σ) =
(−1)r .
Beweis:
Folgt aus Satz 4.2.18 durch mehrmaliges Anwenden von ǫ(τ ◦σ) = −ǫ(σ) (siehe Folgerung 4.2.17)
für jede beteiligte Transposition τ.
Wir haben gesehen, dass unabhängig von der Art der Darstellung einer Permutation als
Produkt von Transpositionen die Anzahl der dabei benötigten Transpositionen bei geraden Permutationen stets gerade und bei ungeraden Permutationen stets ungerade ist.
Korollar 4.2.20 Sei m ≥ 2 . Dann gilt:
(a) ǫ(σ ◦ σ ′ ) = ǫ(σ)ǫ(σ ′ ) , σ, σ ′ ∈ Sm .
(b) ǫ(σ −1 ) = ǫ(σ) , σ ∈ Sm .
(c) #Sm = m! , #Am = m!/2 .
Beweis:
(a) folgt aus Satz 4.2.18 und Folgerung 4.2.19, ebenso (b), da für jede Transposition τ gilt:
τ −1 = τ . Die Aussage #Sm = m! in (d) ist klar, da es sich bei Sm um die Menge der Permutationen handelt, die Ausage #Am = m!/2 folgt aus der Tatsache, dass für jede Nachbarvertauschung τ durch Sm ∋ σ 7−→ τ ◦ σ ∈ Sm eine bijektive Abbildung definiert ist, bei der die
geraden Permutationen auf ungerade und die ungeraden Permutationen auf gerade Permutationen abgebildet werden.
(c) folgt aus der Tatsache, dass für σ ∈ Sm , τ ∈ Am stets ǫ(σ ◦ τ ◦ σ −1 ) = ǫ(σ)ǫ(τ )ǫ(σ −1 ) = 1
gilt.
Definition 4.2.21 Die Menge Am := {σ ∈ Sm |ǫ(σ) = 1} heißt alternierende Gruppe.
4.3
Metriken
Wir bringen nun das Objekt metrische Räume“ ins Spiel. Damit wollen wir modellieren, dass
”
man in einer Menge mehr oder minder gut interpretierbare Abstände zwischen zwei Elementen
dieser Menge erklären kann. Die Nützlichkeit dieses Vorgehens wird sich bald erweisen.
Definition 4.3.1 Sei X eine nichtleere Menge. Eine Abbildung d : X × X
Metrik, wenn folgende drei Bedingungen erfüllt sind:
−→
X heißt
a) d(x, y) = 0 genau dann, wenn x = y gilt;
(Definitheit)
b) d(x, y) = d(y, x) für alle x, y ∈ X ;
(Symmetrie)
c) d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z ∈ X .
(Dreiecksungleichung)
Die Zahl d(x, y) heißt Abstand von x, y .
Eine Menge X zusammen mit einer Metrik d wird als metrischer Raum (X, d) bezeichnet. Entsprechend der Bezeichnungsweise, dass d(x, y) für den Abstand von x, y steht, sollte man
erwarten, dass d(x, y) stets nichtnegativ ist. Dies ist aber schon in der Definition 4.3.1 enthalten,
wie folgende Zeile zeigt:
0 = d(x, x) ≤ d(x, y) + d(y, x) = 2d(x, y) d.h. d(x, y) ≥ 0 .
Stand: 9. Februar 2010
45
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Beispiel 4.3.2 Jede nichtleere Teilmenge A von R ist zusammen mit dem (euklidischen) Abstand d(x, y) := |x − y| ein metrischer Raum. Die definierenden Eigenschaften sind ohne Mühe
nachzuweisen.
Beispiel 4.3.3 Jede nichtleere Teilmenge A von R2 ist zusammen mit der euklidischen Metrik
p
d(x, y) := (x1 − y1 )2 + (x2 − y2 )2 , x = (x1 , x2 ), y = (y1 , y2 )
ein metrischer Raum. Der Nachweis der Dreiecksungleichung macht etwas Mühe, wir verweisen
auf die Analysis.
Beispiel 4.3.4 Sei S1 := {(x, y) ∈ R2 |x2 + y 2 = 1} der Rand des Einheitskreises. Wir können
zwei verschiedene Metriken wählen:
a) Die Metrik, die sich als Teilmenge von R2 gemäß Beispiel 4.3.3 ergibt.
b) Die Metrik, die man erhält, wenn man den Abstand als Länge des kürzeren Kreisbogens, der
zwei Punkte aus S1 verbindet, erklärt.
Beispiel 4.3.5 Sei X eine nichtleere Menge. Dann wird durch
(
1 , falls x 6= y
∈R
d : X × X ∋ (x, y) 7−→
0 , falls x = y
eine Metrik definiert. Nachrechnen!
Interpretiert man den Abstand d(x, y) als Kosten für eine Straßenbahnfahrt in dem Haltestellennetz X, so bedeutet die Wahl der Metrik gerade, daß für jede Fahrt der Einheitspreis 1 ezu
entrichten ist.
Beispiel 4.3.6 Sei A ein Alphabet und seien An die Wörter der Länge n . Ein Abstand zwischen
zwei Wörtern x = x1 . . . xn , y = x1 . . . yn ist definiert durch
d(x, y) := #{i ∈ {1, . . . , n}|xi 6= yi } .
Diese Metrik heißt Hamming–Abstand .
Der Abstandsbegriff, der durch eine Metrik eingeführt wird, macht es möglich, die wesentlichen Begriffe der Analysis im Zusammenhang mit Folgen sofort auf metrische Räume zu
übertragen. Dies soll nun geschehen. Dabei ist der Begriff der Folge zentral: eine Folge in X
ist eine Abbildung N ∋ n 7−→ xn ∈ X ; wir schreiben dafür (xn )n∈N .
Definition 4.3.7 Sei (X, d) ein metrischer Raum und sei (xn )n∈N eine Folge in X .
a) Die Folge (xn )n∈N heißt Cauchyfolge genau dann, wenn gilt:
∀ ǫ > 0 ∃N ∈ N ∀m, n ≥ N (d(xn , xm ) < ǫ) .
a) Die Folge (xn )n∈N heißt konvergent genau dann, wenn es x ∈ X gibt mit
∀ ǫ > 0 ∃N ∈ N ∀n ≥ N (d(xn , x) < ǫ) ;
x heißt dann Grenzwert oder Limes der Folge und wir schreiben x = lim xn .
n
Stand: 9. Februar 2010
46
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Beispiel 4.3.8 Sei die Metrik in R der übliche Abstand. Sei L ∈ R mit |L| < 1 . Dann gilt
bekanntlich limn Ln = 0 , d.h. (Ln )n∈N ist eine Nullfolge.
Die Dreiecksungleichung und die Definitheitseigenschaft einer Metrik haben sofort die Eindeutigkeit eines Grenzwertes zur Folge. Ebenso schnell sieht man ein, dass eine konvergente
Folge stets eine Cauchyfolge ist. Man liest dies aus d(xn , xm ) ≤ d(xn , x) + d(x, xm ) ab, wenn
(xn )n∈N gegen x konvergiert. Die Umkehrung davon gilt nicht immer, wie uns das Beispiel Q
zusammen mit der Abstandsfunktion in R als Metrik zeigt. Dies ist der Anlass für die folgende
Definition.
Definition 4.3.9 Sei (X, d) ein metrischer Raum.
a) Eine Teilmenge A von X heißt abgeschlossen genau dann, wenn für jede konvergente
Folge (xn )n∈N mit xn ∈ A für alle n ∈ N stets lim xn ∈ A gilt.
n
b) (X, d) heißt vollständig genau dann, wenn jede Cauchyfolge in X konvergiert.
Ist (X, d) ein metrischer Raum, dann ist X nach Definition abgeschlossen. Also gibt es zu
A ⊂ X sicher eine kleinste Menge (bezüglich der Inklusion) A mit A ⊂ A und A abgeschlossen.
Eine solche Menge A heißt der Abschluss von A; beispielsweise ist [a, b] der Abschluss von
[a, b) im metrischen Raum R1 , versehen mit dem euklidischen Abstand.
Klar, der metrische Raum (X, d) aus Beispiel 4.3.3 ist vollständig genau dann, wenn die Menge
X eine abgeschlossene Teilmenge in R ist.
In einem metrischen Raum (X, d) haben wir die Kugeln
Br (x) := {y ∈ X|d(x, y) < r} , B r (x) := {y ∈ X|d(x, y) ≤ r} (r ≥ 0)
um x ∈ X und die Umgebungen
Uǫ (A) := {y ∈ X|d(x, y) < ǫ für ein x ∈ A}
einer Teilmenge A von X zur Verfügung. Die Bezeichnung B r (x) ist passend gewählt, denn es
gilt ja, dass der Abschluss Br (x) gerade B r (x) ist.
Damit haben wir nun die Begriffe bereit, die wir benötigen, um Iterationen in einem metrischen Raum zu betrachten. Iterationen werden benutzt, um Folgen zu konstruieren, die einen
erwünschten Grenzwert besitzen. Meist interessiert man sich für Punkte, die sich unter einer
Abbildung nicht verändern, also für so genannte Fixpunkte.
Definition 4.3.10 Sei (X, d) ein metrischer Raum und sei T : X −→ X eine Abbildung. Ein
Punkt x ∈ X heißt ein Fixpunkt von T, wenn T (x) = x gilt.
Beispiel 4.3.11 De Abbildung f : N ∋ x 7−→ 2x + 1 ∈ N hat keine Fixpunkte.
Die Abbildung f : R\{0} ∋ x 7−→ x1 ∈ R\{0} hat die Fixpunkte 1, −1 .
Die Fixpunktmenge von f : Z2 ∋ (x, y) 7−→ (y, x) ∈ Z2 ist die Diagonale“ {(x, x)|x ∈ Z} . ”
Hier kommt der Satz, der über die Existenz von Fixpunkten und ihrer Berechnung Aufschluss
gibt.
Stand: 9. Februar 2010
47
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.3. METRIKEN
Satz 4.3.12 (Banachscher Fixpunktsatz) Sei (X, d) ein vollständiger metrischer Raum und
sei T : X −→ X eine Kontraktion, d.h.
∃ L ∈ [0, 1) ∀ x, y ∈ X (d(T (x), T (y)) ≤ Ld(x, y)) .
(4.8)
Dann gilt:
a) T besitzt einen eindeutig bestimmten Fixpunkt x .
b) Für alle x ∈ X konvergiert die Folge (xn )n∈N , definiert durch
xn+1 := T (xn ) , x0 := x ,
gegen x und es gilt:
d(xm+1 , x) ≤
Lm
d(T (x), x) , m ∈ N .
1−L
Beweis:
Sei x ∈ X . Man beweist mit Hilfe der Voraussetzung (4.8) für n, m, n > m ≥ 1, sofort folgende
Aussagen:
d(T (xn+1 ), T (xn )) ≤ d(T (xn ), T (xn−1 )) ≤ · · · ≤ Ln d(T (x), x) ;
n−1
n−1
X
X
Li d(T (x), x)
d(T (xi+1 ), T (xi )) ≤
d(T (xn ), T (xm )) ≤
(4.9)
i=m
i=m
≤ Lm d(T (x), x)
n−1−m
X
j=0
Lj ≤ Lm
1
d(T (x), x) .
1−L
(4.10)
Aus (4.10) folgt nun die Tatsache, dass in (xn )n∈N eine Cauchyfolge vorliegt, da limm Lm = 0 gilt;
siehe Beispiel 4.3.8. Nach Voraussetzung zur Vollständigkeit gibt es x ∈ X mit x = limn∈N xn .
Daraus folgt mit der Kontraktionseigenschaft und der Konvergenz der Folge (xn )n∈N gegen x
sofort T (x) = x , denn
d(T (x), x) ≤ d(T (x), xn+1 ) + d(xn+1 , x) = d(T (x), T (xn )) + d(xn+1 , x) ≤ Ld(x, xn ) + d(xn+1 , x) .
Grenzübergang n → ∞ in (4.10) ergibt die Aussage in b) . Damit ist die Existenz eines Fixpunktes x und die Abschätzung in b) gezeigt. Bleibt die Eindeutigkeit zu zeigen.
Sei x̂ ∈ X ein weiterer Fixpunkt. Dann folgt aus der Ungleichung
d(x, x̂) = d(T (x), T (x̂)) ≤ Ld(x, x̂)
mit der Tatsache 0 ≤ L < 1 sofort x = x̂ .
Der Banachsche Fixpunktsatz ist ein zentrales Resultat, das vielfältige Anwendungen hat:
Existenz von Lösungen nichtlinearer Gleichungen, Konvergenz von Iterationsverfahren, Existenz
von Lösungen bei Differentialgleichungen, . . . .
Beispiel 4.3.13 Man bestimme die Nullstellen von f (x) := −x+ cos x . Dies ist gleichbedeutend
mit der Berechnung der Fixpunkte von g(x) := cos(x).
Hier kommt eine Schlussweise,
wie sie in der Analysis vorbereitet wird. Wegen f (0) = 1 >
√
1
π
′
0, f ( 4 ) = 4 (−π + 2 2) < 0, besitzt f eine Nullstelle in (0, π
4 ). Wegen f (x) = 1 + sin(x) ≥ 0
π
′
für alle x ∈ R folgt, dass Nullstellen nur in (0, 4 ) liegen können. Da f (x) > 0, x ∈ (0, π
4 ), folgt,
π
dass die einzige Nullstelle von f in (0, 4 ) liegt.
Stand: 9. Februar 2010
48
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.4. ISOMORPHISMEN
∗
Also besitzt g genau einen Fixpunkt x∗ in (0, π
4 ). Näherungswerte für x bestimmen wir mit der
Fixpunktiteration xn+1 := cos xn . Wählt man als Startwert (siehe oben) x0 := π
4 , so ergibt sich
die Zahlenfolge
x0 = 0, 785398 . . . , x1 = 0, 707106 . . . , x2 = 0, 760244 . . . , . . . , x25 = 0, 73908
Von x25 stimmen die angegebenen 5 Ziffern nach dem Komma mit den entsprechenden Dezimalstellen der Lösung überein.
Wir haben oben 0 < x1 ≤ x2 ≤ x0 beobachtet. Da g monoton fallend ist (g′ (x) ≤ 0 für alle x),
schließt man ohne Mühe auf
0 < x2k−1 ≤ x2k+1 ≤ x∗ ≤ x2k+2 ≤ x2k , k ∈ N0 .
Wir wissen daher in jedem Stadium der Rechnung
|x2k+2 − x∗ | ≤ |x2k+2 − x2k+1 | ,
wobei die Schranke |x2k+2 − x2k+1 | bei der Rechnung zur Verfügung steht. Damit können wir
während der Rechnung entscheiden, wann wir mit der erreichten Näherung auf Grund der erreichten Genauigkeit zufrieden sind.
4.4
Isomorphismen
Nun wollen wir einen wichtigen Gesichtspunkt bei der Betrachtung mathematischer Objekte
einführen: wann sind Objekte als gleich anzusehen, auch wenn sie in unterschiedlichem Kleide“
”
daherkommen. Dabei stoßen wir auf den Begriff der Strukturgleichheit“, der durch Isomorphis”
men beschrieben wird. Wir geben 4 Beispiele.
Definition 4.4.1 Zwei Graphen G = G(E, K), G′ = G(E ′ , K ′ ) heißen isomorph, in Zeichen
G∼
= G′ , falls es eine bijektive Abbildung ϕ : E −→ E ′ gibt, so dass gilt: k = {u, v} ist eine
Kante in G genau dann, wenn k′ := {ϕ(u), ϕ(v)} eine Kante in G′ ist.
Beispielsweise sind alle vollständigen Graphen mit n Ecken isomorph. Daher ist es gerechtfertigt,
für solche Graphen eine(!) Bezeichnung zu vergeben: Gn . Zu entscheiden, ob Graphen isomorph
sind, ist so einfach nicht. Hilfreich dabei sind Invarianten“ bei Anwendung eines Isomorphismus:
”
Ecken werden auf Ecken vom selben Grad abgebildet, . . . .
Offensichtlich wird durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine
”
Äquivalenzrelation erzeugt.
Definition 4.4.2 Zwei Gruppen (G, •), (G′ , •′ ) heißen isomorph, in Zeichen G ∼
= G′ , falls es
eine bijektive Abbildung ϕ : G −→ G′ gibt mit ϕ(x) •′ ϕ(y) = ϕ(x • y) für alle x, y ∈ G .
Der Isomorphismus ϕ, wie er in Definition 4.4.2 gefordert ist, ist ein bijektiver Gruppenhomomorphismus. Man kann für einen solchen Isomorphismus ϕ zeigen, dass auch ϕ−1 ein
Isomorphismus ist; siehe dazu unten unter Vektorraumisomorphismen. Offensichtlich wird daher
durch die Relation G ∼ G′ genau dann, wenn G, G′ isomorph sind“ eine Äquivalenzrelation
”
erzeugt.
Beispiel 4.4.3 Sei ω3 die dritte Einheitswurzel, d.h.
ω3 = cos(2π/3) + i sin(2π/3) .
Stand: 9. Februar 2010
49
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.5. ÜBUNGEN
Betrachte nun die folgenden Gruppentafeln:
+
0
1
2
0
0
1
2
1
1
2
0
·
1
ω3
ω32
2
2
0
1
1 ω3 ω32
1 ω3 ω32
.
ω3 ω32 1
ω32 1 ω3
Die erste Tafel steht für das additive Rechnen in Restklassen bezüglich des Restes drei (siehe
Kapitel 6), die zweite für das multiplikative Rechnen mit speziellen komplexen Zahlen. Beide
Tafeln definieren eine Gruppe. Wie man sieht, sind sie isomorph.
Definition 4.4.4 Zwei Vektorräume (V, +, ·), (V ′ , +′ , ·′ ) über dem selben Skalarkörper K heißen
isomorph, in Zeichen V ∼
= V ′ , falls es eine bijektive Abbildung ϕ : V −→ V ′ gibt mit
′
ϕ(x + y) = ϕ(x) + ϕ(y), ϕ(α · x) = α ·′ ϕ(x) für alle x, y ∈ V, α ∈ K .
Der Isomorphismus ϕ, wie er in Definition 4.4.4 gefordert ist, ist eine lineare Abbildung, da
er offenbar die Linearkombinationen in Linearkombinationen überführt. (Eine Linearkombination ist etwa αx+βy mit α, β ∈ K.) Eine solche Abbildung wird linear genannt. Die Überraschung
ist, dass auch die per definitionem existierende Umkehrabbildung ϕ−1 diese Eigenschaft hat; man
liest dies aus
ϕ−1 (α ·′ v ′ +′ β ·′ w′ ) = ϕ−1 (α ·′ ϕ(ϕ−1 (v ′ )) +′ β ·′ ϕ(ϕ−1 (w′ )))
= ϕ−1 (ϕ(α · ϕ−1 (v ′ )) +′ ϕ(β · ϕ−1 (w′ )))
= ϕ−1 (ϕ(α · ϕ−1 (v ′ ) + β · (ϕ−1 (w′ )))
= α · ϕ−1 (v ′ ) + β · ϕ−1 (w′ ) , v ′ , w′ ∈ V ′ , α, β ∈ K ,
ab. Beide Abbildungen ϕ, ϕ−1 sind also linear. Offensichtlich wird daher durch die Relation
V ∼ V ′ genau dann, wenn V, V ′ isomorph sind“ eine Äquivalenzrelation erzeugt. Genaueres
”
erfährt man in der Linearen Algebra.
Definition 4.4.5 Zwei metrische Räume (X, d), (X ′ , d′ ) heißen isomorph, in Zeichen X ∼
= X ′,
′
′
falls es eine bijektive Abbildung ϕ : X −→ X gibt mit d (ϕ(x), ϕ(y)) = d(x, y) für alle x, y ∈ X .
Die Abbildung ϕ, wie sie in Definition 4.4.5 gefordert ist, ist eine Isometrie, da sie offenbar
die Abstände gleich lässt. Beachte, dass auch ϕ−1 eine Isometrie ist. Offensichtlich wird daher
durch die Relation X ∼ X ′ genau dann, wenn X, X ′ isomorph sind“ eine Äquivalenzrelation
”
erzeugt.
4.5
Übungen
1.)
Die Fehlstandszahl einer Permutation ist die Anzahl der Paare (i, j), die nach Umstellung
mit dieser Permutation in falscher Reihenfolge stehen.
Ermittle die Anzahl der Permutationen von 1, 2, . . . , 5 mit ungerader Fehlstandszahl.
2.)
Zeige: Die Isomorphie von Graphen ist eine Äquivalenzrelation auf der Menge der Graphen.
3.)
Finde zwei Beispiele von selbstkomplementären Graphen. Dabei heißt ein Graph selbstkomplementär, wenn G zu seinem Komplementärgraphen G isomorph ist.
Stand: 9. Februar 2010
50
c J.Baumeister
KAPITEL 4. ABBILDUNGEN
4.)
4.5. ÜBUNGEN
Zeige, dass durch
V4 :=
1234
1234
1234
1234
,
,
,
1234
4321
2143
3412
in S4 eine Gruppe gebildet wird; die Verknüpfung sei die in S4 . Ist V4 eine Teilmenge
von A4 ?
5.)
Zeige, dass R2 ∋ (u, v) 7−→ u + iv ∈ C ein Gruppenisomorphismus ist (jeweils bezüglich
der Addition). Gibt es weitere Isomorphismen?
6.)
Unter der Ordnung einer Permutation σ versteht man die kleinste natürliche Zahl n,
so dass σ n = id . Bestimme die Ordnung von
1234
1234
,
.
2143
2341
Stand: 9. Februar 2010
51
c J.Baumeister
Kapitel 5
Zählen
Wir verschaffen uns die Hilfsmittel, um die Kunst des Zählens“ zu skizzieren. Es sind dies
”
die natürlichen Zahlen und Operationen auf ihnen. Im nächsten Kapitel ewächst daraus das
Rechnen in den ganzen Zahlen.
5.1
Natürliche Zahlen
Die erste mathematische Erfindung“ dürfte wohl das Zählen von Gegenständen gewesen sein: je”
dem Gegenstand einer Familie von Gegenständen wird der Reihe nach ein Strich auf einem Auf”
zeichnungsbrett“ zugeordnet, einer bestimmten Anzahl von Strichen wird ein Zahlwert (Eins,
Zwei,. . . ) bzw. eine Zahl (1,2,. . . ) zugeordnet. Diese Zahlen stehen für die Kardinalzahlen im
Gegensatz zu den sogenannten Ordinalzahlen Erster (erster Strich), Zweiter (zweiter Strich),
. . . . Die Zahlen 1, 2, 3, . . . bezeichnen wir als natürliche Zahlen. Als Fundament für die Mathematik sind die natürlichen Zahlen ausreichend, alle“ anderen konkreten Objekte der Mathematik
”
lassen sich dann mit Definition durch Abstraktion erfinden. Also kommt es darauf an, die natürlichen Zahlen als existierende Menge N sicher zu definieren und zu akzeptieren. Von L. Kronecker1
ist überliefert:
Die natürlichen Zahlen hat der liebe Gott gemacht, alles andere ist Menschenwerk.
Was sind aber nun die strukturellen Eigenschaften der natürlichen Zahlen, auf die es ankommt?
Wir gehen zurück zur Tätigkeit des Zählens. Stets beginnen wir mit einem ersten Gegenstand,
wir ordnen ihm die Nummer 1 zu. Haben wir nun eine Reihe von Gegenständen gezählt und ist n
die Anzahl dieser gezählten Gegenstände, dann entscheiden wir, ob noch ein weiterer Gegenstand
zu zählen ist; wenn ja, ordnen wir ihm die Nummer n′ zu. n′ ist also Nachfolgezahl von n : zur
Strichliste haben wir einen Strich hinzugefügt. Diese Beobachtung führt uns zur Definition der
natürlichen Zahlen, wie G. Peano2 sie gegeben hat:
Definition 5.1.1 (Axiome von Peano) Es gibt eine Menge N und ein Element 1 ∈ N mit
folgenden Eigenschaften:
(P1) Zu jedem n ∈ N gibt es ein n′ ∈ N , genannt Nachfolger von n .
(P2) 1 ist kein Nachfolger, d.h. 1 6= n′ für alle n ∈ N .
(P3) Ist n′ = m′ , so ist n = m .
(P4) Ist M eine Teilmenge von N mit 1 ∈ M und gilt (n ∈ M =⇒ n′ ∈ M ), dann gilt M = N.
1
2
Leopold Kronecker, 1823 - 1891
Giuseppe Peano, 1858 - 1932
52
KAPITEL 5. ZÄHLEN
5.1. NATÜRLICHE ZAHLEN
Diese Menge N heißt Menge der natürlichen Zahlen.
Ist m = n′ (im Sinne der Definition 5.1.1), so heißt n Vorgänger von m. (P2) besagt, dass
das Element 1 keinen Vorgänger hat. Man beachte, dass wir die Definition der natürlichen Zahlen
mit Existenz verknüpft haben und nicht das Zählen zur Definition herangezogen haben.
In den natürlichen Zahlen N sollten wir, wenn die axiomatische Einführung wohlgelungen
ist, die Addition, die Multiplikation und das Vergleichen wiederentdecken können. Dazu einige
Vorbereitungen.
Lemma 5.1.2 Es gilt N = {1} ∪ {n′ |n ∈ N} .
Beweis:
Sei M := {1} ∪ {n′ |n ∈ N}. Es gilt M ⊂ N, 1 ∈ M , und ist n ∈ M, so ist n′ ∈ M . Also ist nach
(P4) M = N.
Das Axiom (P4) lässt sich bestens verwenden, neue Objekte zu definieren. Man nennt das
resultierende Prinzip induktive Definition. Wir führen dies am Beispiel der Definition des
kartesischen Produktes vor. Sei A eine Menge. Wir gehen so vor:
A1 := A , Ak := A × An falls k = n′ ∈ N .
Offenbar ist nun nach Lemma 5.1.2 An definiert für jedes n ∈ N .
Ist x ∈ An , n ∈ N, so gibt es x1 , . . . , xn ∈ A mit x = (x1 , . . . , xn ). Dies ist die Schreibweise als
n-Tupel der Elemente in An . Dabei haben wir die Schreibweise schon naheliegend verkürzt; wir
haben ja früher nur zweistellige Paarklammern (·, ·) definiert. Wir haben diese Definition schon
vorweggenommen bei der Definition von Wörtern über einem Alphabet.
Wir wollen nun die arithmetischen Operationen Addition, Subtraktion, Multiplikation,
Vergleich in den natürlichen Zahlen entdecken. Bei der Einführung bedienen wir uns wieder
der induktiven Definition.
Addition:
(
n′
n + m :=
(n + k)′
, falls m = 1
, n, m ∈ N .
, falls m = k′
Beachte, dass nun wirklich die Definition für alle m, m ∈ N gelungen ist, denn nach Lemma 5.1.2
ist ja für m ∈ N entweder m = 1 oder m = k′ für ein k ∈ N .
Nun ist es an der Zeit, zur üblichen Notation 1, 2, 3, . . . zurückzukehren. Dies geschieht durch
1, 2 := 1′ = 1 + 1, 3 := 2′ = 2 + 1, . . . .
n′ schreiben wir also nun immer als n + 1 .
Wir haben nun also eine (binäre) Verknüpfung “+“, die die Eigenschaften der Addition haben
sollte. Die folgenden Rechenregeln belegen, dass die uns geläufigen Eigenschaften der Addition
in der Tat vorliegen.
Regel 5.1.3 Seien m, n, k ∈ N . Es gilt:
Stand: 9. Februar 2010
(m + n) + k = m + (n + k) ;
(5.1)
m + n = n + m;
(5.2)
m + n = m + k =⇒ n = k .
(5.3)
53
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.1. NATÜRLICHE ZAHLEN
Wir beweisen exemplarisch (5.1).
Sei M := {k ∈ N|(m + n) + k = m + (n + k) für alle m, n ∈ N}. Mit der Definition der Addition
gilt
(m + n) + 1 = (m + n)′ = m + n′ = m + (n + 1) .
Also ist 1 ∈ M . Sei k ∈ M. Dann ist mit der Definition der Addition
(m + n) + k′ = ((m + n) + k)′ = (m + (n + k))′ = m + (n + k)′ = m + (n + k′ ), .
Also ist auch k′ ∈ M . Nach (P4) gilt nun M = N .
Gilt m = k′ , so ist k Vorgänger von m. Also schreiben wir dann k = m − 1 . Damit haben
wir die Subtraktion mit 1 zur Verfügung. Wir wissen ja, dass allgemein in N keine Subtraktion
möglich ist.
Wir sollten nun auch die Multiplikation in den natürlichen Zahlen definieren können. Dies
gelingt mit Hilfe der Addition so:
m · 1 := m ; m · (n + 1) := m · n + m , n ∈ N .
Damit ist die Verknüpfung m · n für m, n ∈ N, die wir Multiplikation nennen, wohldefiniert.
Den Multiplikationspunkt · lassen wir mitunter weg, die Schreibweise m × n für m · n vermeiden
wir vollständig.
Die Potenzschreibweise im Bereich der natürlichen Zahlen können wir nun auch einführen.
Wir setzen für alle a ∈ N
a1 := a , an+1 := a · an .
Es gilt dann
an+m = an · am , (an )m = an·m für alle a, n, m ∈ N .
Die Rechenarten “+, ·“ vertragen sich dann mit der neuen Schreibweise; etwa:
1 + 7 = 8, 15 · 3 = 45, 33 = 11 · 3 = (7 + 4) · 3 = 7 · 3 + 4 · 3 = 21 + 12 = 33, . . . .
Dies ist Inhalt der folgenden Regel, die das Distributivgesetz festhält; der Beweis erfolgt auf
dem üblichen Weg über (P4).
Regel 5.1.4 Seien m, n, k ∈ N . Es gilt:
m(n + k) = mn + mk .
(5.4)
(5.5)
Auch die Kleiner–Beziehung finden wir in N wieder. Dabei lassen wir uns von der Anschauung
leiten, dass einer kürzeren Strichliste einige Striche hinzuzufügen sind, um sie einer gegebenen
längeren Strichliste gleichzumachen.
Definition 5.1.5 Seien m, n ∈ N.
(a) m < n : ⇐⇒ ∃ x ∈ N (m + x = n) ;
(b) m ≤ n : ⇐⇒ m < n oder m = n ;
(c) m > n : ⇐⇒ n < m ;
Stand: 9. Februar 2010
54
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
(d) m ≥ n : ⇐⇒ n ≤ m .
Klar, ist n ∈ N und n 6= 1, dann ist n > 1 , denn dann ist n ein Nachfolger nach Lemma 5.1.2,
also etwa n = k′ = k + 1 mit k ∈ N , und daher n > 1 . Ohne Beweis führen wir an:
Regel 5.1.6
5.2
k ≤ m, m < n
=⇒
k < n.
(5.6)
m<n
=⇒
(5.7)
k<m
=⇒
m + k < n + k für alle k ∈ N .
k + 1 ≤ m.
(5.8)
Induktion
Nun wollen wir das Axiom (P4) einsetzen als Beweismethode. Dieses Prinzip der Induktion
stellt sich so dar:
Sei A(n) für jedes n ∈ N eine Aussage. Diese Aussage gilt für alle n ∈ N, falls
Induktionsbeginn: A(1) ist wahr.
Induktionsschluss: Ist A(n) wahr, dann ist auch A(n + 1) wahr.
verifiziert werden kann. Klar, man hat ja nur die Menge M := {n ∈ N|A(n) ist wahr} einzuführen und darauf (P4) anzuwenden.
Häufig wird Sei A(n) wahr“ als Zwischenschritt Induktionsverankerung oder Induktions”
annahme formuliert; wir verzichten darauf. Damit wird ja nur die Voraussetzung im Induktionsschluss extra herausgestellt.
Beispiel 5.2.1 Über C.F. Gauss3 wird berichtet, dass er die Beschäftigungstherapie seines Lehrers “Addiert mal die ersten 20 Zahlen“ durch folgenden Trick zunichte gemacht hat: Er addiert
die erste und die letzte Zahl: Ergebnis 21; er addiert die zweite und die vorletzte Zahl: Ergebnis
21; er . . . . Also kann man das verlangte Resultat durch
1 + 2 + · · · + 20 = 10 · 21 = 210
erhalten. Man beachte, dass die Lösungsmethode von Gauß auch tiefere“ Einsichten mitliefert:
”
Wann ist das Ergebnis gerade, warum ist die letzte Ziffer im Ergebnis oben eine Null.
Löst man sich von den konkreten Zahlen, ist also zu beweisen:
2
n
X
i = n(n + 1)
i=1
Der Beweis mittels vollständiger Induktion sieht so aus:
Induktionsbeginn: Die Formel ist offenbar richtig für n = 1.
Induktionsschluss: Die Formel sei richtig für n. Wir zeigen damit die Richtigkeit der Formel für
n + 1 so:
n
n+1
X
X
i + 2(n + 1) = n(n + 1) + 2(n + 1) = (n + 1)(n + 2) .
i=2
2
i=1
i=1
3
Gauss, Carl Friedrich (1777 — 1855)
Stand: 9. Februar 2010
55
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
Beispiel 5.2.2 Den Pythagoreern war bekannt, dass die Quadratzahlen die Summe ungerader
Zahlen sind, d. h. dass
n
X
(2i + 1) = (n + 1)2 , n ∈ N ,
1+
i=1
gilt. Sie hatten dafür einen geometrischen Beweis“; lese ihn aus der Figurensequenz in Abbil”
dung 5.1 ab! Der Beweis mittels vollständiger Induktion sieht (in abgekürzter Notation) so aus:
n = 1 : Klar.
n+1 :
1+
n+1
X
(2i + 1) = 1 +
n
X
(2i + 1) + (2(n + 1) + 1) = n2 + 4n + 4 = (n + 2)2
i=1
i=1
Die Aufspaltung 1 +
n
P
(2i + 1) ist der Tatsache geschuldet, dass wir hier noch keine Null (als
i=1
Summationsindex) zur Verfügung haben.
Beispiel 5.2.3 Beweise, dass für jede natürliche Zahl n
(n + 3)2 > 3(n + 3) + n
gilt. Wir betrachten dazu die Aussage
A(n) : (n + 3)2 > 3(n + 3) + n
und beweisen die Gültigkeit der Aussage für jedes n ∈ N nach dem Induktionsprinzip.
Induktionsbeginn: A(1) ist wahr, da (1 + 3)2 = 42 = 16 > 12 + 1 = 3(1 + 3) + 1 ist.
Induktionsschluss: Sei A(n) wahr.
((n + 1) + 3)2 = ((n + 3) + 1)2 = (n + 3)2 + 2(n + 3) + 1
> 3(n + 3) + n + 2(n + 3) + 1 > 3(n + 3) + n + 1 + 3 = 3(n + 4) + n + 1
Also folgt aus der Gültigkeit der Aussage A(n) die Gültigkeit der Aussage A(n + 1).
Die Aussage A(n) ist nach dem Induktionsprinzip nun für alle n ∈ N bewiesen. Die Ungleichung
(n + 3)2 > 3(n + 3) + n , n ∈ N,
kann aber auch ohne den Rückgriff auf das Induktionsprinzip bewiesen werden, da n2 + 2n ≥ 1
ist. Stelle die Verbindung her!
Beispiel 5.2.4 Bei einem Tennisturnier ist die Teilnehmerzahl üblicherweise eine Zweierpotenz
2n (n = 7 bei einem Grand-Slam-Turnier). Die Anzahl der Spiele bei einem K.O.-System beträgt
2n − 1. Dies lässt sich mit Induktion zeigen:
n = 1: Bei zwei Teilnehmern gibt es offenbar 1 = 21 − 1 Spiele.
n + 1: Die 2n+1 Teilnehmer lassen sich in zwei Gruppen zu je 2n Teilnehmern einteilen. Nach
Induktionsvoraussetzung gibt es in jeder Gruppe 2n − 1 Paarungen, also insgesamt 2(2n − 1)
Paarungen. Die Sieger der beiden Gruppen treffen dann in einer letzten Paarung aufeinander,
so dass es
2(2n − 1) + 1 = 2n+1 − 1
Paarungen gibt.
Man kann die Lösung mit einem anderen Argument schneller finden. Wegen des K.O.Systems verliert bis auf den Gewinner jeder Teilnehmer genau einmal. Jedes Spiel hat genau
Stand: 9. Februar 2010
56
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.2. INDUKTION
einen Verlierer. Also gibt es ein Spiel weniger als die Teilnehmerzahl. Dieser Alternativbeweis
lässt sich auf Teilnehmerfelder beliebiger Größe anwenden (z.B. wenn es Freilose gibt). Also gibt
es bei m Teilnehmern m − 1 Spiele.
Diese Gegenüberstellung der beiden Beweise zeigt, dass Induktion nicht immer die kürzeste
Beweismethode ist.
Nun verwenden wir die vollständige
Induktion zur Aufklärung der inneren
”
Struktur“ der natürlichen Zahlen.
Satz 5.2.5 Für m, n ∈ N gilt genau eine
der folgenden Aussagen:
•
•
◦
•
•
• •
◦ ◦
◦ ◦
•
•
•
•
◦
◦
◦
•
◦
◦
◦
•
◦
◦
◦
•
•
•
•
Abbildung 5.1: Quadratzahlen
m < n , m = n , m > n.
Beweis:
Sei n ∈ N . Zu m ∈ N setzen wir Mm := {x ∈ N|n + x = m}. Wir untersuchen die beiden Fälle
Mm 6= ∅ und Mm = ∅ .
Ist Mm 6= ∅, dann gibt es x ∈ N mit n + x = m , also n < m .
Wir beweisen mit vollständiger Induktion (bezüglich m) die folgende Behauptung:
Ist Mm = ∅, dann trifft genau eine der folgenden Aussagen zu: n > m, n = m .
m = 1 : Ist n = m, dann sind wir fertig. Ist n 6= m = 1, dann ist sicher n > 1 = m .
m + 1 : Sei also Mm+1 = ∅. Dann ist auch Mm := {y ∈ N|n + y = m} = ∅, da sonst für y ∈ Mm
sofort x := y + 1 ∈ Mm+1 folgt. Also gilt nach Induktionsvoraussetzung genau eine der Aussagen
n > m, n = m . n = m ist nicht möglich, da sonst 1 ∈ Mm+1 wäre. Also wissen wir nun n > m,
und es gibt daher z ∈ N mit m + z = n. Ist z = 1, dann ist m + 1 = n, ist z > 1, dann ist
1 + u = z mit einem u ∈ N und wir haben (m + 1) + u = m + (1 + u) = n, d. h. n > m + 1 .
Damit ist nun gezeigt, dass eine der Aussagen
m<n, m=n, m>n
jedenfalls eintritt. Bleibt die Unverträglichkeit von zweien der Aussagen zu zeigen, etwa von
m = n und m > n . Wenn m = n und m > n gilt, dann gibt es x ∈ N mit m + x = m. Mit
vollständiger Induktion folgt sofort, dass diese Gleichheit für kein m ∈ N gelten kann.
Satz 5.2.6 (Wohlordnungssatz) Jede nichtleere Teilmenge M von N enthält ein kleinstes
Element (bezüglich ≤).
Beweis:
Sei m ∈ M . Wähle in 1, . . . , m das kleinste Element m∗ aus M (bezüglich ≤ ) aus. Diese Auswahl
ist möglich, da nach Satz 5.2.5 die Elemente 1, . . . , m bezüglich ihrer Größe nach verglichen
werden können. Da die natürlichen Zahlen n ≥ m nicht als kleinste Elemente von M in Frage
kommen, ist m∗ das kleinste Element von M .
Bei der Komplexitätsanalyse – und nicht nur dort – ist eine Notation hilfreich, die einen Vergleich von Funktionen so zulässt, dass ihr Verhalten für große natürliche Zahlen zum Vorschein
kommt.
Stand: 9. Februar 2010
57
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.3. ABZÄHLEN
Definition 5.2.7 Sei f : N −→ N . Dann bezeichnet
O(g) := {f : N −→ N|es gibt c > 0, N ∈ N mit f (n) ≤ cg(n) für alle n ≥ N } .
Gehört eine Funktion f : N −→ N zu O(g), so schreibt man f ∈ O(g) oder f = O(g) und wir
sprechen f ist groß-O von g .“
”
Die Tatsache, dass in der Definition von O(g) nur das Verhalten für große natürliche Zahlen
eine Rolle spielt, drückt man oft so aus: f ist groß-O von g für n −→ ∞ .
Beispiel 5.2.8
n3 = O(n3 ) für n → ∞ .
Pn
2
i=1 i = O(n ) für n → ∞ .
Wenn wir sagen, dass ein Algorithmus einen Aufwand von O(g(n)) hat, dann meinen wir
damit Folgendes: Wenn der Algorithmus auf unterschiedlichen Computern mit den gleichen
Datensätzen läuft, und diese die Größe n haben, dann werden die resultierenden Laufzeiten
immer kleiner sein als eine Konstante mal g(n) .
5.3
Abzählen
Kombinatorik bedeutet Kunst des Zählens“. Sie beschäftigt sich mit Möglichkeiten, die Anzahl
”
der Elemente bei endlichen Mengen zu bestimmen. Die Elemente des kleinen Einmaleins der
”
Kombinatorik“ stellen wir in Kapitel 8 vor. Die Resultate sind interessant und hilfreich etwa
beim Einstieg in die Wahrscheinlichkeitstheorie und bei Anwendungen in der Informatik. Hier
erläutern wir nur, wie wir die Elemente einer Menge zählen wollen.
Als Prototyp“ einer Menge mit n Elementen steht uns Nn := {1, . . . , n} zur Verfügung.
”
Damit wollen wir erklären, wann eine beliebige Menge n Elemente besitzt. Wenn wir zählen/abzählen, ordnen wir den Elementen einer Menge von Objekten sukzessive eine natürliche Zahl,
beginnend bei 1, zu. Wesentlich beim Zählen ist, dass wir zwei verschiedenen Objekten nicht
dieselbe Zahl zuordnen. Dies führt uns dazu, das Zählen mit einer Abbildung, der Zuordnung,
mit Werten in N zu beschreiben, die zusätzlich die eben formulierte Forderung respektiert. Als
Vorbereitung für das Abzählen von Mengen beweisen wir
Satz 5.3.1 Sei A eine Menge, seien m, n ∈ N, und seien φ : A −→ Nn , ψ : A −→ Nm
bijektiv. Dann gilt n = m .
Beweis:
Wir beweisen mit vollständiger Induktion die Aussage
Zu n ∈ N gibt es für 1 ≤ m < n keine injektive Abbildung g : Nn −→ Nm .
n = 1 : Klar, da Nn = {1}, Nm = ∅ für m < n .
n + 1 : Annahme: Es gibt eine injektive Abbildung g : Nn+1 −→ Nm , 1 ≤ m < n + 1 .
Da g injektiv ist und Nn+1 mindestens die Elemente 1,2 enthält, ist 1 < m . Sei k := g(n + 1) .
Offenbar gibt es eine Bijektion f : Nm −→ Nm mit f (i) = i für i 6= k, m und f (k) = m, f (m) =
k . Nun ist (f ◦ g)|Nn : Nn −→ Nm−1 injektiv, wobei also 1 ≤ m − 1 < n gilt. Dies ist im
Widerspruch zur Induktionsannahme.
Nachdem nun die obige Aussage bewiesen ist, ist die Behauptung des Satzes schnell gezeigt.
Annahme: Es gibt bijektive Abbildungen φ : A −→ Nn , ψ : A −→ Nm , n 6= m . O.E. sei etwa
n > m . Da ψ ◦ φ−1 : Nn −→ Nm bijektiv ist nach Lemma 4.2.5, haben wir einen Widerspruch
zur obigen Aussage.
Stand: 9. Februar 2010
58
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.3. ABZÄHLEN
Definition 5.3.2 Sei M eine Menge, M 6= ∅ .
(a) M heißt endlich, wenn es ein N ∈ N und eine bijektive Abbildung ϕ : M −→ {1, . . . , N }
gibt; wir setzen dann #M := N . (Da nach Satz 5.3.1 die Zahl N eindeutig bestimmt ist,
ist die Schreibweise #M := N wohldefiniert.)
(b) M heißt abzählbar unendlich, wenn es eine bijektive Abbildung ϕ : M −→ N gibt. Wir
schreiben dann #M = ∞ .
(c) M heißt abzählbar, wenn M endlich oder abzählbar unendlich ist.
Die obige Definition sagt also, dass wir die Elemente einer (endlichen) Menge M gezählt
haben, wenn wir eine Bijektion φ : M −→ {1, . . . , N } gefunden haben; das Zählergebnis ist
#M := N .
Endliche Mengen haben wir schon viele
kennengelernt. Als ganz einfache Beispiele für
b1
b2
···
bn
abzählbare unendliche Mengen führen wir an:
a
(a
,
b
)
(a
,
b
)
·
·
·
(a
1
1 1
1 2
1 , bn )
A := {10n |n ∈ N} , N × N . Mit der Definitia2 (a2 , b1 ) (a2 , b2 ) · · · (a2 , bn )
on 5.3.2 (a),(b) verträglich ist, dass wir Nn die
..
..
..
..
.
.
.
.
Elementanzahl n zuordnen und dass N abzählam (am , b1 ) (am , b2 ) · · · (am , bn )
bar unendlich ist; die Identität ist ja jeweils
die passende Bijektion. Klar, der leeren Menge ordnen wir die Elementanzahl 0 zu, d. h.
Abbildung 5.2: Abzählschema
#∅ := 0 , und bezeichnen sie ebenfalls als endliche Menge.4 Man beachte, dass es Mengen
gibt, die nicht abzählbar sind. Ein wichtiges
Beispiel ist M := R . Das Cantorsche Diagonalisierungsverfahren, das üblicherweise im
Rahmen der Analysis im Zusammenhang mit der Dezimalbruchentwicklung vorgestellt wird,
belegt dies; wir kommen darauf zurück.
Sind A, B endliche Mengen, dann gilt für das kartesische Produkt die Formel
#(A × B) = #A · #B
(5.9)
Dies liest man etwa am Rechteckschema in Abbildung 5.2 ab (#A = m, #B = n).
Wir können die Situation des kartesischen Produkts in drei Veranschaulichungen festhalten;
siehe Abbildung 5.3 für m = 3 und n = 4 . Die Baumdarstellung“ hat den Vorteil, dass man sie
”
mühelos auf mehr als zwei Faktoren ausdehnen kann; man hat ja nur in die Tiefe weiterzubauen.
Wir halten der besseren Zitierbarkeit wegen die elementaren Zählprinzipien nochmal
kompakt fest:
Gleichheitsregel Existiert eine Bijektion zwischen zwei Mengen M und N , so gilt #M = #N .
Summenregel Sei M = ∪ki=1 Mi eine disjunkte Vereinigung endlicher Mengen. Dann gilt:
P
#M = ki=1 #Mi .
4
Die Definition 5.3.2 ist nicht die von G. Cantor 1895 erstmals gegebene Definition der Unendlichkeit einer
Menge: eine Menge ist unendlich, wenn zwischen ihr und einer ihrer echten Teilmengen eine umkehrbar eindeutige
Zuordnung möglich ist.
Stand: 9. Februar 2010
59
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.4. REKURSION
x
a
y
c
b
u
c
z
b
a
x
(a) Abbildungsmodell
b
c
a
y
u
(b) Gittermodell
z
x
y
u z x
y u
z
x y
u
z
(c) Baumdarstellung
Abbildung 5.3: Veranschaulichung des kartesischen Produkts
Produktregel Sei M = M1 × · · · × Mk ein kartesisches Produkt. Dann gilt #M =
Alle Regeln ergeben sich aus den obigen Ableitungen in offensichtlicher Weise.
k
Q
#Mi .
i=1
Ein einfaches, aber sehr anwendungsreiches Prinzip, in einer Anzahl von Objekten die Existenz eines Objekts mit einem bestimmten Merkmal behaupten zu können, ist das
Schubfachprinzip 5 Verteilt man n Objekte auf r < n Schubfächer, so existiert ein Fach, das
mindestens zwei Objekte enthält.
Dieses Prinzip ist völlig klar, nichts ist zu beweisen. Es ist daher überraschend, dass dieses
Prinzip zu nichttrivialen Ergebnissen führt, wie wir noch sehen werden. Zunächst eine Verallgemeinerung:
Schubfachprinzip/allgemein Verteilt man n = r·k+1 Objekte auf r Schubfächer, so existiert
ein Fach, das mindestens k + 1 Objekte enthält.
Formulieren wir das allgemeine Schubfachprinzip mengentheoretisch:
Schubfachprinzip für Mengen Ist eine Menge M mit Elementanzahl n = r · k + 1 in r
disjunkte Teilmengen zerlegt, so gibt es eine Teilmenge, die mindestens k + 1 Elemente
besitzt.
5.4
Rekursion
Ein Objekt wird als rekursiv bezeichnet, wenn es sich selbst als Teil enthält oder mit Hilfe
von sich selbst definiert ist. Rekursion kommt nicht nur in der Mathematik vor, sondern auch
im täglichen Leben (ein Bild im Spiegel im Spiegel . . . ). Rekursion kommt speziell in mathematischen Definitionen vor. Ein Beispiel haben wir schon kennengelernt: in der Definition der
natürlichen Zahlen kommt die zur Definition anstehende Menge N selbst vor. Ein anderes Beispiel ist die Fakultät einer natürlichen Zahl. Ihre rekursive Definition sieht so aus:
(
1
falls n = 1
n! :=
n · (n − 1)! falls n 6= 1
Es ist nicht überraschend, dass Rekursion sehr oft im Zusammenhang mit Objekten greift, die
mit natürlichen Zahlen im Zusammenhang stehen, da ja die natürlichen Zahlen selbst rekursiv
”
definiert sind“.
5
Es wird im Englischen “pigeonhole principle“, also Taubenschlagprinzip genannt.
Stand: 9. Februar 2010
60
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.4. REKURSION
Das Wesentliche an der Rekursion ist die Möglichkeit, eine unendliche Menge von Objekten
durch eine endliche Aussage zu definieren oder eine unendliche Anzahl von Berechnungsschritten
durch ein endliches Programm zu beschreiben. Allerdings ist Vorsicht geboten, denn rekursive
Anweisungen bergen die Gefahr nicht abbrechender Ausführung; der Terminierung ist also besonderes Augenmerk zu schenken.
Hier führen wir zwei Beispiele an, die keine Hintergrundtheorie benötigen. Später kommen
wir zu einem weiteren Beispiel, nämlich zur rekursiven Behandlung des Problems des größten
gemeinsamen Teilers.
Die Türme von Hanoi
Wir betrachten drei Pfeiler i, j, k, auf die runde Scheiben mit unterschiedlichem Durchmesser
aufgesteckt werden können. Das Problem lautet: Es sind n Scheiben, die auf dem Pfeiler i mit
nach oben abnehmendem Durchmesser aufgesteckt sind unter Zuhilfenahme des Pfeilers k durch
sukzessive Bewegung jeweils einer Scheibe auf den Pfeiler j umzuschichten. Dabei ist darauf
zu achten, dass niemals eine Scheibe mit größerem Durchmesser auf einer mit einem kleinerem
Durchmesser zu liegen kommt.
Man kann dieses Problem folgendermaßen lösen:
Man schichtet die obersten n − 1 Scheiben vom Pfeiler i auf den Pfeiler k unter
Zuhilfenahme von Pfeiler j den Regeln entsprechend; dann bringt man die auf dem
Pfeiler i verbliebene einzige (anfangs unterste) Scheibe auf den Pfeiler j . Nun ist der
Pfeiler i frei und man kann die n − 1 Scheiben vom Pfeiler k auf den Pfeiler j mit
Hilfe des Pfeilers i umschichten.
Es ist klar das rekursive Vorgehen zu erkennen: zur Lösung des Problems der Größe n bedienen
wir uns der Lösung der Größe n − 1 .
Wir benötigen die Bewegungsarten
bewege(m,von,über,nach), bringe(von,nach) .
Hierbei bedeutet bewege(l,a,b,c), dass die l obersten Scheiben vom Pfeiler a nach Pfeiler c den Regeln entsprechend unter Nutzung von b als Hilfspfeiler umzuschichten sind. Mit
bringe(a,b) wird die oberste Scheibe vom Pfeiler a auf den Pfeiler b gelegt. Die rekursive
Lösung für bewege(n,i,j,k) lautet damit:
Solange n > 0
bewege(n-1,i,j,k), bringe(i,j), bewege(n-1,k,j,i).
Beim Lösen der Aufgabe für n Scheiben, wird
Z(n) := 2n − 1 mal eine Scheibe umgelegt
Dies zeigt man induktiv. Der Induktionsbeginn ist trivial, der Induktionsschluss sieht so aus:
Z(n) = 1 + 2Z(n − 1) = 1 + 2(2n−1 − 1) = 2n − 1
Der Aufwand ist enorm: für n = 64 müssen 264 − 1 ∼ 1021 Scheiben umgelegt werden. Allerdings
sind wir ja nicht sicher, ob es nicht einen schnelleren Algorithmus gibt. Dies ist aber nicht der
Fall! (Man kann genauer hinsehen: Die kleinste Scheibe S1 wird bei jedem zweiten Zug bewegt,
die größte Scheibe Sn wird nur einmal bewegt, die Scheibe Sm wird genau 2n−m mal bewegt.)
Stand: 9. Februar 2010
61
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.5. PRIMZAHLEN
Die Ackermann-Funktion Als Beispiel für eine rekursive Funktionsdefinition komplexerer
Art betrachten wir das Beispiel der so genannten Ackermann-Funktion A(m, n) . Die Definition
lautet:

falls m = 0

n + 1
A(m, n) := A(m − 1, 1)
falls m 6= 0, n = 0 , m, n ∈ N0 .


A(m − 1, A(m, n − 1)) falls m 6= 0, n 6= 0
Die Ackermann-Funktion wächst sehr stark:
2
A(0, n) > n , A(1, n) > n + 1 , A(2, n) > 2n , A(3, n) > 2n , A(4, 3) > 22 , A(5, 4) > 1010000
Der Aufwand, um A(m, n) auszurechnen, wächst auch entsprechend. Beispielsweise erfordert die
Berechnung von A(1, 3) bereits folgende Rechenschritte:
A(1, 3) = A(0, A(1, 2)) = A(0, A(0, A(1, 1))) = A(0, A(0, A(0, A(1, 0))))
= A(0, A(0, A(0, A(0, 1)))) = A(0, A(0, A(0, 2))) = A(0, A(0, 3)) = A(0, 4) = 5
Es ist nicht sehr einfach einzusehen, dass die Rekursion terminiert; es ist so!
Satz 5.4.1 Für alle m, n ∈ N terminiert der Aufruf A(m, n) nach endlich vielen Schritten.
Beweis:
Der Beweis erfolgt durch zwei ineinander geschachtelte Induktionen über m (äußere Induktion)
und, bei festem m, über n (innere Induktion). Induktionsanfang: m = 0
Es folgt unabhängig von n nur ein Aufruf.
Induktionsvoraussetzung: Die Behauptung sei richtig für alle k mit 0 ≤ k ≤ m, und für alle
n ∈ N.
Induktionsschluss: m + 1
Induktion über n
n = 0: Hier wird für A(m + 1, 0) der Wert A(m, 1) zurückgegeben. Hierfür terminiert
der Aufruf nach Induktionsvoraussetzung der äußeren Induktion. Induktionsvoraussetzung: Der Aufruf A(m + 1, l) terminiert für (festes) m und alle l ≤ n.
Induktionsschluss: n + 1
Der Aufruf von A(m + 1, n) erzeugt den Aufruf von A(m, A(m + 1, n − 1)). Nach innerer Induktionsvoraussetzung terminiert der Aufruf A(m + 1, n − 1) und liefert eine
Zahl k. Dies erzeugt den Aufruf A(m, k), der nach äußerer Induktionsvoraussetzung
terminiert.
5.5
Primzahlen
Die Bausteine der natürlichen Zahlen sind die Primzahlen. Dies wollen wir nun belegen.
Definition 5.5.1 Eine Zahl p ∈ N, p 6= 1, heißt Primzahl, falls aus p = kl mit k, l ∈ N folgt:
k = 1 oder l = 1 . (Später nennen wir k, l Teiler.)
Über die Existenz unendlich vieler Primzahlen war sich schon Euklid im Klaren. Die größte
Zahl, von der man zur Zeit L. Eulers wusste, dass sie eine Primzahl ist, war 231 − 1, eine Zahl
mit 10 Stellen. Zur Vorbereitung Euklids Beweises von der Existenz unendlich vieler Primzahlen
geben wir an:
Stand: 9. Februar 2010
62
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.5. PRIMZAHLEN
Lemma 5.5.2 Sei n ∈ N, n ≥ 2. Sei
T := {m ∈ N|m ≥ 2, n = km mit k ∈ N} .
Dann besitzt T ein (bezüglich ≤) kleinstes Element p und p ist eine Primzahl.
Beweis:
Sicherlich ist n ∈ T . Klar, nach dem Wohlordnungssatz 5.2.6 besitzt T ein kleinstes Element
p ∈ N, p ≥ 2; also p ≤ m für alle m ∈ T und n = kp mit k ∈ N .
Annahme: p ist keine Primzahl.
Dann gibt es l, j ∈ N, 2 ≤ l < p, mit p = lj . Dann gilt n = pk = l(jk), also l ∈ T, was im
Widerspruch zur Minimalität von p in T ist.
Satz 5.5.3 (Unendlichkeit der Primzahlen/Euklid) Es gibt unendlich viele Primzahlen.
Beweis:
Annahme: Es gibt nur endlich viele Primzahlen.
Seien p1 , . . . , pr diese Primzahlen. Setze N := p1 · · · pr + 1. Dann ist N ∈ N und N ≥ 2. Da
N > pi für jedes i = 1, . . . , r ist, ist N keine Primzahl. Also gibt es nach Lemma 5.5.2 eine
Primzahl p ∈ N mit N = kp, k ∈ N . Also kommt p unter p1 , . . . , pr vor; o.E. p = p1 . Dann folgt:
1 = p(k − p2 . . . pr ) .
Daraus liest man nun p = ab, was ein Widerspruch ist.
Die einzige gerade Primzahl ist 2. Alle anderen Primzahlen sind ungerade. Daraus folgt sofort,
dass diese Primzahlen von der Form 4m + 1 bzw. 4m + 3 mit m ∈ N sind. Also haben wir drei
Schubladen“ von Primzahlen:
”
P2 = {2} , P1 = {p|p Primzahl , p = 4m + 1} , P3 = {p|p Primzahl , p = 4m + 3} .
Nun bleibt die Frage, ob P1 und P3 unendlich viele Zahlen enthält. Dies ist so!
Bemerkung 5.5.4 J. Bertrand stellte die Vermutung auf, dass zwischen n und 2n stets eine
Primzahl liegt; er selbst verifizierte die Vermutung für n < 3000000 . Ein erster Beweis für die
vermutete Tatsache wurde 1850 von P. Tschebyscheff vorgelegt.
Wir geben hier nicht den Beweis
erbracht
werden kann, sondern verifiwieder, der durch eine sorgfältige Abschätzung von 2n
n
zieren die Vermutung nur für n < 4000 (Landau’s Trick): Hier ist eine Folge von Primzahlen,
von denen jeweils die Verdopplung größer als die folgende Zahl ist:
2, 3, 5, 7, 13, 23, 43, 83, 163, 317, 631, 1259, 2503, 4001
Beispiel 5.5.5 Lange Zeit glaubte man, dass die so genannten Fermatsche Zahlen
n
Fn := 22 + 1, n ∈ N ,
stets Primzahlen sind. Für n = 0, 1, 2, 3, 4 trifft dies zu:
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537 .
Im Jahre 1733 widerlegte L. Euler mit dem Beispiel F5 = 4294967297 = 641 · 6700417 die
Vermutung. Bisher hat man keine weitere Zahl Fn als Primzahl erkannt, im Gegenteil, die
Vermutung ist nun, dass keine Fermatzahl Fn , n ≥ 5, eine Primzahl ist. Die kleinste Fermatzahl,
von der man derzeit noch nicht weiß, ob sie eine Primzahl ist oder nicht, ist die Zahl F24 .
Beispielsweise ist F18 = 13631489 · k , wobei k eine Zahl mit 78906 Stellen ist.
Stand: 9. Februar 2010
63
c J.Baumeister
KAPITEL 5. ZÄHLEN
5.6. ÜBUNGEN
Wie kann man bei gegebener Zahl n entscheiden, ob es sich um eine Primzahl handelt oder
nicht? Liegt eine große Zahl vor, so ist die Aufgabe schwierig. Die Probiermethode, n sukzessive
auf Teiler zu untersuchen, kann man sehr schnell als sehr zeitraubend“ erkennen. Aktualität
”
erhielt die Frage bei der Suche nach Primzahltests in der Kryptologie. In der Kryptologie
beschäftigt man sich mit der Verschlüsselung von Nachrichten zum Zwecke der Geheimhaltung
und mit der Entschlüsselung zum Zwecke der Aufdeckung von Nachrichten.
5.6
1.)
Übungen
Sei g : N ∋ n 7−→ n(n2 + 11) ∈ N . Zeige:
(a)
g ist injektiv, aber nicht surjektiv.
(b) 6 ist ein Teiler von 3n2 + 3n + 12 für alle n ∈ N .
(c)
6 ist ein Teiler von g(n) für alle n ∈ N .
2.)
Ein deutsches Autokennzeichen besteht aus einer Kombination von ≤ 3 Buchstaben für
den Landkreis oder die Stadt, ≤ 2 weiteren Buchstaben und bis zu einer vierstelligen
Zahl. Bestimme die Anzahl der möglichen Kennzeichen (wenn man von einer Assoziation
mit dem Namen des Landkreises absieht).
3.)
Die Fibonacci-Zahlen Fn sind definiert durch
F0 := F1 := 1 , F n + 1 := Fn + Fn−1 , n ≥ 1 .
(a)
Schreibe ein rekursives Berechnungsschema und mache das rekursive Rechenschema
durch einen binären Baum klar.
(b) Welche überflüssige Rechenschritte lassen sich finden ?
4.)
Die Collatz/Kakutani/Klam/Ulam-Folge ist ausgehend vom Startwert c0 ∈ N folgendermaßen definiert:
(
1
cn
falls n gerade
,
cn+1 := 2
3cn + 1 sonst
wobei die Berechnung abgebrochen wird, wenn cn = 1 eintritt. Es ist bisher nicht gezeigt,
dass die Berechnung für jedes c0 abbricht.
Finde eine rekursive Funktion C : N −→ N , die die Länge der Collatz/Kakutani/Klam/UlamFolge in Abhängigkeit von c0 berechnet.
5.)
Finde einen Algorithmus, der die n-te Fibonacci-Zahl rekursiv berechnet.
Stand: 9. Februar 2010
64
c J.Baumeister
Kapitel 6
Elementare Arithmetik
Arithmetik ist das Teilgebiet der Mathematik, welches auch als Synonym zum Begriff Zahlentheorie verstanden werden kann. Elementare Arithmetik bezeichnet allgemein das Rechnen mit
natürlichen Zahlen und ganzen Zahlen und die Untersuchung der Konsequenzen, die sich daraus
ergeben, dass die Division in den ganzen Zahlen nur eingeschränkt möglich ist.
6.1
Ganze Zahlen
In Abschnitt 5.1 haben wir die natürlichen Zahlen geschaffen“. Skizzieren wollen wir nun den
”
Konstruktionsweg von den natürlichen Zahlen zu den ganzen Zahlen. Wir sehen dabei die Nützlichkeit des Begriffs der Äquivalenzrelation“ ein. Auf N × N läßt sich nämlich eine Äquivalenzrelation durch
R := {((m, n), (k, l)) ∈ N2 × N2 |m + l = n + k} ,
d.h.
(m, n) ∼ (k, l) : ⇐⇒ m + l = n + k ,
einführen. Man bestätigt leicht, dass in der Tat eine Äquivalenzrelation vorliegt. Etwa folgt die
Symmetrie allein schon aus der Kommutativität der Addition in den natürlichen Zahlen; siehe
Rechenregel 5.2.
Die Zuordnung eines Paares (m, n) zu einer Klasse [(k, l)] geschieht unter dem Gesichtspunkt,
dass die Differenz m − n gleich der Differenz k − l ist und dies liefert den Zusammenhang zur
Menge der ganzen Zahlen Z, wenn wir sie schon als bekannt voraussetzten. Also sollte etwa
[(n, n)] für 0 ,
[(n + 1, n)] für 1 , [(n, n + 1)] für − 1 ,
[(n + n, n)] für n , [(n, n + n)] für − n ,
stehen. Der Weg, ausgehend von der Kenntnis der natürlichen Zahlen, die ganzen Zahlen zu
konstruieren, ist also vorgezeichnet:
Man führe Z als Menge der Äquivalenzklassen (N × N)/ R ein.
Vervollständigt wird dieser Schritt durch die Beobachtung, daß durch
[(m, n)] ⊕ [(k, l)] := [(m + k, n + l)]
eine Addition und durch
[(m, n)] ⊙ [(k, l)] := [(m · k + n · l, m · l + n · k)]
65
KAPITEL 6. ELEMENTARE ARITHMETIK
6.1. GANZE ZAHLEN
eine Multiplikation eingeführt wird. Die Anordnung der ganzen Zahlen spiegelt sich in
[(m, n)] ⊳ [(k, l)] : ⇐⇒ m + l < n + k bzw. [(m, n)] [(k, l)] : ⇐⇒ m + l ≤ n + k
wieder. Hierbei ist ja “ < , ≤ “ schon von den natürlichen Zahlen her bekannt. Beachte bei diesen
Definitionen stets, dass [(m, n)] für m−n stehen sollte. Ergänzend sei nun noch die Subtraktion
[(m, n)] ⊖ [(k, l)] := [(m, n)] ⊕ [(l, k)] .
eingeführt.
Bemerkung 6.1.1 Wenn man mit Äquivalenzklassen neue Objekte unter Verwendung von Repräsentanten für die Klassen definiert, hat man sich zu vergewissern, dass die Definition vom
Repräsentanten für die Klasse unabhängig ist. Dies ist oben bei der Definition der Addition,
Multiplikation und Kleiner–Beziehung der Fall. Bei der Addition etwa bedeutet dies, nachzuweisen, dass [(m, n)] ⊕ [(k, l)] = [(m′ , n′ )] ⊕ [(k′ , l′ )] ist, falls [(m, n)] = [(m′ , n′ )] , [(k, l)] = [(k′ , l′ )]
gilt. Dies sieht man mit Hilfe der Identitäten m + n′ = m′ + n , k + l′ = k′ + l sofort ein.
Entsprechend unserer Hinführung finden wir die natürlichen Zahlen wieder als Teilmenge
e := {[(n + n, n)]|n ∈ N} . Auch diese Menge erfüllt nun die Peano–Axiome:
N
e;
• 1̃ := [(n + 1, n)] ∈ N
• n]
+ 1 := [(n + n + 1, n)] Nachfolger von n
e;
• 1̃ ist kein Nachfolger, denn aus 1̃ = [(n+n+1, n)] folgt sofort die widersprüchliche Aussage
1 = n + 1;
f ⊂ N,
e so dass 1̃ ∈ M
f und (ñ ∈ M
f =⇒ n]
f), dann ist offenbar M
f=N
e.
• Ist M
+1∈M
e , n ∈ N und die Null 0̃ := [(n, n)] .
Zusätzlich haben wir die negativen Zahlen [(n, n + n)] ∈ N
Die aufwendige Schreibweise wollen wir nun aber wieder vermeiden. Wir tun dies, indem wir,
statt die Existenz der natürlichen Zahlen axiomatisch zu fordern, die ganzen Zahlen axiomatisch
einführen.
Es gibt Mengen N, Z , ein Element 0 ∈ Z, Abbildungen
Z × Z ∋ (a, b) 7−→ a + b ∈ Z,
Z × Z ∋ (a, b) 7−→ a · b ∈ Z,
und eine Vergleichsoperation ≤ mit folgenden Eigenschaften:
1. (a + b) + c = a + (b + c) für alle a, b, c ∈ Z .
2. a + 0 = 0 + a für alle a ∈ Z .
3. Zu a ∈ Z gibt es genau ein (−a) ∈ Z mit
(a + (−a)) = 0 = ((−a) + a) .
4. a + b = b + a für alle a, b ∈ Z .
5. (a · b) · c = a · (b · c) für alle a, b, c ∈ Z .
6. a · b = b · a für alle a, b ∈ Z .
7. a · (b + c) = a · b + a · c für alle a, b, c ∈ Z .
8. N ⊂ Z , 1 6= 0 , Z = N ∪ {0} ∪ −N .
9. 1 · a = a , 0 · a = 0 für alle a ∈ Z .
10. a ≤ b ⇐⇒ b + (−a) ∈ N ∪ {0} .
Stand: 9. Februar 2010
66
(Addition)
(Multiplikation)
(Assoziativgesetz)
(0 ist neutrales Element)
((−a) ist Negatives von a)
(Kommutativgesetz)
(Assoziativgesetz)
(Kommutativgesetz)
(Distributivgesetz)
(1 ist neutrales Element)
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.2. TEILBARKEIT
Man beachte aber, dass nur die Existenz der natürlichen Zahlen eine wesentliche Forderung ist.
Wir tun dies durch Anführung von Eigenschaften, die das übliche Rechnen in den ganzen Zahlen
möglich machen. (Wir legen dabei nicht Wert auf ein minimales Gerüst von Axiomen.)
Dies deckt sich mit obiger Konstruktion. Zur Abkürzung führen wir noch die Subtraktion
durch
Z × Z ∋ (a, b) 7−→ a − b := a + (−b) ∈ Z
ein, schreiben meist kurz
ab für a · b
und vereinbaren die Schreibweise
a < b für a ≤ b, a 6= b .
Damit können wir nun in Z und N genauso rechnen, wie wir es gewohnt sind.
6.2
Teilbarkeit
Definition 6.2.1 Seien a, b ∈ Z. Wir sagen, dass a die Zahl b teilt, wenn es k ∈ Z gibt mit
b = ka. Wir schreiben dafür a|b .
Ist b nicht durch a teilbar, so schreiben wir a 6 | b.
Srechweisen:
Für a|b: a teilt b, b ist Teiler von a, a ist durch b teilbar.
Für a 6 | b: a teilt b nicht, b ist kein Teiler von a, a ist nicht durch b teilbar.
Korollar 6.2.2 Seien a, b, c, d ∈ Z. Dann gilt:
(1) a|a; a|b und b|a =⇒ a = ±b; a|b und b|c =⇒ a|c.
(2) d|a und d|b =⇒ d|(ax + by) für alle x, y ∈ Z.
(3) a|b und a|(b + c) =⇒ a|c.
Beweis:
Zu 1. a|a, da a = 1 · a.
Es gibt k, l ∈ Z mit b = ka, a = lb. Ist b = 0, dann ist a = 0 und nichts ist mehr zu zeigen. Sei
nun b 6= 0; o.E. b > 0. Dann folgt aus b = klb offenbar kl ∈ N, kl = 1 und damit k = ±1, l = ±1.
Wir haben b = ka, c = lb mit k, l ∈ Z. Daraus folgt c = lb = lka, also a|c.
Zu 2. Wir haben a = kd, b = ld. Seien x, y ∈ Z. Dann gilt ax + by = kdx + ldy = (kx + ly)d;
also d|(ax + by) .
Zu 3. Wir haben b = ka, b + c = la mit k, l ∈ Z. Daraus folgt c = la − b = la − ka = (l − k)a,
also a|c.
Bei Teilbarkeitsfragen in Z können wir uns in der Regel immer auf positive Teiler, d.h. auf
Teiler in N, zurückziehen, da von den zwei Zahlen a, −a stets eine in N liegt, falls a 6= 0; der Fall
a = 0 ist uninteressant, da dann auch b = 0 .
In diesem Abschnitt kommen wir ausschließlich mit den Eigenschaften der ganzen Zahlen
aus, wie sie sich aus der axiomatischen Einführung der natürlichen Zahlen mittels der Peano–
Axiome ergaben; insbesondere haben wir die Rechenarten“ +, −, ·, ≤, < uneingeschränkt zur
”
Stand: 9. Februar 2010
67
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.2. TEILBARKEIT
Verfügung. Nicht zur Verfügung steht die Division ÷, eine Tatsache, die die Reichhaltigkeit der
Resultate bzgl. Teilbarkeit beschert.
Fragt man nach gemeinsamen Teilern zweier ganzer Zahlen a, b, so interessiert insbesondere der größte dieser gemeinsamen Teiler. Dabei können wir uns dann auf positive Teiler beschränken, denn 1 ist stets ein gemeinsamer Teiler von a und b.
Definition 6.2.3 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl d ∈ N heißt größter gemeinsamer Teiler von a, b genau dann, wenn
(1) d|a , d|b
(2) Ist d′ ∈ N ein Teiler von a und b, so teilt d′ auch d
gilt. Wir schreiben d = ggT (a, b) = a ⊓ b .
Der größte gemeinsame Teiler d gemäß Definition 6.2.3 ist eindeutig bestimmt dank der
Tatsache, dass wir d ∈ N gefordert haben.
Es sollte klar sein, wie nun der größte gemeinsame Teiler von endlich vielen ganzen Zahlen
erklärt ist. Beispiel:
6 ⊓ 10 = 2, 6 ⊓ 10 ⊓ 30 = 2, 6 ⊓ 10 ⊓ 15 = (6 ⊓ 10) ⊓ 15 = 6 ⊓ (10 ⊓ 15) = 1 .
Definition 6.2.4 Seien a, b ∈ Z. Gilt a ⊓ b = 1 , so nennen wir a, b teilerfremd.
Lemma 6.2.5 Seien a, b ∈ Z nicht beide Null. Dann gilt a ⊓ b = (−a) ⊓ b = (−a) ⊓ (−b) =
a ⊓ (−b) .
Beweis:
Wir beweisen etwa die erste Gleichheit. Diese folgt aber aus der einfachen Beobachtung, dass d
ein Teiler von a und b genau dann ist, wenn d ein Teiler von −a und b ist.
Wir suchen den größten gemeinsamen Teiler von Zahlen a, b ∈ Z . Beachte, dass es wegen
Lemma 6.2.5 ausreicht, den größten gemeinsamen Teiler für Zahlen in N zu berechnen.
Satz 6.2.6 (Division mit Rest) Für alle a ∈ Z, b ∈ N gibt es eindeutig bestimmte Zahlen
q, r ∈ Z mit
a = bq + r und 0 ≤ r < b.
Beweis:
Wir beweisen zunächst die Existenz von q, r für a ≥ 0 durch vollständige Induktion:
a = 0 : Setze q := r := 0 .
a + 1 : Ist a + 1 < b, so gilt a + 1 = 0b + (a + 1) und wir sind fertig. Ist a + 1 ≥ b, so folgt aus
der Induktionsvoraussetzung a + 1 − b = qb + r mit q ∈ Z, 0 ≤ r < b. Also a + 1 = (q + 1)b + r.
Die Existenz folgt für a < 0 aus der Anwendung der eben bewiesenen Aussage auf −a gemäß
−a = q ′ b + r ′ , 0 ≤ r ′ < b
durch
a=
Stand: 9. Februar 2010
(−q ′ − 1)b + (b − r ′ ) , falls r ′ 6= 0
(−q ′ )b
, falls r ′ = 0
68
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Um die Eindeutigkeit zu beweisen, nehmen wir ein zweites Zahlenpaar q ′ , r ′ mit
a = q′b + r′, 0 ≤ r′ < b ,
wobei o. E. r ≥ r ′ sei. Dann ist 0 ≤ r − r ′ < b, r − r ′ = (q − q ′ )b, q − q ′ ≥ 0, und dies ist nur mit
q ′ = q, r = r ′ verträglich.
Lemma 6.2.7 Sei a ∈ Z und b ∈ N. Dann folgt aus der Darstellung a = qb + r , q ∈ Z, die
Aussage a ⊓ b = b ⊓ r.
Beweis:
Ist d ein Teiler von a, b, dann ist d ein Teiler von b und r und umgekehrt (siehe Folgerung 6.2.2).
6.3
Euklidischer Algorithmus
Algorithm 1 Der euklidische Algorithmus
EIN a, b ∈ Z ; o.E. a ≥ b > 0 .
Schritt 0 a′ := a, b′ := b .
Schritt 1 (a′ , b′ ) := (b′ , r), wobei a′ = qb′ + r mit 0 ≤ r < b′ ist.
Schritt 2 Ist r = 0, gehe zu AUS. Ist r 6= 0, setze a′ := b′ , b′ := r, gehe zu Schritt 1.
AUS d := b′ = a ⊓ b .
Die Aussage, dass d der größte gemeinsame Teiler von a, b ist, falls die Situation r = 0 erreicht
wird, folgt aus dem Lemma 6.2.7. Bleibt noch zu klären, dass die Situation r = 0 in endlich
vielen Schritten wirklich erreicht wird. Dies folgt aber aus der Tatsache, dass für zwei aufeinanderfolgende Durchläufe von Schritt 1 (a′ , b′ ) , (a′′ , b′′ ) sicherlich 0 ≤ b′′ < b′ , b′ , b′′ ∈ N0 gilt.
Also muss schließlich das Verfahren bei r = 0 abbrechen.
Der euklidische Algorithmus gilt als ein recht schneller Algorithmus: um den größten gemeinsamen Teiler d von a, b auszurechnen, ist etwa soviel Aufwand wie für die Multiplikation von a
und b nötig. Er findet vielfältig Anwendung in der mathematischen Informatik.
Wir geben dem Euklidischen Algorithmus, wohlwissend, dass der Schritt 1 nur endlich oft
durchlaufen wird, eine explizite Fassung:
Euklidischer Algorithmus
Kettenbruchentwicklung
a
b
r0
r1
r1
r2
r0 := a , r1 := b,
r0
=
q1 r1 + r2 , 0 < r2 < r1 ,
r1
=
q2 r2 + r3 , 0 < r3 < r2 ,
..
.
..
.
rk−1
=
qk rk + rk+1 , 0 < rk+1 < rk ,
rk
=
qk+1 rk+1 ,
Stand: 9. Februar 2010
..
.
rk−2
rk−1
rk
rk+1
69
=
r0
r1
= q1 + rr12
= q2 + rr3
2
..
.
= qk + r rk
k−1
= qk+1
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
In dieser Darstellung ist rk+1 = rk−1 ⊓ rk = · · · = r0 ⊓ r1 = a ⊓ b nach Lemma 6.2.7.
Beachte: Bei der Spalte Kettenbruchentwicklung“ haben wir Brüche vorweggenommen. Für
”
ein Verständnis der Kettenbruchentwicklung reicht ein elementares Wissen über rationale Zahlen
aus.
Beispiel 6.3.1 a = 104629 , b = 432000 .
104629 = 0 · 432000 + 104629
432000 = 4 · 104629 + 13484
104629 = 7 · 13484 + 10241
13484 = 1 · 10241 + 3243
10241 = 3 · 3243 + 512
3243 = 6 · 512 + 171
512 = 2 · 171 + 170
171 = 1 · 170 + 1
170 = 170 · 1
Also gilt: 104629 ⊓ 432000 = 1 .
Aus der obigen Darstellung des euklidischen Algorithmus lesen wir
r0
r2
1
1
1
a
= ...
(6.1)
=
= q1 +
= q1 + r1 = q1 +
=
q
+
1
r
1
b
r1
r1
q2 + r32
q2 +
r2
r4
q3 +
r3
r
ab; wir wissen dabei, dass stets 0 < k+1
rk < 1 gilt und dass das Schema nach k Schritten abbricht, denn in formaler Interpretation haben wir rk+2 = 0 . Die berechneten Größen q1 , . . . , qk+1
schreiben als
a
[q1 , . . . , qk+1 ] oder = [q1 , . . . , qk+1 ]
b
auf und bezeichnen dies als Kettenbruch. Der Kettenbruch kann mitunter auch sehr lang“
”
sein. In vielen Fällen ist man schon mit einer Näherung [q1 , . . . , ql ] , 1 ≤ l < k + 1 , zufrieden,
d.h. mit der Näherung, die entsteht, wenn man
rl
rl+1
=0
setzt.
Beispiel 6.3.2 Die Zahlen
a = 71755875
b = 61735500
kommen in Berechnungen des Astronomen Aristarchus von Samos vor. Für a verwendet er die
b
43 . Sie ergibt sich, wenn man den Kettenbruch geeignet abbricht:
Näherung 37
a
1
.
∼1+
b
6 + 61
Stand: 9. Februar 2010
70
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Beispiel 6.3.3 Die Umlaufzeit der Erde um die Sonne beträgt ziemlich genau
365 +
104629
Tage .
432000
Aus der Kettenbruchentwicklung
432000
= [0, 4, 7, 1, 3, 6, 2, 1, 170]
104629
ergeben sich Ansätze für Kalender:
[0] = 0
[0, 4] =
Keine Schaltjahre
(Anpassung von Zeit zur Zeit durch Hinzufügen eines Tages)
1
4
[0, 4, 7, 3, 6] =
Alle vier Jahre ein Schalttag
194
801
In 800 Jahren läßt man sechs Schaltjahre ausfallen
(und zwar in den Jahren, deren Jahreszahlen durch 400 teilbar ist.)
Beachte: Da a1 ⊓ a2 ⊓ · · · ⊓ an = a1 ⊓ (a2 ⊓ · · · ⊓ an ) gilt, ist klar, dass wir nun auch ein
Verfahren haben, das den größten gemeinsamen Teiler von a1 , . . . , an bereitstellt: Man hat es
nur mehrmals anzuwenden.
Eine wichtige Konsequenz aus dem Euklidischen Algorithmus ist
Satz 6.3.4 (Lemma von Bezout) Seien a, b ∈ Z. Dann gibt es Zahlen s, t ∈ Z mit a ⊓ b =
sa + tb .
Beweis:
O.E. a ≥ b > 0 .
Die Aussage folgt dadurch, dass wir den euklidischen Algorithmus in der expliziten Fassung
rückwärts lesen. Wir strukturieren dies, indem wir nachrechnen, dass für 0 ≤ i ≤ k + 1 gilt
ri = si a + ti b , mit si , ti ∈ Z.
(6.2)
Dies ergibt sich so: Für i = 0 setze s0 := 1, t0 := 0 und für i = 1 setzte s1 := 0, t1 := 1 . Nun
setzen wir
si+1 := si−1 − qi si , ti+1 := ti−1 − qi ti , 1 ≤ i ≤ k.
(6.3)
Dann gilt offenbar die obige Aussage.
Beispiel 6.3.5 Wir betrachten wieder Beispiel 6.3.1. Für das Tupel (ri , qi , si , ti ) haben wir dann
nach (6.2) und (6.3) die folgende Sequenz (× bedeutet uninteressant oder nicht definiert):
(36667, ×, 1, 0), (12247, 2, 0, 1), (12173, 1, 1, −2), (74, 164, −1, 3), (37, ×, 165, −494).
Also haben wir
37 = 36667 ⊓ 12247 = 165 · 36667 − 494 · 12247
Korollar 6.3.6 Seien a, m ∈ Z, die nicht beide Null sind, mit a ⊓ m = 1 . Dann gibt es b ∈ Z
mit m|(ab − 1) .
Stand: 9. Februar 2010
71
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Beweis:
Wir wissen aus dem Lemma von Bezout 1 = ax + my mit x, y ∈ Z . Setze b := x . Dann ist
ab − 1 = −my = m(−y) .
Die obige Folgerung können wir so lesen, dass bei Teilerfremdheit von a und m zu a eine Zahl
b existiert, die die Gleichung
a·b=1
bis auf ein Vielfaches von m löst.
Bemerkung 6.3.7 Ein Polynom vom Grade n mit ganzzahligen Koeffizienten ist ein Term“
”
der folgenden Form:
p(x) := an xn + an−1 xn−1 + · · · + a1 x + a0 ;
dabei sind a0 , . . . , an−1 ∈ Z die Koeffizienten des Polynoms und n der Grad, wenn n 6= 0 . Dieses
Polynom kann einerseits selbständiges Objekt im Ring Z[X] aller dieser Terme von beliebigem
Grad oder als Abbildung von Z nach Z betrachtet werden. Wir nehmen zunächst den ersten
Standpunkt ein. Ring“ meint, dass man solche Terme (koeffizientenweise) addieren und mit
”
ganzen Zahlen multiplizieren kann. Umgekehrt, kann man nun versuchen, zwei Terme dieser
Art zu dividieren“; man wird zur Division mit Rest bei Polynomen geführt. Auf unserer
”
ganzzahligen Basis können wir diese nicht vorstellen, denn dazu brauchen wir die rationalen
Zahlen; wir kommen im nächsten Kapitel darauf zurück.
Kommen wir nochmals auf Primzahlen zurück. Dies sind natürliche Zahlen p 6= 1, die nur die
Teiler 1 und p haben. Wir wissen schon, dass es unendlich viele Primzahlen gibt.
Maple - Illustration 6.1
Maple kennt die ganzen Zahlen
und die rationalen Zahlen, wobei
die Anzahl der Stellen von Zähler
und Nenner jeweils auf 524279
beschränkt ist. Mit diesen Zahlen rechnet Maple exakt.
Der Befehl ifactor zerlegt eine
ganze Zahl in ihre Primfaktoren.
Hier haben wir mit ‘‘“ das letz”
te Ergebnis aufgerufen.
Mit isprime überprüft man Zahlen auf die Eigenschaft, Primzahl
zu sein.
4
> 2(2 ) ;
65536
> ifactor(‘‘);
(2)16
> seq(k2 -k-41, k= 34..41);
1163,1231,1301,1373,1447,1523,1601,1681
> seq(isprime(k2-k-41), k= 35..41);
true,true,true,true,true,true,true,false
Ein Primzahltest leitet sich aus der Äquivalenz
n Primzahl ⇐⇒ n|((n − 1)! + 1)
ab. Diese Äquivalenz wird als Satz von Wilson bezeichnet.1
1
Schon G.W. Leibniz hat diesen Satz vermutet, der erste vollständige Beweis stammt von J.L. Lagrange2 , etwa
100 Jahre später hat ihn J. Wilson nachentdeckt. Man sieht schnell, dass, was den Rechenaufwand betrifft, nicht
viel gewonnen ist, denn (n − 1)! auszurechnen, ist eine aufwendige Angelegenheit.
Stand: 9. Februar 2010
72
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.3. EUKLIDISCHER ALGORITHMUS
Die Probiermethode – man probiere alle Primzahlen p ≤ n als mögliche Teiler durch – kann
dahin verbessert werden, dass man nur solche p mit p2 ≤ n durchzuprobieren hat, da bei einer
Zerlegung n = pq, p, q Primzahlen, für einen der beiden Faktoren sicherlich gilt, dass er dem
Quadrate nach nicht grö”ser als n ist. Aber hier hat man das Problem, dass man von allen
Zahlen z mit z 2 ≤ n wissen sollte, ob sie Primzahlen sind. Da aber jede Primzahl p von der
Form p = 6k±1, k ∈ N, ist (Beweis!) können wir dieses Problem umgehen, indem wir mit solchen
6k ± 1 testen. Man hat dann aber immer noch mit einer Anzahl von Zahlen zu testen, die etwa
bei einer 100–stelligen Zahl einen nicht zu bewältigender Aufwand darstellt.
Korollar 6.3.8 (Lemma von Euklid) Teilt eine Primzahl ein Produkt a1 · · · ar natürlicher
Zahlen, so teilt p wenigstens einen der Faktoren a1 , . . . , ar .
Beweis:
O. E. sei r = 2. Also haben wir a1 a2 = kp mit k ∈ N . Teilt p die Zahl a1 nicht, dann ist
p ⊓ a1 = 1, da p eine Primzahl ist, und es gibt nach Satz 6.3.4 s, t ∈ Z mit 1 = sp + ta1 . Daraus
folgt a2 = spa2 + ta1 a2 = p(sa2 + tk). Also teilt p die Zahl a2 .
Bevor wir den Hauptsatz der elementaren Zahlentheorie, die Primfaktorzerlegung, beweisen,
formulieren noch eine Schreibweise/Vereinbarung: Das Produkt von Zahlen a1 , . . . , an+1
definieren wir induktiv
0
Y
ai := 1 (leeres Produkt) ,
1
Y
ai := a1
(einfaches Produkt) ,
i=1
i=1
i=1
n+1
Y
ai := an+1 ·
n
Y
ai .
i=1
Satz 6.3.9 (Primfaktorzerlegung) Jede natürliche Zahl n ≥ 2 läßt sich bis auf die Reihenfolge der Faktoren eindeutig als Produkt von Primzahlen darstellen.
Beweis:
Die Existenz einer Darstellung für n ∈ N beweisen wir induktiv:
Für n = 2 ist dies nach der obigen Vereinbarung über das einfache Produkt klar.
n + 1 : Ist n + 1 eine Primzahl, dann ist nach Vereinbarung über das einfache Produkt nichts
mehr zu zeigen. Anderenfalls gilt n + 1 = pm mit 1 < p, m < n + 1. O.E. können wir nun annehmen nach Lemma 5.5.2, dass m einen Teiler p besitzt, der eine Primzahl ist; also n + 1 = pm
mit 1 < p, m < n + 1 . Nach Induktionsvoraussetzung gilt m = p2 · · · pr , p2 , . . . , pr Primzahlen.
Dann liegt in n + 1 = pp2 · · · pr eine Zerlegung von n + 1 in Primfaktoren vor.
Zur Eindeutigkeit: Sei n = p1 · · · pr = q1 · · · qs mit Primzahlen p1 , . . . , pr , q1 , . . . , qs . Durch Induktion über n zeigen wird, dass r = s und nach Umnumerierung p1 = q1 , . . . , pr = qr gilt.
p1 teilt das Produkt q1 · · · qs und damit einen der Faktoren q1 , . . . , qs . Also etwa nach Umnumerierung p1 |q1 . Da q1 Primzahl ist, ist p1 = q1 . Also (Kürzungsregel) p2 · · · pr = q2 · · · qs =: m .
Da m < n gilt, sagt die Induktionsannahme r = s, p2 = q2 , . . . , pr = qs nach eventueller Umnumerierung und wir sind fertig.
Die Herstellung der Primfaktorzerlegung einer (großen) Zahl ist kein leichtes Unterfangen.
Die Schwierigkeit wird dadurch beleuchtet, dass nahezu gleiche Zahlen eine sehr verschiedene
Primfaktorzerlegung besitzen können:
370273 = 43 · 79 · 109 , 370277 = 17 · 23 · 947 , 370279 = 7 · 13 · 13 · 313 .
Definition 6.3.10 Seien a, b ∈ Z, die nicht beide 0 sind. Eine Zahl k ∈ N heißt kleinstes
gemeinsames Vielfaches von a, b genau dann, wenn gilt:
(1) a|k , b|k .
Stand: 9. Februar 2010
73
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.4. MODULARE ARITHMETIK
(2) Sind a, b Teiler von k′ ∈ N, so ist k ein Teiler von k′ .
Wir schreiben k = kgV (a, b) = a ⊔ b .
Bemerkung 6.3.11 Das kleinste gemeinsame Vielfache von Zahlen a, b ∈ N ist die kleinste
Zahl m ∈ N, für die a|m , b|m gilt. Kennt man die Primfaktorzerlegung von a und b, so kann
man es sehr einfach ablesen(, wie übrigens auch den größten gemeinsamen Teiler).
6.4
Modulare Arithmetik
Die modulare Arithmetik beschreibt das Rechnen im Ring Zm , wobei m ∈ N, m ≥ 2, der gewählte
Modul ist. Der Ring Zm kommt als Menge der Äquivalenzklassen/Restklassen bezüglich der
Äquivalenzrelation Division mit Rest“ bezüglich des Moduls m zustande:
”
Zm := {[0], [1], . . . , [m − 1]} wobei [i] := {n ∈ N|n = qm + i für ein q ∈ Z} .
Beachte, dass etwa die Klasse [1] auch als die Klasse [m + 1] beschrieben werden kann; wir haben
in der Definition von Zm ein naheliegendes Representantensystem gewählt.
Klar, für m = 2 erhalten wir gerade die Einteilung der natürlichen Zahlen in die Klassen gerade Zahlen und ungerade Zahlen. Für diese Klassen hat man in natürlicher Weise eine Addition
und eine Multiplikation:
gerade + gerade = gerade , ungerade + gerade = ungerade
gerade · gerade = gerade , ungerade · gerade = gerade
Diese Beobachtung schreiben wir nun fort auf Zm :
Addition: [i] + [j] := [i + j] , i, j ∈ {0, 1, . . . , m − 1} ;
Multiplikation: [i] · [j] := [ij] , i, j ∈ {0, 1, . . . , m − 1} .
Damit dies wohldefiniert ist, muss noch gezeigt werden: aus [i] = [j], [i′ ] = [j ′ ] folgt [i+j] = [i′ +j ′ ]
und [ij] = [i′ j ′ ] . Wir beweisen dies am Beispiel der Multiplikation. [i] = [j], [i′ ] = [j ′ ] bedeutet
i′ = pm + i, j ′ = qm + j für p, q ∈ Z . Daraus folgt
i′ j ′ = (pm + i)(qm + j) = (iqm + jpm + pqm)m + ij also [ij] = [i′ j ′ ] .
[0] ist das neutrale Element für die Addition, [1] ist das neutrale Element für die Multiplikation:
[i] + [0] := [i] , [i] · [1] = [i] , i, j ∈ {0, 1, . . . , m − 1} .
Weiterhin ist leicht zu sehen, dass [m − i] das Inverse von [i] bezüglich der Addition ist. Nun
fassen wir zusammen: Zm ist bezüglich der Addition eine kommutative Gruppe. Dieses Ergebnis
gilt unabhängig von m.
Für die Multiplikation ist die Situation nicht so einfach, denn es gibt die Situation, dass
Nullteiler auftreten; etwa
[2] · [2] = [2 · 2] = [0] in Zm für m = 4 .
Also kann hier [2] kein Inverses bezüglich der Multiplikation haben. Ist nun m eine Primzahl,
dann ist, wie wir wissen, die Klasse [1] ein neutrales Element und aus dem Lemma von Bezout
6.3.4 folgern wir, dass es zu jeder Zahl k = 1, . . . , m − 1 ein l ∈ N gibt mit m teilt kl − 1;
d.h. [k] · [l] = [1] . Somit hat man für jedes Element in Zm \{[0]} ein Inverses. Nun fassen wir
zusammen: Zm \{[0]} ist bezüglich der Multiplikation eine kommutative Gruppe, falls m eine
Stand: 9. Februar 2010
74
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
+
[0] [1] [2] [3] [4]
[0]
[0] [1] [2] [3] [4]
·
[1] [2] [3] [4]
[1]
[1] [2] [3] [4] [0]
[1]
[1] [2] [3] [4]
[2]
[2] [3] [4] [0] [1]
[2]
[2] [4] [1] [3]
[3]
[3] [4] [0] [1] [2]
[3]
[3] [1] [4] [2]
[4]
[4] [0] [1] [2] [3]
[4]
[4] [3] [2] [1]
(b)
(a)
Abbildung 6.1: Gruppentafeln zu Z5
+
0 1 a b
·
0 1 a b
0
0 1 a b
0
0 0 0 0
1
1 0
b
a
1
0 1 a b
a
a b
0 1
a
0 a b
b
b a 1 0
b
0 b
(a)
1
1 a
(b)
Abbildung 6.2: Gruppentafeln zu einem Körper mit 4 Elementen
Primzahl ist.
Die Gruppentafeln – so bezeichnen wir eine vollständige Auflistung der Verknüpfungen der
Gruppenelemente – zu m = 5 sehen wie in 6.1 aufgeführt aus.
Man beachte, dass sowohl in der Gruppentafel zur Addition als auch in der Gruppentafel zur
Multiplikation in jeder Zeile und Spalte jede Klasse genau einmal vertreten ist. Beachte ferner,
dass die Potenzen des Elements [2] alle Elemente von Z∗5 := Z5 \{[0]} durchlaufen:
[2]0 = [1] , [2]1 = [2] , [2]2 = [4] , [2]3 = [3] , [2]4 = [1] .
Man nennt eine Gruppe, die ein solches zyklisches Element besitzt, eine zyklische Gruppe.
Bemerkung 6.4.1 Für beliebiges m ∈ N, m ≥ 2, ist (Zm , +, ·) ein Ring mit Einselement. Ist
p ∈ N eine Primzahl, so ist (Zm , +, ·) sogar ein Körper, ein endlicher, denn Zp hat ja (nur)
p Elemente. Damit kennen wir zu jeder Primzahl p einen Körper mit p Elementen. Wie sieht
es aber mit den Lücken m = 4, m = 6, m = 8, . . . aus? Es gibt das diese Frage abschließende
Resultat, dass es einen Körper mit m Elementen genau dann gibt, wenn m eine Primzahlpotenz
ist. In 6.2 findet man einen Körper mit 4 Elementen in abstrakter, d.h. nicht in einer schon
durch bekannte Objekte beschriebene Form.
Wo werden endliche Körper benötigt? Allgemein in der Diskreten Mathematik, der Mathematischen Informatik und speziell in der Verschlüsselung von Daten.
6.5
Pseudozufallszahlen
Um die umständliche Verwendung von Tabellen zu vermeiden, werden Folgen von Zufallszahlen
verwendet, die im Allgemeinen durch Iterationen hergestellt werden; wir sprechen von Pseudozufallszahlen. Darunter versteht man mathematisch wohldefinierte Zahlenfolgen, die als Folgen
Stand: 9. Februar 2010
75
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
von Zufallszahlen angesehen werden sollen. Diese Zufallszahlen haben den Vorteil, dass sie reproduzierbar sind, und haben den Nachteil, dass sie deterministischen Charakter besitzen. Alles,
was wir hier zur Sprechweise Zufallszahl“ sagen können, ist, dass jedenfalls kein Muster, keine
”
Struktur in der Folge erkennbar sein soll. Die Wahrscheinlichkeitstheorie und Statistik stellt
Hilfsmittel bereit, solche Folgen auf ihre Zufälligkeit zu testen.
Zunächst einige allgemeine Bemerkungen. Sei M eine endliche Menge. Pseudozufallszahlen,
deren Konstruktionsmethode wir hier besprechen wollen, ergeben sich als Iterierte einer Funktion
f : M −→ M
in folgender Weise:
xn+1 := f (xn ) , n ∈ N0 .
(6.4)
Der Startwert x0 heißt Samen der Pseudozufallsfolge (xn )n∈N die Folge selbst heißt auch Orbit
und die Funktion f heißt der Generator.
Die Folge ist durch die Wahl von f und x0 vollständig bestimmt; es handelt sich also um keine
echte Zufallsfolge. Durch geschickte Wahl von f – gewünscht wird eine gute Durchmischung von
M – kann man jedoch erreichen, dass sich die Folge für viele Anwendungen wie eine Zufallsfolge
verhält.
Da die Menge M endlich ist, können nicht alle Folgenglieder xn verschieden sein. Es gibt
also Indizes k, l mit xk = xl ; o. E. k > l . Seien k, l die ersten Indizes, für die dies eintritt.
Sei damit r := k − l . Da xk = xl gilt, folgt xn+r = xn für alle n ≥ l . Also wird der Orbit
(xn )n∈N periodisch mit Periode r ; wir haben einen Zyklus der Länge r . Verlangt man, dass
jedes Element der Menge M die Chance hat im Orbit aufzutauchen, muss der Zyklus ganz M
umfassen. Daraus folgt, dass die Abbildung f surjektiv sein muss. Da M endlich ist, hat f also
sogar bijektiv zu sein. Wir werden unten sehen, dass die Bijektivität keineswegs dafür schon
ausreicht, ein guter Generator zu sein.
Die Pseudozufallszahlengeneratoren, die wir hier besprechen wollen, sind ausschließlich affine
Generatoren; also
M := Zm ; f : Zm ∋ [x] 7−→ ([ax] + [b]) ∈ Zm ,
(6.5)
mit einem Modul m . Hier sind a.b ∈ Z .
Wir bezeichnen (6.5) auch als Kongruenz–Generator, denn Rechnen in Kongruenzen ist
nichts anderes als das Rechnen in Restklassen. Wir führen die zugehörige Schreibweise ein.
Mit u, v ∈ Z schreiben wir:
u=v
mod m : ⇐⇒ [u] = [v] ⇐⇒ m|(u − v) .
Damit lautet die Rechenvorschrift für den Kongruenz–Generator
M := {0, . . . , m − 1} ; f : M ∋ x 7−→ ax + b
mod m ∈ M .
(6.6)
Bemerkung 6.5.1 Durch die Generatoren in (6.5) werden Zufallszahlen in M := {0, 1, . . . , m−
1} erzeugt. Aus einer Zufallszahl y ∈ {0, . . . , m − 1} ergibt sich eine Zufallszahl z in [0, 1] ganz
y
einfach so: z := m .
Damit die Abbildung f aus (6.5) bijektiv wird, muss a ein invertierbares Element in Zm sein,
d.h. a muss zu m teilerfremd sein. Für die Klärung der Frage, unter welchen Bedingungen dieser
Typ von Generatoren einen Zyklus maximaler Länge erzeugt, schauen wir uns Beispiele an.
Stand: 9. Februar 2010
76
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Beispiel 6.5.2 Betrachte die spezielle Wahl m = 10, a = b = 7 . Hier ist der erzeugte Zyklus
7, 6, 9, 0, 7, 6, 9, 0, . . .
ziemlich kurz, obwohl natürlich a = 7 ein invertierbares Element in Z10 ist.
Beispiel 6.5.3 Betrachte die spezielle Wahl m = 231 , a = 65539, b = 0 . Dies ist der Zufallsgenerator RANDU, wie er von IBM in den Computern in den 60er Jahren verwendet wurde.
Die maximal erreichbare Zykluslänge r ist hier nicht ganz maximal, aber mit r = 229 nahezu
maximal. Wir kommen später auf die Güte dieses Generators noch zu sprechen.
Lemma 6.5.4 Für a ∈ Z und k ∈ N0 setzen wir
Sk (a) := 0 , falls k = 0 , Sk (a) := 1 + a + · · · + ak−1 , falls k ≥ 1 .
(6.7)
Damit gilt (in Z) :
Srk (a) := Sr (ak )Sk (a) , r ∈ N .
(6.8)
Beweis:
Dies rechnet man mittels vollständiger Induktion so nach:
r = 1 : Srk (a) = Sk (a) = S1 (ak )Sk (a), da S1 (ak ) = 1 ist.
r+1:
S(r+1)k (a) = Srk+k (a) = Srk (a) + ark + · · · + ark+k−1
= Sr (ak )Sk (a) + ark Sk (a) = Sk (a)(Sr (ak ) + ark ) = Sk (a)Sr+1 (ak ) .
Lemma 6.5.5 Sei p eine Primzahl und a eine ganze Zahl mit a = 1 mod p bzw. a = 1 mod 4,
falls p = 2 . Dann gilt für alle n, k ∈ N :
n
n
(a) Sp (ap ) = 0 mod p , Sp (ap ) 6= 0 mod p2 .
(b)
(c)
Spn (a) = 0 mod pn , Spn (a) 6= 0 mod pn+1 .
Sk (a) = 0 mod pn ⇐⇒ pn |k .
Beweis:
Zu a). Wir führen den Beweis nur für p > 2 .
Wir haben auf Grund der Voraussetzung a = 1 + jp mit j ∈ Z . Mit der Binomialformel erhält
man at − 1 = tjp + cp2 mit einer Konstante c . daher
p−1
X
n
1
(akp − 1) = pn jp p(p − 1) + c̃p2 ,
Sp (a ) − p =
2
pn
k=0
mit einer weiteren Konstanten c̃ . Daraus liest man die Behauptung ab.
Zu b). Wir beweisen die Behauptung durch Induktion nach n .
n = 1 . Der Fall p = 2 ist trivial. Sei also p ungerade. Nach Voraussetzung ist a = 1 + jp mit
einer ganzen Zahl j , also ak = 1 + kjp mod p2 , k ∈ N . Dann ist
Sp (a) − p =
Stand: 9. Februar 2010
p−1
p−1
X
X
p(p − 1)
= 0 mod p2 .
(ak − 1) =
kjp = jp
2
k=0
k=0
77
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Damit ist der Induktionsbeginn schon klar.
n + 1 . Der Induktionsschluss ergibt sich aus der Formel
n
Spn+1 (a) = Sp (ap )Spn (a) ,
die sich aus (6.8) ergibt, und a).
Zu c).
Sei pm die höchste Potenz von p mit pm |k, also k = pm l mit p 6 | l . Nach (6.8) ist
m
Sk (a) = Sl (ap )Spm (a) .
m
m
Es gilt Sl (ap ) = l mod p , Sl (ap ) 6= 0 mod p ; dies verifiziert man wie oben. Daraus schließt
man
pn |Sk (a) ⇐⇒ pn |Spm (a) ,
und mit Lemma 6.5.5
pn |Sk (a) ⇐⇒ n ≤ m d.h. pn |Sk (a) ⇐⇒ pn |k ;
beachte dabei a).
Bevor wir das Hauptergebnis über lineare Kongruenz–Pseudozufallsgeneratoren beweisen,
noch ein wichtiges Resultat für das Rechnen in Kongruenzen, das man oft zur Vereinfachung
von Argumentationen verwenden kann.
Satz 6.5.6 (Chinesischer Restsatz) Ist m = pk11 · · · · · pkr r die Primfaktorzerlegung von m,
so ist Zm isomorph zu Zpk1 × · · · × Zpkr r , d.h. es gibt eine bijektive Abbildung g : Zm −→
1
Zpk1 × · · · × Zpkr r , für die gilt:
1
g([u] + [v]) = g([u]) + g([v]) , g([u] · [v]) = g([u]) · g([v]) , u, v ∈ Z .
(6.9)
Dabei wird sowohl Addition als auch Multiplikation in Zpk1 ×· · ·×Zpkr r komponentenweise erklärt.
1
Beweis:
Offenbar haben Zm und Zpk1 × · · · × Zpkr r gleich viele Elemente. Also genügt es zeigen, dass g
1
injektiv ist. Dazu reicht nun zu zeigen, dass aus g([u]) = ([0], . . . , [0]) folgt: [u] = [0] .
Aus g([u]) = ([0], . . . , [0]) folgt pki i |u, i = 1, . . . , r . Dann folgt aber m = pk11 · · · pkr r |u . Also
[u] = [0] .
Satz 6.5.7 Mit m, a, b ∈ Z, m ≥ 2 betrachte die Abbildung
f : {0, . . . , m − 1} ∋ x 7−→ ax + b
mod m ∈ {0, . . . , m − 1} .
(6.10)
Für beliebiges x0 ∈ {0, . . . , m − 1} sei die Folge (xn )n∈N definiert durch
xn+1 := f (xn ) , n ∈ N 0 .
Genau dann ist diese Folge periodisch mit der maximalen Periodenlänge m, wenn folgende Bedingungen erfüllt sind:
a) p|(a − 1) für alle Primteiler p von m ;
b) 4|(a − 1) falls 4|m ;
c) b und m sind teilerfremd.
Stand: 9. Februar 2010
78
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.5. PSEUDOZUFALLSZAHLEN
Beweis:
Ist m = pk11 ·· · · ·pkr r die Primfaktorzerlegung von m, so hat man nach dem chinesischen Restsatz,
dass Zm isomorph zu Zpk1 × · · · × Zpkr r vermöge der Abbildung g in Satz 6.5.6mit den Eigen1
schaften aus (6.9) ist. Es ist daher leicht einzusehen, dass es genügt, den Satz für den Fall zu
beweisen, dass m eine Primzahlpotenz pk ist. Vorüberlegung: Es gilt
xi+1 − xi = f (xi ) − f (xi−1 ) = a(xi − xi−1 ) , i = 1, 2, . . . ,
und daher
xn − x0 =
n−1
X
i=0
ai (x1 − x0 ) = Sn (a)(x1 − x0 ) , xn − x0 = Sn (a)(x1 − x0 )
mod m , n ∈ N . (6.11)
Wir zeigen nun die Notwendigkeit der Bedingungen. Es sei also vorausgesetzt, dass f einen
Zyklus der maximalen Länge m erzeugt. Beachte: m = pk .
Falls p nicht a − 1 teilt, sind m, a − 1 teilerfremd und die Gleichung (a − 1)x = b ist in Zm lösbar,
d.h. f besitzt einen Fixpunkt. Dann kann aber kein Zyklus der Länge m existieren. a) ist damit
gezeigt.
Es teile 4 die Zahl m, also m = 2k mit k ≥ 2 . Nach a) wissen wir schon, dass 2|(a − 1)
gilt; a ist also ungerade. Es muß also noch gezeigt werden, dass der Fall a = 3 mod 4 nicht
auftreten kann. Wäre dies doch der Fall, so würde S2 (a) = 1 + a = 0 mod 4 sein und daher
mit S2i (a) = Si (a2 )S2 (a) (siehe Lemma 6.5.5) schließlich S2i (a) = 0 mod 4 für alle i gelten.
Mit (6.11) folgt daraus x2i = x0 mod 4 und x2i+1 = x1 mod 4 für alle i ; es könnte also keinen
Zyklus maximaler Länge m geben. b) ist damit gezeigt.
In einem Zyklus der Länge m muß insbesondere das Element 0 vorkommen; wir dürfen daher o.
E. x0 = 0 und daher x1 = b voraussetzen. Dann sagt (6.11), dass xn = Sn (a)b gilt. Ist b nicht
invertierbar mod m, kann das Element 1 niemals im Zyklus auftreten. Damit ist auch c) klar.
Wir zeigen nun die Hinlänglichkeit der angeführten Bedingungen. Beachte m = pk .
Ist m = 2, dann ist b = 1 wegen c) und ein Zyklus der Länge 2 existiert. Im Fall p = 2 dürfen
wir also 4|m annehmen und die Voraussetzungen von Lemma 6.5.5 sind erfüllt. Es genügt zu
zeigen, dass für x0 = 0 ein Zyklus der Länge m erzeugt wird. Aus x0 = 0 folgt mit (6.11), dass
xn = Sn (a)b mod m gilt. Da b invertierbar mod m ist, ist dann xn = x0 = 0 gleichbedeutend
mit Sn (a) = 0 mod m . Aus Lemma 6.5.5 c) folgt m|n und damit die Behauptung.
Satz 6.5.7 nen nt uns die Bedingungen für einen affinen Kongruenz–Generator, damit er der
Minimalforderung, einen Zyklus maximaler Länge zu erzeugen, genügt. Jedoch garantieren diese
Bedingungen noch lange keinen guten Zufallsgenerator, wie nachfolgendes Beispiel zeigt.
Beispiel 6.5.8 Betrachte für einen beliebigen Modul m den Generator f (x) := x + 1 mod m .
Kein Zweifel, die Zykluslänge ist maximal, nämlich m, aber die erzeugte Folge 0, 1, 2, . . . , m −
1, 0, 1 . . . kann sicherlich nicht den Anspruch einer Zufallsfolge erheben.
In der Praxis wird häufig ein Modul der Form m = 2k verwendet (und dazu in der Regel der
√
√
Multiplikator a im Bereich m < a < m − m). In diesem Fall bedeuten die Bedingungen des
Satzes 6.5.7 einfach
a = 1 mod 4 und b ungerade .
(6.12)
Im Beispiel 6.5.3 sind diese Bedingungen offenbar verletzt (a = 216 + 3 und b = 0) und Konsequenz ist ein verkürzter maximaler Zyklus.
Beispiel 6.5.9 In der Programmiersprache C++ gibt es einen Generator namens drand48:
Modul = 248 , a = 25214903917 , b = 11 .
Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfült sind.
Stand: 9. Februar 2010
79
c J.Baumeister
KAPITEL 6. ELEMENTARE ARITHMETIK
6.6. ÜBUNGEN
Beispiel 6.5.10 Von D. Knuth wurde der Generator
Modul = 216 , a = 137 , b = 187
vorgeschlagen. Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind.
Beispiel 6.5.11 Ein weiterer Generator:
Modul = 216 , a = 193 , b = 73 .
Die Zykluslänge ist maximal, da die Bedingungen (6.12) erfüllt sind.
Wie soll man nun gute und weniger gute Generatoren auseinanderhalten? Es liegt nahe, Paare,
Trippel,. . . von Zufallszahlen zu betrachten und deren geometrische Verteilung zu untersuchen.
Wir skalieren“ dazu die Zufallszahlen mit Modul m gemäß
”
X i :=
xi
∈ [0, 1] , i ∈ N0 .
m
Vergleichen wir die geometrische Verteilung der Paare (X i+1 , X i ) in [0, 1] × [0, 1] für die Generatoren aus Beispiel 6.5.10 und Beispiel 6.5.11. Man kann Geraden entdecken, worauf alle
Zufallszahlen liegen, 21 im ersten Fall, 8 im zweiten Fall; die Streifen dazwischen sind frei von
den erzeugten Zufallspaaren. Der maximale Abstand von solchen Streifen ist bei beiden Gene1
bei Beispiel 6.5.10, √132 bei Beispiel 6.5.11.
ratoren dementsprechend ziemlich verschieden: √274
Dies bedeutet, dass der Generator 6.5.10 größeres Vertrauen genießen sollte.
Betrachtet man für den Generator 6.5.3 Tripel (X i+2 , X i+1 , X i ) in [0, 1] × [0, 1] × [0, 1], so stellt
1
haben.
man fest, dass diese Tripel auf genau 15 Ebenen liegen, die jeweils einen Abstand √118
Neben der mangelnden Maximalität der Zykluslänge ein weiterer Nachteil dieses Generators.
6.6
1.)
Übungen
Betrachte die Zahlen
H := {3j + 1|j ∈ N} .
Bestimme in dieser Menge nichtzerlegbare Elemente. Bestimme in dieser Menge eine Art
Primfaktorzerlegung von 100. Ist diese eindeutig bestimmt?
Stand: 9. Februar 2010
80
c J.Baumeister
Kapitel 7
Polynome und ihre Nullstellen
In diesem Kapitel greifen wir die algebraischen Konzepte auf, die u.a. im Zusammenhang mit
dem Gruppenbegriff stehen. Zentral sind Polynome über Körpern. Die Frage nach den Nullstellen von Polynomen wird diskutiert, insbesondere auch der zusammenhang mit klassischen
Fragestellungen.
7.1
Polynome
Zur Erinnerung:
Definition 7.1.1 Eine Menge K mit zwei Verknüpfungen
+ : K × K ∋ (a, b) 7−→ a + b ∈ K ,
(Addition)
· : K × K ∋ (a, b) 7−→ a · b ∈ K
(Multiplikation)
heißt ein Körper, wenn gilt:
a) (K, +) ist eine abelsche Gruppe mit neutralem Element 0.
b) (K∗ := K\{0}, ·) ist eine abelsche Gruppe mit neutralem Element 1 .
c) Für alle a, b, c ∈ K gilt: a · (b + c) = a · b + a · c .
Eine Eigenschaft, die in der Definition verborgen ist, ist die Nullteilerfreiheit. Sie besagt, dass
aus a · b = 0 in einem Körper (den Multiplikationspunkt unterdrücken wir meist) stets a = 0
oder b = 0 folgt.
Wir kennen aus der Analysis die Körper Q (rationale Zahlen), R (reelle Zahlen) und C
(komplexe Zahlen). Sie enthalten unendlich viele Elemente, insbesondere ist
1| + ·{z
· · + 1} 6= 0 für alle m ∈ N .
(7.1)
1| + ·{z
· · + 1} = 0 .
(7.2)
m−mal
Dies ist im Gegensatz zur Situation in endlichen Körpern. Wir kennen die Körper Zp , wobei p
eine Primzahl ist. Ohne Beweis sei hier zunächst angemerkt, dass es endliche Körper zu jedem
q ∈ N mit q = pn , n ∈ N, gibt, wobei p eine Primzahl ist. Diese Körper bezeichnen wir (der
Literatur entsprechend) Fq . In endlichen Körpern kann die Eigenschaft (7.1) nicht zutreffen.
Also gibt es ein kleinstes n ∈ N mit
m−mal
81
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
Dieses m heißt die Charakteristik char(Fq ) des Körpers Fq . Zur Ergänzung setzen wir char(K) =
0 für unendliche Körper K . Es ist nicht allzu schwer einzusehen, dass char(Fq ) = p, falls q = pn
gilt.
Sei K ein Körper. Betrachte
p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn =
n
X
ak xk ,
(7.3)
k=0
Ein Ausdruck dieser Art heisst ein Polynom mit Koeffizienten a0 , . . . , an in K . Ist an 6= 0 und
n ≥ 1, so sagen wir, dass das Polynom den Grad n hat, anderenfalls den Grad 0 .
Wir fassen die Polynome zusammen in K[x]:
K[x] := {p|p Polynom} .
(7.4)
Eine Teilmenge davon bilden die Polynome vom Grad höchstens n:
Kn [x] := {p|p Polynom vom Grad ≤ n} .
(7.5)
Ohne genauer darauf einzugehen halten wir fest: Beide Zusammenfassungen stellen Vektorräume
über dem Skalarkörper dar. Addition und skalare Multiplikation werden definiert, indem wir auf
dem Koeffizientenvektor (a0 , . . . , an ) operieren:
ap(a0 ,...,an ) + bp(b0 ,...,bn ) := p(aa0 +bb0 ,...,aan +bbn ) .
Eine Basis des Vektorraums Kn [x] ist gegeben durch die Monome 1, x, . . . , xn , falls char(K) = 0 .
Beispiel 7.1.2 Sei K := Z2 . Dann ist das Polynom p : x 7−→ x2 +x offenbar die Nullabbildung,
denn es gilt p(0) = p(1) = 0 . Offenbar ist das Polynom nicht das Nullpolynom, denn es hat ja den
Grad 1. Dies macht deutlich, dass wir zwischen Polynomen und Polynomfunktion unterscheiden
müssen.
Bemerkung 7.1.3 Polynome mit Koeffizienten in Z sind auch interessant. Wir kommen im
Zusammenhang mit algebraischen Zahlen darauf zurück; siehe Bemerkung 7.2.4.
Mit den obigen Feststellungen ist die algebraische Bedeutung der Polynome bei weitem noch
nicht erschöpft, im Gegegenteil, sie spielen in der Körpertheorie eine große Rolle; wir deuten
dies an.
Definition 7.1.4 Ein Polynom p ∈ Fq [x] vom Grade n ∈ N heißt irreduzibel (über Fq ), falls
eine Zerlegung p = f g in Polynome f, g ∈ Fq [x] mit Grad ≤ n − 1 nicht möglich ist.
Die Zerlegung von Polynomen führt zur Teilbarkeit von Polynomen.
Definition 7.1.5 Sei K ein Körper und seien p, g ∈ K[x] . Wir sagen, dass g das Polynom p
teilt, wenn es f ∈ K[x] gibt mit p = f g .
Wir schreiben dafür g|p . Ist p nicht durch g teilbar, so schreiben wir g 6 | p .
Teilbarkeit führt wieder zu einer Äquivalenzrelation in der Menge der Polynome über einem
Körper. Noch wichtiger, auch Division mit Rest ist möglich. Damit ist auch die Rechenart“
”
mod erklärt. Ohne Beweis geben wir an:
Satz 7.1.6 Sei p ∈ Fq [x] ein irreduzibles Polynom vom Grad m ∈ N . Führt man in (Fq )m−1 [x]
die Additon und Multiplikation modulo p durch, dann ist (Fq )m−1 [x] ein Körper mit q m Elementen.
Stand: 9. Februar 2010
82
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
+
0
1
x
1+x
·
0
1
x
x+1
0
0
1
x
x+1
0
0
0
0
0
1
1
0
x+1
x
1
0
1
x
x+1
x
x
x+1
0
1
x
0
x
x+1
1
x+1
x+1
x
1
0
x+1
0
x+1
1
x
(a)
(b)
Abbildung 7.1: Gruppentafeln zu (Fq )n−1 [x]
Beispiel 7.1.7 Sei K := F2 . Betrachte das Polynom p(x) := x2 + x + 1 . Diese Polynom ist
irreduzibel, denn eine Zerlegung in Linearfaktoren“ ist nicht möglich, wie man durch einfache
”
Rechnung bestätigt. Also bilden die Polynome 0, 1, x, x + 1 (beachte x2 = −x − 1 = x + 1 über F2 )
einen Körper mit 4 Elementen. Wir haben ihn in Abbildung 6.2 schon kennengelernt, allerdings
können wir die dortigen Objekte a, b nun mit x, x + 1 identifizieren; siehe Abbildung 7.1.
Sei p ∈ K[x] . Dieses Polynom kann auch als Abbildung interpretieren:
K ∋ x 7−→ p(x) ∈ K[x] .
Die Auswertung von p in einem Punkt z ∈ K kann durch Auswertung der Monome und Aufsummierung der Terme erfolgen. Man muss folgenden Aufwand betreiben:
n Additionen und 1 + 2 + · · · + n = 21 n(n + 1) Multiplikationen.
Ein effizientere Methode basiert auf der Beobachtung, dass jedes Polynom p mit p(x) = a0 +
a1 x + · · · + an xn als
p(x) = a0 + x(a1 + x(a2 + · · · + x(an−1 + an x) · · · )).
(7.6)
geschrieben werden kann. Diese Schreibweise eines Polynoms führt zur Horner–Methode zur
Auswertung von Polynomen. Wir lesen ab, dass die Auswertung von p in z dieser Weise mit
Hilfe von
n Additionen und n Multiplikationen
erfolgen kann.1 Die Horner Methode kann realisiert werden in folgendem Fragment eines Algorithmus:
Horner–Methode:
bn−1 := an ;
for j = n − 2, n − 3, . . . , 0
bj := aj+1 + zbj+1 ;
p(z) = a0 + zb0
1
Die Horner–Methode kann als optimal angesehen werden, was den Aufwand zur Auswertung eines Polynoms
für allgemeine Körper und allgemeine Polynome betrifft. Dieses Result kann als Geburtsstunde der Komplexitätstheorie für Algorithmen angesehen werden.
Stand: 9. Februar 2010
83
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.1. POLYNOME
Lemma 7.1.8 Sei p(x) = a0 + a1 x + · · · + an−1 xn−1 + an xn ein Polynom mit Koeffizienten
in C vom Grad n und sei p ausgewertet in z Mit Hilfe des obigen Fragments. Sei q(y) :=
b0 + b1 y + · · · + bn−1 y n−1 das Polynom mit den Koeffizienten b0 , b1 , . . . , bn−1 , die man dabei
erhält. Dann haben wir
p(x) = q(x)(x − z) + p(z) , p′ (z) = q(z) .
(7.7)
Beweis:
Die zweite Behauptung p′ (z) = q(z) ist eine Konsequenz der ersten Aussage p(x) = q(x)(x −
z) + p(z) .
Wir wissen aus dem obigen Fragment aj = bj−1 − zbj , j = 1, 2, . . . , n − 1, und a0 = p(z) − zb0 .
Deshalb
p(x) =
n−1
X
j=0
=
n
X
j=0
bj xj (x − z) + p(z) =
bj−1 xj − z
= an xn +
n−1
X
n−1
X
n−1
X
j=0
bj xj+1 − z
n−1
X
bj xj + p(z)
j=0
bj xj + p(z) = bn−1 xn +
n−1
X
j=1
j=0
aj xj + a0 =
n
X
(bj−1 − zbj )xj − zb0 + p(z)
aj xj = p(x)
j=0
j=1
Maple - Illustration 7.1
Die Koeffizienten a0 , . . . , an des
Polynoms werden im Vektor a
gespeichert. Der Wert p(z) ist
pval zugewiesen.
≫
≫
≫
≫
≫
n=length(a);
pval= a(n);
for i=n-1:-1:1
pval= z*pval + a(i);
end
Hier
ist
eine
VektorImplementierung
im
Fall,
dass das Polynom in mehreren
Punkten ausgewertet werden
soll. Die Auswertungspunkte
z1 , . . . , zm werden im Vektor
zz gespeichert, die Ergebniss
werden pVal zugewiesen.
≫
≫
≫
≫
≫
n=length(a);
pVal = a(n) * ones(size(zz));
for k=n-1:-1:1
pVal= zz.*pVal + a(k);
end
Polynome sind in der Angewandten Mathematik als Bausteine für Approximationen von
Funktionen von großem Wert und großer Attraktivität, da sie sehr einfach gespeichert (Koeffizienten) und ausgewertet (Horner-Verfahren) werden können. Sie sind involviert bei der Interpolation von Funktionen, bei Splines, Bezier-Kurven und Finiten Elementen. Die zentrale Stütze
dabei ist der Approximationssatz von Weierstrass, der besagt, dass jede stetige Funktion
auf einem beschränktem und abgeschlossenen Intervall I ⊂ R durch Polynome mit vorgegebener
Genauigkeit approximiert werden kann.
Stand: 9. Februar 2010
84
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
Nullstellen von Polynomen formelmäßig
Wir betrachten nun das Problem der Auflösbarkeit von polynomialen Gleichungen mit Koeffizienten in einem Körper K ∈ {Q, R, C}. Aus den Lösungsformeln kann man dann ablesen, wann
diese Auflösbarkeit in Q bzw. R bzw. C gelingt. In diesem Sinne sprechen wir von Lösungen.
Eine Gleichung der Form
x−c=0
(7.8)
heißt eine lineare Gleichung. Der einzige Lösung ist x = c .
Gegeben sei die quadratische Gleichung
ax2 + bx + c = 0
(7.9)
b , denn für y ergibt sich die
für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 2a
Gleichung
b2 − 4ac
,
(7.10)
y2 =
4a2
deren Lösungskandidaten auf der Hand liegen:
1p 2
b − 4ac .
y=±
2a
Die Lösungskandidaten von (7.9) werden damit mit
b
1p 2
x=− ±
b − 4ac
(7.11)
2a 2a
beschrieben. Aus der Gleichung (7.11) liest man auch die Methode der quadratischen Ergänzung
ab:
b
b2
b2
c
b
(x + )2 = x2 + x + 2 = − + 2 .
2a
a
4a
a 4a
Über Q liegt also Lösbarkeit vor, wenn a, b, c rational sind und b2 − 4ac ein Quadrat einer
rationalen Zahl ist. Über R liegt Lösbarkeit vor, wenn a, b, c reell sind und b2 − 4ac ≥ 0 ist. Die
Lösbarkeit über C liegt universell vor. Insbesondere hat die Gleichung x2 + 1 = 0 die Lösungen
(Wurzeln) x = ±i.
Bemerkung 7.2.1 Aus der Formel (7.11) lesen wir ab, dass das Produkt der Lösungen der
quadratischen Gleichung (7.9) für a = 1 gleich dem Koeffizienten c ist. Diese Tatsache bezeichnet
man als Vietaschen Wurzelsatz.
Betrachte die kubische Gleichung
ax3 + bx2 + cx + d = 0
(7.12)
b , denn für y ergibt sich die
für a 6= 0. Sie wird vereinfacht durch die Substitution y = x + 3a
Gleichung
y 3 = py + q,
wobei p, q gewisse rationale Ausdrücke in a, b, c, d sind. Diese Gleichung ist immer noch nicht
einfach, aber folgende Substitution y = u + v 2 hilft weiter, denn es entsteht
3uv(u + v) + u3 + v 3 = p(u + v) + q.
2
Die Idee mit den Hilfsgrößen u, v hatte wohl Scipione del Ferro, der er vorzeitig verstarb, ausgearbeitet hat sie
dann Tartaglia. Er teilte die Lösung einer kubischen Gleichung Cardano in Form eines Sonetts mit. Die wesentliche
Zeile lautete: Trovan dui altri“ (Finde zwei andere Größen). Diese Idee läßt sich geometrisch aus einer Zerlegung
”
eines Einheitswürfels ableiten.
Stand: 9. Februar 2010
85
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
Wir spalten auf in
3uv = p , u3 + v 3 = q,
p
setzen v := 3u , und lösen
u3 + (
p 3
p
) = q , d.h. (u3 )2 − qu3 + ( )3 = 0 .
3u
3
Dies ist eine quadratische Gleichung in u3 und wir haben mit (7.11)
r
q
p
q
3
u = ± ( )2 − ( )3 .
2
2
3
Die Symmetrie der Formeln in u und v hat zur Folge, dass sich für v nichts wesentlich Neues
ergibt. Wir erhalten
r
r
q
p 3 3
q
p
q 2
q
3
u = + ( ) − ( ) , v = − ( )2 − ( )3 ,
2
2
3
2
2
3
und daher
x=
s
3
q
+
2
r
q
p
( )2 − ( )3 +
2
3
s
3
q
( −
2
r
q
p
b
( )2 − ( )3 −
.
2
3
3a
(7.13)
b gefunFür die ursprüngliche Gleichung (7.12) haben wir so einen Lösungskandidaten x = y − 3a
den. Durch Division mit Rest reduzieren wir dann die Gleichung 3. Grades auf eine Gleichung 2.
Grades und behandeln diese nach dem schon vorgestellten Verfahren für Gleichungen 2. Grades
weiter.
Beispiel 7.2.2 Betrachte die Gleichung
x3 − 7x − 6 = 0 .
Sie hat die Lösungen x1 = −1, x2 = −2, x3 = 3 (in Q) . Die obige Vorgehensweise liefert in C
die Lösung
s
s
r
r
100
100
3
3
∗
+ 3−i
.
x = 3+i
27
27
Man stellt fest, dass es sich dabei um die Lösung x3 handelt.
Betrachte die Gleichung
x3 + 3x − 4 = 0 .
Sie hat die Lösung x1 = 1 (in Q) . Die obige Vorgehensweise liefert in C die Lösung
q
q
√
√
3
3
∗
x = 2 + i 5+ 2 − i 5.
Man stellt fest, dass es sich dabei um die Lösung x1 handelt.
Hier sind drei Probleme, die schon im Altertum formuliert wurden und die alle mit polynomialen Gleichungen zu tun haben.
1. Dreiteilung des Winkels (Teilung eines Winkels in drei gleiche Teile.)
2. Verdoppelung des Würfels (Konstruktion der Seite eines Würfels, dessen Volumen
zweimal so groß ist wie das gegebene Dreieck.) Es wird das Delische Problem genannt.
Stand: 9. Februar 2010
86
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.2. NULLSTELLEN VON POLYNOMEN FORMELMÄSSIG
3. Quadratur des Kreises (Konstruktion eines Quadrates mit einer Fläche, die der Fläche
eines gegebenen Kreises gleich ist.)
Die Herausforderung bei der Beschäftigung mit den Problemen besteht darin, dass als Han”
dicap“ verlangt wird, dass die Lösungen der Probleme mit Zirkel und Lineal konstruierbar
sein sollen. Ob dies möglich ist, kann nun mit der algebraischen Theorie der Körpererweiterung
beantwortet werden. Bezogen auf die Probleme bedeutet dies, dass gewisse den Problemen zugeordneten Polynome Nullstellen in Körpern besitzen, die aus Q problembezogen in durchsichtiger
Weise abgeleitet werden.
Die Quadratur des Kreises kann nicht gelingen, da man nun weiß, dass die Zahl π transzendet
ist, also keine Nullstelle eines Polynoms mit rationalen Koeffizienten sein kann.
Das Delische Problem besitzt keine Lösung mit Zirkel und Lineal, denn die Gleichung x3 −2 =
0, die das Problem beschreibt, hat in C die drei Lösungen
√
3
2,
√
3
2(cos(
2π
4π
2π √
4π
3
) + i sin ), 2(cos( ) + i sin( )) .
3
3
3
3
Das Problem der Winkeldreiteilung mit Zirkel und Lineal besitzt im allgemeinen keine Lösung.
Wir können etwa speziell fragen, ob der Winkel 31 π gedrittel werden kann. Dazu haben wir dann
zu zeigen, dass die Gleichung 4x3 − 3x − 12 = 0 keine Lösung in Q besitzt, denn für x := cos θ
gilt ja die allgemeine Identität 4x3 − 3x = cos θ .
Bemerkung 7.2.3 Wir können aus dem Zwischenwertsatz, den wir aus der Analysis kennen,
ablesen, dass jede kubische Gleichung mit Koeffizienten in R eine Lösung in R besitzt. Man hat
dabei nur zu beachten, dass für ein kubisches Polynom p limx→∞ p(x) = ∞, limx→−∞ p(x) = −∞
oder limx→∞ p(x) = −∞, limx→−∞ p(x) = ∞ gilt.
Betrachte die quartische Gleichung
ax4 + bx3 + cx2 + dx + e = 0
(7.14)
b vereinfacht zu
für a 6= 0. Diese Gleichung wird durch die Substitution y = x + 4a
y 4 + py 2 + qy + r = 0,
wobei p, q, r gewisse rationale Ausdrücke in a, b, c, d, e sind. Wir schreiben sie um zu
(y 2 + p)2 = py 2 − qy + p2 − r
– dieser Reduktionsschritt geht wohl auf R. Descartes zurück – und erweitern
(y 2 + p + u)2 = (py 2 − qy + p2 − r) + 2u(y 2 + p) + u2
mit beliebigem u ∈ K. Wähle nun u so, dass
py 2 − qy + p2 − r + 2u(y 2 + p) + u2 = Ay 2 + By + C
ein Quadrat wird; hierbei ist A := p + 2u, B := −q, C := p2 − r + 2up + u2 . Dies gelingt dann,
wenn
B 2 − 4AC = 0
gilt. Dies ist eine kubische Gleichung für u, die nach dem obigen Verfahren behandelt werden
kann. Nach Wahl von u ziehen wir nun die Wurzel und lösen die resultierende quadratische
Stand: 9. Februar 2010
87
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.3. DETERMINANTEN UND EIGENWERTE
b ergibt Lösungen für die Gleichung
Gleichung für y. Einsetzen in die Substitution x = y − 4a
(7.14).
Eine gemeinsame Beobachtung bei den obigen Vorgehensweisen ist, dass die Lösungen, wenn
sie denn existieren – dies ist eine Frage nach dem gewählten Körper – Ausdrücke in den Koeffizienten der Gleichungen sind, die nur die Operationen
+, −, ·, ÷,
√
m
mit m ≤ 2 (quadratische Gleichung) bzw. m ≤ 3 (kubische Gleichung) bzw. m ≤ 4 (quartische
Gleichung) verwenden. Allgemein sagt man, daß eine polynominale Gleichung
an xn + an−1 xn−1 + · · · + a1 x + a0 = 0
lösbar durch Radikale ist, wenn eine Lösung als rationaler Ausdruck in den Koeffizienten
a0 , . . . , an existiert, in der nur die Operationen
+, −, ·, ÷,
√
m
, m ≤ n,
verwendet werden.3
Bemerkung 7.2.4 Irrationalität einer Zahl z kann auch so definiert werden: Es gibt kein lineares Polynom mit ganzzahligen Koeffizienten, dessen Nullstelle z ist. Als Verallgemeinerung haben
wir die folgende Definition: Eine Zahl z ∈ R heisst algebraisch, wenn es ein Polynom mit ganzzahligen (gleichbedeutend mit rationalen) Koeffizienten gibt, dessen Nullstelle z ist; anderenfalls
heis̈t sie transzendet. Es ist nun ganz einfach einzusehen, dass die Menge der algebraischen
Zahlen abzählbar ist. Dazu führen wir als Höhe eines Polynoms
p(x) := a0 + · · · + an xn
die Zahl
Np := n − 1 + |a0 | + · · · + |an |
ein. Zu jeder natürlichen Zahl N ∈ N gibt es nur endlich viele Polynome p mit Höhen Np ≤ N .
Jedes dieser Polynome hat höchstens endlich viele Nullstellen. Damit ist die Aussage klar.
Transzendente Zahlen können als besonders irrational“ angesehen werden. Die bekanntesten
”
transzendenten Zahlen sind e, π. Der Beweis, dass π irrational ist, ist etwa in [1] enthalten.4 7.3
Determinanten und Eigenwerte
Die Bestimmung von Nullstellen eines Polynoms mit Koeffizienten in einem Körper ist von
großer Relevanz bei der Untersuchung von Endomorphismen endlichdimensionaler Vektorräume.
Stellt man einen solchen Endomorphismus durch eine Matrix A ∈ Kn,n dar, dann hat man die
Abbildung
A : Kn ∋ x 7−→ Ax ∈ Kn .
3
Nach der Lösung der kubischen und quartischen (Ferrari) Gleichungen durch Radikale — Cardano hat die
Ergebnisse gesammelt — , ließen viele erfolglose Versuche, die quintische Gleichung (m = 5) durch Radikale zu
lösen, die Vermutung keimen, dass dies prinzipiell unmöglich sein könnte. Viète (1591) bestärkte dies durch die
Entdeckung, daß die Frage der Lösbarkeit der quintischen Gleichung durch Radikale äquivalent zur Winkeldreiteilung ist. Der Beweis, dass die Vermutung zutrifft, gelang Abel (1826) und Galois (1831) im Rahmen einer
grandiosen Theorie über Körpererweiterungen (Galoistheorie).
4
Der Transzendentbeweis zu e wurde 1873 von C. Hermite, der zu π 1882 von F. Lindemann erbracht.
Stand: 9. Februar 2010
88
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.3. DETERMINANTEN UND EIGENWERTE
Die Frage, ob diese Abbildung bijektiv ist, d.h., ob das Gleichungssystem
Ax = y
(7.15)
eindeutig lösbar ist, kann mit der Determinante der Matrix A entschieden werden. Verschwindet
det(A) nicht, dann liegt in (7.15) eindeutige Lösbarkeit vor. Ein lineares Gleichungssystem der
Form (7.15) tritt in vielfältige Anwendungen auf: Ressourcen-Bilanz in der Ökonomie, Diskretisierung bei linearen Differenzialgleichungen, . . . .
Definition 7.3.1 Sei A ∈ Kn,n , A = (aij )i=1 (1 )n , j =1 (1 )n . Wir definieren (siehe Abschnitt 8.2)
det(A) :=
X
σ∈Sn
ε(σ)a1 σ(1) · · · an σ(n) .
Die Determinante det(A) ∈ K einer Matrix A ∈ Kn,n ist somit eine Multilinearform auf den
Spalten der Matrix A .
Das Studium von Endomorphismen hat unter anderem auch das Ziel, Normalformen von solchen Morphismen zu finden, die dann, weil sie einfache Struktur haben, leichter zu analysieren
sind. Wir formulieren dies für die darstellenden Matrizen. Hier kommen dann die Normalformen dadurch zustande, dass man im Vektorraum Kn geeignete Basen wählt. Eine allgemeine
Normalform ist die Jordansche Normalform. Hier nutzt man die Basis, die durch die (verallgemeinerten) Eigenvektoren erzeugt wird. Weitere Normalformen sind die Schurzerlegung,
die die Singulärwertzerlegung, die QR-Zerlegung und die LU-Zerlegung.
Definition 7.3.2 Sei A ∈ Kn,n . Ein Skalar λ ∈ K ist ein Eigenwert von A, falls es einen
nicht verschwindenden Vektor x ∈ Kn gibt mit
Ax = λx .
(7.16)
x heißt dann Eigenvektor zum Eigenwert λ .
Die Existenz von Eigenwerten ist verknüpft mit der polynomialen Gleichung
det(A − λE) = 0
(7.17)
wobei E ∈ Kn,n die Einheitsmatrix ist. Dass durch
K ∋ x 7−→ det(A − λE) ∈ K
ein Polynom definiert wird, sieht man mit Definition 7.3.1 leicht ein; dieses Polynom heißt
charakteristisches Polynom von A . Was ist gewonnen, wenn Eigenwerte und Eigenvektoren
existieren/bestimmt sind? Bilden die Eigenvektoren eine Basis in Kn , dann hat man eine Basis
gefunden, die zu einer Normalform führt. Man kann dies daran erkennen, dass eine Matrix auf
einem Eigenvektor sehr einfach operiert:
Ax = λx , d.h. Ax ist eine Streckung“ von x .
”
Die Jordansche Normalform setzt dies in verallgemeinerten Form um. Eine Verallgemeinerung ist
nötig, da nicht immer gesichert ist, dass eine Basis von Kn , bestehend aus lauter Eigenvektoren,
existiert.
Stand: 9. Februar 2010
89
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
Achtung: Die Eigenwerte einer Matrix berechnet man in der Regel nicht als Nullstellen des
charakteristischen Polynoms. Es gibt (numerische) Methoden, die effizienter sind.
Für viele Anwendungen sind qualitative Aussagen (einfache, nur reelle Eigenwerte, nur positive, nur negative Eigenwerte) und quantitative Aussagen (wie klein, wie groß, wie sensitiv
gegenüber änderungen gegenüber Variationen der Einträge in der Matrix) von großer Bedeutung. Hier ist ein Resultat, das sowohl qualitative und quantitative Schlüsse erlaubt.
Satz 7.3.3 (Gerschgorin–Kreise) Sei A = (aij )1≤i,j≤n ∈ Cn,n . Ist λ ∈ C ein Eigenwert von
A, dann gibt es ein i ∈ {1, . . . , n} mit
|λ − aii | ≤ ri :=
n
X
j=1,j6=i
|aij | .
Beweis:
Die Eigenwertgleichung lautet mit dem Eigenvektor z zum Eigenwert λ
Az = λz , d.h. (λ − aii )zi =
n
X
j=1,j6=i
aij zi , 1 ≤ i ≤ n .
Sei i derjenige Index, für den
|zi | = max |zk |
1≤k≤n
gilt. Mit diesem Index i gilt dann die behauptete Abschätzung.
Wir setzen zu einer Matrix A = (aij )1≤i,j≤n ∈ Cn,n
σ(A) := {λ ∈ C|λ Eigenwert von A}
und nennen σ(A) das Spektrum von A . Damit können wir das obige Resultat auch so formulieren:
σ(A) ⊂ ∪ni=1 B ri (aii ) ,
P
mit ri := nj=1,j6=i |aij | , i = 1, . . . , n . Damit erklärt sich die Bezeichung Kreise“.
”
Die Existenz von Eigenwerten hat nun mit dem zugrundliegenden Körper zu tun. Dies diskutieren wir im folgenden Abschnitt.
7.4
Fundamentalsatz der Algebra
Betrachte das Polynom
n−1
p(x) := p(a0 ,...,an ) (x) = a0 + a1 x + · · · + an−1 x
n
+ an x =
n
X
ak xk .
(7.18)
k=0
Wenn wir alle Nullstellen kennen, dann können wir das Polynom hinschreiben als Produkt der
Linearfaktoren:
k
X
m1
mk
p(x) = an (x − z1 ) · · · (x − zk ) ,
ml = n
l=1
wobei zi bzw. mi die i-te Nullstelle von p bzw. ihre Mehrfachheit bezeichnet.
Stand: 9. Februar 2010
90
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
Die Aussage, dass jedes nicht konstante Polynom mit Koeffizienten in C eine Nullstelle besitzt, wird der Fundamentalsatz der Algebra genannt. Alle bekannten Beweise dieses Satzes5
benützen offen oder versteckt auch das Konzept Stetigkeit“ aus der Analysis. Wir geben einen
”
Beweis, der nur wenige über die Analysis der reellen Zahlen hinausgehende Fakten verwendet.
Lemma 7.4.1 Ist p ein nichtkonstantes Polynom mit Koeffizienten in C und ist |p(z0 )| =
6 0,
dann gibt es zu jedem r > 0 ein z1 ∈ Br (z0 ) mit |p(z1 )| < |p(z0 )|.
Beweis:
Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 , z ∈ C , und r > 0. Nach einer Multiplikation mit
einem Skalar können wir annehmen: p(z0 ) = 1 .
Dann haben wir mit w ∈ C
p(z0 + w) = 1 + As ws + · · · + An wn ,
wobei As , . . . , An ∈ C, As 6= 0, und 1 ≤ s gilt. Diese Aussage folgt sofort durch Betrachtung der
Differenz p(z0 + w) − p(z0 ) und Aufsammlung der Potenzen von w . Da p nicht konstant ist, ist
nach Wahl von s sicher As 6= 0 . Wir wollen nun w ∈ C so wählen, dass z0 + w ∈ Br (z0 ) und
|p(z0 + w)| < |p(z0 )| gilt. Mit einem solchen w setzen wir dann z1 := z0 + w und wir sind fertig.
π − φ0
und setzen w damit als w := ρeiφ
Sei As = rs eiφs mit rs = |As | > 0 . Wir wählen φ :=
s
an; es bleibt noch ρ geeignet zu wählen. Wir haben nun
p(z0 + w) = 1 − r s ρs + ρs+1 g(ρ)
mit einem Polynom g . Da die Funktionen h : ρ 7−→ ρg(ρ) stetig in 0 mit h(0) = 0 ist, gibt es
√
δ ∈ (0, r) mit |ρg(ρ)| < 21 rs für |ρ| ≤ δ . Setze α := min(δ, r, s rs ) . Für jedes ρ mit 0 ≤ ρ ≤ α ist
nun
1
|p(z0 + w)| ≤ |1 − rs ρs + ρs ρg(ρ)| ≤ 1 − rs ρs + rs ρs < 1 = |p(z0 )| .
2
Bemerkung 7.4.2 Das obige Lemma 7.4.16 ist im Reellen falsch, wie man sofort an dem Polynom p(x) := x2 + 1 sieht. Dass sie im Komplexen gilt, hängt wesentlich an der Tatsache, dass
die Abbildung K ∋ z 7−→ z s ∈ K für K = C stets surjektiv ist, dass dies für K = R aber bei
geradem s sicher nicht zutrifft.
Satz 7.4.3 Sei p ein nicht konstantes Polynom mit Koeffizienten in C . Dann gibt es ein z0 ∈ C
mit p(z0 ) = 0.
Beweis:
Sei p(z) = an z n + an−1 z n−1 + · · · + a1 z + a0 . Wähle R > 0 so, dass
f : C\BR ∋ z 7−→ |p(z)| ∈ R
monoton wachsend mit |z| ist, d.h.
R ≤ |z| ≤ |z1 | =⇒ f (z) ≤ f (z1 ) .
Dies ist möglich, da der Term z 7−→ |an z n | den Term z −→ |an−1 z n−1 + · · · + a1 z + a0 | für |z|
genügend groß überwiegt. Da die Abbildung
q : C ∋ z 7−→ |p(z)| ∈ R
5
6
C.F. Gauß publizierte 1799 den ersten strengen Beweis, später gab er einige weitere Beweise dafür.
Dieses Lemma geht auf J.B. d’Alembert (1717 — 1783) zurück.
Stand: 9. Februar 2010
91
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.4. FUNDAMENTALSATZ DER ALGEBRA
stetig ist — dies bedeutet: lim zn = z̄ =⇒ lim q(zn ) = q(z̄) für alle z̄ ∈ BR — gibt es z0 ∈ BR
n
n
mit
q(z0 ) = min q(z) .
z∈B R
Ist q(z0 ) = |p(z0 )| = 0, d.h. p(z0 ) = 0, sind wir fertig. Zur Aussage q(z0 ) = |p(z0 )| =
6 0 erhalten
wir mit Lemma 7.4.1 einen Widerspruch wie folgt: Es gibt z1 ∈ C mit |p(z1 )| < |p(z0 )|. Ist dieses
z1 in BR , so haben wir einen Widerspruch zur Wahl von z0 , ist dieses z1 nicht in BR , so haben
wir einen Widerspruch zur Monotonie von q in C\BR ; beachte hierzu, dass es ein z2 ∈ B R \BR
gibt mit |p(z2 )| ≥ |p(z0 )| .
Korollar 7.4.4 Jedes Polynom n–ten Grades p, p(z) = a0 + · · · + an z n , z ∈ C, n ≥ 1, mit
Koeffizienten in C besitzt in C genau n Nullstellen und das Polynom zerfällt in Linearfaktoren,
d.h.
p(z) = an (z − z1 ) · · · · · (z − zn ) , z ∈ C .
(7.19)
Beweis:
Nach Satz 7.4.3 besitzt p eine Nullstelle z1 . Mit Division mit Rest spalten wir den Linearfaktor
z 7−→ z − z1 ab – siehe nachfolgendes Lemma 7.4.5 – und erhalten ein Polynom (n − 1)–ten
Grades. So fortfahrend erhalten wir das Ergebnis.
Lemma 7.4.5 (Division mit Rest) Sei K ein Körper und seien f, g ∈ K[x] mit g 6= θ . Dann
existieren q, r ∈ K[x] mit
f = qg + r und grad(r) < grad(g) .
Beweis:
Wir beweisen die Behauptung durch Induktion nach grad(f ) . Dabei sei zunächst grad(f ) <
grad(g) . Dann setze q := θ und r := f . Wir können also grad(f ) ≥ grad(g) annehmen.
Sei f (x) = a0 + · · · + an xn und g(x) = b0 + · · · + bn xm , wobei n = grad(f ) und m = grad(f )
n−m g(x) . Dann ist h ∈ K[x] und grad(h) < grad(f ) . Nach
sei. Setze h(x) := f (x) − an b−1
m x
Induktionsvoraussetzung ist h = q1 g + r1 mit grad(r1 ) < grad(g) . Nun ist
n−m
f (x) = (an b−1
+ q1 (x))g(x) + r1 (x) .
m x
Beispiel 7.4.6 Von Gauss stammt das umfassende Resultat über die Lösbarkeit der Kreisteilungsgleichung
xn − 1
= xn−1 + · · · + x + 1 .
x−1
Etwa leitet er ab, dass eine Wurzel x1 = cos( 2π
17 ) folgende Darstellung
r
q
q
q
√
√
√
√
1√
1
1
1
x1 = − +
17 +
34 − 2 17 +
17 + 3 17 − 34 − 2 17 − 2 34 + 2 17
16 16
16
8
hat. Damit ist das regelmäßige 17–Eck durch Zirkel und Lineal konstruieren, da ja Quadratwurzeln durch Zirkel und Lineal konstruierbar sind.
Ohne Beweis sei noch angemerkt, daß die Konstruktion eines regelmäßigen n−Ecks mit Zirkel
und Lineal genau dann möglich ist, wenn die Primfaktorzerlegung von n die Form n = 2m p1 · · · pr
k
hat, wobei p1 , . . . , pr paarweise verschiedene Primzahlen der Form 22 +1 (Fermatsche Zahlen)
sind. Für k = 0, 1, 2, 3, 4 erhält man die Primzahlen 3, 5, 17, 257, 65537.7
7
Diese Erkenntnis verdanken wir C. F. Gauß, der eine erste Entdeckung zu diesem Thema bereits einen Monat
vor seinem 18. Geburtstag machte.
Stand: 9. Februar 2010
92
c J.Baumeister
KAPITEL 7. POLYNOME UND IHRE NULLSTELLEN
7.5
1.)
7.5. ÜBUNGEN
Übungen
Sei K := F2 . Zeige, dass das Polynom p(x) := x4 + x + 1 über F2 irreduzibel ist.
Stand: 9. Februar 2010
93
c J.Baumeister
Kapitel 8
Zufall
Stochastik beschäftigt sich mit der mathematischen Beschreibung und Analyse zufälliger Vorgänge. Die beiden Hauptgebiete der Stochastik sind Wahrscheinlichkeitstheorie und Statistik.
In diesem einführenden Kapitel über den Zufall stellen wir elementare Fragestellungen vor und
erläutern sie an Hand von interessanten Problemstellungen. Das Modellierungsinstrument –
Modellierung besprechen wir im nächsten Kapitel – Markov–Ketten wird skizziert.
8.1
Laplace–Häufigkeiten
Wie reden wir über den Zufall? Wir wollen uns nicht lange dabei aufhalten. Mögliche Defini”
tionsschnipsel“:
Zufall ist das Eintreten unvorhergesehener und unbeabsichtigter Ereignisse.
Das, wobei unsere Rechnungen versagen, nennen wir Zufall (Albert Einstein).
Jemandem fällt etwas (unverdientermaßen) zu.
Die Spannung bei der Verwendung des Zufalls resultiert wesentlich aus der naturwissenschaftlichen Sicht vom Eintreten von Ereignissen: das Kausalitätsprinzip läßt nicht Determiniertes nicht
zu. Ein Ausweg ist, dass wir die Umstände (Anfangsbedingungen) des Greifens von naturwissenschaftlichen Gesetzen nicht vollständig kennen können.
Beispiele für das Wirken von Zufall“:
”
• Ergebnis beim Münzwurf
• Eintreten von Augenzahlen beim Würfeln
• Radioaktiver Zerfall
• Männlicher oder weiblicher Nachwuchs
Die Folge von Zahlen, die wir etwa beim Würfeln (mit einem fairen Würfel) erhalten nennen wir
Zufallszahlen; siehe 6. Es drängt sich sofort die Problematik des Tests auf Zufälligkeit auf. Ist
1, 2, 2, 6, 5, 6, 6, 6, 3, 6, 6
Teil einer Folge von Würfelergebnissen? Klar, dass dies sein kann, aber als Basis für eine Simulation des Zufalls ist sie ungeeignet.
Nun gehen wir daran, das Nichtwissenkönnen des Ausgangs eines Zufallsexperiments zu quantifizieren: Jedem Ereignis soll eine Zahl aus [0, 1] zugeordnet werden, die uns gestattet, die Unsicherheit über den Ausgang anzugeben: 1 sollte für Sicherheit, 0 für vollständige Unsicherheit
94
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
stehen. Wir tun dies nun in einer einfachen Situation, nämlich in einer Situation, in der alle Elementarereignisse, was die Unsicherheit über ihr Eintreten betrifft, gleichberechtigt sind. Dazu
führen wir die Begriffe Laplace–Experiment und Laplace–Wahrscheinlichkeit ein. Der Begriff der
Laplace–Wahrscheinlichkeit hat den Vorteil, dass ihm die Vorstellung eines konstruktiven Vorgehens zugrunde liegt, nämlich die Vorstellung von der rein zufälligen Wahl“. Wir stellen uns
”
hierunter vor, dass es gelingt, aus einer endlichen Menge von Elementarereignissen Ω ein Element
so auszuwählen, dass jedes Element diesselbe Chance hat, ausgewählt zu werden. Einen Mechanismus, der eine solche Zufallswahl bewerkstelligt, nennen wir einen Laplace–Mechanismus.
Ein beliebtes Bild von einem Laplace–Mechanismus ist das Urnenmodell (ein Gefäß, in dem
Gegenstände versteckt“ werden, die man dann herausholen kann) eine weitere Vorstellung von
”
einem Laplace–Mechanismus ist der Würfelwurf.
Definition 8.1.1 Sei Ω eine endliche Menge. Für jede Teilmenge A von Ω ist die Laplace–
Wahrscheinlichkeit definiert durch
P (A) :=
#A
.
#Ω
Man nennt P (A) die Wahrscheinlichkeit, dass ein (rein zufällig ausgewähltes) Element ω ∈ Ω
in A liegt. Die Abbildung
P : P OT (Ω) ∋ A 7−→ P (A) ∈ R
heißt (auch) Laplace–Wahrscheinlichkeit.
Das Tripel (Ω, P OT (Ω), P ) nennen wir (in Anlehnung an den allgemeinen Fall in der Wahrscheinlichkeitstheorie) einen (Laplace-)Wahrscheinlichkeitsraum
Bemerkung 8.1.2 Die Konzepte einer Wahrscheinlichkeitstheorie mit einem unendlichen Ereignisraum Ω wurden abschließend ausformuliert von Kolmogorov1 . Sie passen zu unserem Herangehen für einen endlichen Ereignisraum. Im folgenden lassen wir das Vorwort Laplace“ meist
”
weg.
Beispiel 8.1.3 Den Münzwurf betrachten wir als Laplace–Mechanismus. Hier ist
1
.
2
Beim Würfelexperiment, betrachtet als Laplace–Mechanismus, haben wir
Ω = {K, Z} ; P ({K}) = P ({Z}) =
Ω = {1, . . . , 6} ; P ({i}) =
1
, 1 ≤ i ≤ 6.
6
Für das zusammengesetzte“ Ereignis A := {1, 2, 3} errechnen wir P (A) = 21 .
”
Beim Würfeln mit zwei Würfeln, betrachtet als Laplace–Experiment, haben wir:
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6} ; P ((i, j)) =
1
, 1 ≤ i, j ≤ 6 .
36
Daraus errechnet sich:
6
=
36
15
P (A) =
=
36
Für das zusammengesetzte Ereignis
P (A) =
1
für A := {(i, j) ∈ Ω|i + j ≥ 10},
6
5
für A := {(i, j) ∈ Ω|i > j}.
12
A := {(i, j) ∈ N × N|i = 1 oder (i ≥ 4 und j = 1) oder (i ≥ 4 und j ≥ 4)}
ist die Laplace–Wahrscheinlichkeit schon etwas mühsam auszurechnen. Sie ist
1
13
36 .
A.N. Kolmogorov, 1903-1987
Stand: 9. Februar 2010
95
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
Es ist nun offensichtlich, dass bei der Berechnung von Laplace–Wahrscheinlichkeiten das
Einmaleins der Kombinatorik äußerst hilfreich ist; dazu kommen wir in Abschnitt 8.2.
Bemerkung 8.1.4 Beachte, dass ein Laplace–Experiment ein Modell für eine konkrete reale
Situation ist. Unsere Definition der Laplace–Wahrscheinlichkeit ist innerhalb dieses Modells
gegeben und nicht für die reale Situation. Der Übergang von der Wirklichkeit zum Modell ist in
den hier exemplarisch betrachteten Fällen meist naheliegend, in allgemeineren Situationen ( Wie
”
wahrscheinlich ist ein Supergau in einem russischen Kernkraftwerk“/ Wie wahrscheinlich ist
”
es, dass auf einem Stern der Milchstraße Leben existiert“) ist dieser sicher sehr viel schwieriger
zu vollziehen.
In der Bemerkung 8.1.4 haben wir den Begriff Modell erwähnt. Nehmen wir hier die Gelegenheit wahr, den Begriff schon mal zu beleuchten, genauer gehen wir darauf in Kapitel 9 ein.
. . . Deshalb vertrete ich die Auffassung, die man als schlicht oder naiv bezeichnet hat, daß
eine physikalische Theorie nur ein mathematisches Modell ist, mit dessen Hilfe wir die Ergebnisse unserer Beobachtungen beschreiben. Eine Theorie ist eine gute Theorie, wenn sie
ein elegantes Modell ist, wenn sie eine umfassende Klasse von Beobachtungen beschreibt und
wenn sie die Ergebnisse weiterer Beobachtungen vorhersagt. Darüber hinaus hat es keinen
Sinn zu fragen, ob sie mit der Wirklichkeit übereinstimmt, weil wir nicht wissen, welche
Wirklichkeit gemeint ist.
. . . Es hat keinen Zweck, sich auf die Wirklichkeit zu berufen, weil wir kein modellunabhängiges Konzept der Wirklichkeit besitzen.2
Legen wir uns nun einige einfache Aussagen zurecht.
Korollar 8.1.5 Sei Ω eine endliche Menge. Wir haben zur Laplace–Wahrscheinlichkeit
P : P OT (Ω) ∋ A 7−→
#A
∈R
#Ω
die folgenden Aussagen:
(a) P (A) ∈ [0, 1] ∩ Q für alle A ⊂ Ω.
(b) P ({x}) = 1 für alle x ∈ Ω.
#Ω
(c) P (A ∪ B) = P (A) + P (B) − P (A ∩ B) für alle A, B ∈ P OT (Ω).
(d) P (Ω\A) = 1 − P (A) für alle A ⊂ Ω.
(e) P (∅) = 0.
Beweis:
(a) und (b) sind trivial. Die Aussage (c) ist einfach einzusehen. Damit sind nun auch (d) und
(e) klar.
In einer Urne liegen drei schwarze Kugeln und eine weisse Kugel. Auf gut Glück werden
zwei Kugeln der Urne entnommen. Welche Wahrscheinlichkeit ist größer, zwei schwarze Kugeln
oder eine weisse und eine schwarze Kugel herauszunehmen? Man ist auf Grund der Tatsache,
dass dreimal soviele schwarze wie weisse Kugeln in der Urne liegen zu vermuten, dass die erste
Möglichkeit wahrscheinlicher ist. Dem ist aber nicht so, denn es gibt drei Möglichkeiten, zwei
2
Aus: St. W. Hawkin, Einsteins Traum, Rowohlt, 1993
Stand: 9. Februar 2010
96
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
schwarze Kugeln herauszunehmen und drei Möglichkeiten eine schwarze und eine weisse Kugel
herauszunehmen. Es läßt sich das auch rechnerisch begründen:
Wahrscheinlichkeit für das Ziehen zweier schwarzer Kugeln = 34 · 23 = 12 ;
Wahrscheinlichkeit für das Ziehen einer weissen und einer schwarzer Kugel = 14 · 1 + 34 · 13 = 21 .
Betrachten wir ein Würfelexperiment und nennen wir es das Augensummenparadoxon.
G.W. Leibniz hat sich bei der Analyse dieses Experimentes einen kleinen Schnitzer erlaubt:
Es sei ihm unbegreiflich, wie ihm erfahrene Würfelspieler versicherten, warum bei zwei Würfeln die
”
Augensumme 9 wahrscheinlicher sei als die Augensumme 10, aber bei drei Würfeln die Augensumme
10 wahrscheinlicher als die Augensumme 9. Denn schließlich könne die Summe 9 wie die Summe 10
in beiden Fällen auf gleich viele Arten anfallen, also müßten die Augensummen in beiden Fällen gleich
wahrscheinlich sein.“.
Wir betrachten das Würfeln mit zwei Würfeln als Laplace–Experiment. Wir unterstellen
damit, dass die Würfel unterscheidbar sind und es einen ersten und einen zweiten Würfel gibt.
Wir haben
Ω = {(i, j) ∈ N × N|1 ≤ i, j ≤ 6},
und interessieren uns also für die Laplace–Wahrscheinlichkeiten der Ereignisse
A9 := {(i, j) ∈ Ω|i + j = 9} , A10 := {(i, j) ∈ Ω|i + j = 10} .
Wir haben dazu A9 , A10 abzuzählen. Es gilt
A9 = {(3, 6), (6, 3), (4, 5), (5, 4)} , A10 = {(4, 6), (6, 4), (5, 5)} .
und daher
1
3
1
4
= , P (A10 ) =
=
36
9
36
12
Bei drei Würfeln zeigt eine einfache Aufzählung (bei entsprechender Bezeichnung)
P (A9 ) =
P (A9 ) =
19
24
, P (A10 ) =
.
216
216
Leibniz hat übersehen, dass die Reihenfolge der Summanden hier wichtig ist. Modelliert man
das Experiment mit zwei ununterscheidbaren Würfeln, dann hat man statt 36 Möglichkeiten
nur noch 21 mögliche Ausgänge, aber kein Laplace–Experiment mehr, da etwa die Ausgänge
1–1 und 1–2 verschiedene Wahrscheinlichkeiten haben.
Der Fehler, der hier Leibniz unterlaufen ist, ist Basis für einen Jahrmarkttrick, der nach J.
Bertrand Bertrandsches Schachtelparadoxon genannt wird:
Drei nicht unterscheidbare Schachteln enthalten zwei Goldmünzen (1. Schachtel),
zwei Silbermünzen (2. Schachtel) und eine je eine Gold- und eine Silbermünze (3.
Schachtel). Jetzt entnimmt man einer Schachtel eine Münze. Der Veranstalter des
Spiels bietet nun eine Wette an: Die zweite Münze in der Schachtel ist aus demselben
Metall!
Man ist versucht, zu vermuten, dass die Wette fair ist, da man geneigt ist, zu vermuten, dass die
Beschaffenheit der zweiten Münze gleichwahrscheinlich ist. Dies ist nicht der Fall. Analysieren
wir die Situation, dass G(old) gezogen wurde. Wir vermuten richtig, dass nicht aus der Schachtel
mit den zwei Silbermünzen gezogen wurde und schließen daraus irrig, dass mit Wahrscheinlichkeit 21 beide Münzen in der Schachtel, aus der gezogen wurde, aus Gold sind. In Wahrheit sind
mit einer Wahrscheinlichkeit von 32 beide Münzen aus Gold, weil in zwei von 3 Fällen die beiden
Stand: 9. Februar 2010
97
c J.Baumeister
KAPITEL 8. ZUFALL
8.1. LAPLACE–HÄUFIGKEITEN
Münzen in der Schachtel aus Gold sind; später kommen wir darauf zurück..
Betrachten wir nun das Geburtstags–Pardoxon. Für eine Gruppe von n Personen ist die
Wahrscheinlichkeit“ zu ermitteln, dass mindestens ein Paar unter diesen Personen existiert, das
”
am gleichen Jahrestag Geburtstag hat. Wir nehmen an:
• Das Jahr wird mit 365 Tagen angesetzt, wir sehen also vom Auftreten von Schaltjahren ab.
• Geburtstage sind über die Jahrestage gleichverteilt.
Damit liegt ein Laplace–Experiment vor und jede Person hat mit
einem bestimmten Jahrestag Geburtstag. Wir setzen
1
365
Wahrscheinlichkeit an
Ω := {(ω1 , . . . , ωn ) ∈ Nn |1 ≤ ωi ≤ 365, 1 ≤ i ≤ n}.
Das zu betrachtende Ereignis ist
A := {(ω1 , . . . , ωn ) ∈ Ω|ωi = ωj für mindestens ein Paar (i, j), i 6= j}
und die gesuchte Wahrscheinlichkeit ist
Pn∗ :=
#A
365n
Betrachten wir zunächst einige Spezialfälle.
n ≥ 365
n=2
Pn∗ = 1 .
Die erste Person hat freie Auswahl, für die zweite Person ist die Wahrscheinlichkeit, am gleichen Tag wie die erste Person Geburtstag zu ha1
. Also
ben, 365
1
Pn∗ =
365
n=3
Die erste Person hat freie Auswahl, die zweite Person hat einen ver364
schiedenen Geburtstag mit Wahrscheinlichkeit 365
, die dritte Person
wiederum einen von den beiden Tagen verschiedenen Geburtstag mit
Wahrscheinlichkeit 363
365 . Also gilt
Pn∗ = 1 −
365 364 363
·
·
≈ 0, 009
365 365 365
Am Beispiel n = 3 sehen wir zweierlei. Erstens wird das günstige Vorgehen deutlich: Statt
Pn∗ haben wir zunächst die Wahrscheinlichkeit ausgerechnet, dass das Ereignis nicht eintritt.
Zweitens sehen wir einen multiplikativen Ansatz für zusammengesetzte Ereignisse. Wir kommen
darauf zurück.
Allgemein erhalten wir
365!
Pn∗ = 1 −
(365 − n)!365n
und damit die ergebnisse aus Tabelle
Stand: 9. Februar 2010
98
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Wir sehen also, dass bei einer Gruppengrößen von 23 Personen die Wahrn
20
22
23
30
40
50
scheinlichkeit, dass darunter ein Paar
Pn∗ 0,411 0,476 0,507 0,706 0,891 0,970
mit gleichem Geburtstag ist, bereits
größer als 21 ist.
Abbildung 8.1: Zum Geburtstagsproblem
Die Annahme über das Schaltjahr
beeinflußt die obigen Ergebnisse nur unwesentlich, etwa bleibt es bei der Aussage bezüglich der Gruppengröße n = 23. Die Annahme
über die Gleichverteilung der Geburtstage ist auch kein Einwand zur Qualität der obigen Ergebnisse, denn die Wahrscheinlichkeiten werden eher größer; man mache sich dies etwa daran
klar, dass alle Personen an einem bestimmten Tag Geburtstag haben.
Die Überraschung mit dem Ergebnis ist: ein Ereignis, dessen Eintreten für uns als Individuum
höchst unwahrscheinlich ist, ist für eine Gruppe bei weitem nicht mehr unwahrscheinlich. Der
Grund ist der, dass wir nicht auf einen bestimmten Geburtstagszwilling“ warten, sondern auf
”
irgendeinen.
8.2
Kombinatorische Überlegungen
Sei M eine Menge mit n Elementen. Wir wollen für den Sachverhalt
Wähle Elemente von M unter den Gesichtspunkten Anzahl und/oder Reihenfolge“
”
aus
die damit verbundenen Anzahlprobleme – auf wieviele Arten ist dies möglich? – studieren.
Definition 8.2.1 Eine r–Permutation (ohne Wiederholung) der Elemente einer n–elementigen Menge M ist eine injektive Abbildung von {1, . . . , r} nach M. Ist r = n, so sprechen
wir kurz von einer Permutation.
Sei M = {x1 , . . . , xn } mit #M = n. Aus der Definition 8.2.1 folgt sofort, dass r ≤ #M sein
muss, wenn es r−Permutationen geben soll, weil das Bild von {1, . . . , r} unter einer injektiven
Abbildung sicher r Elemente besitzt.
Ist σ eine r–Permutation, so entspricht dieser Abbildung σ das geordnete Tupel (xσ(1) , . . . , xσ(r) ) .
Umgekehrt, hat man eine Menge B := {xi1 , . . . , xir } mit #B = r, so gehört dazu die r–
Permutation σ : {1, . . . , r} ∋ j 7−→ xij ∈ M . Damit ist wohl klar, dass die Definition 8.2.1
unserer Anschauung von der Auswahl von r Elementen unter Berücksichtigung der Reihenfolge
entspricht.
Satz 8.2.2 Sei M eine Menge mit n Elementen. Die Anzahl P (n, r) der r–Permutationen ist
P (n, r) = n(n − 1) · · · (n − r + 1) =
n!
, 0 ≤ r ≤ n.
(n − r)!
Beweis:
Sei M := {x1 , . . . , xn } . Wie können wir eine r–Permutation σ hinschreiben? Für das Bild σ(1)
stehen n Elemente zur Verfügung. Sind die Bilder σ(1), . . . , σ(r − 1) festgelegt, so stehen für σ(r)
wegen der geforderten Injektivität nur die Elemente in M \{xσ(1) , . . . , xσ(r−1) } zur Verfügung,
also n − (r − 1) Elemente. Dies bedeutet nun:
P (n, 1) = n ; P (n, r) = P (n, r − 1) · (n − r + 1) .
Daraus folgt durch sukzessives Ausmultiplizieren oder induktiv P (n, r) = n(n − 1) · · · (n − r + 1) .
Stand: 9. Februar 2010
99
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Das schnelle Anwachsen der Ziffernstellen bei den Fakultäten3 ist Grund für die große Komplexität für Aufgaben, bei denen etwa eine große Anzahl von Objekten nach einem bestimmten
Merkmal in eine Ordnung gebracht werden sollen; siehe Abschnitt 3.3.
Im Spezialfall M = {1, . . . , n} kennen wir schon folgende Bezeichnung:
Sn := {σ : M −→ M |σ Permutation}
Eine Permutation σ ∈ Sn können wir dann schlicht durch die Abfolge (σ(1) . . . σ(n)) hinschreiben. Etwa bedeutet σ = (231) ∈ S3 , dass σ(1) = 2, σ(2) = 3, σ(3) = 1 gilt.
Beispiel 8.2.3 Man bestimme die Anzahl m der vierziffrigen Zahlen, deren Ziffern alle verschieden sind; 0 darf als erste Ziffer nicht vorkommen.
Für die erste Ziffer gibt es 9 Möglichkeiten: 1, 2, . . . , 9 . Für die Besetzung der verbleibenden
drei Ziffern gibt es dann jeweils noch P (9, 3) Möglichkeiten. Also m = 9 · P (9, 3) = 4536 .
Für das eben diskutierte Objekt Permutation“ gibt es die Interpretation durch ein Urnenex”
periment:
In einer Urne befinden sich n Objekte, nämlich die n Elemente von M . Man nimmt
der Reihe nach jeweils ein Element aus der Urne, ohne es wieder zurückzulegen.
Dann bilden r gezogene Elemente in der Reihenfolge, in der sie gezogen wurden, eine
r−Permutation der Menge M .
Eine duale Interpretation als Schachtelexperiment ist:
Jedem Element von M entspricht eine Schachtel; wir haben also n Schachteln. Es
werden nun der Reihenfolge nach r Objekte auf die n Schachteln verteilt und zwar
so, dass eine Schachtel höchstens ein Objekt enthält.
Definition 8.2.4 Eine r−Permutation mit Wiederholung einer Menge M ist eine Abbildung τ : {1, . . . , r} −→ M.
Die Anzahl W (n, r) der r−Permutationen mit Wiederholungen ist
W (n, r) = nr .
Der Beweis dafür ist leicht zu erbringen.
Die Interpretation der r−Permutationen mit Wiederholung als Urnenexperiment ist folgende:
Man nimmt der Reihe nach — die Reihenfolge spielt daher eine Rolle – jeweils ein Element aus
der Urne, insgesamt r Elemente, legt sie aber jeweils nach dem Ziehen wieder in die Urne
zurück. Die duale Interpretation als Schachtelexperiment ist die Verteilung von r Objekten auf
n Schachteln, wobei jede Schachtel beliebig viele Elemente aufnehmen kann.
Bisher haben wir Auswahlen betrachtet, so dass die Reihenfolge der Elemente von Relevanz
war und verschiedene Reihenfolgen verschieden zu zählen waren. Wenn wir nun keine Rücksicht
auf die Anordnung nehmen, kommen wir zum Begriff der Kombination (der Elemente).
Definition 8.2.5 Eine r–Kombination von M ist die Auswahl einer Teilmenge von M, bestehend aus r Elementen.
3
G.W. Leibniz liebte es, zahlenmäßige Zusammenhänge in Form von Tabellen und Tafeln darzustellen. Beispielsweise fügte er seiner Arbeit Dissertatio de Arte Combinatoria“aus dem Jahre 1666, in der mit seinem Titel
”
auch die Bezeichnung Kombinatorik vorprägte, eine Tabelle der Fakultäten 1! bis 24! = 620448401733239439360000
an.
Stand: 9. Februar 2010
100
c J.Baumeister
KAPITEL 8. ZUFALL
8.2. KOMBINATORISCHE ÜBERLEGUNGEN
Die Anzahl C(n, r) der r–Kombinationen einer Menge M mit n Elementen ist
C(n, r) =
n!
.
r!(n − r)!
Die Interpretation als Urnenexperiment kann man etwa so sehen: Man ziehe r Elemente ohne Zurücklegen und vergesse die Reihenfolge der gezogenen Elemente. Die Interpretation als
Schachtelexperiment ist so: Man verteile r Objekte auf n Schachteln, so dass in jeder Schachtel
höchstens ein Objekt liegt. Einordnungen heißen äquivalent (oder werden nicht unterschieden),
wenn sie durch eine Permutation der Objekte ineinander übergeführt werden können.
Wir nennen
n
n!
(n, r ∈ N, r ≤ n)
:=
r!(n − r)!
r
Binominalkoeffizienten. n
r kann interpretiert werden als die Anzahl der binären Wörter mit
r Einsen und n − r Nullen. Aus dieser Interpretation oder aus der Definition folgt sofort
n
n
n
n
n
n
=
=1,
=
=n,
=
(8.1)
0
n
1
n−1
r
n−r
Sortiert man die Teilmengen der n–elementigen
Menge M nach der Anzahl ihrer Elemente, so
liefert die Summenregel
n
n
n
+
+ ··· +
= 2n ,
(8.2)
0
1
n
1
1
1
1
1
1
3
4
5
1
2
1
3
6
10
1
4
10
1
5
1
da links und rechts der Identität die Anzahl
...
...
...
aller Teilmengen von
M steht.
Sortieren wir die nr Wörter der Länge n mit
r Einsen und n − r Nullen nach der 1. Ziffer:
Abbildung 8.2: Pascalsches Dreieck
n−1
Mit 1 beginnen r−1 Wörter der Länge n, mit
0 beginnen n−1
n−Wörter. Also
r
n
n−1
n−1
=
+
.
(8.3)
r
r−1
r
n
n
Zusammen mit der Randbedingung“
=
= 1, stellt man dies im Pascalschen Dreieck 4
0
n
”
dar. Die Bezeichnung von nr als Binomialkoeffizient hängt zusammen mit dem folgenden Satz.
Satz 8.2.6 (Binomialformel) Für a, b ∈ R und n ∈ N gilt:
n
(a + b) =
n X
n
j=0
j
aj bn−j .
Beweis:
Die Multiplikation der n Faktoren (a + b), . . . , (a + b) kann so erfolgen, dass man für
jedes
j, 0 ≤ j ≤ n, aus j Klammern a und aus n − j Klammern b auswählt; dies kann auf n
j Arten
n
j
n−j
geschehen. Daher ist der Koeffizient von a b
im ausgerechneten Produkt j .
Der Beweis mittels vollständiger Induktion sieht so aus:
n = 1 : Klar.
4
Diese Anordnung der Binomialkoeffizienten findet sich wohl erstmals bei B. Pascal.
Stand: 9. Februar 2010
101
c J.Baumeister
KAPITEL 8. ZUFALL
n+1 :
8.3. BEDINGTE WAHRSCHEINLICHKEITEN
(a + b)n+1 = (a + b)(a + b)n = (a + b)
=
n X
n
j=0
=
=
=
=
j
n X
n
j=0
aj+1 bn−j +
n X
n
j=0
j
j
aj bn−j
aj bn−j+1
n X
n j n−j+1
n
k n−(k−1)
ab
a b
+
j
k−1
j=0
k=1
n n n+1 X
n
n
n n+1
k n+1−k
b
+
+
a b
+
a
0
k−1
k
n
k=1
n n + 1 n+1 X n + 1 k n+1−k
n + 1 n+1
b
+
a b
+
a
0
k
n+1
k=1
n+1
X n + 1
ak bn+1−k
k
n+1
X
k=0
Beispiel 8.2.7 Beim Bridge–Spiel
erhält ein Spieler 13 Karten aus einem Spiel aus 52 Karten.
12 Kartenzusammenstellungen möglich. Die Chance“ eine
≈
10
Für einen Spieler sind also 52
13
”
ganz bestimmte Hand“ zu erhalten, ist für einen Spieler also etwa 1 : 1012 .
”
Beispiel 8.2.8 Beim Lotto wird bei einer Ziehung aus der Menge {1, . . . , 49} eine 6–elementige
Teilmenge ausgewählt. Daher ist die Anzahl der möglichen Ziehungen
49
= 13983816 .
6
8.3
Bedingte Wahrscheinlichkeiten
Häufig steht, bevor der Ausgang eines Zufalls–Experiments bekannt ist, schon die Information
zur Verfügung, dass der Ausgang zu einer bestimmten (möglicherweise eingeforderten) Teilmenge
des Ereignisraumes gehört. Was läßt sich dann über Wahrscheinlichkeiten sagen? Diese Fragestellung wollen wir nun untersuchen.
Zur Motivation des folgenden greifen wir auf den Begriff der relativen Häufigkeiten zurück. Sei
V ein Zufallsexperiment mit zugehörigem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ). Seien A, B
Ereignisse in (Ω, P ). Der Versuch V werde nun n–mal (unabhängig) wiederholt. Die relativen
Häufigkeiten von A unter der Bedingung B sind dann definiert durch
hn (A|B) :=
n#{ Es tritt A ∩ B ein }
hn (A ∩ B)
#{ Es tritt A ∩ B ein }
=
=
, n ∈ N.
#{ Es tritt B ein }
n#{ Es tritt B ein }
hn (B)
Dabei haben wir hn (B) > 0, n ∈ N, unterstellt. Analog zu dieser Formel kommen wir nun zu
einer entsprechenden Begriffsbildung im Wahrscheinlichkeitsraum (Ω, P ) .
Definition 8.3.1 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A, B ⊂ Ω
mit P (B) > 0. Dann heißt
P (A ∩ B)
P (A|B) :=
P (B)
die bedingte Wahrscheinlichkeit des Ereignisses A unter der Bedingung B.
Stand: 9. Februar 2010
102
c J.Baumeister
KAPITEL 8. ZUFALL
8.3. BEDINGTE WAHRSCHEINLICHKEITEN
Korollar 8.3.2 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Sei B ⊂ Ω mit
P (B) > 0. Dann ist (Ω, P OT (Ω), PB ) mit
PB (A) := P (A|B) , A ⊂ Ω,
ein endlicher Wahrscheinlichkeitsraum.
Beweis:
Verifiziert man unmittelbar.
Satz 8.3.3 (Satz von der totalen Wahrscheinlichkeit) Sei (Ω, P OT (Ω), P ) ein endlicher
Wahrscheinlichkeitsraum. Seien B1 , . . . , Bk ⊂ Ω mit
Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k .
Dann ist
P (A) =
k
X
i=1
P (Bi )P (A|Bi ) , A ⊂ Ω .
(8.4)
Beweis:
Ergibt sich aus der Additivität von P und der Tatsache, dass A disjunkte Vereinigung von
A ∩ B1 , . . . , A ∩ Bk ist.
Satz 8.3.4 (Satz von Bayes ) Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum.
Seien B1 , . . . , Bk ⊂ Ω mit
Ω = B1 ∪ · · · ∪ Bk , Bi ∩ Bj = ∅, 1 ≤ i, j ≤ k, i 6= j , P (Bi ) > 0 , 1 ≤ i ≤ k .
Ist P (A) > 0, so gilt für j = 1, . . . , k :
k
X
P (Bi )P (A|Bi ))−1
P (Bj |A) = P (Bj )P (A|Bj )(
(8.5)
i=1
Beweis:
Folgt aus Satz 8.3.3 zusammen mit P (Bj ∩ A) = P (Bj )P (A|Bj ), 1 ≤ j ≤ k .
In beiden Fällen ist man mit der Forderung nicht verschwindender Wahrscheinlichkeiten
(P (Bi ) > 0, 1 ≤ i ≤ n) konfrontiert. In der Formel in (a) kann man dies aber überspielen, da
das Nennerproblem nun in der Definition bedingter Wahrscheinlichkeit angelegt ist.
Aus der bedingten Wahrscheinlichkeit leitet sich der Begriff der Unabhängigkeit ab, der
für die Bewertung von Beobachtungen von Zufallsexperimenten von überragender Bedeutung
ist. Wir lassen uns dabei davon leiten, dass in einem Wahrscheinlichkeitsraum (Ω, P OT (Ω), P )
zwei Ereignisse A, B (nach Wahrscheinlichkeit) als unabhängig voneinander zu betrachten sind,
wenn P (A) mit der bedingten Wahrscheinlichkeit P (A|B) übereinstimmt. Dass P (A|B) nur für
P (B) > 0 erklärt ist, hat dabei keinen Einfluss mehr.
Definition 8.3.5 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Zwei Ereignisse
A, B ⊂ Ω heißen unabhängig, wenn P (A ∩ B) = P (A)P (B) gilt.
Unabhängigkeit ist ein in A, B symmetrischer Begriff. Sind A, B ⊂ Ω unabhängig, dann sind
es auch A, Ω\B und Ω\A, B und Ω\A, Ω\B. Die Verallgemeinerung der Unabhängigkeit auf
mehr als zwei Ereignisse liegt auf der Hand.
Stand: 9. Februar 2010
103
c J.Baumeister
KAPITEL 8. ZUFALL
8.4. DAS ZIEGENPROBLEM
Definition 8.3.6 Sei (Ω, P OT (Ω), P ) ein endlicher Wahrscheinlichkeitsraum. Seien A1 , . . . , Ak
Ereignisse. Diese Ereignisse heißen unabhängig, wenn für jede Wahl 1 ≤ i1 < · · · < il ≤ k
gilt:
P (Ai1 ∩ · · · ∩ Ail ) = P (Ail ) · · · P (Ail ).
Beispiel 8.3.7 Betrachte im Wahrscheinlichkeitsraum (Ω, P OT (Ω), P ) mit
Ω = {ω1 , ω2 , ω3 , ω4 }, P ({ωi }) =
1
, i = 1, . . . , 4,
4
die Ereignisse
A = {ω1 , ω2 }, B = {ω2 , ω3 }, C = {ω1 , ω3 }.
Wir haben
P (A ∩ B) = P (A)P (B) , P (A ∩ C) = P (A)P (C) , P (B ∩ C) = P (B)P (C),
aber
1
P (A ∩ B ∩ C) = 0, P (A) · P (B) · P (C) = .
8
Dieses Beispiel beleuchtet die Definition 8.3.6.
8.4
Das Ziegenproblem
Betrachten wir nun das sogenannte Ziegenproblem.5 In einer Spielshow wird ein Kandidat
vom Moderator vor drei geschlossene Türen geführt. Hinter diesen Türen sind ein Auto (Preis)
und jeweils eine Ziege (Niete) versteckt. Der Kandidat darf nun eine Tür bestimmen, die geöffnet
werden soll. Um die Spannung zu erhöhen, öffnet der Moderator aber vor der Öffnung dieser
Tür — zufällig, aber mit der Vorgabe, dass dahinter kein Auto ist — eine andere Tür; hinter
dieser Tür ist eine Ziege. Nun erlaubt der Moderator dem Kandidaten seine ursprügliche Wahl
zu überdenken und gegebenenfalls seine Entscheidung zu ändern. Wie soll er sich entscheiden?
Gibt es aus stochastischer Sicht berechtigte Gründe, die Tür zu wechseln?
Ja, er soll wechseln! Dies wollen wir mit bedingten Wahrscheinlichkeiten erklären. Bevor wir dies
tun, spielen wir die Situation mit 100 Türen, einem Auto und 99 Ziegen durch; sie vermeidet die
1
haben wir die Tür mit dem Auto
1 : 1 : 1 Situation bei drei Türen. Mit Wahrscheinlichkeit 100
99
gewählt und mit Wahrscheinlichkeit 100 ist das Auto hinter den verbleibenden Türen. Jetzt
öffnet der Moderator 98 der verbleibenden Türen, hinter jeder eine Ziege. Natürlich würde jeder
99
wechseln, denn mit Wahrscheinlichkeit 100
ist das Auto hinter der noch verschlossenen Tür.
Bevor wir ein mathematisches Modell betrachten, noch eine andere Argumentation, die den
Wechsel stützen kann. Der Standhafte gewinnt das Auto genau dann, wenn sich dieses hinter
der ursprünglich gewählten Tür befindet; die Wahrscheinlichkeit dafür ist 13 . Ein Wechselnder
gewinnt das Auto genau dann, wenn er zuerst auf eine der beiden Ziegentüren zeigt – die Wahrscheinlichkeit dafür ist 32 –. denn nach dem Öffnen der anderen Ziegentür durch den Moderator
führt die Wechselstrategie in diesem Fall automatisch zur Autotür.
Hier geben wir nun eine Erklärung für den Ratschlag Wechseln“ unter Nutzung elementarer
”
Wahrscheinlichkeiten.
5
G.v. Randow: Das Ziegenproblem, Reinbek, 1992, und I. Stewart: Mathematische Unterhaltungen, Spektrum
11/91, 12 – 16 . Dieses Problem hat beträchtlichen Wirbel verursacht, da selbst “gestandene“ Mathematiker
falsche Schlüsse zogen. Das Problem ist auch als Monty-Hall-Dilemma“ bekannt (nach dem Moderator der US”
amerikanischen Spielshow Let’s make a deal.
Stand: 9. Februar 2010
104
c J.Baumeister
KAPITEL 8. ZUFALL
8.4. DAS ZIEGENPROBLEM
Wir nehmen an, dass das Auto hinter Tür 1 steht. Wir können dies tun ohne Beschränkung
der Allgemeinheit: es ist ja nur ein Nummerierungsproblem. Der Kandidat hat drei Möglichkeiten
der Wahl, die er zufällig trifft, denn er hat ja keine zusätzliche Information. Der Moderator trifft
seine Wahl der Tür ebenfalls zufällig, sofern ihm auf Grund seiner Informationslage eine Wahl
bleibt. Dies führt zu folgender Tabelle für die Wahrscheinlichkeit der 4 möglichen Ereignisse vor
der Wechselmöglichkeit:
Wahl des Kandidaten
Tür 1
Tür 1
Tür 2
Tür 3
Wahl des Moderators
Tür 2
Tür 3
Tür 3
Tür 2
p (Wahrscheinlichkeit)
1 1
1
6 = 3 · 2
1 1
1
6 = 3 · 2
1
1
3 = 3 ·1
1
1
3 = 3 ·1
Die folgende Tabelle listet nun die Gewinn/Verlust–Wahrscheinlichkeiten auf:
Wahl/Kandidat
Tür 1
Ohne Wechsel
Wahl/Moderator Wahl/Kandidat
Tür 2
Tür 1
Gewinn
JA
Tür 1
Tür 3
Tür 1
JA
Tür 2
Tür 3
Tür 2
NEIN
Tür 3
Tür 2
Tür 3
NEIN
Wahl/Kandidat
Tür 1
Mit Wechsel
Wahl/Moderator Wahl/Kandidat
Tür 2
Tür 3
Gewinn
NEIN
Tür 1
Tür 3
Tür 2
NEIN
Tür 2
Tür 3
Tür 1
JA
Tür 3
Tür 2
Tür 1
JA
p
1
6
1
6
1
3
1
3
p
1
6
1
6
1
3
1
3
Es ist nun klar, dass der Wechsel zu einer Gewinnwahrscheinlichkeit von 2/3 führt, während
kein Wechsel nur eine Gewinnwahrscheinlichkeit von 1/3 realisiert.
Nun zu einer Darstellung des Dreitüren–Problems, die mit bedingten Wahrscheinlichkeiten
arbeitet.
O.E. öffne der Kandidat die erste Tür. Sei
Ω := {(azz, 2), (azz, 3), (zaz, 3), (zza, 2)}.
Hierbei steht etwa (azz, 2) für: Auto hinter der 1. Tür, Ziegen hinter Tür 2 und Tür 3; 2
bezeichnet die Türwahl des Moderators.
Setze
A1 := {(azz, 2), (azz, 3)}, A2 := {(zaz, 3)}, A3 := {(zza, 2)}.
Wir haben als Wahrscheinlichkeiten
P (A1 ) = P (A2 ) = P (A3 ) =
und ferner
P ({(azz, 2)}) =
Stand: 9. Februar 2010
1
,
3
1
1
, P ({(azz, 3)}) = .
6
6
105
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Wir analysieren etwa den Fall, dass der Moderator Tür 3 öffnet. Setze
B := {(azz, 3), (zaz, 3)}.
Wir haben dann P (B) = 21 und P (A1 ∩ B) = 16 , P (A2 ∩ B) = 31 , P (A3 ∩ B) = 0. Also P (B|A1 ) =
1
2 , P (B|A2 ) = 1, P (B|A3 ) = 0. Damit erhalten wir:
P (A1 |B) =
1
P (A1 )P (B|A1 )
= ,
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
3
P (A2 |B) =
P (A2 )P (B|A2 )
2
=
P (B|A1 )P (A1 ) + P (B|A2 )P (A2 ) + P (B|A3 )P (A3 )
3
Nun liegt der Beleg für den Ratschlag Wechsel“ vor !
”
8.5
Markov–Ketten
Gegeben sei ein System, welches unterschiedliche Zustände annehmen kann. Zu sukzessiven
diskreten Zeitpunkten ändert das System auf zufällige Weise seinen Zustand. Der zeitliche
Ablauf der Systemzustände ist dann eine Folge von Zuständen. Will man Aussagen über alle möglichen Zustandfolgen herleiten, so muß man Annahmen über die Wahrscheinlichkeiten
von Zustandsänderungen machen.6
Definition 8.5.1 Eine Markov–Kette ist ein (stochastischer) Prozess, der die zeitliche Entwicklung eines Systems unter den folgenden Bedingungen beschreibt:
(1) Endlichkeit: das System nimmt nur eine endliche Anzahl n von Zuständen an;
(2) diskrete Zeit: das System ändert seinen Zustand nur in diskreten Zeitabständen;
(3) Gedächtnislosigkeit: die Wahrscheinlichkeit pij des Übergangs vom i-ten zum j-ten Zustand innerhalb eines Zeitschrittes ist unabhängig davon, im wie vielten Schritt das System
gerade betrachtet wird.
Die Übergangsmatrix eines Markovprozesses mit k Zuständen ist die k × k-Matrix P, deren
Einträge gerade die Übergangswahrscheinlichkeiten pij sind.
Bemerkung 8.5.2 Wir vermeiden hier den Begriff der Zufallsvariablen, der in der Wahrscheinlichkeitstheorie von überrragender Bedeutung ist. Dies ist möglich, weil wir einen sehr
naiven Wahrscheinlichkeitsbegriff zugrundelegen und nur sehr einfache Zufallsexperimente“ be”
trachten.
Die Einträge in einer Übergangsmatrix P einer Markov–Kette können nicht beliebige Zahlen
sein: falls sich der Prozess zum Zeitpunkt n im Zustand xi befindet, muß er sich mit Wahrscheinlichkeit 1 zum Zeitpunkt n + 1 in irgendeinem Zustand befinden. Diese Wahrscheinlichkeit ist
gleich pi1 + · · · + pik und wir erhalten die Bedingung
0 ≤ pij ≤ 1, i, j = 1, . . . , k ,
k
X
pij = 1 für alle i = 1, . . . , k .
j=1
Eine Matrix P, die diese Eigenschaft hat, nennen wir zeilenstochastisch.
6
A.A. Markov, 1856-1922
Stand: 9. Februar 2010
106
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Eine Markovsche Kette stellt man graphisch häufig dadurch dar, dass man die verschiedenen Zustände als Punkte in der Ebene markiert und dann jeweils vom i-ten zum j-ten Punkt
einen mit der Übergangswahrscheinlichkeit pji beschrifteten Pfeil einzeichnet. Das so entstehende
Schaubild heißt Graph der betrachteten Markovschen Kette; beachte Schleifen sind zuzulassen.
Beispiel 8.5.3 Betrachte die Matrix
P := (pij )1≤i,j≤3


q p 0


:= q 0 p
q p 0
Der Eintrag p23 = p etwa bedeutet, dass der Zustand 2 mit Wahrscheinlichkeit p in den Zustand
3 übergeht. Damit hier eine Übergangsmatrix vorliegt, benötigen wir q + p = 1 .
Beispiel 8.5.4 Das Wetter in einer bestimmten Gegend werde jeweils durch einen der zwei
Zustände R (regnerisch) und T (trocken) charakterisiert; der Übergang von einem Tag auf den
nächsten sei durch folgende Tabelle bestimmt, aus dem dann die Übergangsmatrix P abgeleitet
wird:
!
R
T
0.662 0.338
R 0.662 0.338
P :=
0.250 0.750
T 0.250 0.750
Beispiel 8.5.5 Wir betrachten die Irrfahrt eines Betrunkenen. Ein Betrunkener will aus einem
Gasthaus heimkehren. Das Gasthaus liegt an einer geraden Straße, an einem Ende befindet sich
ein See, am anderen das Wohnhaus des Betrunkenen. Der Betrunkene erinnert sich nicht an die
richtige Richtung. Er macht einen Schritt nach links oder rechts mit gleicher Wahrscheinlichkeit
1/2, dann hält er inne. Ohne sich zu erinnern, woher beim letzten Schritt gekommen war, irrt
er in dieser Weise weiter: einen Schritt dem See zu, einen Schritt dem Wohnhaus zu, immer
mit Wahrscheinlichkeit 1/2. Erreicht er den See, fällt er hinein, erreicht er das Wohnhaus,
bleibt er dort (und schläft den Rausch aus). Frage: mit welcher Wahrscheinlichkeit ertrinkt der
Betrunkene und mit welcher Wahrscheinlichkeit erreicht er sein Haus?
Wir machen hier nicht weiter, sondern verweisen auf die Literatur.
Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P := (pij )1≤i,j≤k . Mit
(n)
(n)
einem Vektor π (n) = (π1 , . . . , πk ) ∈ R wollen wir die Wahrscheinlichkeit beschreiben, dass
(n)
sich die Markovkette zum Zeitpunkt n mit Wahrscheinlichkeit πi im Zustand i befindet. Wir
fordern also für jedes u := π (n) :
0 ≤ uj ≤ 1, j = 1, . . . , k ,
k
X
uj = 1 .
(8.6)
j=1
Es ist einfach nachzurechnen, dass mit u := π (n) auch u := π (n+1) die Bedingung (8.6) erfüllt.
Nun gilt:
π (n+1) = π (n) P
π
(n)
P
n
(P n )ij
Stand: 9. Februar 2010
= π
(0)
P
(8.7)
n
n−r
(8.8)
r
= P
P
Xk
=
(P n−r )il (P r )lj
l=1
107
(8.9)
(8.10)
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Hierbei sind P l die Potenzen der Matrix P . Die Gleichungen (8.7),(8.8),(8.9) heißen ChapmanKolmogorov-Gleichungen. Die Interpretation von (8.9),(8.10) ist die, dass die Wahrscheinlichkeit, in n Schritten vom Zustand i in den Zustand j zu gelangen, gleich der Summe der
Wahrscheinlichkeiten, zunächst von i in r Schritten zu einem Zwischenzustand l und von dort
in den restlichen n − r Schritten nach j zu gelangen, wobei die Summe über alle möglichen
Zwischenzustände l auszuführen ist.
Definition 8.5.6 Betrachte eine Markovkette, beschrieben durch die Übergangsmatrix P :=
(pij )1≤i,j≤k . Seien i, j zwei Zustände der Markovkette. Wir sagen i führt zu j, falls die Wahr(n)
scheinlichkeit, von i nach j zu gelangen, strikt positiv ist, d.h. wenn es n ∈ N gibt mit Pij > 0 .
Führt i zu j und j zu i, dann sagen wir, dass i, j miteinander kommunizieren.
In der Darstellung der Markovkette durch einen Graphen bedeutet i führt zu j“ nichts anderes,
”
als dass es einen Weg entlang der Pfeile von i nach j gibt.
Die Relation kommunizieren miteinander“ ist zwar keine Äquivalenzrelation – die Reflexi”
vität ist nicht notwendigerweise gegeben – trotzdem wird die Markovkette in disjunkte Klassen
eingeteilt, wenn wir das Problem mit Reflexivität dadurch beheben, dass wir jedem Zustand,
der mit keinem anderen kommunizieren, eine eigene Klasse zuordnen.
Lemma 8.5.7 Jeder Zustand gehört genau einer Klasse an.
Beweis:
Offenbar gehört jeder Zustand einer Klasse an. Sei i ein Zustand, der den Klassen K1 und K2
angehört. Seien u ∈ K1 und v ∈ K2 , dann gilt wegen der Transitivität der Relation kommuni”
zieren miteinander“, dass u mit v kommuniziert. Also kommunizieren alle Zustände von K1 mit
allen von K2 , und folglich muß K1 gleich K2 sein.
Definition 8.5.8 Eine Markovkette mit Übergangsmatrix heißt M-regulär, falls es ein N ∈ N,
so dass P N nur strikt positive Einträge enthält.
Offenbar zieht Regularität“ nach sich, dass alle Zustände miteinander kommunizieren; also gibt
”
es nur eine Klasse. Diese Eigenschaft nennt man Ergodizität. Hinreichend für die Eigenschaft
Ergodizität“ sind Irreduzibilität“ und Aperiodizität“; wir verweisen auf die Literatur.
”
”
”
Satz 8.5.9 Sei P die Übergangsmatrix einer M-regulären Markovkette mit k Zuständen. Dann
gilt:7
(a) Der Grenzwert W := limn P n existiert.
(b)
Die Matrix W ist zeilenstochastisch und alle Zeilenvektoren von W sind gleich.
(c)
Die Matrix W hat einen Eigenwert 1 und für den zugehörigen Eigenvektor π = (π1 , . . . , πk )
gilt
πi > 0, i = 1, . . . , k , π1 + · · · + πk = 1 ;
π ist der Zeilenvektor von W .
(d) Für jeden Vektor π 0 , der (8.6) erfüllt, gilt limn π (0) P (n) = π .
Beweis:
Die Minima und Maxima in den Spalten von P n spielen die Hauptrolle:
m(j, n) := min(P n )ij , M (j, n) := max(P n )ij .
i
7
i
Konvergenz bei einer Folge von Matrizen ist definiert über die Konvergenz aller Einträge.
Stand: 9. Februar 2010
108
c J.Baumeister
KAPITEL 8. ZUFALL
8.5. MARKOV–KETTEN
Sei j ∈ {1, . . . , k} .
Wir zeigen, dass die Folge (m(j, n))n∈N monoton nicht fallend ist. Dies liest man ab aus
m(j, n + 1) = min(P
n+1
i
≥ min
i
)ij = min
i
k
X
k
X
Pil (P n )lj
l=1
Pil (min(P n )lj ) = m(j, n) min
i
l
l=1
k
X
Pil = m(j, n) .
l=1
Analog beweist man, dass die Folge (M (j, n))n∈N monoton nicht wachsend ist.
Also ist auch die Folge (M (j, n) − m(j, n))n∈N monoton nicht wachsend und daher auch konvergent. Setze µ(j, n) := limn (M (j, n) − m(j, n)) . Es gilt offenbar µ(j, n) ≥ 0 . Wir wollen
limn µ(j, n) = 0 zeigen. Wegen der Monotonie der Folge reicht es zu zeigen, dass eine Teilfolge
von (µ(j, n))n∈N gegen Null konvergiert.
Nach Voraussetzung über die M-Regularität können wir N ∈ N so wählen, dass P N nur strikt
positive Einträge hat. Setze d := mini,j (P N )ij ) ; es gilt d ∈ (0, 1] . Sei n ∈ N . Dann gilt
(P n+N )ij
=
=
=
k
X
l=1
k
X
l=1
k
X
l=1
(P N )il (P n )lj
N
n
n
((P )il − d(P )jl )(P )lj + d
k
X
(P n )jl (P n )lj
l=1
((P N )il − d(P n )jl )(P n )lj + d(P 2n )jj
≥ m(j, n)
k
X
((P N )il − d(P n )jl ) + d(P 2n )jj
l=1
= m(j, n)(1 − d) + d(P 2n )jj .
Durch Minimumbildung erhalten wir
m(j, n + N ) ≥ m(j, n)(1 − d) + d(P 2n )jj .
Analog leitet man her:
M (j, n + N ) ≤ M (j, n)(1 − d) + d(P 2n )jj .
Folglich haben wir
µ(j, n + N ) ≤ (1 − d)µ(j, n) .
Betrachte nun für ein n ∈ N die Teilfolge (µ(j, n + lN ))l∈N . Wir haben
µ(j, n + lN ) = µ(j, n + (l − 1)N + N ) ≤ (1 − d)µ(j, n + (l − 1)N )
und nach Iteration
µ(j, n + lN ) ≤ µ(j, n)(1 − d)l .
Da 1 − d < 1 gilt, folgt die Konvergenz von (µ(j, n + lN ))l∈N gegen Null.
Nun kommen wir zum Beweis der Aussagen in der Formulierung des Satzes.
Aus der Existenz von limn m(j, n) = limn M (j, n) , j = 1, . . . , k , folgt die Existenz von wij :=
limn (P n )ij = limn m(j, n) für alle i, j = 1 . . . , k , und die Unabhängigkeit von wij von i für alle
j = 1, . . . , k . Setze W := (wij )1≤i,j≤k . W hat nun gleiche Zeilenvektoren; sei π = (π1 , . . . , πk )
Stand: 9. Februar 2010
109
c J.Baumeister
KAPITEL 8. ZUFALL
8.6. ÜBUNGEN
der Zeilenvektor von W .
Da (m(j, n))n∈N monoton
P
Pk nicht fallend und m(j, N ) positiv ist, ist jedes ist πi positiv. Aus
k
n
l=1 (P )ij = 1 folgt
l=1 πl = 1 .
Aus
k
k
X
X
πj = lim(P n+1 )ij = lim( (P n )il plj ) =
πl plj = (πP )j , j = 1, . . . , k ,
n
n
l=1
l=1
folgt die Eigenwertgleichung.
Zu (d).
Offenbar konvergiert (π (0) P n )n∈N gegen π (0) W . Da u := π (0) die Bedingung (8.6) erfüllt und
alle Zeilen von W gleich sind, ist π (0) W = π .
Damit sind alle Aussagen gezeigt.
Die Gleichung
πP = π
(8.11)
ist nun der Ansatz zur Analyse einer regulären Markovkette: bestimme den Eigenvektor zum
größten Eigenwert von P . Dann ist das Langzeitverhalten ablesbar. Der Vektor π heißt Gleichgewichtsverteilung.
Beispiel 8.5.10 Wir betrachten das Beispiel 8.5.4 mit der Übergangsmatrix
!
0.662 0.338
P :=
0.250 0.750
Wir erhalten in numerischer Rechnung
!
0.432
0.568
P5 =
, P 10 =
0.420 0.580
0.425 0.575
0.425 0.575
!
, P 20 =
0.425 0.575
0.425 0.575
!
.
Der Eigenvektor zum Eigenvektor 1 ist
α = (0.425, 0.575) .
Auf lange Sicht ist also das Wetter in der Gegend unabhängig von einer beliebigen Startverteilung
π (0) : es ist in 42.5% der Tage regnerisch und in 57.5% der Tage trocken.
8.6
Übungen
1.)
Stand: 9. Februar 2010
110
c J.Baumeister
Kapitel 9
Modellierung
Modellierung ist der Versuch, eine Wirklichkeit durch ein Modell der Wirklichkeit zu ersetzen.
Mathematische Modellierung bedeutet, Modelle in der Sprache der Mathematik zu formulieren
und Theorien zu ihrer Analyse zu entwickeln/anzuwenden. Modellierung ist eng mit Simulation
verknüpft und damit auch mit dem Einsatz von Computern.
9.1
Wissenschaft
Bevor wir über Modelle reden können, die ja mathematische Modelle sein sollen, ist über die
Wissenschaft Mathematik zu reden. Sie soll ja hier mit seinen Entwicklungen, Resultaten, Ordnungsinstrumenten, . . . herangezogen werden.
Was ist Wissenschaft, was ist eine Wissenschaft, was ist die Wissenschaft Mathematik? Darum
geht es hier, aber etwas weniger umfassend. Wir fragen nach dem Gemeinsamen einer wissenschaftlichen Theorie.1
Es ist offenbar, dass eine Darlegung dazu hier nur sehr laienhaft angelegt sein kann. Aber
die folgenden Thesen scheinen doch richtungsweisend zu sein für eine spätere Einordnung des
Vorgangs der Modellierung.
• Die Aussagen einer wissenschaftlichen Theorie beziehen sich nicht auf konkrete
Objekte sondern auf bestimmte theoretische Begriffe
• Eine wissenschaftliche Theorie hat eine streng deduktive Struktur.
• Anwendungen einer wissenschaftlichen Theorie auf die wirkliche Welt basieren
auf Korrespondenzregeln zwischen theoretischen Gebilden und konkreten Objekten.
Anders als die internen Aussagen der Theorie2 enthalten die Korrespondenzregeln keine absolute
Garantie für ihre Gültigkeit. Die grundlegende Methode, um ihre Gültigkeit – und damit die
Anwendbarkeit der Theorie – zu überprüfen, ist die experimentelle Methode. Der Bereich, in
dem die Korrespondenzregeln gültig sind, ist in jedem Falle begrenzt.
Der ungeheuere Nutzen exakter Wissenschaften – dies ist die Gesamtheit aller wissenschaftlichen Theorien – besteht darin, dass sie Modelle der Wirklichkeit liefern. Diese Modelle ermöglichen
die Darstellung und Vorhersage natürlicher Phänomene, indem man sie mittels Korrespondenzregeln auf die theoretische Ebene überträgt, die so erhaltenen Übungsaufgaben“ löst und die
”
Lösungen auf die wirkliche Welt zurücküberträgt.
1
Die folgenden Ausführungen sind geleitet von den Gedanken und Ausführungen in L. Russio, Die vergessene
Revolution, Springer, 2003, das sehr interessant und mit überraschenden Einsichten das hellenistische Zeitalter
des antiken Wissens darstellt.
2
L. Russio schreibt davon, dass eine Theorie nur dann wissenschaftlich genannt werden kann, wenn man
Übungsaufgaben zu ihr erstellen kann.
111
KAPITEL 9. MODELLIERUNG
9.2. MODELLE
In jeder reinen Naturlehre ist nur so viel an eigentlicher Wissenschaft enthalten, als
Mathematik in ihr angewandt werden kann.
I. Kant
9.2
Modelle
Wenn wir nun von Modellen für etwas sprechen wollen, haben wir zu klären, was dieses etwas sein
soll: ein reales Problem?, ein Phänomen?, ein räselhaftes Verhalten?, . . . . Wir wollen uns dabei
des Begriffs des Systems bedienen und unter einem System einen wohlumschriebenen Teilbereich
der Wirklichkeit verstehen. Zugegeben, nicht viel ist gewonnen mit dieser Definition“, in kon”
kreten Situation wird sie uns aber schon helfen können. Beispiele für solche Wirklichkeitsbereiche
könnten sein:
Mechanische Systeme, chemische Reaktoren, Biotope, Lebensgemeinschaft gewisser
Spezies, Körperorgane, Handelsbetriebe, Volkswirtschaften, Klimasysteme
Die Beschreibung von Systemen umfasst die Angabe der Objekte (Bestandteile), die zum System
gehören, legt die Beziehungen unter den Objekten offen, erklärt mögliche Interaktionen unter
den Bestandteilen und gibt die Umstände an, unter denen die Beschreibungen gültig sein sollten.
Die Wechselwirkung eines Systems mit der Systemumgebung erfolgt über so genannte Eingangsund Ausgangsgrößen.
In grober Einteilung sprechen wir von zeitunabhängigen (stationären) Systemen und zeitabhängigen (dynamischen) Systemen. Manchmal ist Zeit“ auch eine fiktive Zeit. Unter einem
”
Experiment an einem System versteht man den Prozess, durch Aufschalten“ spezieller Ein”
gangsgrößen aus gemessenen Ausgangsgrößen Aussagen über das System zu gewinnen.
Ein Modell ist ein Abbild eines Systems, einer Wirklichkeit in einem anderen Kontext. Der
Physiker Hertz3 scheint erstmals das Wort Modell“ in einem Sinne verwendet zu haben, der
”
unserem Verständnis entspricht. Wir werden uns auf mathematische Modelle beschränken, d.h.
auf solche, die im Kontext der Mathematik betrachtet werden; siehe unten. Es ist nicht zwingend,
nur mathematische Modelle zu betrachten, z. B. kann man für die Lebensgemeinschaft gewisser
”
Spezies“ auch ein sozialwissenschaftliches Modell aufstellen; möglicherweise landet man aber bei
der Modellierung dieses Models wieder bei einem mathematischen.
Die Modellbildung, der Modellierungsprozess umfasst
(1) die Identifikation der Bestandteile (des zu modellierenden Systems),
(2) die Aufdeckung von Zusammenhängen im Beziehungen im System,
(3) die Annahmen, unter denen das Modell schließlich betrachtet werden soll,
(4) die Festlegung der Modellierungsebene.
Mit Modellierungsebene meinen wir hier: sozialwissenschaftlich, physikalisch, mathematisch, . . . .
Typische methodische Elemente der Modellbildung sind
• Vereinfachung, Idealisierung,
• Festlegung des Wesentlichen, Weglassung von Unwesentlichem, Abstraktion,
• schrittweises Vorgehen von einfach zu komplex,
3
Heinrich Hertz, 1857-1894, Physiker
Stand: 9. Februar 2010
112
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.3. MATHEMATISCHE MODELLIERUNG
• Versuch und Irrtum.
Im Allgemeinen wird man Modellsequenzen betrachten, beginnend mit einfachen Grundmodellen, fortschreitend unter Einbeziehung der Ergebnisse der vorangegangenen Modellanalyse.
Simulation ist das Nachbilden eines Systems (mit seinen dynamischen Prozessen) in einem experimentierfähigen Modell, um zu Erkenntnissen zu gelangen, die auf die Wirklichkeit übertragbar
sind; siehe Abschnitt 9.4.
Die Schwierigkeit bei der konzeptuellen Modellbildung liegt darin, das Beobachtete zu vereinfachen und zu abstrahieren ohne die wesentlichen Aspekte auszulassen oder zu verfälschen.
Dabei spielt die Fragestellung, die das Ziel für die Analyse vorgibt, eine wesentliche Rolle. Neben diesen konzeptuellen Modellen, die unser Anliegen sind, werden in den Naturwissenschaften
auch deskriptive Modelle benötigt. Sie sind in höchstem Maße nützlich für die Aufbereitung von
großen Datenmengen/Meßdaten. Dem Anspruch, den Simulationsmodelle mitunter erheben, ein
wirklichkeitstreues Abbild einer komplexen Realität wiederzugeben, können diese Modelle im
Allgemeinen nicht gerecht werden: die hohe Komplexität eines Simulationsmodells, die ja gerade den engen Realitätsbezug herstellen sollte, führt oft dazu, dass sie undurchschaubar werden
in ihrer Aussagekraft.
Modellen liegen Gedankenexperimente zugrunde unter Idealbedingungen, allenfalls
geeignet, wirkliche Experimente nach ihnen zu entwerfen. Wo das, wie meist in
den Sozialwissenschaften, nicht möglich ist,
kann die Lösung“, die Wirklichkeit ein”
fach mit den Modellen zu identifizieren,
nur Verwirrung stiften, vor allem dann,
wenn man nicht akzeptieren will, dass Modelle nicht als richtig oder falsch, sondern als mehr oder weniger passend anzusehen sind. Die Rolle kann in Problemfeldern, in denen es keine Laborversuche gibt,
nicht dieselbe sein wie etwa in der Physik.
9.3
Ingenieurwisschensachaften
I
n
f
o
r
m
a
t
i
k
Naturwissenschaften
Mathematik
Theorie
Experiment
Berechnung
Ö
k
o
n
o
m
i
e
Life sciences
Abbildung 9.1: Mathematik und Modellierung
Mathematische Modellierung
Mathematische Modellierung/Modellbildung meint – siehe Abschnitt 9.1 – die Korrespondenzregeln zwischen den konkreten Objekten und den theoretischen mathematischen Gebilden herzustellen. Von Galileo Galilei stammt die Metapher vom Buch der Natur, das in der Sprache der
”
Mathematik“ geschrieben sei. Sie beschreibt den Zugang zur Natur, den die Naturwissenschaften
seit Galilei gewählt haben. Mathematische Modellierung ist demnach der Versuch, das Nachdenken über eine Fragestellung in mathematische Termini zu übersetzen und sich der (Stringenz
der) Mathematik für die Behandlung von Problemen außerhalb der Mathematik zu bedienen.
A. Alexandrov schreibt:4
Die Mathematik ist ein mächtiges und universelles Instrument der Erkenntnis und
der Lösung von Aufgaben überall dort, wo sich genügend klar definierte Strukturen
abzeichnen.
4
A. Alexandrov, Mathematik und Dialektik, Ideen des exakten Wissens, 4 (1971), 251-257.
Stand: 9. Februar 2010
113
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.4. SIMULATION
Dies ist sicher der Fall in den klassischen Anwendungsgebieten Physik und Ingenieurwissenschaften. Der Erfolg der mathematischen Modellierung bei der Behandlung physikalischer und
technischer Systeme hat diesen Zugang auch in die Lebenswissenschaften, Wirtschaftswissenschaften und und Sozialwissenschaften hineingetragen.
Mathematische Modelle dienen dem Verständnis grundlegender Mechanismen, sind jedoch
meist stark vereinfachend und lassen dann nur allgemeine, qualitative Aussagen zu. Die Theoriebildung aus mathematischen Modellen heraus ist dementsprechend auch stark auf grundlegende
Aussagen über das modellierte System eingeschränkt. Der springende Punkt der Brauchbarkeit
eines mathematischen Modells für den angepeilten Zweck ist die Güte des Modells: eine Beobachtung des Systems liefert qualitative und quantitative Daten, die Güte des mathematischen
Modells wird an Hand des Grades der Übereinstimmung der Vorhersagen“ des Modells mit den
”
Daten bewertet.
Mathematische Modellierung realer Phänomene kann mit unterschiedlichen Werkzeugen der
Mathematik erfolgen. Phänomene, die sich so modellieren lassen, finden sich u.a. in den Anwendungsgebieten
• Informatik
• Wirtschaftswissenschaften, Finanzmathematik
• Biologie, Biophysik
• Mechanik, (Mathematische) Physik
In der Informatik werden diskrete Strukturen durch Graphen, Gitter, Automaten, . . . abgebildet;
in den Wirtschaftswissenschaften werden Entscheidungs– und Optimierungsprobleme umgesetzt
in mathematische Aufgaben; in der Biologie werden Wachstumsmodellle betrachtet; In der Biophysik werden (dynamische) Mdelle zum Beispiel für die Aktivität des Gehirns erarbeitet; in der
Mechanik werden Konsequenzen aus den Bewegungsgesetzen für starre Körper gezogen; Modelle
der mathematischen Physik beschreiben kontinuierliche Systeme mittels partieller Differentialgleichungen; in der Finanzmathematik ist ein zentrales Problem die Bewertung von Optionen,
modelliert in erster Näherung“ durch die Black-Scholes-Differentialgleichung. In jedem Falle
”
stehen Modellannahmen am Anfang: sie dienen zum Einen, ein Modell auf der jeweiligen mathematischen Basis herleiten zu können und zum anderen dieses Modell so einfach zu gestalten,
dass eine stringente mathematische Untersuchung“ möglich wird.
”
9.4
Simulation
Was ist Simulation? Hier ist der Versuch einer Definition:
Unter Simulation versteht man in der Wissenschaft die Nachbildung eines realen
Objektes oder Vorganges als Modell und die Nutzung dieses Modells an Stelle des
Objekts.
Ein Beispiel dafür ist der maßstabsgetreue Nachbau eines Autos für ein Experiment im Windkanal. Seit dem Siegeszug des Rechners als technisches Werkzeug werden solche Modelle jedoch in
der Regel nicht mehr physikalisch, sondern virtuell in Form von Computerprogrammen realisiert
und benutzt.
Das bekannteste Beispiel einer Simulation durch einen Computer ist wohl die Wettervorhersage, welches das Ergebnis aufwändiger Rechnungen auf leistungsfähigen Supercomputern ist.
Aus der Sicht, die wir einnehmen wollen, beginnt die Geschichte wohl in den vierziger Jahren
Stand: 9. Februar 2010
114
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE
des letzten Jahrhunderts. Im Vordergrund standen Simulationen von Flugkörpern, radioaktiven Stoffen, elektrischen Schalkreisen und schlies̈lich von Satelliten. In den Universitäten sind
sogar Fachgebiete wie Modellierung, Simulation“ entstanden. Heutzutage kann Jedermannn
”
Simulationsreisen machen, die PC’s sind leistungsstark genug, allerdings ist der Grat zwischen
wissenschaftlicher Simulation und Beispielsanwendungen schmall.
Simulation ist im Allgemeinen eine interdisziplinäre Tätigkeit, ein interdisziplinäres Fach. Es
ist angesiedelt im Überlappungsbereich von Informatik, Mathematik und den Anwendungsgebieten, wie beispielsweise der Physik, der Medizin und Biologie. Stichworte zu Gründen für den
Einsatz von Simulation können sein: Kosten, Gefahrenpotential, Beobachtbarkeit, Beinflussbarkeit, Störungsfreiheit.
Anwendungen der Simulation sind vielfältig. Bereiche sind:
Wissenschaft Hier wird Simulation eingesetzt, um Theorien zu entwickeln und zu verfeinern.
Dies geschieht durch einen Vergleich zwischen Simulationsergebnissen und theoretischen
Prognosen.
Technik Für den Ingenieur ist die Simulation ein Entwurfs- und Optimierungswerkzeug. Mit
ihrer Hilfe kann er seine Ideen für ein Produkt oder System testen, lange bevor der erste
Prototyp gebaut wird.
Gesellschaft Für die Gesellschaft liegt der Nutzen der Simulation in den Prognosen von Ereignissen und Erklärungen von realem Geschehen. Beispiele sind Märkte, Wahlverhalten,
....
Unterhaltung Simulationen haben Einzug gehalten bei den Unterhaltungsmedien in der Entwicklung von Filmen, . . . . Anwendungen in der Medizin profitieren davon.
Simulation bedarf im Allgemeinen der Entwicklung von (schnellen) Algorithmen, um die
Zwecke der Simulation zu erreichen. Hier ist heutzutage der Ansatz für Forschung und Weiterentwicklung. Man unterscheidet deterministische und stochastische Ansätze für Algorithmen.
Beispiele sind:
Deterministisch Lineare Optimierung/Simplexverfahren, Differenzengleichungen, Differentialgleichungen, Gröbnerbasen,. . . .
Stochastisch Approximationsalgorithmen, Monte-Carlo-Methoden, Markovketten, stochastische Differentialgleichungen, . . . .
9.5
Zur Mendelschen Vererbungslehre
Eine der ersten systematischen Arbeiten zur Vererbungslehre wurde im 19. Jahrhundert von
Gregor Mendel5 geleistet. Unter anderem untersuchte Mendel die Vererbung einer Eigenschaft
von Erbsen, nämlich ob die Erbsen eine glatte oder runzelige Oberfläche besitzen. Wie bei allen
Pflanzen besitzt dabei jedes Individuum zwei Eltern.
Durch Kreuzung von Erbsen mit glatter Oberfläche und runzeliger Oberfläche erhält jede
Erbse in der Tochtergeneration das Genmaterial je eines Elternteils mit glatter und je eines
Elternteils mit runzeliger Oberfläche. Überraschenderweise gab es bei den Nachkommen der
Erbsen in der ersten Tochtergeneration nur noch glatte Erbsen. Noch überraschender waren die
Ergebnisse bei der nachfolgenden Tochtergeneration, bei der nun beide Elternteile aus der ersten
5
Gregor Mendel, 1822 - 1884, Augustinermönch
Stand: 9. Februar 2010
115
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.5. ZUR MENDELSCHEN VERERBUNGSLEHRE
Tochtergeneration stammten. Hier kamen sowohl glatte als auch wieder runzelige Erbsen zum
Vorschein. Interessanterweise waren jedoch die glatten Erbsen im Übergewicht, und zwar im
Verhältnis 3 zu 1. Mendel suchte nach einer Erklärung und fand sie.
Bei diploiden“ Organismen, z. B. bei Menschen, Pflanzen,. . . , sind entlang der Chromo”
somen Gene wie in einer Kette nebeneinander aufgereiht. Ein Gen kann in zwei oder mehr
Zustandsformen auftreten, die man Allele nennt. Am Genort der Erbsen, der für die Oberfläche verantwortlich ist, gibt es zwei allele Gene, bezeichnet mit G (glatte Oberfläche) und g
(runzelige Oberfläche). Damit gibt es drei verschiedene Genotypen: GG, Gg, gg (Gg und gG
können wir identifizieren). Hier ist die Mendelsche Vererbung:
Elterngeneration:
Erste Tochtergeneration:
Zweite Tochtergeneration:
GG, gg
Gg, Gg
GG, Gg, gG, gg
Hier geht man also davon aus, dass in der Elterngeneration die Genotypen GG und gg vorliegen.
Wieso kommt es zu den Genotypen in der ersten und zweiten Tochtergeneration und was soll
nun Gg eigentlich sein? Wir wissen nur, dass GG glatt und gg runzelig bedeutet. Ein Organismus, der bezüglich einer Ausprägung dieselbe Erbinformation trägt, wird als reinerbig oder
homozygot bezeichnet.6 Wir haben nun mit Gg eine mischerbige oder heterozygote Erbinformation vorliegen. Soll daher die Ausprägung ein wenig runzelig“ vorliegen oder soll eine
”
der beiden Allele zufällig die Ausprägung bestimmen? Bei anderen Pflanzen gibt es durchaus
die Beobachtung, dass Nachfahren eine gemischte Ausprägung“ haben: rote Blume + weisse
”
Blume = rosa Blume als Nachfahre. Dies ist aber hier, wie die Experimente gezeigt haben,
nicht der Fall: alle Erbsen der ersten Tochtergeneration werden als glatt beobachtet.
Die Interpretation dieses Sachverhalts ist, dass beide Allele gegeneinander konkurrieren und
in Abhängigkeit der Gene sich immer eines der beiden als dominant behauptet. Dies legt es
nahe, der Unterscheidung Genotyp (Zusammensetzung der Erbinformation) die Unterscheidung
Phänotyp (sichtbare Ausprägung) zur Seite zu stellen. Damit erklärt sich die Ausprägung der
ersten Tochtergeneration dadurch, dass Gg, gG und GG denselben Phänotyp besitzen.
Wie kann man nun die Erscheinung in der zweiten Tochtergeneration erklären? Nimmt
man an, dass Eltern des Genotyps Gg eines seiner Gene mit gleich großer Wahrscheinlichkeit
an seine Kinder weitergibt, dann gibt es für die Erbsen der zweiten Tochtergeneration vier
Möglichlichkeiten, wie sie in der obigen Tabelle aufgelistet ist. Davon sind drei der vier Kombinationen, die im Genotyp möglich sind, im Phänotyp gleich, nämlich glatt; nur der Genotyp gg
liefert eine runzelige Erbse. Dabei ist offenbar angenommen, dass eine nachfolgende Generation
durch zufällige Paarung gebildet wird, ohne Rücksicht auf den Genotyp der Eltern.
Beispiel 9.5.1 In der Mendelschen Vererbung haben wir die Genotypen D: GG, H: Gg, R: gg .
Wir gehen nun so vor: Wir nehmen irgendein Individuum, kreuzen es mit einem Individuum
des gewählten Typs, wählen zufällig einen Abkömmling aus, kreuzen diesen wieder mit einem
Individuum des gewählten Typs, und so weiter. Beobachtet man die Genotypen der so erzeugten Abkömmlinge durch die Generationen, so erhält man eine Markovkette. Dazu gehören die
Übergangsmatrizen

1 1




0 0 0
1 12 0
2
4 0






PD := 0 21 1 , PH :=  12 21 12  , PR := 1 21 0 .
0 0 0
0 21 1
0 41 12
Studiere nun das Langzeitverhalten der Generationen im Kontext von Satz 8.5.9.
6
Die Annahme, dass eine Situation vorliegt, in der die Elterngeneration reinerbig ist, läst sich durchaus rechtfertigen.
Stand: 9. Februar 2010
116
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.6
9.6. DAS FALLGESETZ VON GALILEI
Das Fallgesetz von Galilei
Das Gesetz des freien Falls steht am Beginn der neuzeitlichen Physik. Es besagt, dass
(1) alle Körper gleich schnell fallen,
(2) bei einem freien Fall aus der Ruhelage die zurückgelegten Wege sich verhalten
wie die Quadrate der Zeiten.
Um die Entdeckung dieses Gesetzes rankt sich die Legende, Galilei7 hätte es gefunden im Experiment, Körper vom schiefen Turm in Pisa fallen zu lassen. Es handelt sich wirklich nur um eine
Legende.8 Hätte er dieses Experiment wirklich durchgeführt und wäre er von den Beobachtungen ausgegangen, so wäre er nie auf das Fallgesetz gekommen, denn der störende Einfluss des
Luftwiderstands hätte sich bemerkbar gemacht.
Wie läßt sich nun etwa das erste Fallgesetz beweisen“? Zwei gleiche Kugeln müssen aus Sym”
metriegründen gleich schnell fallen. An der gemeinsamen Fallgeschwindigkeit wird sich nichts
ändern, wenn man die beiden Kugeln durch einen festen, masselosen“ Stab miteinander ver”
bindet. Dabei handelt es sich dann aber um einen Körper der doppelten Masse, der mit der
gleichen Geschwindigkeit fällt. Durch Anwendung dieser Überlegung auf drei, vier, . . . Kugeln
ergibt sich die Unabhängigkeit der Fallgeschwindigkeit von der Masse des Körpers.
Welche Annahme liegt der Überlegung zugrunde? Es ist die
Annahme: Auf die Gestalt des Körpers kommt es nicht an.
Man könnte diese Annahme als willkürlich bezeichen, sie ist aber hilfreich, eine wunderbare
mathematische Theorie für die Mechanik starrer Körper zu entwickeln.
Wie verhält es sich nun beim zweiten Teil des Fallgesetzes? Es ergibt sich bei Galilei als mathematischer
Satz über die gleichförmig beschleunigte Bewegung,
nachdem er eine Definition von gleichförmiger und
gleichförmig beschleunigter Bewegung gegeben hat.
Die Empirie kommt nur insofern ins Spiel, als festgestellt wird, dass ein schwerer Körper (nach unten)
fällt, und dass nachträglich in einem Versuch mit
einer schiefen Ebene das Gesetz verifiziert“ wird.
”
Wir wollen die Definitionen nicht wiederholen,
wollen aber ein Zwischenergebnis“ angeben. Galilei
”
schreibt:
Die Zeit, in welcher irgendeine Strecke
von einem Körper von der Ruhelage aus mittelst einer gleichförmigen
beschleunigten Bewegung zurückgelegt
wird, ist gleich der Zeit, in welcher dieselbe Strecke von demselben
Abbildung 9.2: Erstes Fallgesetz
Körper zurückgelegt würde mittelst einer
gleichförmigen Bewegung, deren Geschwindigkeit gleich wäre dem halben Betrage des
höchsten und letzten Geschwindigkeitswertes bei jener ersten beschleunigten Bewegung.
7
8
Galileo Galilei, 1564-1642, it. Wissenschaftler
Die Episode wird erst 60 Jahre nach der Entdeckung des Gesetzes erstmals beschrieben.
Stand: 9. Februar 2010
117
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.6. DAS FALLGESETZ VON GALILEI
Hier werden zwei verschiedene Bewegungen einander gegenübergestellt: eine gleichförmig beschleunigte, bei der im Zeitintervall [0, t1 ] die Geschwindigkeit gleichmäßig von 0 auf einen
maximalen Wert v1 zunimmt, und eine gleichförmige mit der konstanten Geschwindigkeit 21 v1 .
Offenbar sind die Flächen unter den beiden verschiedenen Geschwindigkeitsprofilen gleich; siehe
Abbildung ??. Aus der Integralrechnung wissen wir, dass der Weg s, der im Interval [0, t1 ] bei
gegebener Geschwindigkeit v durchlaufen wird als
Z t1
v(t)dt
s=
0
gegeben ist. Dies ist das Zwischenergebnis von Galilei. Galilei hat das Argument der Integralrechnung durch ein geometrisches Argument ersetzt.
Betrachte nun eine gleichförmig beschleunigte Bewegung, die zum Zeitpunkt t1 bzw. t2 die
Geschwindigkeit v1 bzw. v2 besitzen. Dann gilt also für die durchlaufenen Wege
1
1
s1 = v1 t1 und s2 = v2 t2
2
2
und auf Grund der Annahme der Gleichförmigkeit der Bewegung
t1
v1
=
.
v2
t2
Daraus folgt
s1
t2
= 21 ,
s2
t2
also das zweite Fallgesetz.
Wir sehen in den obigen Darlegungen schon die Begriffe der Newtonschen Mechanik und im
Schlepptau die Anfänge der Infinitesmal– und Integralrechnung aufscheinen. In der modernen
Sprache der Infinitesmal– und Integralrechnung ist die Annahme der gleichförmigen Beschleunigung gleichbedeutend mit der Aussage, dass die Ableitung der Geschwindigkeitsfunktion konstant ist:9
v̇(t) = a für alle t .
Daraus ergibt sich zunächst
ẋ(t) = v(t) = v0 + a(t − t0 ) für alle t ,
wobei t0 , v0 der Anfangszeitpunkt bzw. die Anfangsgeschwindigkeit sind. Daraus leitet sich dann
mit t0 = 0, v0 = das Fallgesetz
1
x(t) = at2 für alle t ≥ 0
2
ab. Hier wird deutlich, welchen Stellenwert die Entwicklung der Infinitesmal– und Integralrechnung, genauer der Theorie der gewöhnlichen Differentialgleichungen, bei der Begründung der
klassischen Mechanik einnehmen musste.
In einem Brief von Galilei wird Mathematische Modellierung versus Erfahrung mit der Wirklichkeit treffend beschrieben:
9
Die Schreibweise ẋ, ẍ ist die bei den Physikern gebräuchliche, wenn es um Zeitableitungen in der Mechanik
geht.
Stand: 9. Februar 2010
118
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.7. GUTGESTELLTHEIT – WELLPOSEDNESS
Zeigt die Erfahrung nunmehr, dass solche Eigenschaften, wie wir sie abgeleitet haben,
im freien Fall der Naturkörper ihr Bestätigung finden, so können wir ohne Gefahr des
Irrtums behaupten, dass die konkrete Fallbewegung mit derjenigen, die wir definiert
und vorausgesetzt haben, identisch ist; ist dies nicht der Fall, so verlieren doch unsere
Beweise, da sie einzig und allein für unsere Voraussetzung gelten wollten, nichts von
ihrer Kraft und Schlüssigkeit.
Newton10 betrachtet den Fall der beschleunigten Bewegung unter der
Annahme, dass ein Widerstand im Verhältnis seiner Geschwindigkeit“ geleistet
”
wird.
Dies bedeutet unter der zusätzlichen Annahme eines linearen Ansatzes, dass nun die Differentialgleichung
v̇ = b − cv
mit positiven Konstanten b, c zu untersuchen ist. Wir kennen alle Lösungen davon. Hier sind sie:
v(t) =
b
b
+ (v0 − ) exp(−ct) für alle t,
c
c
wobei v0 die Geschwindigkeit zur Zeit t0 = 0 ist. Wir leiten die Formel aus der Beobachtung
d ct
(e v) = ect b
dt
ab.
Wir stellen also fest, dass dieses Modell für t → ∞ eine gleichförmige Geschwindigkeit prognostiziert. Diese letzte Aussage ist eine Aussage vom Typ qualitative Aussage, während eine
Aussage zu der Geschwindigkeit, mit der sich der Grenzwert limt→∞ = cb einstellt, nämlich
exponentiell schnell, eine quantitative Aussage ist.
9.7
Gutgestelltheit – Wellposedness
Mathematischen Modelle (für eine physikalische Fragestellung) haben meist die Form einer Gleichung/Differentialgleichung, die gewisse Parameter enthält, und in die weitere Größen einzubringen sind. Siehe etwa das Fallgesetz aus dem letzten Abschnitt: die Differentialgleichung ist v̇ = b
und im Gefolge sind einzubringen t0 , v0 . Eine beliebte Beschreibung eines solchen Modells ist
der Problembeschreibung in der Systemtheorie abgeschaut: es enthält eine
Systemgleichung
und die Größen
Input, System-Parameter, Output.
Die Analyse eines solchen Modells kann dann in drei Typen von Problemen eingeteilt werden:
(A) Das direkte Problem: Gegeben sind Input und System-Parameter, bestimme den Output, der in Übereinstimmung damit ist.
(B) Das Rekonstructionsproblem: Gegeben sind Output und System-Parameter, bestimme
den Input, der in Übereinstimmung damit ist.
10
Isaac Newton, 1642-1727, engl. Wissenschaftler
Stand: 9. Februar 2010
119
c J.Baumeister
KAPITEL 9. MODELLIERUNG
9.8. ÜBUNGEN
(C) Das Identifikationsproblem: Gegeben sind Input und Output, finde die System-Parameter,
die in Übereinstimmung damit sind.
Wir nennen ein Problem vom Typ (A) ein direktes Problem, da aus bekannten Ursachen eine
Wirkung zu bestimmen ist. Damit in Übereinstimmung ist dann, Probleme vom Typ (B) und
(C) inverse Probleme zu nennen: es sind ja aus Wirkungen Ursachen zu bestimmen. Wir kommen
auf die Begriffe bei konkreten Modellen wieder zurück.
Bei einem mathematischen Modell läuft es meist darauf hinaus, eine Gleichung zu lösen.
Damit sollte eine umfassende Untersuchung eines solchen mathematischen Modells folgende
Fragen klären:
(1) Festlegung der Daten des Problems und ihrer quantitativen Beschreibung,
(2) Existenz und einer Lösung,
(3) Eindeutigkeit einer Lösung,
(4) Stabilität, d.h. die stetige“ Abhängigkeit der Lösung von den Daten,
”
(5) Berechnung einer Lösung.
Die Festlegung der Daten des Problem ist eigentlich Teil der Modellbildung, die quantitative
Beschreibung ist verbunden damit, in welchem mathematischen Kontext eine Lösung anstreben läßt. Die Frage der Existenz und Eindeutigkeit ist von Bedeutung, wenn es darum geht,
Modellannahmen zu hinterfragen. Nichteindeutigkeit etwa könnte ein Indiz sein, dass die Modellbeschreibung nicht ausreichend viele Annahmen formuliert, um sicherzustellen, dass nur eine
mathematische Lösung“ existiert. In der Frage der Stabilität soll geklärt werden, wie sich Va”
riationen in den Parametern und den Modellannahmen auf die Lösung auswirken. Die Forderung
(5) ist selbsterklärend. Als beispielhaft kann man sich immer eine lineare Gleichung vorstellen:
hier sind die obigen Fragen im Rahmen der linearen Algebra vollständig diskutierbar.
Dieses Konzept der Modellbewertung“ wurde von Hadamard 1902 im Zusammenhang mit
”
dem Studium von Randwertpoblemen der mathematischen Physik eingeführt. Hadamard bezeichnet ein mathematisches Problem schlechtgestellt/ill-posed, wenn es hinsichtlich der Forderungen (1),(2),(3) nicht überall eine positive Antwort gegeben werden kann, im entgegegesetzten
Fall als gutgestellt/well-posed.11 Es ist in der Natur der Problemstellung, dass inverse Probleme
im Allgemeinen schlechtgestellt sind (Irreversibilität, Kausalität, . . . ).
9.8
Übungen
1.)
11
Hadamard glaubte – viele Mathematiker tun dies heute noch – dass schlechtgestellt Probleme nicht sachgemäß
gestellt sind und daher als künstlich zu bezeichnen sind.
Stand: 9. Februar 2010
120
c J.Baumeister

Grundlagen der Computernutzung - Goethe

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können