mathematik 1 - FHDW / bib Portalseite

MATHEMATIK 1
Eine Einführung in die mathematischen Grundlagen der Informatik
Dozent:
Prof.Dr. Carsten Elsner
FHDW Hannover
1
=
π
Fassung: Januar 2017
3
10 −
14
110
25 −
2450
171 −
17556
533 −
75900
1207 −
244530
2289 −
P (7)
3875 −
P (8)
Q(7) −
.
Q(8) − . .
1
m(m − 1)(2m − 1)(2m + 1)(4m − 5)(4m + 3) ,
9
Q(m) = (4m + 1)(4m2 + 2m − 1) ,
m ≥ 2.
P (m) =
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
1
MATHEMATIK, Teil 1
Eine Einführung in die mathematischen Grundlagen der Informatik
Zusammenfassung
Wie der Titel bereits andeutet, werden in dieser Vorlesung mathematische Themen behandelt, die Bedeutung im Bereich der modernen Informatik gefunden haben. In diesem ersten Teil sind hauptsächlich Grundlagen aufgeführt. Im Hinblick auf die in der InformatikAusbildung angestrebten praktischen Bezüge werden aber bereits konkrete mathematische
Sätze erarbeitet. Da sich eine solche praxisorientierte Ausbildung zunächst an einer Programmierausbildung orientieren soll, in der weniger eine konkrete Programmiersprache als
vielmehr die grundlegenden Konzepte der Programmierung (die sog. Semantik ) vermittelt
werden, ist es das Ziel der Vorlesung, den dafür notwendigen mathematischen Apparat schnell
zu erarbeiten.
Nach der Einführung einiger fundamentaler Definitionen und Notationen aus dem Bereich
Logik und Mengenlehre werden die für ein tieferes Verständnis der Informatik notwendigen
Bereiche Relationen und Funktionen behandelt. Der praktisch orientierten Einführung der
natürlichen Zahlen folgt im zweiten Hauptteil der Begriff der Rekursion. Hier werden die
mathematischen Grundlagen für die in der Informatik übliche Definitionstechnik (z.B. für
Sprachen oder Funktionen) gelegt. Zusammen mit dem Begriff Ordnung werden dann einige
für die Programmsemantik wichtige Lehrsätze aufgestellt. Diese Vorlesung ermöglicht somit
ein frühzeitiges strukturelles Verständnis der wesentlichen Sachverhalte in der praktischen
Informatik.
Lernziele
Alle heute gängigen Programmiersprachen enthalten Kontrollstrukturen, die auf rekursiven
Definitionen beruhen. Die Festlegung syntaktisch korrekter Programmtexte basiert ebenfalls
auf rekursiven Definitionen. Das Ziel ist es daher, ein grundlegendes Verständnis für solche
Konstrukte zu bekommen. Dies kann erschöpfend und präzise nur durch die Kenntnis des
mathematischen Hintergrundes geschehen. Es soll aufgezeigt werden, daß die Mathematik
immer noch das einzige und wesentliche Hilfsmittel für solche Untersuchungen ist. Zusätzlich
ist es wichtig, Informatikern das kritische Betrachten von Artefakten in der Programmierung
(oder generell im Software-Engineering) aufzuzeigen. Diese Thematik kann im wesentlichen
unterteilt werden in einen syntaktischen Aspekt (Kann ein Compiler mein Programm verstehen? ) und in einen semantischen Aspekt (Arbeitet der Algorithmus korrekt? ).
Eine gute Programmierung führt nicht am Verständnis abstrakter Programmstrukturen vorbei: Man denke nur an Polymorphie in der objektorientierten Programmierung, an abstrakte
Datentypen in der Modellierung und an verallgemeinerte Strukturen im Datenbank-Design.
Ein weiteres wichtiges Ziel ist es daher, den Begriff der Abstraktion in der Informatik mathematisch zu fassen und die im Hintergrund stehenden Denkweisen zu verdeutlichen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
2
Literatur
Die in dieser Vorlesung behandelten mathematischen Themen findet man in zahlreichen
Büchern. Einen großen Teil des behandelten Stoffes findet man in
Peter Hartmann, Mathematik für Informatiker, 3.Auflage, Vieweg 2004, ISBN 3-528-23181-5.
und (neben vielen anderen Dingen) in
H. Ehrig, B. Mahr, F. Cornelius, M. Große-Rhode, P. Zeitz, Mathematisch-strukturelle Grundlagen der Informatik , 2.Auflage, Springer 2001, ISBN 3-540-41923-3.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
3
Inhaltsverzeichnis
1 Grundlagen
5
1.1 Logik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2 Die Technik des Beweisens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
1.3 Quantoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
1.4 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
1.5 Konstruktion neuer Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
2 Relationen und Funktionen
27
2.1 Relationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
2.2 Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
2.3 Spezielle Funktionen in der Informatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
2.4 Äquivalenzrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
3 Induktion
51
3.1 Einfache Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
3.2 Induktiv definierte Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
3.3 Strukturelle Induktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
3.4 Rekursiv definierte Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
4 Ordnungen
68
4.1 Partielle und totale Ordnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
4.2 Spezielle Elemente partiell geordneter Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
4.3 Funktionen auf partiell geordneten Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
4
Literatur.
• Peter Fejer & Dan Simovici: Mathematical Foundations of Computer Sciences, Springer
(1990).
• Martin Gardner: Gotcha, dtv.
• Paul R. Halmos: Naive Mengenlehre, Vandenhoeck & Ruprecht (1994).
• Peter Hartmann: Mathematik für Informatiker, Vieweg (2004).
• H. Ehrig, B. Mahr, F. Cornelius, M. Große-Rhode, P. Zeitz: Mathematisch-strukturelle
Grundlagen der Informatik , 2.Auflage, Springer (2001).
• Guido Walz: Mathematik für Fachhochschule, Duale Hochschule und Berufsakademie,
Spektrum Akademischer Verlag Heidelberg (2011), ISBN 978-3-8274-2521-8.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
5
1 Grundlagen
Die mathematische Logik und die Mengenlehre stellen die Hilfsmittel bereit, mit denen dann
später die Probleme und Sachverhalte der Informatik universell formuliert und verstanden
werden können. Es werden daher in diesem Kapitel grundlegende Definitionen und Notationen aus der Logik und Mengenlehre aufgestellt.
1.1 Logik.
Die im folgenden eingeführte Logik stellt ein mathematisches Modell für ein präzises Argumentieren und Ableiten von wahren Aussagen zur Verfügung. Die Aussage ist der zentrale
Begriff in der Logik. Aussagen sind Wahrheitswerte zugeordnet: eine Aussage ist entweder
wahr oder falsch. Eine dritte Alternative gibt es nicht; man spricht auch von zweiwertiger
Logik . Die folgenden Beispiele sind Aussagen:
• 3+3 = 6
• Die Erde ist eine flache Scheibe.
• Wenn Java eine Insel ist, dann ist Pascal ein Ozean.
Mit Aussagen, die für sich alleine stehen, kann man noch nicht viel anfangen. Erst durch das
Kombinieren von Aussagen mit Hilfe von Operationen wird der Aussagenkalkül zu einem
mächtigeren Instrument. Das dritte Beispiel in der obigen Aufzählung stellt eine solche Aussagenkombination dar. Es handelt sich nämlich um die Kombination zweier Aussagen mittels
Wenn . . . , dann . . . . Es wird jetzt u.a. gezeigt, wie man eine solche Operation formalisiert
und wie man ihren Wahrheitswert ermittelt.
Die fünf wichtigsten Operationen mit Aussagen heißen Konjunktion ( und“), Alternative
”
( oder“), Negation ( nicht“), Implikation ( Wenn . . . , dann . . .“) und Äquivalenz ( Ge”
”
”
”
nau dann, wenn “). Die Schreibweisen für diese Operationen entnimmt man der folgenden
Tabelle, in der A und B irgendwelche Aussagen bezeichnen.
Name
Konjunktion
Alternative
Negation
Implikation
Äquivalenz
Sprechweise
A und B
A oder B
Nicht A
Wenn A, dann B
A genau dann, wenn B
Schreibweise
A∧B
A∨B
¬A
A =⇒ B
A ⇐⇒ B
Besonders übersichtlich werden Operationen auf Aussagen durch Wahrheitstafeln. Das sind
Tabellen, in denen für jede Operation und jeden möglichen Wahrheitswert der beteiligten
Aussagen aufgeschrieben ist, welchen Wahrheitswert die durch die Operation neu entstandene Aussage hat. So erhält man für die fünf oben definierten Operationen folgende Wahrheitstafel:
A
B
A ∧ B A ∨ B ¬A
A =⇒ B A ⇐⇒ B
wahr wahr wahr
wahr
falsch wahr
wahr
wahr falsch falsch wahr
falsch falsch
falsch
falsch wahr falsch wahr
wahr wahr
falsch
falsch falsch falsch falsch wahr wahr
wahr
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
6
Die Wahrheitswerte für die Operationen ∧, ∨ und ¬ bedürfen keiner weiteren Erläuterungen.
Es ist jedoch einiges zur Implikation zu sagen. Bei einer Implikation A =⇒ B heißt die
Aussage A die Hypothese und die Aussage B die Folgerung. Man sagt dann auch kurz: Aus
A folgt B. In dem Satz
Wenn es morgen regnet, werde ich zu Hause bleiben.“
(*)
”
ist also der Teil vor dem Komma die Hypothese und der Teil nach dem Komma ist die
Folgerung. Umgangssprachlich etwas holprig, aber mathematisch korrekt könnte man diesen
Satz auch folgendermaßen formulieren: Aus Regen am nächsten Tag folgt, daß ich zu Hause
”
bleibe.“Es ist klar, daß diese Gesamtaussage wahr ist, wenn sowohl die Aussage der Hypothese A ( Morgen regnet es.“) als auch die Aussage der Folgerung B ( Ich werde zu Hause
”
”
bleiben.“) wahr ist. Ebenso sieht man leicht ein, daß die Gesamtaussage falsch ist, wenn
zwar die Hypothese A wahr, aber die Folgerung B falsch ist (Der Satz Wenn es morgen
”
regnet, werde ich das Haus verlassen.“widerspricht offensichtlich dem obigen Satz (*)). Es
ist aber etwas kniffliger einzusehen, warum die Implikation A =⇒ B eine wahre Aussage ist,
wenn die Hypothese A falsch ist, und zwar unabhängig davon, ob die Folgerung B wahr oder
falsch ist. Es werden nämlich beide Aussagen
Wenn es morgen nicht regnet, werde ich zu Hause bleiben.“
”
und
Wenn es morgen nicht regnet, werde ich das Haus verlassen.“
”
als wahr angesehen, da sie nicht im Widerspruch zur Aussage in (*) stehen. Die Folgerung
von A auf B ist nämlich nur dann bindend, wenn die Hypothese wahr ist.
Die Äquivalenz zweier Aussagen ist nichts anderes als eine Abkürzung für die Aussage
Wenn A dann B“ und
Wenn B dann A“
”
”
Formalisieren kann man diese Aussage folgendermaßen:
( (A =⇒ B) ∧ (B =⇒ A) )
=
(A ⇐⇒ B) .
Man beachte, daß hier das Gleichheitszeichen ’=’ die Bedeutung der semantischen Gleichheit
zweier Aussagen hat. Das bedeutet: Zwei Aussagen C und D sind gleich (C = D), wenn sich
bei jeder Belegung aller in C und D vorkommenden Aussagen mit Wahrheitswerten für
die Aussagen C und D stets der gleiche Wahrheitswert ergibt. Die oben vorgenommene
Klammerung innerhalb von Aussagen gibt eine Auswertereihenfolge vor: Die Aussagen in
den Klammern werden immer zuerst ausgewertet.
Ziel ist es nun, die wichtigsten aussagenlogischen Gesetze aufzustellen. Diese Gesetze werden
hauptsächlich zur Vereinfachung von logischen Aussagen verwendet. Diese Vorgehensweise
soll zunächst an einem Beispiel verdeutlicht werden.
Beispiel 1.1 In einem Programm steht die folgende Anweisungssequenz:
if ((x > 0) and (y ≤ 6)) or ((x > 0) and (y > 6))
then ** do something**
else ** do something else**
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
7
Wann wird nun der ’then’ - Teil und wann der ’else’ - Teil ausgeführt? Dies kann man mit
einer Wahrheitstafel ermitteln:
x>0
wahr
wahr
falsch
falsch
y ≤ 6 y > 6 Wahrheitswert der ’if ’ - Bedingung
wahr falsch
wahr
falsch wahr
wahr
falsch
wahr falsch
falsch wahr
falsch
Offensichtlich ist der Wahrheitswert der ’if ’ - Bedingung garnicht vom Wahrheitswert der
Aussage y ≤ 6 abhängig; kurz: die ’if ’ - Bedingung hängt nur vom Wahrheitswert der Aussage
x > 0 ab.
Für solche Vereinfachungen lassen sich nun allgemeine Regeln aufstellen. Einige solcher Regeln sind im folgenden Satz zusammengefaßt. Der Beweis dieser Regeln geschieht jeweils
durch Ausprobieren aller Kombinationen von Wahrheitswerten.
Satz 1.1 (Aussagenlogische Grundregeln)
Für alle Aussagen A, B und C gelten die folgenden Gesetze.
A∧B =B∧A
A∨B =B∨A
A ∧ (B ∧ C) = (A ∧ B) ∧ C
A ∨ (B ∨ C) = (A ∨ B) ∨ C
A ∧ (B ∨ C) = (A ∧ B) ∨ (A ∧ C) A ∨ (B ∧ C) = (A ∨ B) ∧ (A ∨ C)
A ∧ wahr“ = A
A ∨ falsch“ = A
”
”
A ∧ falsch“ = falsch“
A ∨ wahr“ = wahr“
”
”
”
”
(A =⇒ B) = (¬B =⇒ ¬A)
(Kommutativgesetze)
(Assoziativgesetze)
(Distributivgesetze)
(Neutrale Elemente)
(Konstante Funktion)
(Kontraposition)
Mit diesen Regeln wird noch einmal die Vereinfachung der ’if’ - Bedingung aus Beispiel 1.1
vorgenommen. Unter Anwendung des Distributivgesetzes kommt zunächst:
(x > 0 ∧ y ≤ 6) ∨ (x > 0 ∧ y > 6) = (x > 0) ∧ (y ≤ 6 ∨ y > 6) .
Da die Aussage (y ≤ 6 ∨ y > 6) offensichtlich immer wahr ist, erhält man weiter mit der
Regel für neutrale Elemente:
(x > 0 ∧ y ≤ 6) ∨ (x > 0 ∧ y > 6) = (x > 0) ∧ wahr“ = (x > 0) .
”
Auch der nun folgende Satz enthält aussagenlogische Grundregeln. Wegen ihrer Bedeutung
werden diese Regeln in einem gesonderten Satz aufgeführt.
Satz 1.2 (De Morgansche Regeln)
Es seien A und B beliebige Aussagen. Dann gilt:
¬(A ∧ B) = ¬A ∨ ¬B
(1.1)
¬(A ∨ B) = ¬A ∧ ¬B
(1.2)
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
8
Auch diese beiden Aussagen beweist man leicht, indem man alle vier Kombinationen von
Wahrheitswerten für A und B durchprobiert. Eine Anwendung von Satz 1.2 findet man im
folgenden Beispiel.
Beispiel 1.2 In einem Programm steht die Anweisungssequenz
if (not (x > 0) and not (y > x))
then ** do Anweisung 1**
else ** do Anweisung 2**
Man stellt nun fest, daß das Programm auch nach Weglassen der Anweisung 1 immer korrekt
läuft. Also tritt stets die Negation der in der ’if ’ - Abfrage stehenden Aussage ein. Wegen
(1.1) gilt nun
¬(¬A ∧ ¬B) = A ∨ B ,
und deshalb kann man das Programm mittels
if (x > 0 or y > x)
vereinfachen.
then ** do Anweisung 2**
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
9
1.2 Die Technik des Beweisens.
In diesem Abschnitt geht es um die Technik des Ableitens von wahren Aussagen. Beweise
und logische Argumentation sind nicht immer etwas Abstraktes und nicht nur eine Domäne
der Mathematiker. Das zeigt das folgende Beispiel aus der Finanzmathematik.
Jemand behauptet, ein Kapital von 1000 Euro, das sich über mindestens 20 Jahre mit einem
Zinssatz von 5% verzinst, ist am Ende der Laufzeit auf mindestens 2000 Euro angewachsen.
Ist diese Aussage nun wahr oder falsch? Im ersten Schritt wird man diese Aussage erst einmal
für die erwähnten Zahlen formalisieren; dadurch erhält man:
1000 · (1, 05)20 ≥ 2000 .
(1.3)
Es entsteht also keine formale Identität, sondern eine Ungleichung. Diese Ungleichung kann
man durch 1000 teilen. Dadurch wird sie einfacher und es zeigt sich, daß die Aussage auch
unabhängig vom Startkapital von 1000 Euro formuliert werden kann. Allerdings wurde oben
mehr behauptet als nur die Gültigkeit der Ungleichung (1.3), von deren Richtigkeit man sich
ja leicht mit dem Taschenrechner überzeugen kann. Es hieß aber mindestens zwanzig Jahre.
Tatsächlich lautet in Erweiterung von (1.3) die Behauptung:
Für alle natürlichen Zahlen n gilt: (n ≥ 20 =⇒ 1, 05n ≥ 2) .
(1.4)
Wir müssen hier eine Aussage für unendlich viele natürliche Zahlen n nachweisen, nämlich
für alle, die größer oder gleich 20 sind. Nun wird man allein durch praktische Erfahrung
natürlich einwenden, daß sich die Behauptung in (1.4) sofort ergibt, wenn man sie für die
Mindestlaufzeit von 20 Jahren nachgerechnet hat. Aber man bedenke, daß man hier erstens
bereits die Gültigkeit eines mathematischen Arguments (nämlich eine gewisse Monotonie der
Exponentialfunktion und die Transitivität der Relation ’≥’) vorausgesetzt hat, und daß es
zweitens nicht darum geht, möglichst schnell die Behauptung in (1.4) nachzuweisen. Vielmehr
soll an diesem (einfachen) Beispiel eine allgemeine Beweistechnik demonstriert werden.
Da wir die Aussage in (1.4) nicht für alle unendlich vielen natürlichen Zahlen n nachrechnen
können, muß man stichhaltig argumentieren. Ein Beweis ist nun nichts anderes als eine
logisch korrekte kausale Kette von Aussagen. Was das im konkreten Fall bedeutet wird
gleich klar werden. Da man mit einem Beweis jedoch immer nur die Richtigkeit einer Aussage
nachweisen kann, muß man sich zunächst entscheiden, was man beweisen will: die Aussage
oder ihre Negation (Es könnte ja auch sein, daß die Behauptung in (1.4) falsch ist!). Im
vorliegenden Fall entscheiden wir uns aber für den Beweis der Aussage selbst.
Formal besteht ein Beweis nur aus zwei Teilen:
Teil 1 Man schreibe die Hypothese(n) aus der Aussage auf. Dadurch erhält man eine
Aussage A.
Teil 2 Man finde Aussagen A1 , A2 , . . . , Ak , für die folgendes gilt:
(i)
(ii)
A1 = A ,
Ak ist die zu beweisende Folgerung ;
Die Implikationskette A1 =⇒ A2 =⇒ . . . =⇒ Ak ist wahr.
Da man die Aussagen A2 , . . . , Ak−1 noch finden muß, kann man Teil 2 als den kreativen Teil
des Beweises bezeichnen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
10
Im vorliegenden Beispiel besteht Teil 1 aus dem Hinschreiben der folgenden Hypothese: A1
ist die Aussage:
Sei n ≥ 20 eine beliebig gewählte natürliche Zahl.
(1.5)
Nun folgt der kreative Teil. Es muß also eine Idee her, wie man weitermachen kann. Dazu
sollte man kurz innehalten und auf den Kontext des Problems schauen, um eine möglichst
gute Abschätzung des Wertes von 1, 05n nach unten zu bekommen, um den es in der Behauptung ja geht. Hierfür ist nun die folgende Überlegung hilfreich: Wenn sich ein Kapital
jährlich mit 5% verzinst, dann muß schon nach zwei Jahren mehr vorhanden sein, als wenn
man jedes Jahr nur 5% des Anfangskapitals hinzuaddiert. Man berücksichtigt also nur die
Verzinsung des Anfangskapitals und vernachlässigt den Zinseszinseffekt. Formal lautet das
Ergebnis dieser Überlegung:
Für alle natürlichen Zahlen n ≥ 1 gilt: (1, 05)n ≥ 1 + 0, 05 · n .
(1.6)
Wir haben mit (1.5) und (1.6) nun zwei Ungleichungen erhalten, die wir wegen der Transitivität der Relation ’≥’ miteinander kombinieren können. Daher führt der nächste Beweisschritt zu der Aussage:
Da x ≥ y ∧ y ≥ z =⇒ x ≥ z immer wahr ist, folgt aus (1.5) und (1.6):
(1, 05)n ≥ 1 + 0, 05 · 20 = 2 .
(1.7)
Eine aus dem Hintereinanderschreiben der Aussagen (1.5), (1.6) und (1.7) bestehende kausale
Kette beweist also präzise die gewünschte Aussage. Die folgende formale Darstellung des
Beweises zeigt noch einmal, daß es sich dabei wirklich um eine Implikationskette handelt.
Man beachte, daß jede Teilimplikation für sich eine wahre Aussage darstellt, weil immer
wieder aus einer wahren Hypothese eine wahre Folgerung gezogen wird!
n ≥ 20
=⇒ n ≥ 20 ∧ (Für alle n ≥ 1 gilt: (1, 05)n ≥ 1 + 0, 05 · n)
=⇒ n ≥ 20 ∧ (Für alle n ≥ 1 gilt: (1, 05)n ≥ 1 + 0, 05 · n)
∧ (Für alle reellen Zahlen x, y, z gilt: (x ≥ y ∧ y ≥ z =⇒ x ≥ z))
=⇒ 1 + 0, 05 · n ≥ 1 + 0, 05 · 20 ∧ (Für alle n ≥ 1 gilt: (1, 05)n ≥ 1 + 0, 05 · n)
∧ (Für alle reellen Zahlen x, y, z gilt: (x ≥ y ∧ y ≥ z =⇒ x ≥ z))
=⇒ (1, 05)n ≥ 1 + 0, 05 · 20
=⇒ (1, 05)n ≥ 1 + 0, 05 · 20 ∧ 1 + 0, 05 · 20 = 2
=⇒ (1, 05)n ≥ 2 .
Zumindest das formale Schema von Beweisen orientiert sich immer an diesem Muster. Allerdings werden in der Praxis nicht alle Zwischenschritte in dieser Ausführlichkeit hingeschrieben. Vieles wird nämlich beim Leser des Beweises als bekannt vorausgesetzt; zu viele
notierte Zwischenschritte würden die Beweise unübersichtlich machen. Ist ein Beweis beendet, wird dies mit einem vorab vereinbarten Zeichen angezeigt. Wir haben hier das Quadrat
gewählt.
Bei dem obigen Beispiel weisen wir noch auf die Tatsache hin, daß die Ungleichung 1, 05n ≥ 2
unter der allgemeinen Voraussetzung n ≥ 10 offensichtlich falsch ist (Für n = 10, 11, 12, 13,
14 gilt die Ungleichung nicht!). Was wäre unter der Voraussetzung n ≥ 10 geschehen? Man
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
11
hätte beliebig lange aus der Hypothese (n ≥ 10) Folgerungen ziehen können, ohne jemals auf
die Aussage 1, 05n ≥ 2 zu stoßen. Dies erklärt sich dadurch, daß niemals eine falsche Aussage
aus einer wahren Aussage folgen kann (Man beachte die zweite Zeile in der Wahrheitstafel
für die Implikation ’=⇒’, Seite 4). Wenn man sehr lange erfolglos versucht hat, aus einer
Hypothese eine Folgerung abzuleiten, sollte man vielleicht auch einmal versuchen, die gegenteilige Aussage zu beweisen. Wie man eine gegenteilige Aussage formal korrekt formuliert,
wird im nächsten Abschnitt 1.3 erläutert.
Eine häufig verwendete Beweistechnik soll jetzt behandelt werden, die nicht nur in vielen
theoretischen Beispielen hilfreich ist, sondern auch als Denkmodell in zahlreichen praktischen
Tätigkeiten in der Informatik vorkommt. Mit den Wahrheitstafeln auf Seite 4 findet man
leicht die Identität
(A =⇒ B) = (¬A ∨ B) ,
indem man alle vier Kombinationen von Wahrheitswerten für A und B durchprobiert. Zusammen mit der De Morganschen Regel (1.1) ergibt sich weiter
(A =⇒ B) = ¬(A ∧ ¬B) .
(1.8)
Diese Gleichung wird nun folgendermaßen für Beweise angewendet: Um eine Implikation
A =⇒ B zu beweisen, schreibt man zunächst wieder (wie in Teil 1 eines Beweises gefordert)
die Hypothese A auf. Zusätzlich nimmt man dann noch an, daß ¬B gilt, daß also die eigentlich zu beweisende Behauptung falsch ist. Gelingt es nun zu zeigen, daß diese Konjunktion
(nämlich die Aussage A∧¬B) falsch ist, so hat man wegen (1.8) die Richtigkeit von A =⇒ B
bewiesen. Man wird dann beim Herleiten weiterer Aussagen aus A ∧ ¬B auf eine Situation stoßen, die erkennbar nicht möglich bzw. widersprüchlich ist. Die ganze Vorgehensweise
nennt man einen Beweis durch Widerspruch.
Dieses Verfahren soll an einem Beispiel erläutert werden. Die alten Griechen glaubten irrtümn
darstellen lassen, wobei n und
lich, daß sich alle positiven Zahlen in Gestalt eines Bruches m
m > 0 für teilerfremde natürliche Zahlen stehen. Insbesondere sollte auch die Länge der
Diagonale in einem Quadrat mit der Seitenlänge 1 durch einen solchen Bruch ausgedrückt
n
benennen, die die Gleichung
werden können. Doch niemand konnte eine Zahl der Gestalt m
2
x = 2 löst und damit die Länge der Diagonale im Quadrat beschreibt. Woran liegt das?
Wir werden die Richtigkeit des folgenden Lehrsatzes zunächst mit dem Beweisprinzip durch
Widerspruch nachweisen.
Satz 1.3 Ist p eine Primzahl, so besteht für alle natürlichen Zahlen n und m > 0 die
Ungleichung
2
n
6= p .
m
Ist dieser Satz bewiesen, so wenden wir ihn insbesondere für die Primzahl p = 2 an und
haben damit das Diagonalenproblem der alten Griechen gelöst: Die Länge der Diagonale im
Einheitsquadrat wird nicht durch eine rationale Zahl beschrieben!
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
12
Beweis: Es sei p eine beliebige Primzahl. Zusätzlich wird nun angenommen, daß es teilerfremde natürliche Zahlen n und m > 0 gibt, die eine Darstellung
2
n
= p
(1.9)
m
zulassen; dies ist nun genau die gegenteilige Aussage von dem, was zu beweisen ist. Wenn die
Zahlen m und n teilerfremd sind, so sind auch die Zahlen m2 und n2 teilerfremd, denn durch
das Quadrieren sind keine neuen Primteiler bei m und n hinzugekommen. Die Gleichung in
(1.9) wird nun umgestellt:
n2 = p · m2 .
(1.10)
Hieraus liest man ab, daß p ein Teiler der Zahl n2 ist. Da nun n2 eine Quadratzahl ist, kommen
alle Primteiler (und insbesondere der nachgewiesene Primteiler p) mindestens zweimal in der
Primfaktorzerlegung vor. So ist beispielsweise 36 = 62 = (2 · 2) · (3 · 3). Daher existiert eine
natürliche Zahl k mit der Eigenschaft
n2 = p2 · k .
(1.11)
Aus (1.10) und (1.11) folgt durch Gleichsetzen über n2 die Gleichung p · m2 = p2 · k. Teilt
man diese Gleichung einmal durch p, so erhält man
m2 = p · k .
Damit ist p aber auch ein Primteiler von m2 . Insgesamt haben wir nun nachgewiesen, daß
p sowohl ein Primteiler von m2 als auch von n2 ist. Andererseits hatten wir aber m2 und
n2 bereits als teilerfremd erkannt. Damit liegt ein Widerspruch vor, der den Satz (unter
Berufung auf (1.8)) beweist.
Warum ist diese doch befremdliche Argumentation legitim? Es wurde doch aus einer (wie
sich ja nun im Nachhinein herausstellte) falschen Aussage, nämlich aus der Annahme der
n 2
) = p, eine andere falsche Aussage, nämlich
Existenz natürlicher Zahlen n und m mit ( m
(n2 und m2 sind teilerfremd)
∧
(p ist zugleich ein Teiler von n2 und von m2 ) ,
hergeleitet. Diese Argumentation ist genau deshalb erlaubt, weil die Implikation A =⇒
B auch dann eine wahre Aussage ist, wenn A und B beide falsch sind (Man beachte die
Wahrheitstafel auf Seite 4!). Man kann dies auch anders formulieren: Wenn man davon
ausgeht, daß die Argumentationskette im Beweis korrekt ist, so muß die Annahme falsch
sein. Denn wäre sie wahr, hätte sich aus etwas Wahrem durch korrektes Schließen etwas
Falsches ergeben. Dies ist aber gerade, wie man wieder aus der Wahrheitstafel abliest, nicht
korrekt.
1.3 Quantoren.
Häufig enthalten Aussagen Formulierungen wie ’für alle . . . ’ oder ’es gibt . . . ’. Diese
Festlegungen nennt man Quantoren. Beispielsweise lautete die Behauptung in (1.6):
Für alle natürlichen Zahlen n ≥ 1 gilt: (1, 05)n ≥ 1 + 0, 05 · n .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
13
Wie bei den im vorigen Abschnitt erläuterten Beweistechniken erwähnt, ist es in manchen
Fällen wichtig, Aussagen zu negieren, etwa um in einem Beweis durch Widerspruch das Gegenteil einer Aussage formulieren zu können. Als Hilfsmittel zur Formalisierung von Aussagen
und ihrer Negation werden die folgenden Symbole eingeführt:
∀
∃
bedeutet
bedeutet
’für alle’
’es gibt’
Bisher wurden Aussagen etwa kurz mit A notiert. Aussagen, die noch zusätzlich von einem
Parameter x abhängen, werden künftig mit A(x) bezeichnet. Dabei versteht man unter x
einen Platzhalter für einen beliebigen Wert, z.B. für eine Zahl, für eine Zeichenkette oder auch
für einen Wahrheitswert. Wenn die Aussage von mehreren Parametern x, y, z, . . . abhängt,
schreiben wir entsprechend A(x, y, z, . . . ). Die oben eingeführten Quantoren - Symbole werden dann in folgender Weise verwendet:
Symbolik
∀ x : A(x)
∃ x : B(x)
Sprechweise
Für alle x gilt die Aussage A(x)
Es gibt ein x, für das die Aussage B(x) gilt
Mit diesen neuen Symbolen können Aussagen leicht formal negiert werden. Eine Aussage
A(x) gelte zuerst für alle möglichen Werte von x. Das Gegenteil dieser Aussage (also ihre Negation ¬(∀ x : A(x))) besagt dann offensichtlich, daß es ein gewisses x gibt, für das
die Aussage A(x) nicht gilt (aber nicht, daß die Aussage A(x) für alle möglichen x nicht
gilt!!). Gilt umgekehrt eine Aussage B(x) für ein gewisses x, so besteht hier die Negation
(¬(∃ x : B(x))) offensichtlich in der Aussage, daß B(x) für alle x falsch ist.
Besteht eine Aussage aus einer Gleichung oder Ungleichung, so wird meist auf die Voranstellung des Allquantors ∀ verzichtet und der Gültigkeitsbereich der Gleichung bzw. Ungleichung
in Klammern angefügt.
Beispiele:
1.) (a + b)2 = a2 + 2ab + b2
(a, b ∈ R) .
Gelesen: ’Die Gleichung ... gilt für alle reellen Zahlen a und b’.
2.) (1 + x)n ≥ 1 + nx
(x ≥ −1 , n ∈ N) .
Gelesen: ’Die Ungleichung ... gilt für alle reellen Zahlen x ≥ −1 und für alle natürlichen
Zahlen n’.
Wir können nun formal Aussagen negieren:
Satz 1.4 (Negation von Aussagen, die Quantoren enthalten)
Für beliebige Aussagen A(x) und B(x) gelten die Identitäten
¬(∀ x : A(x) ) = ∃ x : ¬A(x)
¬(∃ x : B(x) ) = ∀ x : ¬B(x)
Man beachte die Analogie zu den De Morganschen Regeln!
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
14
Beispiel 1.3 Nach der Entwicklung einer Software - Anwendung werden Testfälle durchgeführt, mit denen die Korrektheit der neuen Programme verifiziert werden soll. Nachdem
die Testfälle durchgeführt wurden, machten die Tester folgende Aussage:
’In jedem Testfall gibt es eine Programmeingabe, mit der das Programm nicht funktioniert.’
Die Entwickler versuchen nun die Situation so zu korrigieren, daß nach der Veränderung
der Programme die Negation der obigen Aussage eintritt. Diese lautet aber nun gemäß Satz
1.4:
’Es gibt einen Testfall, so daß bei jeder Programmeingabe das Programm funktioniert.’
Ob jetzt die Software fehlerfrei funktioniert, überlassen wir dem Glauben des Lesers.
In manchen Fällen ist auch der Gebrauch der folgenden Existenzquantoren sinnvoll:
∃∞
bedeutet: ’Es gibt unendlich viele’ ,
∃1
bedeutet: ’Es gibt genau ein’
Beispiel 1.4 Ein berühmter Satz aus der Zahlentheorie (bewiesen im 20.Jh.) lautet: Jede
hinreichend große ungerade Zahl ist als Summe von drei Primzahlen darstellbar. Formal
lautet diese Aussage:
∃ n0 ∈ N ∀ n ∈ N (n ≥ n0 ∧ n ≡ 1 mod 2) ∃ p1 , p2 , p3 ∈ P : n = p1 + p2 + p3 .
Die Negation dieser Aussage lautet zunächst formal:
∀ n0 ∈ N ∃ n ∈ N (n ≥ n0 ∧ n ≡ 1 mod 2) ∀ p1 , p2 , p3 ∈ P : n 6= p1 + p2 + p3 .
Mit der ∃∞ - Schreibweise können aber die beiden ersten Quantoren in dieser Negation
zusammengefaßt werden zu:
∃∞ n ∈ N (n ≡ 1 mod 2) ∀ p1 , p2 , p3 ∈ P : n 6= p1 + p2 + p3 .
Dies lautet jetzt umgangssprachlich: ’Es gibt unendlich viele ungerade natürliche Zahlen n,
die nicht als Summe dreier Primzahlen darstellbar sind.’
1.4 Mengen.
Die Konzepte der Mengenlehre bilden nicht nur das Fundament der modernen Mathematik,
sondern auch das der Informatik. Der Informatiker betreibt die Mengenlehre nicht als eine
exotische Wissenschaft. Vielmehr hat er hiermit ein grundlegendes Hilfsmittel für viele Disziplinen an der Hand, wie Datenbank-Design, Programmiersprachen oder objektorientierte
Modellierung.
Was ist nun eine Menge? Der Mathematiker Georg Cantor (1845 - 1918) versuchte mit
Mengen einen gemeinsamen Begriff für verschiedene Objekte der realen Welt oder unserer
Vorstellung zu schaffen. Die Objekte selbst nennt man Elemente der Menge. In diesem Sinne
ist eine Menge nichts anderes als eine Sammlung von Objekten, nämlich den Elementen der
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
15
Menge. Ist nun eine Menge S gegeben, so kann man entscheiden, ob ein gegebenes Element
a in der Menge S enthalten ist oder nicht 1 . Man sagt dann, ’a ist in S enthalten’ oder ’a
ist nicht in S enthalten’. Kommt a in der Menge S vor, schreibt man
a ∈ S.
Ist a nicht in der Menge S enthalten, notiert man das mit
a 6∈ S .
Ein wichtiges Beispiel für die Verwendung dieser Mengenschreibweisen ist die Deklaration
von Zahlbereichen durch Datentypen in verschiedenen Programmiersprachen:
Beispiel 1.5 In der Programmiersprache Java wird durch den Datentyp int die Menge I
aller ganzen Zahlen im Bereich von −231 bis 231 − 1 dargestellt. Die Deklaration
int zahl
(1.12)
legt dann zahl als ein (zunächst nicht näher bestimmtes, also noch nicht mit einem bestimmten Wert belegtes) Element der Menge I fest. In Visual Basic wird die gleiche Deklaration
mit der Syntax
dim zahl As Integer
(1.13)
ausgedrückt. Die Bedeutung der beiden durch (1.12) und (1.13) notierten Deklarationen ist
aber in beiden Fällen gleich, nämlich
zahl ∈ I .
Durch dieses Beispiel wird auch folgendes klar:
Die mathematische Notation ist ein von jeder Programmiersprache unabhängiges
Hilfsmittel, die Semantik eines Programms aufzuschreiben.
Hiermit erhält man insbesondere auch die Möglichkeit, gleichartige semantische Aspekte
einer Programmiersprache zu vergleichen, indem man die Sprache der Mathematik als ’Meta
- Sprache’ verwendet.
Mengen können auf zwei Arten beschrieben werden. Die erste Methode besteht darin, die
Elemente der Menge explizit aufzuführen. Besteht eine Menge S aus genau den Elementen
x1 , x2 , . . . , xn , so notiert man die Menge mit
S = { x1 , x2 , . . . , xn } .
1
S steht für das englische Wort set. Dieser Buchstabe wird häufig für den Namen einer Menge verwendet.
Generell werden im folgenden Mengen meist mit Großbuchstaben und Elemente mit kleinen Buchstaben
bezeichnet.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
16
Kann man nicht alle Elemente einer Menge aufschreiben, weil es zu viele oder unendlich
viele Elemente sind, so deutet man die nicht notierten Elemente durch Punkte ’. . . ’ an,
wenn daraus intuitiv ersichtlich ist, welches die fehlenden Elemente sind. Beispielsweise wird
die Menge der natürlichen Zahlen durch
{ 0, 1, 2, 3, . . . }
beschrieben und mit dem Buchstaben N abgekürzt. Auch würde niemand die 232 Elemente
der Menge I aus Beispiel 1.5 einzeln hinschreiben; man notiert I durch
I = { −231 , −231 + 1, . . . , 231 − 2, 231 − 1 } .
Bei der anderen Methode der Spezifikation einer Menge S verwendet man eine oder mehrere
definierende Bedingungen. Man benutzt dafür eine Aussage der Gestalt A(x) (vgl. Abschnitt
1.3), mit der die Elemente der Menge in folgendem Sinne beschrieben werden: ein Element
x ist genau dann in S enthalten, wenn A(x) wahr ist. Hierzu ein Beispiel:
Die Elemente der Menge S aller Quadratzahlen, die kleiner als 20 sind, kann man einerseits
alle hinschreiben. Man erhält
S = { 0, 1, 4, 9, 16 } .
Andererseits können diese Quadratzahlen aber auch durch die Aussage
A(x)
:= (’x ist eine Quadratzahl’ ∧ ’x ist kleiner als 20’)
= (x ∈ N ∧ x < 20 ∧ ∃ y ∈ N : y 2 = x )
beschrieben werden. Hiermit drückt man jetzt aus, daß ein Element x genau dann zu S
gehört, wenn A(x) wahr ist. Um auf diese Art und Weise eine Menge zu definieren, benutzt
man die folgende Notation:
S = {x | A(x) } = { x | x ∈ N ∧ x < 20 ∧ ∃ y ∈ N : y 2 = x } .
Der Kürze halber verwendet man häufig
anstelle von
S = {x | A(x) } = x| x ∈ X ∧ A0 (x)
die gleichwertige Schreibweise S = x ∈ X| A0 (x) , die die Aussage A(x) = (x ∈ X ∧ A0 (x))
hinsichtlich der Zugehörigkeit von x zu einer Obermenge X verkürzt. Damit haben wir im
vorigen Beispiel die kürzere Schreibweise
S = { x ∈ N | x < 20 ∧ ∃ y ∈ N : y 2 = x } .
Nun stehen die wesentlichen Schreibweisen für ein Werkzeug bereit, mit dessen Hilfe man
Mengen von Objekten notieren und schließlich ’weiterverarbeiten’ kann. Wir benutzen diese
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
17
Schreibweisen, um einige sehr wichtige Zahlmengen einzuführen:
N
N∗
P
Z
Z∗
Q
R
:= { 0, 1, 2, 3, . . . }
(Menge der natürlichen Zahlen mit 0)
:= { 1, 2, 3, . . . }
(Menge
der natürlichen Zahlen ohne 0)
:=
p | p ∈ N ∧ p ≥ 2 ∧ (p ≡ 0 mod k =⇒ k ∈ {1, p})
(Menge der Primzahlen)
:= { 0, ±1, ±2, ±3, . . . }
(Menge der ganzen Zahlen)
:= { ±1, ±2, ±3, . . . }
(Menge
der ganzen Zahlen ohne 0)
:=
q | ∃ a ∈ Z ∃ b ∈ Z∗ : q = a/b
(Menge der rationalen Zahlen)
:= Menge der rellen Zahlen
Leider stellt sich heraus, daß wir uns einige Probleme eingekauft haben, die mit der Allgemeinheit der obigen Definitionen zusammenhängen. Damit ist folgendes gemeint:
Die Elemente von Mengen können selbst wieder Mengen sein. Man führe nur etwa die Menge
S := { T | T ist eine Menge mit unendlich vielen Elementen }
ein. S ist eine Menge von Mengen. Es stellt sich nun die Frage, ob S (als Menge) selbst auch
zu der Menge aller Mengen gehört, die in S enthalten sind. Das ist hier offensichtlich der
Fall, denn S enthält ja selbst auch unendlich viele Elemente. Hierfür betrachte man nur die
unendlich vielen Mengen
Sn := { k ∈ N | k ist ein Vielfaches von n }
(n ∈ N ∧ n > 0) .
Jede dieser Mengen Sn besteht aus unendlich vielen Elementen und ist daher ein Element
T von S. Weiterhin sind für zwei verschiedene Primzahlen p und q die Mengen Sp und Sq
verschieden, weil p ∈ Sp , q ∈ Sq und p 6∈ Sq , q 6∈ Sp gilt, denn keine Primzahl ist ein
Vielfaches einer anderen Primzahl. Also ist die Aussage
S ∈ S
offensichtlich wahr. Mengen, die sich selbst enthalten, sind ziemlich kurios. Es wäre doch
erstrebenswert, solche kuriosen Mengen auszugrenzen und nur mit Mengen zu arbeiten, die
in dem Sinne ’normal’ sind, daß sie sich nicht selbst enthalten. Diese Menge N aller normalen
Mengen X wird demnach durch
N := { X | X 6∈ X }
(1.14)
definiert. Die obige Menge S gehört demnach nicht zu N ; es gilt also S 6∈ N . Leider sind
die fundamentalen Probleme damit immer noch nicht aus der Welt geschafft. Wir stellen
nämlich jetzt einmal die Frage, ob N selber eine normale Menge ist. Wir unterscheiden die
beiden möglichen Fälle:
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
18
Fall 1 : N ist eine normale Menge.
Dann gilt aufgrund der Definition von N , daß N ∈ N , denn N gehört ja zu den normalen
Mengen. Somit ist N = X für ein X, das in N vorkommt. Nun gilt aber für die Elemente
X von N , daß X 6∈ X, und daher haben wir N 6∈ N . Es hat sich ein Widerspruch ergeben.
Fall 1 kann also nicht eintreten!
Fall 2 : N ist keine normale Menge.
Jetzt haben wir N 6∈ N vorausgesetzt, was aber andererseits aufgrund der definierenden
Eigenschaft von N wiederum N ∈ N bedeutet (wieder für ein gewisses X = N mit X ∈ N ).
Auch hier tut sich ein Widerspruch auf! Auch Fall 2 kann nicht eintreten.
Hilfe!! Was ist passiert? Die Tatsache, daß die Definition der Menge N erlaubt ist, führt
zu einem Widerspruch, der nicht auflösbar ist. Das ist das berühmte Russel’sche Paradoxon
(Bertrand Russell, 1872 - 1970, engl. Earl und Philosoph). Der Leser möge beruhigt sein:
derartige Paradoxien haben in der Vergangenheit die Mathematik in eine tiefe Grundlagenkrise gestürzt, aus der sie sich erst durch die Entwicklung der mathematischen Logik befreit
hat. Die Dinge sind geklärt!
Für den Erstzugang zur Mengenlehre bedeutet diese Paradoxie, daß solche allgemeinen Definitionen von Mengen wie oben für S und N nicht zugelassen werden dürfen. Man verlangt,
daß bei der Definition einer Menge mit Hilfe einer definierenden Bedingung immer eine Art
Grundmenge von vorneherein die Auswahl der möglichen Elemente einschränkt. Eine solche Grundmenge wird mit U bezeichnet (wie ’Universum’), und es sind ab jetzt nur noch
Definitionen in der Form
{ x | x ∈ U ∧ A(x) }
(1.15)
erlaubt. Damit ist das Russel’sche Paradoxon aus der Welt geschafft, denn die Definition
einer Menge N mit
N := {X | X ∈ U ∧ X 6∈ X }
(1.16)
(anstelle von (1.14)) führt jetzt bei der Frage, ob N in N enthalten ist, nicht mehr zu
einem unauflösbaren Widerspruch. Geht man von N ∈ N aus, so erhält man zunächst einen
Widerspruch wie in Fall 1 oben, denn man hat N ∈ U ∧ N 6∈ N . Der Widerspruch kommt
allein durch N 6∈ N zustande, die gleichzeitig erfüllte Bedingung N ∈ U spielt keine Rolle.
Also kann Fall 1 nicht eintreten; es muß also Fall 2 eintreten, was N 6∈ N bedeutet. Aus
(1.16) ergibt sich so die Gültigkeit der Aussage ¬ (N ∈ U ∧ N 6∈ N ). Aufgrund der De
Morganschen Regel (1.1) folgt daraus:
N 6∈ U ∨ N ∈ N .
Da die zweite Alternative der Voraussetzung von Fall 2 widerspricht, tritt zwingend die erste
Alternative ein, und die besagt N 6∈ U . Setzt man also ein Universum U voraus und definiert
dann anschließend die Menge N wie in (1.16), so gilt N 6∈ N , und man erhält als zusätzliche
Information die Aussage N 6∈ U . Dies besagt also, daß die Menge N nicht in dem Universum
U enthalten ist, obwohl die Elemente von N in U enthalten sind. Zukünftig werden wir bei
Mengendefinitionen immer die Einschränkung aus (1.15) berücksichtigen.
Wir haben jetzt das nötige Werkzeug, um nach der Einführung weiterer grundlegender Notationen die Eigenschaften von Mengen und ihre Beziehungen untereinander beschreiben zu
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
19
können. Beispielsweise ist es wichtig ausdrücken zu können, ob die Elemente einer Menge
A auch alle in einer anderen Menge B vorkommen. So repräsentieren die drei Elemente der
Menge S := { 7, 11, 25 } drei natürliche Zahlen. Diese drei Elemente kommen auch in der
Menge N vor; man sagt, die Menge S ist eine Teilmenge der Menge N. Allerdings ist die
Menge S keine Teilmenge der Menge P aller Primzahlen, weil das Element 25 von S keine
Primzahl ist. Es spielt dann keine Rolle mehr, daß 7 und 11 Primzahlen sind.
Diese und weitere Verknüpfungen zwischen Mengen werden folgendermaßen formalisiert:
Verknüpfung
A⊆B
A=B
A⊂B
Bedeutung
∀ x : (x ∈ A =⇒ x ∈ B)
A⊆B ∧ B⊆A
A ⊆ B ∧ ¬(A = B)
Für ¬(A = B) wird der Kürze halber auch A 6= B geschrieben. Nach diesen Definitionen
bedeutet die Gleichheit zweier Mengen A und B, daß A und B die gleichen Elemente besitzen.
Definition 1.1 Zwei Mengen A und B heißen gleich, wenn jedes Element von A auch Element von B ist und umgekehrt.
Es ergibt sich aufgrund dieser Definition aber auch
{ 1, 2, 3, 2 } = { 1, 2, 3 } = { 3, 2, 1 } .
Das bedeutet:
Bei Mengen haben Mehrfachnennungen der Elemente keine Bedeutung: jedes Element kann
nur höchstens einmal in einer Menge vorkommen. Es kommt dabei auch nicht auf die Reihenfolge an, in der die Elemente genannt werden.
Auf die wichtige Unterscheidung zwischen endlichen, unendlichen und gleichmächtigen Mengen gehen wir später in Abschnitt 2.3 ein, weil hierzu der im Augenblick noch nicht vorhandene Begriff der Bijektion erforderlich ist.
Wichtig für Anwendungen ist die Aussage des folgenden Satzes:
Satz 1.5 (Transitivität der Teilmengenbeziehung)
Es seien A, B und C Mengen. Dann gilt:
(A ⊆ B ∧ B ⊆ C) =⇒ A ⊆ C
(A ⊂ B ∧ B ⊂ C) =⇒ A ⊂ C
Beweis: Es wird die erste Aussage des Satzes gezeigt. Da die Aussage die Gestalt einer
Implikation hat, setzen wir die Hypothese als wahr voraus und zeigen, daß dann auch die
Folgerung A ⊆ C wahr ist. Hierzu sei x ∈ A. Wir müssen jetzt unter Ausnutzung der
Hypothese (A ⊆ B ∧ B ⊆ C) zeigen, daß x ∈ C gilt (siehe die Definition von ’⊆’). Wegen
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
20
des ersten Teils der Hypothese A ⊆ B wissen wir auch x ∈ B, und wegen des zweiten
Teils der Hypothese B ⊆ C ergibt sich mit diesem Zwischenergebnis dann auch x ∈ C, was
insgesamt zu zeigen war. Die zweite Aussage im Satz wird ähnlich bewiesen.
Unter der leeren Menge versteht man eine Menge, die keine Elemente enthält. Für die leere
Menge benutzt man das Symbol ∅. Die leere Menge ist Teilmenge jeder Menge, es gilt also
∅ ⊆ A.
(1.17)
Diese Aussage ist leicht zu verifizieren, denn es muß die Implikation x ∈ ∅ =⇒ x ∈ A gezeigt
werden. Da die Hypothese dieser Implikation immer falsch ist, ist die Implikation also wahr.
Eine weitere Eigenschaft der leeren Menge ist die, daß eine Menge, die nur die leere Menge
enthält, selber nicht leer ist; in Zeichen {∅} =
6 ∅.
In der Informatik kommen oft Mengen von Mengen vor. Die sog. Programmzustände bilden
beispielsweise eine Menge, deren Elemente jeweils aus Mengen von Variablen bestehen. Auf
solche Mengen von Mengen ist die folgende Definition zugeschnitten.
Definition 1.2 (Potenzmenge)
Es sei S eine Menge. Die Potenzmenge ist als die Menge aller Teilmengen von S erklärt und
wird mit ℘(S) bezeichnet. Es ist also
℘(S) = {T | T ⊆ S}
Beispiel 1.6 Es sei S := { 1, 2, 3 }. Dann ist die zugehörige Potenzmenge von S gleich
℘(S) = { ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} } .
Der folgende Satz drückt zwei wichtige Eigenschaften von Potenzmengen aus.
Satz 1.6 (Eigenschaften der Potenzmenge)
1.) Die Potenzmenge einer Menge ist niemals leer, denn sie enthält stets die leere Menge.
2.) Besteht die Menge S aus unendlich vielen Elementen, so auch die Potenzmenge ℘(S).
Besteht S hingegegen aus genau n Elementen, so besteht ℘(S) aus 2n Elementen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
21
1.5 Konstruktion neuer Mengen.
Im vorigen Abschnitt 1.4 sind Mengen definiert und die Möglichkeiten ihrer Notation erläutert
worden. Jetzt werden verschiedene Operationen auf den Mengen eingeführt. Wie schon bei
den Aussagen in Abschnitt 1.1 werden jetzt die verschiedenen Methoden der Verknüpfung
von Mengen diskutiert.
Definition 1.3 Die Schnittmenge A ∩ B zweier Mengen A und B besteht aus genau den
Elementen, die sowohl in A als auch in B liegen:
A ∩ B = {x | x ∈ A ∧ x ∈ B}
Sprechweise: A geschnitten mit B.
Definition 1.4 Die Vereinigungsmenge A ∪ B zweier Mengen A und B besteht aus genau
den Elementen, die entweder in A oder in B oder in A ∩ B liegen:
A ∪ B = {x | x ∈ A ∨ x ∈ B}
Sprechweise: A vereinigt mit B.
Definition 1.5 Die Differenzmenge A \ B zweier Mengen A und B besteht aus genau den
Elementen, die in A, aber nicht in B liegen:
A \ B = {x | x ∈ A ∧ x 6∈ B}
Der folgende Satz faßt die wichtigsten Eigenschaften von Vereinigung und Schnittmengen
zusammen.
Satz 1.7 (Allgemeine Gesetze für Vereinigung und Schnitt von Mengen)
Es seien A, B und C beliebige Mengen. Dann gilt:
A∪B =B∪A
A∩B =B∩A
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A∪A=A
A∩A=A
A∪∅=A
A∩∅=∅
(Kommutativgesetze)
(Assoziativgesetze)
(Distributivgesetze)
(Idempotenzgesetze)
Der Beweis dieses Satzes besteht im Nachprüfen der Definitionen 1.3 und 1.4 unter Anwendung von Satz 1.1.
Da sowohl die Vereinigung als auch die Schnittmengenbildung assoziative Operationen auf
Mengen sind (es also auf die Reihenfolge der beteiligten Mengen nicht ankommt), schreibt
man bei der Vereinigung bzw. Schnittmengenbildung von drei Mengen A, B, C auch
[
{ A, B, C } := A ∪ B ∪ C für A ∪ (B ∪ C)
und
\
{ A, B, C } := A ∩ B ∩ C
für A ∩ (B ∩ C) .
Dies legt eine Verallgemeinerung nahe, die sich auf den Schnitt bzw. die Vereinigung über
eine Menge von Mengen bezieht:
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
22
Definition 1.6 Es sei C eine Sammlung von Mengen (also eine Menge, die Mengen enthält).
Dann wird folgende Schreibweise vereinbart:
Verknüpfung Sprechweise
T
Schnitt von C
SC
Vereinigung von C
C
Bedeutung
T
S C = {x | ∀A ∈ C : x ∈ A}
C = {x | ∃A ∈ C : x ∈ A}
Für viele Aspekte in der Mengenlehre ist der folgende Begriff von Bedeutung.
Definition 1.7 (Disjunkte Mengen)
(i) Zwei Mengen A und B heißen disjunkt, wenn sie keine gemeinsamen Elemente haben:
A∩B = ∅ .
(ii) Ist C eine Sammlung von Mengen, so heißt C eine Sammlung paarweise disjunkter Mengen, wenn je zwei verschiedene Mengen aus C disjunkt sind.
(iii) Ist C eine Sammlung von Mengen, so heißt C eine Sammlung disjunkter Mengen, wenn
gilt:
\
C = ∅.
Ein Mengensystem kann disjunkt sein, obwohl es nicht paarweise disjunkt ist. Paarweise
Disjunktheit ist also eine stärkere Forderung an ein Mengensystem als nur Disjunktheit.
Beispiel: Sei A = {1, 2}, B = {2, 3} und C = {1, 3}. Dann ist
A ∩ B = {2} ,
A ∩ C = {1} ,
B ∩ C = {3} ,
A ∩ B ∩ C = ∅.
Im täglichen Leben verwendet man Operationen wie Addition, Subtraktion und Multiplikation bei der Verknüpfung von Zahlen. Man sagt auch, daß man Summen, Produkte oder
Differenzen bildet. Es soll jetzt gezeigt werden, daß man diese Begriffe auch für Mengen
definieren kann und daß dies auch etwas mit den Operationen auf Zahlen zu tun hat. Insbesondere die Subtraktion von Mengen ist mit der Differenzmenge aus Definition 1.5 bereits
eingeführt worden, die Vereinigung zweier Mengen entspricht der klassischen Addition von
Zahlen. Der Zusammenhang zwischen Differenz- und Schnittmenge bzw. zwischen Differenzund Vereinigungsmenge ergibt sich aus dem folgenden Satz.
Satz 1.8 (Zusammenhang zwischen Differenz und Schnitt- bzw. Vereinigungsmenge)
Es seien A, B und C beliebige Mengen. Dann gilt:
C \ (A ∪ B) = (C \ A) ∩ (C \ B)
C \ (A ∩ B) = (C \ A) ∪ (C \ B)
A ∩ (B \ C) = (A ∩ B) \ (A ∩ C)
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
23
Der Beweis der ersten beiden Aussagen besteht wieder aus einer einfachen Anwendung der
Definitionen der jeweiligen Operationen unter Berücksichtigung der aussagenlogischen Regeln von De Morgan aus Satz 1.2. Man beachte, daß die Aussage A∪(B\C) = (A∪B)\(A∪C)
im allgemeinen falsch ist. Hierfür betrachte man drei Mengen A, B, C mit B ⊆ A, A 6= ∅
und C = ∅. Dann ist einerseits
A ∪ (B \ C) = A ∪ B = A ,
andererseits
(A ∪ B) \ (A ∪ C) = A \ A = ∅ .
Hingegen besteht für drei beliebige Mengen A, B, C die Mengeninklusion
(A ∪ B) \ (A ∪ C) ⊆ A ∪ (B \ C) .
In manchen Fällen werden alle Operationen mit Mengen innerhalb einer festen Obermenge X ausgeführt. Insbesondere sind alle auftretenden Mengen in X enthalten (Beispielsweise
sind irgendwelche Mengen ganzer Zahlen immer in der Menge aller ganzen Zahlen enthalten).
Setzt man im vorigen Satz C = X (führt man also die Differenzbildung in der Obermenge
X aus), so schreibt man statt X \ A auch kurz A und nennt diese Menge das Komplement
von A in X. Der vorige Satz nimmt dann die folgende Gestalt an:
Korollar 1.1 (De Morgansche Regeln)
Es seien A und B beliebige Mengen. Dann gilt:
A∪B = A∩B
A∩B = A∪B
Außerdem gilt die Mengenbeziehung A \ B = A ∩ B.
Für viele Anwendungen wird der folgende Satz benötigt. Ist A eine Menge mit höchstens
endlich vielen Elementen, so bezeichnet |A| die Anzahl der Elemente in der Menge A.
Satz 1.9 Sind A und B Mengen mit höchstens endlich vielen Elementen, so gilt:
|A ∪ B| = |A| + |B| − |A ∩ B| ,
|A \ B| = |A| − |A ∩ B| .
Korollar 1.2 Sind A und B disjunkte Mengen mit höchstens endlich vielen Elementen, so
gilt:
|A ∪ B| = |A| + |B| ,
|A \ B| = |A| .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
24
Jetzt wird der Begriff des Produktes von Mengen eingeführt.
Definition 1.8 (Das Cartesische Produkt)
Es seien A und B Mengen. Das Cartesische Produkt (meist nur kurz Produkt genannt) von
A und B ist die Menge A × B, die aus allen geordneten Paaren (a, b) besteht, wobei a ∈ A
und b ∈ B ist. In Zeichen:
A × B = {(a, b) | a ∈ A ∧ b ∈ B}
Insbesondere stimmen zwei Elemente (a, b) und (c, d) aus A × B genau dann überein, wenn
sie komponentenweise übereinstimmen:
(a, b) = (c, d) ⇐⇒ (a = c ∧ b = d) .
(1.18)
Man beachte, daß es im Gegensatz zu Mengen beim Cartesischen Produkt auf die Reihenfolge bei der Belegung der Komponenten ankommt, und (a, a) ist auch ein völlig anderes
Objekt als a.
Für ein praktisches Beispiel zu Produkten von Mengen gehen wir in eine Möbelfirma und
untersuchen die Produktionspreise von Einzelteilen der Möbel. So möge eine Spezialschraube
bei der Fertigung eines Tisches 1,50 Euro kosten. Wir fassen nun eine solche Preisangabe
im mengentheoretischen Sinn als ein geordnetes Paar auf, in dem ein Wert (mit zwei Nachkommastellen) und eine Währungseinheit vorkommen. Bezeichnet Q in üblicher Weise die
Menge aller rationalen Zahlen und N die Menge aller natürlichen Zahlen einschließlich der
Null, so kann mit
W := { x ∈ Q | 100x ∈ N }
die Menge aller rationalen Zahlen beschrieben werden, die als Werte eines Stückpreises vorkommen. In der Menge
E := { DEM, Euro, USD, FRF, . . . }
seien alle auf der Welt vorkommenden Währungseinheiten zusammengefaßt. Damit kann die
Menge P aller Preise als das cartesische Produkt der Mengen W und E aufgefaßt werden:
P = W ×E .
In der Firma werden nun Möbel gefertigt. Diese bestehen aus verschiedenen Teilen, wobei
die Teile wieder aus kleineren Teilen zusammengesetzt sind, u.s.w. Jedes Teil kann durch
eine Liste seiner Einzelteile beschrieben werden. So besteht ein Tisch (unter Vereinfachung
der realen Verhältnisse) beispielsweise aus einer Tischplatte, 4 Tischbeinen und 16 Schrauben, mit denen die Beine an die Platte montiert werden. Damit besteht ein Tisch also aus
21 Teilen. Mengentheoretisch ausgedrückt läßt sich ein Tisch durch eine Menge mit 21 Elementen beschreiben. Aber es reicht nun für eine Beschreibung des Tisches nicht aus, daß
das Möbelstück aus einer Tischplatte, einigen Tischbeinen und diversen Schrauben besteht.
Es soll nun noch mengentheoretisch erfaßt werden, wieviele der jeweiligen Teile verarbeitet
werden. Aus der Bemerkung im Anschluß an die Definition 1.1 wissen wir, daß es nicht
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
25
möglich ist, in einer Menge viermal das Element ’Tischbein’ zu nennen. Man behilft sich
nun dadurch, daß man jedes Tischbein mit einer Nummer versieht und dann in einer Menge die Elemente ’Tischbein 0’, ’Tischbein 1’, ’Tischbein 2’ und ’Tischbein 3 aufführt (aus
konventionellen Gründen beginnt man die Nummerierung mit 0). Jetzt unterscheiden sich
nämlich die Elemente und können nebeneinander in einer Menge genannt werden. Gleichzeitig ist festgelegt, wie oft das Element ’Tischbein’ vorkommt: nämlich einmal mehr wie
es die größte Nummer angibt (weil die Zählung bei Null beginnt). Bei der Formalisierung
dieses Sachverhaltes hilft die folgende Definition, in der auf das Konzept des Cartesischen
Produkts zurückgegriffen wird.
Definition 1.9 (Multimengen)
Eine Multimenge über einer Menge A ist eine Teilmenge M von A × N mit der folgenden
Eigenschaft:
∀ a ∈ A ∃ n ∈ N : (a, m) ∈ M ⇐⇒ m < n .
(1.19)
Die Menge aller Multimengen über A wird mit M(A) bezeichnet. Die zum Element a ∈ A
gehörige natürliche Zahl n wird die Multiplizität von a in M genannt.
Die Bedingung in (1.19) dient der Gewährleistung, daß ein Element fortlaufend nummeriert
ist: für jedes a ∈ A kommen genau die Elemente (a, 0), (a, 1), . . . , (a, n−1) in der Multimenge
vor. Gibt es zu a ∈ A kein Element (a, 0) in M , so sagt man entweder der Kürze halber, daß
a in M nicht vorkommt oder daß a in M die Multiplizität 0 hat. In diesem Fall wähle man in
(1.19) n = 0. Das Möbelstück ’Tisch’ besitzt nun als Multimenge die folgende Darstellung:
’Tisch’ =
{ (Tischplatte, 0), (Tischbein, 0),. . . ,(Tischbein, 3), (Schraube, 0), . . . , (Schraube, 15) } .
Für eine Fortführung dieses Beispiels benötigen wir noch einen weiteren Begriff.
Definition 1.10 (Summe zweier Multimengen)
Es sei A eine Menge und M und N zwei Multimengen über A. Die Summe M + N der
Mengen M und N ist diejenige Multimenge über A, so daß für jedes a ∈ A die Multiplizität
von a in M + N die Summe der Multiplizitäten von a in M und N ist.
Jede Menge X kann als eine Multimenge X 0 aufgefaßt werden, indem jedes Element in X 0
mit der Multiplizität 1 vorkommt:
X 0 = {(x, 0) | x ∈ X} .
(1.20)
Eine Multimenge, in der jedes Element mit der Multiplizität 1 vorkommt, ist eine einfache
Multimenge. Jede einfache Multimenge kann demnach wieder als eine Menge interpretiert
werden. Wann ist nun eine Summe zweier einfacher Mengen X und Y wieder einfach? Dies
ist offensichtlich genau dann möglich, wenn die beiden Mengen disjunkt sind, denn kommt
ein Element sowohl in X als auch in Y vor, so ist die Multiplizität von a in X + Y gleich 2,
und damit ist die Summe X +Y nicht mehr einfach. In diesem Sinne kann man herkömmliche
Mengen genau dann addieren, wenn sie disjunkt sind.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
26
Definition 1.11 (Summe zweier Mengen)
Es seien X und Y zwei Mengen und X 0 und Y 0 die zugehörigen einfachen Multimengen.
Die Summe X + Y der Mengen X und Y wird als die Summe X 0 + Y 0 der zugehörigen
Multimengen definiert. X + Y kann genau dann wieder als eine Menge interpretiert werden,
wenn X und Y disjunkt sind.
Welche Möglichkeiten der Beschreibung eröffnen sich hiermit für die zusammengesetzten
Möbelstücke? A bezeichne die Menge aller Teile, die für die Montage aller Möbel in der Firma zur Verfügung stehen. Darunter sind einige Teile Elementarteile, wie z.B. die Schrauben,
die selbst nicht weiter unterteilt sind. Andere Teile sind schon zusammengesetzt, wie etwa ein
bereits montierter Tisch. Zur weiteren Unterscheidung wird die Menge Z aller zusammengesetzten Teile und die Menge E aller Elementarteile eingeführt. E enthält also alle Teile, die
irgendwo in Waren verarbeitet werden. In Z befinden sich nicht nur fertig montierte Teile
wie etwa ein kompletter Tisch, sondern auch ’halbfertige Teile’ wie ein Tischbein, in das
bereits vier Schrauben hineingedreht sind. Die Mengen Z und E sind disjunkt. Somit hat
man also aufgrund von Definition 1.11:
Z ∈ M(Z + E) ;
(1.21)
die Menge aller zusammengesetzten Teile kommt in der Multimenge über der Summe der
Mengen von Einzelteilen und zusammengesetzten Teilen vor. Hierin drückt sich eine rekursive
Teilmengenbeziehung aus, durch die veranschaulicht wird, daß gewisse Teile zusammengesetzte Teile enthalten, die wieder aus anderen Teilen zusammengesetzt sind, usw. Formal
erkennt man die rekursive Teilmengenbeziehung in (1.21) daran, daß das Z sowohl auf der
linken als auch auf der rechten Seite vorkommt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
27
2 Relationen und Funktionen
Sowohl in der Informatik als auch in der Umgangssprache versteht man unter Relationen
gewisse Beziehungen zwischen Objekten. In der Informatik sind dies technische Artefakte
der Programmierung. In der realen Welt treten Relationen bei diversen Sachverhalten auf.
So kann man sagen, daß zwei Menschen durch eine Ehe in Relation zueinander stehen. Eine
Person und ein Fahrzeug können in der Relation ’ist Fahrer von’ genannt werden. Personen
können zu einem Buch in unterschiedlichen Relationen stehen: als Leser, als Autor oder
als Verleger. Man kann z.B. zwischen Menschen und Büchern die Relation ’ist Autor von’
erklären. Sondert ein Bibliothekar aus einem Bücherbestand alle Bücher aus, die mehr als
einen Autor haben, verbleiben in den Regalen nur Bücher, die in Relation zu genau einem
Menschen (nämlich ihrem jeweiligen Autor) stehen. Jetzt wird die Autor-Relation zu einer
Funktion, erklärt auf den Büchern: jedem Buch im Regal kann genau ein Autor zugeordnet
werden. Die Eindeutigkeit der Zuordnung eines Buches zu seinem Autor ist im allgemeinen
aber nicht umkehrbar: Es können mehrere Bücher vom selben Autor im Regal stehen.
In der Software-Entwicklung spielt das getreue Abbilden von Fakten und Zusammenhängen
der realen Welt in Programm-Objekten eine wichtige Rolle. Insofern kommen auch hier
Relationen und Funktionen in sehr vielen Zusammenhängen vor.
2.1 Relationen.
Definition 2.1 (Relationen)
Es seien A und B zwei Mengen. Jede Teilmenge von A × B heißt eine Relation von A nach
B. Ist A = B und R eine Relation von A nach A, so nennt man R auch eine Relation auf A.
Ist R eine Relation von A nach B, so gilt also R ⊆ A × B. Ist (a, b) ∈ R, so schreibt man
dafür auch aRb.
Beispiel 2.1 Es bezeichnen A und B die Mengen
A := { Hans, Oskar, Karl }
und
B := { Lisa, Doris, Andrea, Heidi } .
Hans ist mit Doris und Karl mit Lisa verheiratet. Dann können wir eine Relation REhe ⊆
A × B definieren, durch die genau die Ehepaare herausgefiltert werden:
REhe = { (Hans, Doris), (Karl, Lisa) } .
Beispiel 2.2 Es bezeichne B die Menge aller deutschen Bundesländer und S die Menge
aller Städte in Deutschland. Eine Relation R ⊆ S × B sei erklärt durch
(s, b) ∈ R
⇐⇒
Die Stadt s liegt im Bundesland b.
So ist (Hannover, Niedersachsen) ∈ R, und (Mainz, Hessen) 6∈ R. Durch die Relation R
wird also beschrieben, welche Städte in welchen Bundesländern liegen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
28
Definition 2.2 (Definitions- und Wertebereich einer Relation)
Es sei R eine Relation von A nach B. Als Definitionsbereich von R wird die Menge
Dom (R) = { a ∈ A | ∃ b ∈ B : (a, b) ∈ R} ⊆ A
bezeichnet. Der Wertebereich von R ist die Menge
Ran (R) = { b ∈ B | ∃ a ∈ A : (a, b) ∈ R} ⊆ B .
Falls für eine Relation von A nach B sogar A = Dom (R) gilt, nennt man R auch eine
(links)totale Relation. Hier steht dann jedes a ∈ A zu irgendeinem b ∈ B in Relation.
Hier stehen die Abkürzungen für die englischen Begriffe domain und range. Im Beispiel 2.2
ist so A = S = Dom (R) die Menge aller deutschen Städte und B = Ran (R) die Menge aller
Bundesländer. Wählt man für die Menge S hingegen nur die Städte in Deutschland, in der
mehr als 1 Million Menschen leben, so erhält man hingegen:
S = Dom (R) = { Hamburg, Berlin, München, Köln }
und
Ran (R) = { Hamburg, Berlin, Bayern, Nordrhein-Westfalen } .
In Beispiel 2.1 wird keine totale Relation erklärt, denn Dom (R) = { Hans, Karl } umfaßt
nicht die ganze Menge A. Hingegen ist die Relation in Beispiel 2.2 eine totale Relation, wenn
man davon ausgeht, daß jede Stadt auch in einem Bundesland liegt (!!).
Durch die beiden folgenden Beispiele werden zwei wichtige mathematische Relationen eingeführt.
Beispiel 2.3 Die Relation ’kleiner oder gleich’ auf den natürlichen Zahlen N wird durch
{ (m, n) | ∃ k ∈ N : m + k = n } ⊆ N2
erklärt. Hierbei ist die Zahl k die nicht-negative Differenz zwischen n und m.
Beispiel 2.4 Die Relation ’ist ein Teiler von’ auf den natürlichen Zahlen N wird durch
{ (m, n) | ∃ k ∈ N : m · k = n } ⊆ N2
erklärt. Diese Relation wird künftig auch mit δN bezeichnet.
Definition 2.3 (Inverse Relation)
Es sei R eine Relation von A nach B. Die inverse Relation R−1 ist definiert durch
R−1 = {(b, a) | (a, b) ∈ R} .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
29
Ist R eine Relation von A nach B, so ist R−1 eine Relation von B nach A. Man spricht
in diesem Zusammenhang auch von der Umkehrrelation. Definitions- und Wertebereiche bei
einer Relation und ihrer Umkehrrelation sind untereinander ausgetauscht:
Dom (R−1 ) = Ran (R)
und
Ran (R−1 ) = Dom (R) .
Im täglichen Leben kommen Umkehrrelationen häufig vor: Zu der Relation ’ist Leser von’
zwischen einer Menge von Personen und einer Menge von Büchern gehört die Umkehrrelation
’wird gelesen von’ zwischen der Büchermenge und der Personenmenge. Bei der sprachlichen
Formulierung einer Umkehrrelation geht man oft von einem aktiv ausgedrückten Sachverhalt
zur passiven Ausdrucksweise über (bzw. umgekehrt). Auch in manchen mathematischen
Zusammenhängen ist das so:
Beispiel 2.5 Es bezeichne δN die Teilerrelation aus Beispiel 2.4. Die zugehörige Umkehrrelation ist
δN−1 = { (n, m) | ∃ k ∈ N : n = k · m } ⊆ N2 .
Umgangssprachlich wird hier die Relation ’ist Vielfaches von’ betrachtet.
In der folgenden Definition wird der zentrale Begriff dieses Kapitels eingeführt.
Definition 2.4 (Partielle und totale Funktionen, linkseindeutige Relationen)
1.) Eine Relation R von A nach B heißt eine partielle Funktion oder auch eine rechtseindeutige Relation, falls gilt:
∀ a ∈ A ∀ b1 ∈ B ∀ b2 ∈ B : (aRb1 ∧ aRb2 =⇒ b1 = b2 ) .
Ist eine rechtseindeutige Relation R zusätzlich linkstotal, so spricht man auch von einer
totalen Funktion (oder: Funktion, Abbildung).
2.) R heißt eine linkseindeutige Relation, falls gilt:
∀ a1 ∈ A ∀ a2 ∈ A ∀ b ∈ B : (a1 Rb ∧ a2 Rb =⇒ a1 = a2 ) .
Im Zusammenhang mit partiellen und totalen Funktionen sowie linkseindeutigen Relationen
nennt man die Menge A den Urbildbereich und die Menge B den Bildbereich. Dabei gilt
Dom (R) ⊆ A und Ran (R) ⊆ B.
Satz 2.1 (Interpretation der Funktionen und linkseindeutigen Relationen)
1.) Eine Relation ist eine partielle Funktion, falls jedes Element des Urbildbereiches zu
höchstens einem Element des Bildbereiches in Relation steht.
2.) Eine Relation ist eine Funktion (oder Abbildung), falls jedes Element des Urbildbereiches zu genau einem Element des Bildbereiches in Relation steht.
3.) Eine Relation ist linkseindeutig, falls zu jedem Element des Bildbereiches höchstens
ein Element des Urbildbereiches in Relation steht.
In den folgenden drei Diagrammen versinnbildlicht der jeweils linke Kasten den Urbildbereich, der rechte Kasten den Bildbereich. Die jeweiligen Elemente in diesen Mengen sind
durch Kreise angedeutet und von oben nach unten mit 1 bis 5 (Urbildbereich) bzw. 1 bis
6 (Bildbereich) durchnummeriert. Der Leser mag zur Verdeutlichung Pfeile zwischen den
jeweiligen Elementen einzeichnen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
30
Beispiel für eine partielle Funktion
h
h
h
h
h
h
h
h
h
h
h
{ (1, 2), (2, 1), (4, 3), (5, 3) }
Beispiel für eine totale Funktion
h
h
h
h
h
h
h
{ (1, 2), (2, 1), (3, 6), (4, 3), (5, 3) }
h
h
h
h
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
31
Beispiel für eine linkseindeutige Relation
h
h
h
h
h
h
h
h
h
h
h
{ (1, 2), (2, 1), (3, 3), (3, 4), (3, 5) }
Warum sind die in der Definition 2.4 eingeführten Begriffe so wichtig? Der Begriff linkseindeutige Relation kommt im Bereich der Geschäftsprozeß - Modellierung vor. Er tritt immer
dann auf, wenn Objekte betrachtet werden, die einem identifizierenden Schlüsselbegriff zugeordnet werden. Man betrachte z.B. die Namen von Personen in einer Kundendatenbank.
Jeder (identifizierenden) Kundennummer kann zwar eindeutig ein Name zugeordnet werden,
aber zwei Nummern können zum gleichen Namen führen (wenn es etwa zwei Kunden mit
demselben Namen Peter Müller gibt). Interpretiert man das als eine Relation von der Menge
der Namen in die Menge der Schlüssel , so hat man eine linkseindeutige Relation. Im Urbildbereich kann es Namen geben, die keiner Kundennummer zugeordnet sind (wenn nämlich
die Person noch nicht als Kunde erfaßt ist), und im Bildbereich kommen evtl. Nummern vor,
die bevorratet sind und noch zu keiner Person gehören. Insgesamt steht aber jeder Schlüssel
eindeutig für einen Namen.
Die am Anfang des Kapitels betrachtete ’Ehe - Relation’ ist eine partielle Funktion und eine
linkseindeutige Relation, aber keine totale Funktion. Das liegt daran, daß hierzulande jede
Person höchstens einen Ehepartner haben darf. Man kann also bei jeder verheirateten Person
eindeutig die Frage beantworten, welcher Ehepartner ’zugeordnet’ ist.
In der Programm-Semantik ist oft die Frage wesentlich, ob eine partielle Funktion auch total
ist. Beispielsweise wird in dem folgenden kleinen Programm eine Funktion f definiert, die
einer (geraden) natürlichen Zahl wieder eine natürliche Zahl zuordnet:
f (x : Card) : Card ::= if (x = 0){return 0}else{return f (x mod 2)} .
f nimmt also für x = 0 oder eine gerade natürliche Zahl x > 0 immer den Wert 0 an. Ein
Aufruf von f für ungerade Zahlen x terminiert nicht. Daher ist
f = { (2x, 0) | x ∈ N } .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
32
Da die ungeraden natürlichen Zahlen im Urbildbereich von f nicht abgebildet werden, ist f
zwar eine partielle, aber keine totale Funktion.
Es werden im folgenden noch weitere Beispiele für die in der Definition 2.4 eingeführten
Begriffe diskutiert.
Beispiel 2.6
1.) Die Teilerrelation δN aus Beispiel 2.4 ist weder eine Funktion noch eine linkseindeutige
Relation, denn jede Zahl m ist Teiler vieler Zahlen m, 2m, 3m, . . . (daher ist δN keine partielle
Funktion), und eine Zahl hat im allgemeinen mehr als einen Teiler (daher ist δN keine
linkseindeutige Relation). So hat etwa 60 die Teiler 1,2,3,4,5,6,10,12,15,20,30,60.
2.) Es sei A = B = { 1, 2, 3 }, und
(a)
(b)
(c)
R1 = { (1, 2), (2, 3), (3, 1) }
R2 = { (1, 1), (2, 1) }
R3 = ∅
R1 ist eine totale Funktion und eine linkseindeutige Relation. R2 ist eine partielle Funktion.
Sie ist nicht total, da 3 nicht abgebildet wird und keine linkseindeutige Relation, da 1 zwei
Urbilder hat, nämlich 1 und 2. R3 nennt man auch eine leere Relation. Sie ist in diesem Beispiel eine partielle Funktion und eine linkseindeutige Relation. Wäre auch die Urbildmenge
A leer, so wäre R3 sogar eine totale Funktion.
3.) Es sei A = B = R die Menge der reellen Zahlen, und
(a)
(b)
(c)
R1 = { (x, y) | y = x2 }
⊆ A×B
2
R2 = { (x, y) | x = √
y }
⊆ A×B
R3 = { (x, y) | y = x + 1 } ⊆ A × B
R1 ist eine totale Funktion von R nach R, allerdings keine linkseindeutige
√
√ Relation, denn
jede positive Zahl x hat die beiden (verschiedenen) Urbilder x und − x. R2 ist keine
partielle Funktion (und damit insbesondere auch keine totale Funktion),
√ positive
√ denn jedes
x steht mit zwei (verschiedenen) Elementen in Relation, nämlich mit x und − x. R2 ist
jedoch eine linkseindeutige Relation, und es gilt R2−1 = R1 . Es bleibt R3 zu untersuchen: R3
ist eine partielle Funktion mit dem Definitionsbereich Dom (R3 ) = { x ∈ R | x ≥ −1 }. Da
reelle Zahlen x < −1 nicht abgebildet werden, ist R3 keine totale Funktion. Sie ist zudem
eine linkseindeutige Relation, denn kein Element des Bildbereichs hat zwei Urbilder. Hierbei
beachte man, daß der Graph der positiv genommenen Wurzelfunktion streng monoton wächst,
und daß die negative Wurzel ausgeschlossen ist!
Da die (totalen) Funktionen so wichtig sind, werden sie in einem eigenen Abschnitt gesondert
behandelt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
33
2.2 Funktionen.
Funktionen wurden bereits im vorigen Abschnitt 2.1 definiert. Künftig werden Funktionen
generell mit den Buchstaben f, g, h, . . . bezeichnet. Schränkt man den Urbildbereich A einer
partiellen Funktion auf ihren Definitionsbereich Dom (f ) ein, so wird jedem Element a ∈
Dom (f ) gemäß Definition 2.2 genau ein Element b ∈ B zugeordnet. Dafür schreibt man
auch
f (a) = b .
Anstelle der bisher verwendeten Schreibweise f ⊆ A × B ist auch die Symbolik
f : A
B
für eine partielle Funktion f
und
f : A→B
für eine totale Funktion f
gebräuchlich. In einigen Fällen ist es sinnvoll, eine Notation für die Menge aller Funktionen
von A nach B zu verwenden. Dafür hat man die folgende Schreibweise. Mit A
B wird die
Menge aller partiellen Funktionen von A nach B bezeichnet, während A → B für die Menge
aller totalen Funktionen von A nach B steht. Offensichtlich gilt
(A → B) ⊆ (A
B) .
Einige spezielle Funktionen sind:
• id : A → A
• c : A→B
• ∅ : A→B
∀ x ∈ A : id(x) = x
mit
mit
∀ x ∈ A : c(x) = c
(Identitätsabbildung)
(Konstante Funktion)
(Leere Funktion)
Totale Funktionen sind aufgrund ihrer Definition dadurch ausgezeichnet, daß jedem Urbild
genau ein Bild zugeordnet wird. Es gibt nun noch weitere Eigenschaften, die einige Funktionen vor anderen auszeichnen.
Definition 2.5 (Injektive, surjektive und bijektive Funktionen)
1.) Eine Funktion f : A
B heißt injektiv (oder eineindeutig oder eine Injektion), falls
gilt:
∀ a1 , a2 ∈ Dom (f ) : (f (a1 ) = f (a2 ) =⇒ a1 = a2 ) .
2.) Eine Funktion f : A
falls gilt:
B heißt surjektiv (oder Funktion auf B oder eine Surjektion),
∀ b ∈ B ∃ a ∈ Dom (f ) : f (a) = b .
3.) Eine Funktion f : A
surjektiv ist.
B heißt bijektiv (oder eine Bijektion), falls sie injektiv und
Eine Injektion ist also eine partielle Funktion, die zusätzlich auch eine linkseindeutige Relation darstellt. Eine Surjektion wiederum ist eine partielle Funktion auf B, d.h. jedes Element
aus B wird durch Abbilden unter der Funktion erreicht. Man spricht auch von einer rechtstotalen Abbildung. Zur Veranschaulichung dienen die folgenden Beispiele.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
34
Beispiel 2.7
√
1.) Die partielle Funktion f (x) = x + 1 aus Beispiel 2.6 ist eine injektive partielle Funktion. Als (totale) Funktion von ihrem Definitionsbereich { x ∈ R | x ≥ −1 } in ihren Wertebereich { y ∈ R | y ≥ 0 } ist sie sowohl injektiv als auch surjektiv, also insgesamt eine bijektive
Funktion.
2.) Es sei f : R → R definiert durch
x für
x≥0
f (x) = |x| :=
−x für
x<0
f nennt man die Betragsfunktion. f ist weder injektiv noch surjektiv, denn alle positiven
Zahlen y aus dem Bildbereich von f haben zwei Urbilder (nämlich x = y und x = −y),
und nicht alle Elemente des Bildbereichs werden auch ’erreicht’: die negativen Zahlen haben
keine Urbilder.
In Definition 2.3 wurde das Konzept der Umkehrrelation eingeführt. Es soll jetzt untersucht
werden, inwieweit sich das Prinzip der Umkehrung auf Funktionen übertragen läßt. Da jede
Funktion f insbesondere auch eine Relation ist, existiert auch immer die Umkehrrelation
f −1 . Der folgende Satz beantwortet die Frage, wann die Umkehrrelation sogar wieder eine
Funktion ist.
Satz 2.2 (Charakterisierung der Existenz einer Umkehrfunktion)
Es sei f eine Funktion von A nach B. Die Umkehrrelation f −1 ist genau dann wieder eine
partielle Funktion, wenn f injektiv ist.
Beweis:
Wir erhalten nacheinander:
f −1 ist eine partielle Funktion
⇐⇒
⇐⇒
⇐⇒
∀ a1 ∈ A , a2 ∈ A , b ∈ B : (b, a1 ) ∈ f −1 ∧ (b, a2 ) ∈ f −1 =⇒ a1 = a2
∀ a1 ∈ A , a2 ∈ A , b ∈ B : (a1 , b) ∈ f ∧ (a2 , b) ∈ f =⇒ a1 = a2
∀ a1 ∈ A , a2 ∈ A , b ∈ B : f (a1 ) = b ∧ f (a2 ) = b =⇒ a1 = a2
f ist eine injektive Funktion
Hierbei wurde Definition 2.4 (1.), Definition 2.3 und Definition 2.5 (1.) angewendet.
−1
Ist eine partielle Funktion f : A
B injektiv, so nennt man die Funktion f auch die
Umkehrfunktion von f . Man beachte, daß die Schreibweise f −1 nicht mit der Kurzschreibweise x−1 = x1 bei reellen Zahlen x verwechselt werden darf. Die nun folgenden Untersuchungen
zeigen aber, daß dennoch eine gewisse Ähnlichkeit diese Notation für eine Umkehrfunktion
rechtfertigt. Ist nämlich (in der Relationenschreibweise) (a, b) ∈ f bei einer injektiven Funktion f , so gilt auch (b, a) ∈ f −1 . Wird nun b als f (a) und a als f −1 (b) geschrieben, so kann
man die Eigenschaften einer Umkehrfunktion folgendermaßen zusammenfassen:
Satz 2.3 Ist f eine injektive Funktion, so gilt:
∀ a ∈ Dom (f ) : f −1 (f (a)) = a ,
∀ b ∈ Ran (f ) : f (f −1 (b)) = b .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
35
Die erste Identität in diesem Satz ergibt sich beispielsweise unmittelbar aus f −1 (f (a)) =
f −1 (b) = a. Das ’Hintereinanderausführen’ einer Funktion und ihrer Umkehrfunktion ergibt
somit jeweils die Identitätsfunktion, eingeschränkt auf die jeweiligen Definitionsbereiche. In
den folgenden Beispielen wird bei einigen Funktionen untersucht, ob eine Umkehrfunktion
existiert und wenn ja, wie diese aussieht.
Beispiel 2.8
1.) Die Funktion
f : Z→N,
f (z) :=
2z − 1
−2z
für
für
z>0
z≤0
ist bijektiv. Nach Satz 2.2 existiert zu f eine Umkehrfunktion f −1 : N → Z. Diese Umkehrfunktion ist durch
−n/2
falls n gerade
−1
f (n) =
(n + 1)/2 falls n ungerade
gegeben.
√
2.) Es sei f : R → R definiert durch f (x) := x + 1. In Beispiel 2.6 wurde bereits die
Injektivität von f erwähnt. Die Umkehrfunktion f −1 : { y|y ≥ 0 } → { x|x ≥ −1 } berechnet
man formal durch Auflösen nach x. Es ergibt sich dann f −1 (y) = y 2 − 1. Umkehrfunktionen
werden nun aber meist wieder als Funktionen mit der unabhängigen Variable x und der
abhängigen Variable y notiert. Dafür muß man nach Berechnung einer Umkehrfunktion noch
die Bezeichnungen von x und y vertauschen. In diesem Sinne ergibt sich hier f −1 (x) = x2 −1
für x ≥ 0.
3.) Bei der Cäsarchiffre werden die Buchstaben eines Alphabets auf den jeweiligen um k
Positionen im Alphabet folgenden Buchstaben abgebildet. Gelangt man bei der Verschiebung
über das Ende des Alphabets hinaus, so beginnt man die Zählung einfach wieder mit dem
ersten Buchstaben des Alphabets. Legt man im deutschen Alphabet die Zählung bei 0 für A,
1 für B usw. bis 25 für Z fest, so kann für k eine beliebige natürliche Zahl mit 1 ≤ k ≤ 25
gewählt werden. Steht n ∈ {0, 1, 2, . . . , 25} für einen Buchstaben des Alphabets, so wird dieser
Buchstabe mit der Abbildung
fk : { 0, 1, 2, . . . , 25 } → { 0, 1, 2, . . . , 25 } ,
fk (n) := n + k
mod 26
chiffriert. Der Modulo 26 Operator wirkt dabei in der folgenden Weise auf eine ganze Zahl
x:
x
.
x mod 26 := min{a : a ∈ N ∧ 26|(x − a)} = x − 26floor
26
So wird mit k = 4 das Wort ’GEIZ’ zu ’KIMD’ chiffriert. Eine Abbildung, die einen Text
chiffriert, muß umkehrbar sein; anderenfalls kann der Empfänger der Nachricht nicht mehr
auf den Klartext schließen. Die Umkehrabbildung zur bijektiven Cäsarchiffre fk lautet:
fk−1 : { 0, 1, 2, . . . , 25 } → { 0, 1, 2, . . . , 25 } ,
fk (m) := m − k
mod 26 .
4.) Es sei f : {1, 2, 3} → {1, 2} eine beliebige (totale) Funktion. Eine solche Funktion kann
nicht injektiv sein, denn jedes Element aus {1, 2, 3} wird auf irgendeine Zahl aus {1, 2}
abgebildet. Daher hat ein Bild zwei Urbilder, und eine Injektivität ist damit unmöglich.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
36
Wie oben dargelegt ergibt das Hintereinanderausführen einer Funktion f und ihrer Umkehrfunktion f −1 die Identitätsfunktion. Dieses Hintereinanderausführen oder ’Komponieren’ von
Funktionen ist generell eine wichtige Operation. Daher wird sie formalisiert:
Definition 2.6 (Verkettung von Funktionen)
Es seien f : A
B und g : B
C Funktionen. Dann heißt die Funktion
h:A
C :
h(a) = g(f (a))
die Komposition oder Verkettung der Funktionen f und g. Anstelle der Schreibweise mit dem
Funktionssymbol h ist auch die Notation
(g ◦ f )(a) = g(f (a))
gebräuchlich. Die Sprechweise für die Komposition ist ’g verkettet mit f ’ oder ’g nach f ’.
Offensichtlich gilt:
Dom (g ◦ f ) = {a | a ∈ Dom (f ) ∧ f (a) ∈ Dom (g)} ⊆ Dom f .
Im Spezialfall einer Verkettung einer Funktion f : A
A mit sich selbst schreibt man:
f 0 = id ,
f n = f ◦ f n−1
(n ≥ 1) .
Wie sich die Abbildungseigenschaften Injektivität, Surjektivität, Bijektivität von Funktionen
auf die verketteten Funktionen übertragen, zeigt der folgende Satz.
Satz 2.4 (Eigenschaften verketteter Funktionen)
Es seien f : A
B und g : B
C partielle Funktionen. Dann gilt:
1.) Sind f und g injektiv, so ist auch g ◦ f injektiv.
2.) Sind f und g sogar totale Funktionen und surjektiv, so ist auch g ◦ f eine totale
Funktion und surjektiv.
3.) Sind f und g sogar totale Funktionen und bijektiv, so ist auch g ◦f eine totale Funktion
und bijektiv.
4.) Ist g ◦ f eine bijektive Funktion, so ist g surjektiv und f injektiv.
5.) Sind idA : A → A und idB : B → B die Identitätsabbildungen, so gilt
f ◦ idA = f = idB ◦ f .
6.)
Ist f injektiv, so gilt
f ◦ f −1 = idRan(f )
und
f −1 ◦ f = idDom(f ) .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
37
Der Beweis der einzelnen Aussagen dieses Satzes besteht lediglich im Anwenden der Definitionen sowie einiger obenstehender Ergebnisse. Wir zeigen exemplarisch nur 1.) und 6.). Für
1.) setzt man nur die Injektivität der Funktionen f und g voraus und findet:
g(f (x1 )) = g(f (x2 ))
=⇒
f (x1 ) = f (x2 )
=⇒
x 1 = x2
(x1 , x2 ∈ A) .
In 6.) garantiert die Injektivität von f die Existenz von f −1 . Es bleibt zu zeigen, daß die
jeweiligen Definitionsbereiche der Identitätsabbildungen korrekt angegeben sind. Im Falle f ◦
f −1 besteht wegen f ◦f −1 (x) = f (f −1 (x)) der Definitionsbereich der verketteten Funktion aus
dem Wertebereich von f , da die Abbildung f −1 zuerst ausgeführt wird. Das Zwischenergebnis
z = f −1 (x) liegt im Definitionsbereich von f ; daher kann anschließend die Abbildung f (z)
ausgeführt werden. Im Falle f −1 ◦ f (x) = f −1 (f (x)) ist es umgekehrt: die Funktion f wird
zuerst ausgeführt. Daher besteht der Definitionsbereich der verketteten Funktion auch genau
aus dem Definitionsbereich von f .
Eine unmittelbare Folgerung aus Punkt 4 in Satz 2.4 ist das folgende Resultat.
Korollar 2.1 Es seien f : A → B und g : B → A Funktionen mit f ◦ g = idB und
g ◦ f = idA . Dann sind f und g beide bijektiv, g ist die Umkehrfunktion zu f und f die
Umkehrfunktion zu g.
Wir greifen noch einmal das dritte Beispiel aus Beispiel 2.8 auf und verallgemeinern es:
Beispiel 2.9 Es sei A ein Alphabet. Man stelle sich etwa alle Zeichen auf der Tastatur eines
Computers zu einer Menge zusammengefaßt vor:
A = { a, b, c, . . . , z, A, B, . . . , Z, 0, 1, . . . , 9, +, −, ?, . . . , } .
Die Menge aller Worte, die man über diesem Alphabet bilden kann, bezeichnet man mit A∗ .
Es ist also
A∗ := { x1 x2 . . . xn | xj ∈ A (j = 1, . . . , n) ∧ n ≥ 0 } .
Nun sei K ⊆ A∗ die Menge aller Klartexte, die ein Sender von Nachrichten über einen Kanal
schicken kann. Damit die Übertragung sicher ist, werden alle zu übermittelnden Texte t ∈ K
mit einer Funktion
encrypt : K → C
verschlüsselt. Dabei bezeichnet C die Menge aller resultierenden Chiffretexte. Damit ein legitimierter Empfänger dieser Botschaften die Nachrichten wieder entschlüsseln kann, braucht
er eine Funktion
decrypt : C → K ,
für die gilt
(decrypt ◦ encrypt)(t) = t .
Wegen der in Satz 2.4 aufgeführten Eigenschaften von verketteten Funktionen ist dies möglich,
falls
decrypt = encrypt −1
gilt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
38
2.3 Spezielle Funktionen in der Informatik.
In der Informatik interessiert man sich für spezielle Funktionen. So werden wir in diesem
Abschnitt unter anderem eine formale Definition der Menge aller Worte über einem Alphabet kennenlernen. Dies geschieht mit dem Begriff der Folge. Weiterhin sind in der Informatik
Funktionen interessant, deren Bildbereich aus nur zwei Elementen besteht. Diesen Bildbereich kann man dann als Menge der zwei Wahrheitswerte ’wahr’ und ’falsch’ interpretieren.
Ein Beispiel hierfür ist etwa die Funktion
contains : A∗ × A∗ → { ’wahr’, ’falsch’ } ,
die folgendermaßen definiert ist: contains(t, s) liefert genau dann ’wahr’, wenn die Zeichenkette t in der Zeichenkette s vorkommt. Hierbei bezeichnet A∗ die Menge aller Worte über
dem Alphabet A. Für das Alphabet A aus Beispiel 2.9 ist so etwa
contains(IGEL, SIEGEL) = ’wahr’ ,
contains(IGEL, VOGEL) = ’falsch’ .
Solche Funktionen, deren Bildbereich die Menge der beiden Wahrheitswerte ist, werden auch
Prädikate genannt. Anstelle von ’falsch’ bzw. ’wahr’ schreibt man manchmal auch 0 bzw. 1;
dann ist {0, 1} die Menge der Wahrheitswerte.
Mit I werde nun eine sog. Indexmenge bezeichnet. Hierunter versteht man eine Menge,
mit der man Elemente einer anderen Menge D in gewisser Weise nummerieren kann. Diese
Nummerierung wird dann durch eine Abbildung s von der Indexmenge I in die Menge D
vermittelt, deren Elemente man mittels I abzählen will:
s : I→D.
Im einfachsten Fall besteht I aus den ersten natürlichen Zahlen, etwa I = {0, 1, 2, . . . , n},
oder es ist I = N. Ist D die Menge der geraden natürlichen Zahlen,
D := { 0, 2, 4, 6, 8, . . . } ,
so wählt man I = N und zählt die geraden Zahlen in D mit der Abbildung s(i) = 2 · i ab,
wobei i dann alle Elemente aus den natürlichen Zahlen durchläuft. Statt s(i) ist auch die
Schreibweise si gebräuchlich, wobei i dann der Index des Elementes si genannt wird. Ein und
dasselbe Element aus D kann unter einer Abzählung s unterschiedliche Indices haben, denn
s muß nicht zwingend injektiv sein. In einem solchen Fall wird ein Element aus D mehrfach
gezählt. Wie bereits oben bei der Abzählung aller geraden natürlichen Zahlen mittels si = 2·i
angedeutet wird der Wertebereich {si |i ∈ I} der Abbildung s im allgemeinen durch einen
formalen Term angegeben. So werden alle geraden bzw. alle durch 7 teilbaren natürlichen
Zahlen durch
{ 2i | i ∈ N } bzw. { 7i | i ∈ N }
nummeriert und aufgezählt. In diesem Sinne ist 0 die erste der durch 7 teilbaren Zahlen, 7
die zweite, 14 die dritte usw.1
Ein wichtiger Spezialfall ist die endliche Indexmenge I = {0, 1, 2, . . . , n − 1} für eine natürliche Zahl n ≥ 0.
1
Es sei daran erinnert, daß N = { 0, 1, 2, 3, . . . } die Null enthält.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
39
Definition 2.7 (Endliche Folgen)
Für ein n ≥ 0 versteht man unter einer endlichen Folge von Elementen einer Menge D eine
Abbildung
s : { 0, 1, 2, . . . , n − 1 } −→ D .
In diesem Fall heißt n die Länge von s. Sie wird mit |s| bezeichnet. Die Elemente aus dem
Wertebereich Ran (s) = {s0 , s1 , . . . , sn−1 } der endlichen Folge nennt man die Einträge von
s.
Man beachte, daß in dieser Definition n = 0 gewählt werden darf. Es kann also auch der Fall
einer leeren Indexmenge I eintreten, was in der Praxis nicht selten geschieht. Dann nennt
man s die leere Folge. Eine Kurzschreibweise für eine Folge s der Länge n ist
s = (s0 , s1 , s2 , . . . , sn−1 ) .
Beispiel 2.10
1.) Die monatlichen Umsätze eines Unternehmens innerhalb eines halben Jahres stellen eine
Folge der Länge 6 von reellen Zahlen dar, etwa
s = (1200.00 , 1311.50 , 1550.60 , 342.00 , 0.00 , 1200.00) .
2.) Das Wort ’Mathematik’ ist eine Folge der Länge 10 über dem Alphabet A:
s = (M, a, t, h, e, m, a, t, i, k) .
Selbstverständlich können Elemente auch mehrfach in einer Folge vorkommen: etwa die Zahl
1200.00 im ersten Beispiel und der Buchstabe a im zweiten.
Definition 2.8 (Unendliche Folgen)
Eine unendliche Folge von Elementen aus D ist eine Abbildung s : N → D. Die Elemente
aus dem Wertebereich Ran (s) = {si |i ∈ N} der unendlichen Folge nennt man die Einträge
von s.
Eine unendliche Folge s notiert man auch mit
s = (s0 , s1 , s2 , . . . ) .
Eine unendliche Folge ist z.B. die Folge (2, 3, 5, 7, 11, 13, 17, . . . ) aller Primzahlen (wobei die
Unendlichkeit dieser Folge schon in der Antike eingesehen wurde). Ein anderes Beispiel ist
die unendliche Folge aller Nachkommastellen der rationalen Zahl 71 :
(1, 4, 2, 8, 5, 7, 1, 4, 2, 8, 5, 7, 1, 4, 2, 8, 5, 7, . . . ) .
In diesem Fall kommt jede der Zahlen 1,2,4,5,7,8 unendlich oft in der Folge vor. Die Menge
{1, 2, 4, 5, 7, 8} aller bei den Nachkommastellen vorkommenden Ziffern ist also endlich; die
mit ihnen gebildete Folge ist unendlich!
Wir benötigen noch einige weitere Schreibweisen. Mit Dn wird die Menge aller Folgen der
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
40
Länge n über der Menge D bezeichnet. So ist in Beispiel 2.10: s ∈ R6 (Punkt 1.) und s ∈ A10
(Punkt 2.). Außerdem steht für spätere Anwendungen
[
[
D∗ :=
{ Dj | j ∈ N } =
Dn
(2.1)
n≥0
für alle endlichen Folgen mit Elementen aus D, und
[
[
D+ :=
{ Dj | j ∈ N ∧ j ≥ 1 } =
Dn
(2.2)
n≥1
bezeichnet alle endlichen und nichtleeren Folgen mit Elementen aus D.
In der Mathematik kommt es oft vor, daß man zwei Mengen miteinander identifiziert, wenn
es zwischen ihnen eine Bijektion gibt. Diese (quasi) Gleichsetzung beruht auf folgendem Satz:
Satz 2.5 Wenn es eine Bijektion zwischen zwei Mengen gibt, so sind die Mengen bis auf
Umbenennung ihrer Elemente gleich.
Mit diesem Satz kann man beispielsweise die Isomorphie zwischen den
Mengen D2 und D×D
zeigen; eine Bijektion φ : D2 → D × D ist durch φ(s) = s(0), s(1) gegeben, wobei wir oben
die Kurzschreibweise s0 für s(0) und entsprechend s1 für s(1) eingeführt haben.
Ist X eine endliche Menge und bezeichnet |X| die Anzahl der Elemente in X, so hat man
aufgrund von Satz 2.5 auch die wichtige Beziehung
|X n | = | |X × ·{z
· · × X} | = |X|n
(2.3)
=n
für jede natürliche Zahl n.
Für ein anderes Beispiel zu Satz 2.5 betrachten wir die drei Mengen
N =
0, 1, 2, 3 . . . , n, n + 1, . . . ,
G =
0, 2, 4, 6, . . . , 2n, 2n + 2, . . . ,
U =
1, 3, 5, 7 . . . , 2n + 1, 2n + 3, . . . .
Zwischen je zwei von ihnen gibt es eine Bijektion, nämlich
φ1 : N → G ,
φ2 : N → U ,
φ3 : G → U ,
φ1 (n) = 2n ,
φ2 (n) = 2n + 1 ,
φ3 (g) = g + 1 .
Das Zusammensetzen zweier endlicher Folgen zu einer neuen Folge ist eine wichtige Operation in der Informatik.
Definition 2.9 (Die Konkatenation)
Es seien s1 und s2 endliche Folgen der Länge n bzw. m. Unter der Konkatenation der Folgen
s1 und s2 versteht man die Folge z der Länge n + m, die durch
s1 (i)
für 0 ≤ i ≤ n − 1
z(i) :=
s2 (i − n)
für n ≤ i ≤ n + m − 1
definiert ist. Die Konkatenation von s1 und s2 wird mit concat(s1 , s2 ) oder nur mit s1 s2
bezeichnet.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
41
Die Konkatenation kommt bei der Bearbeitung von Zeichenketten in Computern vor. Auf der
Menge A∗ der Wörter über einem Alphabet A etwa ergibt die Funktion concat : A∗ × A∗ →
A∗ :
concat((H, a, l, l, o), (E, r, d, e)) = (H, a, l, l, o, E, r, d, e) .
Die grundsätzlichen Eigenschaften der Konkatenation sind im folgenden Satz festgehalten,
dessen Beweis aus einfachen Anwendungen der Definition 2.9 besteht.
Satz 2.6 (Eigenschaften der Konkatenation)
Es seien u, v und w endliche Folgen. Insbesondere bezeichne ε die leere Folge. Dann gilt:
1.)
2.)
3.)
4.)
u(vw) = (uv)w
uv = uw =⇒ v = w
vu = wu =⇒ v = w
εu = u = uε
(Assoziativität der Konkatenation)
(Links-Reduktion)
(Rechts-Reduktion)
(Neutrales Element)
Man beachte, daß die Konkatenation nicht kommutativ ist!
Es ist intuitiv klar, was eine endliche Menge ist; oben wurde dieser Begriff auch bereits
benutzt. Das Konzept der Folge ermöglicht nun aber eine präzise Definition einer endlichen
Menge.
Definition 2.10 (Endliche, unendliche und gleichmächtige Mengen)
Eine Menge A heißt endlich, wenn es eine natürliche Zahl n sowie eine Bijektion f :
{0, 1, 2, . . . , n − 1} → A gibt. Alle anderen Mengen nennt man unendlich. Zwei Mengen
A und B heißen gleichmächtig, wenn es eine Bijektion f : A → B gibt.
Gibt es also eine Bijektion von {0, 1, 2, . . . , n−1} nach A, so hat A offensichtlich n Elemente.
Diesen Sachverhalt drückt man durch |A| = n aus. Zwischen zwei endlichen Mengen A und
B existiert genau dann eine Bijektion, wenn |A| = |B| ist.
In der Informatik spielt der Datentyp der Zeichenkette eine herausragende Rolle. Neben
der Verarbeitung von Zeichenketten in Programmen sind Programmtexte selber auch Zeichenketten, die nach bestimmten Regeln (nämlich in der Syntax der Programmiersprache)
aufgebaut sind. Schließlich bestehen letztlich alle Speicherinhalte in Computern aus Zeichenketten über dem Alphabet {0, 1}. Daher benötigt man mathematische Formalisierungen für
die Notation von Symbolfolgen. Hier kann man das Konzept der Folgen nutzbringend anwenden.
Es bezeichne im folgenden A irgendein Alphabet, also eine nichtleere Menge von Symbolen.
A könnte beispielsweise aus allen Zeichen auf der Tastatur eines Computers bestehen, aber
ebenso könnten in A auch nur alle griechischen Buchstaben {α, β, γ, . . . } vorkommen.
Definition 2.11 (Wörter)
Ein Wort der Länge n über einem Alphabet A ist eine Folge der Länge n über A.
Unter Verwendung der für (2.1) eingeführten Schreibweise (mit A anstelle von D) besteht
dann die Menge An aus allen Worten der Länge n. Vereinigt man alle Mengen An zur Menge
A∗ ,
[
A∗ :=
An ,
n≥0
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
42
so kommen in dieser Menge A∗ alle möglichen (endlichen) Worte über dem Alphabet A
vor (siehe auch Beispiel 2.9). Ist w ein Wort der Länge n über A, so schreibt man statt
w = (w0 , w1 , . . . , wn−1 ) auch kürzer
w = w0 w1 . . . wn−1 .
So wird die Folge w, die aus den Buchstaben ’M’, ’a’, ’t’, ’h’, ’e’, ’m’, ’a’, ’t’, ’i’, ’k’ aus A
besteht, zum Wort ’Mathematik’ aus A∗ . Wendet man nun die Konkatenation auf die drei
Worte ’Mathematik’, ’ ist’, ’ wichtig’ aus A∗ an, so ergibt sich die Zeichenkette ’Mathematik
ist wichtig’ (ebenfalls aus A∗ ). Man beachte, daß das Leerzeichen ein legitimes Symbol ist.
Alle bekannten Begriffe bei der Zusammensetzung von Worten können nun formalisiert werden.
Definition 2.12 (Präfix, Suffix, Infix)
1.) Ein Wort p heißt Präfix eines Wortes w, wenn w = px für ein Wort x ∈ A∗ gilt.
2.) Ein Wort s heißt Suffix eines Wortes w, wenn w = xs für ein Wort x ∈ A∗ gilt.
3.) Ein Wort t heißt Infix eines Wortes w, wenn w = xty für zwei Worte x, y ∈ A∗ gilt.
Ein Infix wird auch als Teilwort (engl. substring) bezeichnet.
’Haus’
ist Präfix des Wortes ’Haustür’
’schloss’ ist Suffix des Wortes ’Türschloss’
’tür’
ist Infix des Wortes
’Haustürschloss’
Eine andere wichtige Definition ist
Definition 2.13 (Sprache)
Es sei A ein Alphabet. Jede Teilmenge von A∗ heißt eine Sprache über A.
So ist also {a, b, abba} ⊂ A∗ eine endliche Sprache über dem Alphabet A = {a, b}. Hingegen
ist L := {a, aa, aaa, aaaa, . . . } eine unendliche Sprache über dem Alphabet A = {a}.
2.4 Äquivalenzrelationen.
In diesem Abschnitt wird ein mathematisches Konzept vorgestellt, das nur auf dem Begriff
der Relation basiert. Allerdings kommt es auch im Zusammenhang mit Funktionen zum Einsatz. Die Problematik soll zunächst das folgende Beispiel verdeutlichen:
In Computern werden Zahlen vom Typ FLOAT oder DOUBLE verwaltet. Mathematisch
gesehen handelt es sich darum, rationale Zahlen zu verwalten. Rechnerintern ergibt sich also
das Problem des Umgangs mit solchen rationalen Zahlen. Also fragen wir nach den Bestandteilen dieser Objekte: Geht man von den oben genannten technischen Datentypen aus, so
bestehen die rationalen Zahlen aus einem ganzzahligen Anteil und den Nachkommastellen
(3,1415 = 3 + 0,1415). Man kann diese Zahlen aber auch anders darstellen, etwa durch eine
Mantisse und einen Exponenten:
3, 1415 = exp(1 + ln(3, 1415) − 1) = exp(1 + 0, 144700) .
Eine dritte Möglichkeit besteht darin, rationale Zahlen als Paare der Menge Z×Z anzusehen.
Ein Paar (a, b) stellt dabei den Bruch ab dar. Also repräsentiert die erste Komponente in (a, b)
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
43
den Zähler, die zweite Komponente den Nenner der rationalen Zahl. Diese dritte Möglichkeit
der Darstellung als Paar (a, b) soll jetzt genauer untersucht werden.
Die Programmbibliothek zur Verwaltung der rationalen Zahlen muß wissen, wie man in dieser
Darstellung zwei solche Zahlen addiert, subtrahiert, multipliziert, usw. Die Regeln hierfür
sind ziemlich einfach:
(a, b) + (c, d) =
(a, b) − (c, d) =
(a, b) · (c, d) =
(a, b) : (c, d) =
(ad + bc, bd)
(ad − bc, bd)
(ac, bd)
(ad, bc)
(Addition)
(Subtraktion)
(Multiplikation)
(Division)
Statt des geordneten Paares (a, b) wird im folgenden auch wieder die bekannte Schreibweise
a
verwendet. Nach den eben festgelegten Rechenvorschriften ergibt sich nun zum Beispiel
b
1 1
6
−3 2
−6
+ =
und
·
=
.
2 4
8
4 −3
−12
Diese Darstellung der Rechenergebnisse ist etwas unbefriedigend, denn man hätte die Resultate doch lieber in der gekürzten Form (also 34 bzw. 12 ) ausgegeben. Es ist also die Festlegung
einer weiteren Operation erforderlich, die die Resultate in der gekürzten Form auswirft. Nun
kann man einen Bruch (a, b) kürzen, indem man Zähler und Nenner durch den größten gemeinsamen Teiler (’ggT’) von a und b teilt. Dabei gehen wir von folgender Konvention aus:
1.) Es ist
−ggT (|a|, |b|) , falls a < 0 ∧ b < 0
ggT (a, b) =
ggT (|a|, |b|) , sonst
Der ggT von a und b wird also genau dann als eine negative Zahl ausgegeben, wenn sowohl
a als auch b negativ sind.
2.) Der Nenner einer ausgegebenen Zahl ist stets größer als Null.
Sei Z∗ := Z\{0}. Es werden nun zwei Funktionen f : Z×Z∗ → Z×Z∗ und e : Z×Z∗ → Z×Z∗
definiert:
a
b
,
f (a, b) :=
,
ggT (a, b) ggT (a, b)
und
(−a, −b) , falls a ≥ 0 ∧ b < 0
e(a, b) :=
(a, b) ,
sonst
Indem man nun alle vier möglichen Vorzeichenverteilungen bei einem eingegebenen Bruch
(±a, ±b) durchprobiert und die Konventionen von 1. und 2. berücksichtigt, sieht man ein,
daß die Funktion k := e ◦ f das Gewünschte leistet: jeder Bruch wird gekürzt und mit
positivem Nenner ausgegeben. Hierbei ist
Ran (k) = Menge der gekürzten Brüche mit positivem Nenner .
Der Bruch (−1, 2) gehört offensichtlich der Menge Ran (k) an. Wie sehen nun alle Tupel
(a, b) ∈ Z2 aus, die mittels k auf das Tupel (−1, 2) abgebildet werden, für die also k(a, b) =
(−1, 2) gilt? Man findet leicht:
{ (a, b) | k(a, b) = (−1, 2) }
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
44
= { (−1, 2), (−2, 4), (−3, 6), . . . , (1, −2), (2, −4), (3, −6), . . . } .
(2.4)
Hierbei wurde also formal die Menge in (2.4) mit dem Bruch −1
identifiziert, denn alle
2
dar. Die Elemente in
Elemente dieser Menge stellen letztlich die gleiche rationale Zahl −1
2
der aufgeführten Menge sind also in gewisser Weise aneinander gekoppelt, bzw. sie stehen in
einer Relation zueinander. Diese Relation wird SARA genannt (für: SAme RAtional). Zwei
Brüche (a, b) und (c, d) stehen genau dann in Relation zueinander, wenn ihre Bilder unter
der Abbildung k übereinstimmen:
(a, b) SARA (c, d)
⇐⇒
k(a, b) = k(c, d) .
Dieses Beispiel der Identifikation wertgleicher Brüche soll nun verallgemeinert werden. Hierzu
benötigt man zunächst zwei neue Begriffe:
Definition 2.14 (Kern einer Abbildung)
Es sei f : A → B eine Funktion. Dann heißt die Relation, definiert durch
ker (f ) = {(a, b) ∈ A × A | f (a) = f (b)}
der Kern von f . Insbesondere ist ker (f ) ⊆ A × A.
Der Kern der Abbildung f besteht also aus genau den Paaren von Elementen des Urbildraumes A, die von f auf dasselbe Element im Wertebereich abgebildet werden.
Definition 2.15 (Äquivalenzrelationen)
Eine Relation R auf einer Menge A heißt eine Äquivalenzrelation, falls die folgenden Eigenschaften erfüllt sind:
(a, a) ∈ R
(a, b) ∈ R =⇒ (b, a) ∈ R
(a, b) ∈ R ∧ (b, c) ∈ R =⇒ (a, c) ∈ R
(Reflexivität)
(Symmetrie)
(Transitivität)
Offensichtlich ist für eine Funktion f die Relation ker (f ) eine Äquivalenzrelation. Weil f eine
Funktion ist, wird jedes Element a ∈ A unter f abgebildet und es gilt f (a) = f (a). Daher
ist ker (f ) reflexiv. Die Relation ist auch symmetrisch, denn aus f (a) = f (b) folgt ja auch
sofort f (b) = f (a). Schließlich ist ker (f ) auch transitiv, denn aus f (a) = f (b) ∧ f (b) = f (c)
ergibt sich f (a) = f (c).
Im obigen Beispiel ist k = e ◦ f eine Funktion auf Z × Z∗ . Somit liegt mit SARA = ker (k)
eine Äquivalenzrelation auf der Menge A = Z × Z∗ vor.
Definition 2.16 (Äquivalenzklassen)
Es sei R eine Äquivalenzrelation auf einer Menge A. Ferner sei x ∈ A ein beliebiges Element.
Dann heißt die durch
[x]R = {y | xRy}
gegebene Menge [x]R die Äquivalenzklasse von x. Das Element x heißt ein Repräsentant der
Klasse [x]R .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
45
Wenn keine Verwechslungen zu befürchten sind, läßt man den Index R auch weg und schreibt
kurz [x] anstelle von [x]R . Äquivalenzklassen sind also gerade solche Mengen wie die in (2.4).
Nun haben Äquivalenzklassen einige ausgezeichnete Eigenschaften. Um sie beschreiben zu
können, benötigt man noch einen weiteren Begriff.
Definition 2.17 (Partition einer Menge)
Es sei A eine Menge. Eine Sammlung C von Teilmengen von A mit den folgenden Eigenschaften
1.) ∀ C ∈ C : C 6= ∅
2.) S
∀B, C ∈ C : (B ∩ C = ∅ ∨ B = C)
3.)
C = A
heißt eine Partition von A.
Auch die Partition findet man im obigen Beispiel bei den Brüchen wieder: jeder Bruch ist
bereits gekürzt oder kann noch gekürzt werden; folglich liegt jeder Bruch in einer Menge C
von der Gestalt (2.4). Außerdem können zwei Brüche in unterschiedlichen Äquivalenzklassen
niemals durch Kürzen zur gleichen rationalen Zahl führen. Daher sind je zwei Mengen B
und C der Gestalt (2.4) entweder gleich oder disjunkt. Also bilden die Äquivalenzklassen der
Relation SARA eine Partition von Z × Z∗ . Dabei werden Brüche, deren Nenner Null ist, von
vorneherein ausgeschlossen, da sie als rationale Zahl keinen endlichen Wert haben. Damit
ergibt die Äquivalenzrelation SARA eine Partition der Menge A = Z × Z∗ . Alle Brüche
mit dem Zähler 0 gehören zur Äquivalenzklasse, in der auch der Bruch 0/1 vorkommt. Im
allgemeinen Fall impliziert jede Äquivalenzrelation auch eine Partition, denn es gilt der
folgende Satz.
Satz 2.7 (Eigenschaften der Äquivalenzklassen)
Es sei R eine Äquivalenzrelation auf einer Menge A. Dann gelten die beiden folgenden Aussagen:
1.) ∀ x, y ∈ A : (xRy ⇐⇒ [x] = [y])
2.) Die Menge der Äquivalenzklassen von R bildet eine Partition von A.
Es ist nicht schwer einzusehen, daß auch die Umkehrung von 2.) gilt: Jede Partition einer
Menge A besteht aus den Äquivalenzklassen einer Äquivalenzrelation R auf A.
Beweis: Zum Beweis der ersten Aussage seien x und y zwei beliebige Elemente aus A.
’=⇒’: Es gelte xRy. Es muß gezeigt werden, daß dann die Äquivalenzklassen von x und y
gleich sind. Dazu sei z ∈ [x]. Aus der Definition 2.16 der Äquivalenzklasse ergibt sich dann
xRz. Aufgrund der Symmetrie von R hat man auch zRx. Zusammen mit der Voraussetzung
xRy und der Transitivität von R folgt zRy. Die erneute Anwendung der Symmetrie von R
ergibt yRz, was z ∈ [y] bedeutet. Da z ein beliebiges Element aus [x] war, ist bisher [x] ⊆ [y]
gezeigt worden. Vertauscht man jetzt die Rollen von x und y, so erhält man mit derselben
Schlußweise auch die Inklusion [y] ⊆ [x], und daher insgesamt [x] = [y].
’⇐=’: Hier wird [x] = [y] vorausgesetzt. Da R reflexiv ist, folgt yRy, mithin y ∈ [y] = [x].
Aus y ∈ [x] schließt man auf xRy, was zu zeigen war.
Zum Beweis der zweiten Aussage müssen die Eigenschaften einer Partition aus Definition
2.17 nachgewiesen werden.
zu 1.) Ist [x] eine Äquivalenzklasse, so ist [x] 6= ∅, da x ∈ [x] wegen der Reflexivität xRx.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
46
zu 2.) Hier ist zu zeigen, daß zwei Äquivalenzklassen [x] und [y] entweder disjunkt oder
gleich sind, d.h.:
[x] ∩ [y] 6= ∅ =⇒ [x] = [y] .
(2.5)
Unter der Voraussetzung [x] ∩ [y] 6= ∅ existiert ein Element z ∈ [x] ∩ [y], so daß also xRz und
yRz gewährleistet sind. Da mit yRz wegen der Symmetrie von R auch zRy ist, folgt mit der
Transitivität aus xRz und zRy dann xRy. Aufgrund der bereits bewiesenen ersten Aussage
des Satzes hat man dann [x] = [y], was in (2.5) zu zeigen war.
zu 3.) Jedes x ∈ A liegt wegen der Reflexivität von R in seiner eigenen Äquivalenzklasse:
x ∈ [x]. Die Vereinigung aller Elemente aus allen Äquivalenzklassen umfaßt somit A.
Äquivalenzklassen unterteilen also die Grundmenge A in disjunkte Teile. Man spricht dabei
auch vom Abstrahieren auf übergeordnete Begriffe. So stellen die Äquivalenzklassen aus (2.4)
genau alle rationalen Zahlen dar. Dabei sind die Brüche aus einer Äquivalenzklasse, etwa
−1 −2 −3
, 4 , 6 , . . ., durch die Zusammenfassung in dieser Klasse auf das wesentliche abstrahiert
2
worden, nämlich auf einen ausgezeichneten Repräsentanten, hier auf den gekürzten Vertreter
−1
in dieser Klasse. Bei Brüchen nennt man diesen Prozeß auch normalisieren.
2
Definition 2.18 (Quotientenmenge)
Es sei R eine Äquivalenzrelation auf einer Menge A. Die Quotientenmenge A/R wird definiert durch
A/R = {[x] | x ∈ A} .
Die Quotientenmenge stellt also die Menge aller Äquivalenzklassen dar.
Bei der Anwendung der Theorie der Äquivalenzrelationen auf den Kern einer Funktion ergibt
sich der folgende wichtige Satz:
Satz 2.8 Es sei f : A → B eine Funktion. Dann existiert eine bijektive Funktion
h : A/ker (f ) → Ran (f )
von der Menge der Äquivalenzklassen von ker (f ) in den Wertebereich der Funktion f .
Beweis:
Man überzeugt sich zuerst davon, daß die Abbildung
h : A/ker(f ) → Ran (f ) ,
h([x]) := f (x)
eine Funktion ist. Es wird jede Äquivalenzklasse [x] abgebildet, und jede Klasse aus A/ker (f )
wird auch genau auf ein Element aus Ran (f ) abgebildet: Ist [x] = [y], so gilt einerseits
h([x]) = f (x), andererseits h([x]) = h([y]) = f (y) aufgrund der Definition von h. Es ist
nun f (x) = f (y) zu zeigen, damit der Klasse [x] auch genau ein Bild unter h zugeordnet
wird2 Wegen [x] = [y] ist aber nach der ersten Aussage in Satz 2.7 (x, y) ∈ ker (f ), und das
bedeutet aufgrund der Kerndefinition aber gerade f (x) = f (y).
Die Funktion h ist surjektiv, denn da die Äquivalenzklassen von ker (f ) eine Partition von A
2
Man spricht hier auch von der Wohldefiniertheit der Abbildung h: Ihr Wert unter der Abbildung einer
Äquivalenzklasse darf nicht davon abhängen, mit welchem ausgezeichneten Repräsentanten x oder y die
Abbildung vorgenommen wird!
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
47
bilden, wird jeder Wert f (x) aus Ran (f ) erreicht, indem man zu jedem x ∈ A die zugehörige
Äquivalenzklasse [x] unter h abbildet. h ist auch eine injektive Funktion, denn aus h([x]) =
h([y]) folgt aufgrund der Definition von h dann f (x) = f (y), woraus sich aber (x, y) ∈ ker (f )
bzw. [x] = [y] ergibt. Damit ist h insgesamt als eine bijektive Funktion nachgewiesen.
In Satz 2.8 wird der theoretische Hintergrund des oben begonnenen Beispiels bei der Normalisierung von Brüchen ausgedrückt: Es gibt eine bijektive Abbildung von der Menge aller
Äquivalenzklassen (eine ist in (2.4) aufgeschrieben) in die Menge aller gekürzten Brüche
Ran (k). Damit können diese beiden Mengen miteinander identifiziert werden. In diesem
gleichsetzen.
Sinne kann man die in (2.4) aufgeschriebene Menge mit der rationalen Zahl −1
2
Die Menge Q der rationalen Zahlen kann also nach Satz 2.8 als
Q = (Z × Z∗ )/ker (k)
mit
Z∗ := Z \ {0}
aufgefaßt werden, wobei sich die Elemente in Q und in (Z × Z∗ )/ker (k) nur durch unterschiedliche Notationen unterscheiden. Bezeichnet man mit [.] wieder die Äquivalenzklassen
der Abbildung ker, so kann ein Element aus Q z.B. in der Form [(a, b)] geschrieben werden;
man kann aber auch die Notation k((c, d)) (=normalisierte Fassung des Bruches (c, d)) für
irgendein Element (c, d) aus [(a, b)] wählen. Dann kann man, wie oben bereits erwähnt, statt
(a, b) noch ab schreiben, was ebenfalls nur eine Frage der Notation ist. Damit erhält man die
rationalen Zahlen als einen neuen Vorrat von Zahlen, mit denen gerechnet werden kann.
Satz 2.8 liegt auch dem folgenden Satz zugrunde, der in vielen theoretischen Betrachtungen
eine Rolle spielt:
Satz 2.9 (Dekomposition von Funktionen)
Zu jeder Funktion f : A → B existiert eine surjektive Funktion g : A → A/ker (f ), eine
bijektive Funktion h : A/ker (f ) → Ran (f ) und eine injektive Funktion k : Ran (f ) → B,
so daß f gemäß
f = k◦h◦g
zerlegt werden kann.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
48
f
A
B
-
6
g
k
?
h
A/ker (f )
Beweis:
-
Ran (f )
Die drei Funktionen g, h und k werden folgendermaßen definiert:
g : A → A/ker (f ) ,
h : A/ker (f ) → Ran (f ) ,
k : Ran (f ) → B ,
g(a)
:= [a]ker (f ) ,
h([x]) := f (x) ,
k(y)
:= y .
Die Funktion g ordnet jedem Element a aus A die Menge derjenigen Elemente b aus A zu,
die unter f ebenfalls den Wert f (a) annehmen:
g(a) := { b ∈ A : f (b) = f (a) } .
Die Funktion h ist die bijektive Abbildung aus Satz 2.8 , und die Funktion k ist eine sog.
Einbettung von Ran (f ) in B. Diese Einbettung wird der Funktion h noch nachgeschaltet,
weil die Funktion h als Abbildung von A/ker (f ) nach B nicht bijektiv wäre. Wir prüfen
jetzt die Zerlegung f = k ◦ h ◦ g für jedes Element a ∈ A nach:
k ◦ h ◦ g(a) = k ◦ h [a]ker (f ) = k(f (a)) = f (a) .
g ist offensichtlich surjektiv, denn jede Äquivalenzklasse [a]ker (f ) kommt als Bild eines Elementes aus A unter g vor. k ist injektiv, weil die Identitätsabbildung immer injektiv ist. Es werden zum Abschluß dieses Kapitels noch zwei typische Beispiele für Äquivalenzrelationen angeführt.
Beispiel 2.11 Ein Spiel mit zwei Würfeln besteht darin, die Summe der ’Augenzahlen’ beider Würfel nach einem Wurf zu bilden. Gewonnen hat, wer die höhere Augenzahl wirft.
Daher ist es für jeden Spieler weniger interessant, wie sich eine Summe zusammensetzt, also
ob z.B. die Zahl 10 durch eine Kombination aus zwei Fünfen oder aus einer Kombination
aus 6 und 4 entstanden ist. Die Menge W := {1, 2, 3, 4, 5, 6} enthält alle möglichen Ergebnisse, die man mit einem Würfel erzielen kann. Die Ereignismenge A für das Werfen mit
zwei Würfeln besteht dann aus dem cartesischen Produkt A = W × W . Da aber nur die
Summe der Augenzahlen x + y eines Ereignisses (x, y) ∈ A interessiert, wird eine Funktion
f : A → N durch
f (x, y) := x + y
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
49
definiert. Die Relation
ker (f ) = { ((x1 , y1 ), (x2 , y2 )) ∈ A2 | f (x1 , y1 ) = f (x2 , y2 ) }
ermöglicht dann genau die Reduktion eines Wurfes auf das Wesentliche, nämlich auf die
Summe der Augenzahlen. In diesem Zusammenhang hat man die Augenzahl abstrahiert. Folgendermaßen findet man in diesem Beispiel die oben eingeführten Begriffe wieder:
• Äquivalenzklasse: Die Äquivalenzklassen zu einem bestimmten Würfelergebnis s sind
alle Ereignisse (x, y) ∈ A, für die x + y = s ist. Z.B. stellt
{ (4, 6), (5, 5), (6, 4) }
(2.6)
die Äquivalenzklasse zu s = 10 dar.
• Partition: Je zwei verschiedene Äquivalenzklassen sind auch disjunkt, denn sie sind
ja gerade so definiert, daß zwei Würfe mit unterschiedlichen Summen auch in unterschiedlichen Klassen liegen. Die Vereinigung über alle möglichen Äquivalenzklassen
enthält auch alle möglichen Ereignisse in A, weil jedem Wurf mit zwei Würfeln auch
eine Augensumme zugeordnet ist.
• Bijektion von der Quotientenmenge in den Wertebereich von f : Zu jeder möglichen Augensumme gehört genau eine Äquivalenzklasse. Wegen
Ran (f ) = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 }
gibt es 11 Äquivalenzklassen. Die Funktion
h : A/ker (f ) → Ran (f ) ,
h([(x, y)]) = f (x, y) = x + y
bildet alle Äquivalenzklassen (gemäß Satz 2.8) auf den Wertebereich Ran (f ) von f ab.
Diese Bijektion stellt die Abstraktion auf die Augenzahl dar, denn beispielsweise wird
die gesamte Menge in (2.6) auf die Zahl 10 abgebildet und die Unterscheidung etwa
zwischen (4, 6) und (5, 5) wird dabei herausgefiltert.
Beispiel 2.12 Es sei m > 1 eine natürliche Zahl. Auf den natürlichen Zahlen N wird die
Relation ’Kongruenz modulo m’ eingeführt:
a ≡ b
(mod m)
⇐⇒
∃k ∈ Z : b − a = k · m .
(gelesen: ’a ist kongruent b modulo m’)
a steht also genau dann in Relation zu b, wenn die Differenz von a und b durch m teilbar
ist, oder anders ausgedrückt, wenn a und b bei der Division durch m den gleichen Rest
ergeben. Man rechnet leicht nach, daß die Kongruenz modulo m eine Äquivalenzrelation ist.
Die Äquivalenzklassen bestehen aus den folgenden Mengen:
0
1
2
m−1
=
=
=
..
.
{ 0, m, 2m, 3m, . . . } ,
{ 1, m + 1, 2m + 1, 3m + 1, . . . } ,
{ 2, m + 2, 2m + 2, 3m + 2, . . . } ,
= { m − 1, 2m − 1, 3m − 1, 4m − 1, . . . } .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
50
Man nennt hier die Äquivalenzklassen auch Restklassen.
Die Abbildung f : N → {0, 1, 2, . . . , m − 1} ordne jeder natürlichen Zahl a den (eindeutig
bestimmten) Rest aus der Menge {0, 1, 2, . . . , m − 1} bei der Division durch m zu. Man kann
schreiben:
h a i
.
f (a) := min { r | r ∈ N ∧ m teilt a − r } = a − m
m
Hierfür ist auch die Notation f (a) = a mod m gebräuchlich; das Symbol mod m fungiert
hier als Operator.
Die Kongruenzrelation modulo m besteht gerade aus dem Kern der Abbildung f (siehe Definition 2.14), sie wird also durch f erzeugt. Man hat daher
N/ker (f ) = { 0, 1, 2, . . . , m − 1 } .
Auf der Menge dieser Restklassen werden wieder die Operationen Addition, Subtraktion und
Multiplikation definiert. Dies geschieht mittels
a b := f (a b) ,
wobei jeweils für eine der Operationen +, − oder ∗ steht. Nun gilt für die bijektive Abbildung
h aus Satz 2.8 zwischen den Restklassen und dem Wertebereich von f :
h(a) = f (a) = a
(0 ≤ a ≤ m − 1) .
h ordnet also der Restklasse a genau die Zahl a zu. Daher läßt man beim Rechnen mit
Restklassen den Strich über den Symbolen auch einfach weg. So schreibt man bei m = 12
z.B. 6 + 8 = 2 oder 8 − 9 = 11 oder 5 · 6 = 6.
Auch in der Informatik spielt die Kongruenzrelation eine wichtige Rolle. Dort nimmt m
z.B. oft den maximalen Wert eines Typs ganzer Zahlen an. Unter Umständen kommt ein
Datentyp vor, mit dem 232 natürliche Zahlen darstellbar sind, nämlich
{ 0, 1, 2, . . . , 232 − 1 } .
Hier ist dann m = 232 . Führt eine Rechnung aus diesem Bereich hinaus, so wird das Ergebnis
’modulo m’ ausgegeben, also z.B.
4294967294 + 3 = 1 .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
51
3 Induktion
Induktion ist ein Konzept zur Definition von Mengen und Funktionen. Im Zusammenhang
mit Mengen spricht man von induktiv definierten Mengen. Funktionen können dann rekursiv
auf solchen Mengen definiert werden. Im Gegensatz zu den in Abschnitt 1.4 vorgestellten
Möglichkeiten der Mengendefinition durch Aufzählen aller Elemente oder durch die Angabe
einer definierenden Eigenschaft geht man bei der induktiven Definition anders vor: man
benennt explizit die ’einfachsten Elemente’ und gibt dann Regeln an, wie ’kompliziertere
Elemente’ aus den bereits erhaltenen Elementen erzeugt werden können. Dieses induktive
Vorgehen wird zunächst anhand eines grundlegenden mathematischen Prinzips (des sog.
Wohlordnungsprinzips) vorgestellt, das häufig auch als Beweisprinzip verwendet wird.
3.1 Einfache Induktion.
Beim Beweisprinzip der einfachen Induktion geht man folgendermaßen vor: um eine Aussage
A(n) über natürliche Zahlen n zu beweisen, versucht man zunächst, die Aussage nur für
einen einfachen Fall zu zeigen. Das ist meist leicht, denn man muß nicht A(n) für alle
natürlichen Zahlen n beweisen, sondern eventuell nur den Wahrheitsgehalt der Aussage A(0)
nachprüfen. Danach verwendet man diese einfachen Ergebnisse (= wahre Aussagen), um
komplexere Resultate zu erhalten. Dies geschieht dadurch, daß man Aussagen der Form
A(x) ist wahr
=⇒
A(y) ist wahr
(3.1)
beweist. Gehört x zu einem der bereits behandelten einfachen Fälle, für die die Aussage A(x)
schon als wahr nachgewiesen ist, so erhält man durch (3.1) ein weiteres Element (nämlich y),
für das die Aussage zutrifft. In vielen Fällen kann man diesen Induktionsschritt so strukturieren, daß man hiermit die Aussage A(n) für alle natürlichen Zahlen n bewiesen hat. Warum
das tatsächlich funktioniert, soll jetzt theoretisch untermauert werden.
Man benötigt dazu die folgende Aussage, die zwar intuitiv klar ist, aber dennoch eigentlich
bewiesen werden müßte. Da wir das hier nicht tun können, wird die Aussage als ein Axiom
aufgeführt, d.h. als ein unbegründetes Prinzip.
Axiom 3.1 (Wohlordnungsprinzip für natürliche Zahlen)
Jede nichtleere Teilmenge der natürlichen Zahlen hat ein kleinstes Element, d.h. formal:
∅=
6 A ⊆ N =⇒ ∃ k ∈ A ∀ n ∈ A : k ≤ n .
Aus diesem Axiom gewinnt man eine Beweistechnik für Aussagen über natürliche Zahlen.
Dies soll an einem historischen Beispiel demonstriert werden. Es handelt sich um eine Formel,
die sich der junge Carl Friedrich Gauß (1777 - 1855) ausgedacht hat, als sein Rechenlehrer
in der Schule die Aufgabe stellte, die Zahlen von 1 bis 100 zu addieren. Der Lehrer erwartete,
daß die Schüler hiermit einige Zeit beschäftigt sind, doch Gauß präsentierte die Lösung 5050
nach wenigen Augenblicken. Er hatte nämlich die Zahlen von 1 bis 100 in der Form
1
2 3 ...
100 99 98 . . .
49 50
52 51
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
52
aufgeschrieben. Nun kann man die Addition aller Zahlen von 1 bis 100 rasch durchführen:
man addiere zunächst spaltenweise, was stets 101 ergibt und multipliziere anschließend mit
der Anzahl 50 der Spalten. Also lautet das Ergebnis 50 · 101 = 5050.
Will man nun allgemein die ersten n natürlichen Zahlen (für ein gerades n) addieren, so
muß man offensichtlich die Summe n + 1 jeder Spalte mit der Anzahl n/2 der Spalten
multiplizieren. Es wird nun gezeigt, daß diese Formel tatsächlich allgemeingültig ist und
auch für ungerade natürliche Zahlen ihre Gültigkeit behält.
Beispiel 3.1 Es sei n ∈ N mit n ≥ 1. Dann gilt
n(n + 1)
.
(3.2)
2
Beweis: Es werde mit S die Menge aller natürlichen Zahlen bezeichnet, für die die Gleichung (3.2) falsch ist. Man nimmt nun S 6= ∅ an und führt einen Widerspruch herbei. Nach
dem Wohlordnungsprinzip (Axiom 3.1) besitzt S ein kleinstes Element, das mit k bezeichnet
wird. Offensichtlich ist k ≥ 2, denn für k = 1 ist die Aussage (3.2) mit n = k wahr. Da k
außerdem das kleinste Element von S ist, ist die Aussage (3.2) auch wahr für k − 1. Es gilt
also
(k − 1)k
.
(3.3)
1 + 2 + 3 + · · · + (k − 1) =
2
Berechnet man nun die Summe der ersten k Zahlen, so erhält man
1 + 2 + 3 + ··· + n =
(3.3)
1 + 2 + 3 + · · · + k = (1 + 2 + 3 + · · · + (k − 1)) + k =
(k − 1)k
+k
2
k2 + k
k(k + 1)
k 2 − k + 2k
=
=
.
2
2
2
Hieraus folgt, daß die Aussage (3.2) doch wahr ist für n = k. Dies widerspricht aber der
Konstruktion von k. Der Widerspruch beweist S = ∅, und daher ist die Aussage (3.2) wahr
für alle natürlichen Zahlen n.
=
Aus diesem Beispiel kann man ein allgemeines Beweisprinzip ableiten. Insbesondere hat der
Schritt von k − 1 nach k dazu geführt die Annahme zu widerlegen. Dies ist aber nur eine der
’Zutaten’ zu diesem Prinzip. Vielmehr wurde auch eine wichtige Voraussetzung angewendet,
damit der erwähnte Schritt von k − 1 nach k überhaupt angewendet werden konnte. Hierfür
war nämlich erforderlich, daß die Aussage zumindest für ein (einfaches) Element wahr ist
(im obigen Beispiel die Zahl 1). Wäre dies nicht der Fall gewesen, wäre die Existenz der Zahl
k − 1 nicht gesichert, denn es wäre dann k = 1 möglich gewesen und k − 1 = 0 wäre dann
eine für k − 1 nicht erlaubte Belegung. Es ist also notwendig zu zeigen, daß die Aussage
einerseits für k = 1 wahr ist und daß sie andererseits für k wahr ist, wenn sie es auch für
k − 1 ist.
Satz 3.1 (Prinzip der einfachen Induktion)
Es sei A(n) eine Aussage über natürliche Zahlen. Wenn gilt:
1.) A(0) ist wahr;
2.) ∀ k > 0 : A(k − 1) ist wahr =⇒ A(k) ist wahr ,
so ist A(n) wahr für alle n ∈ N. Speziell heißt die Aussage in 1. der Induktionsanfang und
die Hypothese in 2. die Induktionsvoraussetzung. Die Implikation in 2. wird Induktionsschluß
oder auch Induktionsschritt genannt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
53
Dieser Satz kann mit denselben Argumenten wie im Beweis des Beispiels 3.1 begründet
werden.
Man geht bei einem Induktionsbeweis also folgendermaßen vor:
• Man beweise den Induktionsanfang.
• Man wähle ein beliebiges k > 0 und setze voraus, daß die Aussage A(k − 1) wahr ist
(Induktionsvoraussetzung).
• Man beweise für dieses k unter Ausnutzung der Induktionsvoraussetzung, daß die Aussage A(k) wahr ist.
Als Anwendungsbeispiel für das Prinzip der einfachen Induktion soll die zweite Aussage in
Satz 1.6 bewiesen werden. Es wird dort behauptet, daß für eine Menge S bestehend aus n
Elementen die zugehörige Potenzmenge 2n Elemente enthält:
|℘(S)| = 2|S| = 2n .
(3.4)
Beweis: Es wird eine einfache Induktion über die Zahl n = |S| verwendet. Wir bezeichnen
mit Sk eine Menge mit k Elementen.
Induktionsanfang: Für k = 0 ist die Behauptung wahr, denn dann ist S0 = ∅ und ℘(S0 ) =
{∅}. Also hat man
|℘(S0 )| = 1 = 20 = 2|S0 | .
Induktionsvoraussetzung: Für ein k > 0 gelte:
|℘(Sk−1 )| = 2k−1 .
(3.5)
Induktionsschluß: Die hier zu zeigende Implikation lautet formal:
|℘(Sk−1 )| = 2k−1
=⇒
|℘(Sk )| = 2k .
Für die natürliche Zahl k aus der Induktionsvoraussetzung sei nun Sk eine Menge mit k
Elementen. Wegen k > 0 ist Sk nicht leer, und man kann ein Element a ∈ Sk auswählen. Es
wird nun die Menge
T := { A | A ⊆ Sk \ {a} }
untersucht. Gemäß Definition (1.2) ist T die Potenzmenge der Menge Sk \ {a}, also einer
Menge bestehend aus k − 1 Elementen. Daher ist auf diese Situation die Induktionsvoraussetzung (3.5) anwendbar. Das ergibt:
|T | = |℘(Sk \ {a})| = 2k−1 .
(3.6)
Wir benötigen eine weitere Menge:
U := { A | A ⊆ Sk ∧ a ∈ A } .
Nach Konstruktion sind die Mengen T und U disjunkt, denn jede Menge in U enthält das
Element a, während a aber in keiner Menge aus T vorkommt. Nun ist aber
℘(Sk ) = T ∪ U ,
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
54
und wegen T ∩ U = ∅ folgt mit Korollar 1.2
|℘(Sk )| = |T | + |U | .
(3.7)
Die Menge U kann formal auch anders geschrieben werden, nämlich als
U = { A ∪ {a} | A ∈ T } .
Hieraus liest man unmittelbar ab, daß die Mengen T und U gleichmächtig sind, also daß
|T | = |U | ist. Damit ergibt sich aus (3.6) und (3.7):
|℘(Sk )| = |T | + |U | = |T | + |T | = 2|T | = 2 · 2k−1 = 2k ,
womit die Aussage (3.4) bewiesen ist.
In vielen Fällen möchte man Aussagen über natürliche Zahlen n beweisen, die erst für n ≥ n0
gelten und für n = 0, 1, 2, . . . n0 − 1 unter Umständen falsch sind. Hierbei ist n0 eine feste
natürliche Zahl. Beispielsweise gilt die Aussage
100n < n!
erst für n ≥ n0 = 269 und ist für n = 0, 1, . . . , 268 falsch. Um solche Typen von Aussagen
zu beweisen, kann man eine Erweiterung des Induktionsprinzips verwenden.
Satz 3.2 (Erweitertes Induktionsprinzip)
Es sei A(n) eine Aussage über natürliche Zahlen. Wenn es eine Zahl n0 ∈ N gibt, so daß
gilt:
1.) A(n0 ) ist wahr;
2.) ∀ k > n0 : A(k − 1) ist wahr =⇒ A(k) ist wahr ,
so ist A(n) wahr für alle n ≥ n0 .
Der Beweis dieser Aussage kann mit Hilfe von Satz 3.1 erfolgen und wird hier nicht vorgeführt. Für n0 = 0 reduziert sich Satz 3.2 wieder auf die einfache Induktion. Insofern stellt
dieser Satz eine Verallgemeinerung von Satz 3.1 dar.
In vielen Fällen reicht auch dieses Prinzip nicht aus, denn für die Durchführung des Induktionsschlusses muß man häufig nicht nur wissen, daß die Aussage A(k − 1) wahr ist, sondern
auch, daß die Aussage A(k) für alle k im Bereich k = n0 , n0 + 1, . . . , k − 1 richtig ist. Auch
in diesem Fall kann man ein Induktionsprinzip formulieren:
Satz 3.3 (Starkes Induktionsprinzip)
Es sei A(n) eine Aussage über natürliche Zahlen. Wenn es eine Zahl n0 ∈ N gibt, so daß
gilt:
1.) A(n0 ) ist wahr;
2.) ∀ k > n0 : A(j − 1) ist wahr für alle j mit n0 < j ≤ k =⇒ A(k) ist wahr ,
so ist A(n) wahr für alle n ≥ n0 .
Auch diesen Satz kann man ähnlich wie den Satz 3.1 mit Hilfe des Wohlordnungsprinzips
beweisen. Es folgt eine Anwendung des starken Induktionsprinzips.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
55
Beispiel 3.2 (Der Quicksort - Algorithmus)
Dem Quicksort - Algorithmus wird eine endliche Folge s natürlicher Zahlen eingegeben, und
er liefert als Rückgabe diese Folge aufsteigend sortiert. Die Vorgehensweise des Algorithmus
besteht im Aufsplitten der Folge und dem rekursiven Anwenden des Aufsplittungsprinzips auf
die Teile dieses Splits. Im Detail sieht das folgendermaßen aus: Es sei s = (s1 , s2 , . . . , sn )
eine (endliche) Folge natürlicher Zahlen.1
• Ist s die leere Folge, so wird s als Rückgabe geliefert. Ist die Folge s nicht leer, so wird
ein beliebiges Element sj aus der Folge ausgewählt.
• Es wird eine Folge
sL (sj )sR
(3.8)
konstruiert. Dabei ist sL eine Folge, die aus allen Elementen von s ohne sj besteht,
welche kleiner oder gleich sj sind. sR hingegen setzt sich aus allen Elementen von s
zusammen, die größer als sj sind. Die Schreibweise in (3.8) ist als Konkatenation von
Folgen zu verstehen, wobei die mittlere Folge (sj ) nur aus einem Element besteht.
• Der Algorithmus wird jetzt jeweils für die Folgen sL und sR wiederholt. Das Ergebnis
seien die Folgen s∗L und s∗R , wobei der Algorithmus s∗L und s∗R als aufsteigend sortierte
Folgen aus sL bzw. sR gewonnen hat.
• Es wird die Folge s∗L (sj )s∗R zurückgeliefert.
Die Konstruktion der Folge in (3.8) geschieht durch lineares Analysieren der Folge und durch
Vergleichen jedes Elementes mit sj . Die technischen Einzelheiten sind hier belanglos. So wird
z.B. die Folge s = (6, 10, 4, 3, 4, 14, 1, 4, 7) bei der Wahl von s3 = 4 in die Teile sL = (3, 4, 1, 4)
und sR = (6, 10, 14, 7) gesplittet. Entscheidend sind nun die Fragen, ob dieser rekursiv definierte Algorithmus terminiert und ob er auch immer eine aufsteigend sortierte Folge liefert.
Man kann dies mit dem Prinzip der starken Induktion beantworten. In Satz 3.3 wählt man
n0 = 0.
Induktionsanfang: Es sei n = 0. Dann ist s die leere Folge und gemäß der obigen Beschreibung des Algorithmus wird die leere Folge zurückgeliefert. Der Algorithmus terminiert
also und das Ergebnis ist auch sortiert.
Induktionsvoraussetzung: Es sei k > 0. Es wird nun vorausgesetzt, daß der Quicksort
- Algorithmus für jede Folgenlänge j − 1 mit 0 < j ≤ k terminiert und eine aufsteigend
sortierte Folge liefert.
Induktionsschluß: Es sei s eine Folge der Länge k. Da das hieraus beliebig ausgewählte
Element sj weder in sL noch in sR vorkommt, sind sL und sR jeweils Folgen mit Längen
j − 1, wobei 0 ≤ j − 1 < k. Nach der Induktionsvoraussetzung terminiert der Algorithmus
für jede dieser Folgen und liefert aufsteigend sortierte Folgen s∗L und s∗R . Dann ist auch die
Folge s∗L (sj )s∗R (nach Konstruktion) aufsteigend sortiert und der Algorithmus ist beendet.
1
Im Gegensatz zur Definition 2.7 sind hier die Folgenelemente von 1 bis n und nicht von 0 bis n − 1
durchnummeriert.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
56
Es ist notwendig, auf einige formale Varianten bei der Anwendung der Induktionsprinzipien hinzuweisen, die man oft in der Literatur findet. Beim einfachen und erweiterten Induktionsprinzip wird häufig bei der Formulierung der Induktionsvoraussetzung und bei der
Durchführung des Induktionsschritts dieselbe Variable verwendet, die in der zu beweisenden
Aussage A(n) vorkommt. Etwa beim Prinzip der einfachen Induktion (Satz 3.1) sieht das
dann folgendermaßen aus:
Es sei A(n) eine Aussage über natürliche Zahlen. Wenn gilt:
1.) A(0) ist wahr;
2.) ∀ n > 0 : A(n − 1) ist wahr =⇒ A(n) ist wahr ,
so ist A(n) wahr für alle n ∈ N.
Für jemanden, der im Umgang mit der Induktion sattelfest ist, ist diese etwas zweifelhafte
Doppelverwendung der Variable n kein Problem. Der Anfänger sollte das jedoch vermeiden
und wie in Satz 3.1 eine andere Variable im Induktionsschritt verwenden.
Eine weitere formale Variante beim Induktionsprinzip betrifft ebenfalls den Induktionsschritt. Es ist offensichtlich bei der einfachen Induktion formal dasselbe, wenn man beim
Induktionsschritt statt von A(k − 1) auf A(k) zu schließen die Implikation von A(k) auf
A(k + 1) durchführt. Nur muß dies jetzt für alle k ≥ 0 gelingen (und nicht nur für alle
k > 0), damit mit dem kleinsten Wert k = 0 in der Induktionsvoraussetzung A(k) der Anschluß an die Induktionsvoraussetzung A(0) gelingt. Ganz allgemein ist also beim erweiterten
Induktionsprinzip die folgende Variante möglich:
Es sei A(n) eine Aussage über natürliche Zahlen. Wenn es eine Zahl n0 ∈ N gibt,
so daß gilt:
1.) A(n0 ) ist wahr;
2.) ∃ a ∈ Z : ∀ k ≥ n0 − a : A(k + a) ist wahr =⇒ A(k + a + 1) ist wahr ,
so ist A(n) wahr für alle n ≥ n0 .
In Satz 3.2 ist a = −1 gewählt worden.
3.2 Induktiv definierte Mengen.
Wie schon in der Einleitung zu diesem Kapitel erwähnt, wird jetzt noch eine dritte Möglichkeit der Mengendefinition vorgestellt. Diese erfolgt durch Angabe der ’einfachsten Elemente’
und durch das Aufstellen von Regeln, durch die sich ’kompliziertere Elemente’ aus den bereits enthaltenen Elementen erzeugen lassen. So erhält man eine induktiv definierte Menge.
Auch hier soll das Prinzip an einem typischen Beispiel aus der Informatik erläutert werden.
Beispiel 3.3 Es wird die Menge der korrekten ganzzahligen arithmetischen Ausdrücke definiert. Der Einfachheit halber geschieht dies ohne die konkrete Angabe einer Obermenge,
in der sich alles abspielt. Die hiesige Definition ist dann etwas einfacher als in gängigen
Programmiersprachen, aber insgesamt ähnlich.
Es wird vorausgesetzt, daß eine Menge CONST von ganzzahligen Konstanten und eine Menge VAR von Variablenbezeichnern bereits definiert ist. So könnte die Menge CONST z.B.
aus allen ganzen Zahlen im Intervall von −231 bis 231 − 1 bestehen, und die Menge VAR
⊆ A∗ könnte alle Worte über einem Alphabet A = {a, b, c, . . . , z, A, B, C, . . . , Z, 0, 1, 2, . . . 9}
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
57
umfassen, wobei das erste Zeichen stets ein Buchstabe ist. Die Menge EXP aller Ausdrücke
wird dann folgendermaßen durch Basisregeln und induktive Regeln definiert:
Basisregeln:
1.
2.
Jedes Element aus CONST ist in EXP
Jedes Element aus VAR ist in EXP
3.
4.
5.
6.
7.
8.
9.
E ∈ EXP
E ∈ EXP
E ∈ EXP
E1 ∈ EXP
E1 ∈ EXP
E1 ∈ EXP
E1 ∈ EXP
Induktive Regeln:
=⇒
=⇒
=⇒
∧ E2
∧ E2
∧ E2
∧ E2
(E) ∈ EXP
+E ∈ EXP
−E ∈ EXP
∈ EXP =⇒
∈ EXP =⇒
∈ EXP =⇒
∈ EXP =⇒
(Klammerungsregel)
E1 + E2 ∈ EXP
E1 − E2 ∈ EXP
E1 ∗ E2 ∈ EXP
E1 /E2 ∈ EXP
Man darf nun nicht erwarten, daß diese Regeln die Menge der arithmetischen Ausdrücke ’in
einem Schritt’ definieren. Man könnte dann nämlich einwenden, daß man für die Anwendung
der induktiven Regeln aufgrund der Hypothesen eigentlich schon vorher wissen müßte, wie
EXP aussieht. Man muß sich aber vielmehr die Anwendung der Regeln 3. bis 9. als einen
’Schritt für Schritt’ - Prozeß vorstellen: Zuerst werden die Regeln 1. und 2. angewendet.
Damit ist diejenige Teilmenge von EXP festgelegt, die die einfachen Elemente enthält. Dann
wendet man in einem ersten Schritt auf diese erste Teilmenge die Regeln 3. bis 9. an und
erhält dadurch eine größere Teilmenge. Hierauf werden erneut die Regeln 3. bis 9. angewendet
und so entsteht eine noch größere Teilmenge, usw. Auf diese Weise konstruiert man immer
komplexere Ausdrücke. Man kann also festhalten:
Eine Zeichenkette ist genau dann ein Element von EXP, wenn sie durch eine endliche
Anzahl von Anwendungen der Regeln 1. bis 9. entstanden ist.
Es soll zur Demonstration die Zeichenkette (a+b)/25 dahingehend untersucht werden, ob sie
ein korrekter arithmetischer Ausdruck aus EXP ist. Ihre induktive Konstruktion geschieht
durch die Regeln 1. bis 9. folgendermaßen:
a)
b)
c)
d)
e)
f)
Behauptung
a ∈ EXP
b ∈ EXP
a + b ∈ EXP
(a + b) ∈ EXP
25 ∈ EXP
(a + b)/25 ∈ EXP
Begründung
Regel 2.
Regel 2.
Regel 6. und a) und b)
Regel 3. und c)
Regel 1.
Regel 9. und d) und e)
Vor dem Hintergrund dieses Beispiels wird nun eine allgemeine Beschreibung von induktiv
definierten Mengen gegeben. Diese Beschreibung wird nicht als Definition bezeichnet, weil
sie mathematisch noch zu unpräzise ist. Eine korrekte mathematische Definition würde an
dieser Stelle den Rahmen sprengen.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
58
Beschreibung induktiv definierter Mengen.
Eine induktive Definition einer Menge besteht aus einer Menge von Regeln. Man
unterscheidet zwischen Basisregeln und induktiven Regeln. Die Basisregeln bestimmen in einfacher Weise die Zugehörigkeit bestimmter Elemente zu der Menge.
Die induktiven Regeln legen fest, daß weitere Elemente in der Menge enthalten
sind, wenn gewisse andere Elemente schon in der Menge vorkommen. Da die induktiven Regeln als eine Implikation formuliert sind, nennt man die Elemente
vor dem ’=⇒’ -Zeichen die Hypothesen der Regeln und dementsprechend die Elemente nach dem ’=⇒’ -Zeichen die Folgerungen der Regeln. In der so definierten
Menge befinden sich genau die Elemente, die durch eine endliche Anzahl von
Anwendungen dieser Regeln erzeugt werden können.
Um zu zeigen, daß ein Element e in einer induktiv definierten Menge vorkommt, führt man
einen sog. ’Zeile-für-Zeile’ - Beweis durch (wie im Beispiel 3.3 für den Nachweis, daß e =
(a + b)/25 ein arithmetischer Ausdruck ist). Jede Zeile eines solchen Beweises legt entweder
für ein Element fest, daß es aufgrund einer Basisregel in S liegt, oder sie besteht aus der
Folgerung einer induktiven Regel, deren Hypothese als eine frühere Zeile in dem Beweis
vorkommt. In der letzten Zeile des Beweises steht dann als Folgerung die Aussage e ∈ S.
Der näheren Erläuterung dienen noch die folgenden Beispiele:
Beispiel 3.4 (Induktive Definition der natürlichen Zahlen)
Die Menge N der natürlichen Zahlen kann folgendermaßen definiert werden:
1.
2.
0∈N
n∈N
=⇒
n+1∈N
Dabei ist 1. eine Basisregel und 2. eine induktive Regel. Somit erweist sich N als die einfachste
induktiv definierte Menge. Allerdings kann N aber auch anders konstruiert werden:
0∈N
1∈N
n∈N ∧ n+1∈N
1.
2.
3.
=⇒
n+2∈N
Damit wird klar, daß solche Mengen auf unterschiedliche Art und Weise definiert werden
können.
In Abschnitt 2.3 wurde die Menge A∗ der Worte über einem Alphabet A als eine Menge
von endlichen Folgen über A definiert. Durch eine induktive Mengenkonstruktion bietet sich
hierfür aber auch eine alternative Möglichkeit an.
Beispiel 3.5 (Induktive Definition von Wörtern und Sprachen)
Es sei A ein Alphabet. Dann wird die Menge aller Wörter über A folgendermaßen definiert:
1.
2.
ε ∈ A∗
w ∈ A∗ ∧ x ∈ A
=⇒
wx ∈ A∗
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
59
Geht man nun einen Schritt weiter, so kann man eine sog. Sprache als Teilmenge von A∗
(=Menge der Wörter) ebenfalls induktiv definieren. Für ein besonders einfaches Alphabet
A := {a, b} wird so eine Sprache S ⊆ A∗ folgendermaßen definiert:
1.
2.
3.
4.
ε∈S
w ∈ S =⇒ awb ∈ S
w ∈ S =⇒ bwa ∈ S
w ∈ S ∧ u ∈ S =⇒ wu ∈ S
Bei dieser Konstruktion werden also nicht nur einzelne Buchstaben aus A zu Wörtern für
A∗ zusammengefügt, sondern bereits ganze Worte aus A∗ zu neuen Wörtern kombiniert.
Entweder wird ein bereits konstruiertes Wort w durch das gleichzeitige Voranstellen und
Anfügen zweier verschiedener Buchstaben zu einem neuen Wort ergänzt (Regel 2. und 3.)
oder es werden zwei bereits konstruierte Wörter zu einem neuem Wort zusammengefügt
(Regel 4.). Kommen in der Sprache S die Wörter abba und bab vor? Für das Wort abba
kann man einen Zeile-für-Zeile - Beweis angeben:
a)
b)
c)
d)
Behauptung
ε∈S
ab ∈ S
ba ∈ S
abba ∈ S
Begründung
Regel 1.
Regel 2. und a)
Regel 3. und a)
Regel 4. und b) und c)
Man wird sich vergeblich bemühen, einen solchen Beweis auch für die Behauptung bab ∈ S
zu finden. Tatsächlich kommt dieses Wort auch nicht in S vor, und das liegt daran, daß S
genau die Wörter über dem Alphabet A = {a, b} enthält, bei denen die Anzahl der a’s gleich
der Anzahl der b’s ist. Um diese Aussage auch präzise beweisen zu können, benötigen wir
ein noch allgemeineres Beweisprinzip, das speziell auf Aussagen von Elementen in induktiv
definierten Mengen anwendbar ist. Mit diesem Beweisprinzip befassen wir uns im nächsten
Abschnitt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
60
3.3 Strukturelle Induktion.
Da das Prinzip der strukturellen Induktion einerseits alle bisher eingeführten Induktionsprinzipien verallgemeinert und andererseits in der Informatik eines der wichtigsten Prinzipien
ist, wird es hier in einem eigenen Abschnitt vorgestellt. Es handelt sich bei der strukturellen Induktion um ein Beweisprinzip zum Prüfen von Aussagen über Elemente in induktiv
definierten Mengen. Es wird zunächst das Beweisprinzip eingeführt und anschließend durch
Anwendungen erläutert.
Satz 3.4 (Prinzip der strukturellen Induktion)
Es sei S eine induktiv definierte Menge und A(x) eine Aussage über Elemente x ∈ S. Die
beiden folgenden Bedingungen seien erfüllt:
1.) Für alle Basisregeln R in der Definition von S gelte:
Ist x aufgrund einer Regel R in der Menge S, so ist A(x) wahr.
2.)
Für alle induktiven Regeln R in der Definition von S gelte:
Wenn die Aussage A(x) für jedes x, das in der Hypothese einer Regel R vorkommt, wahr
ist, so ist die Aussage A(y) wahr für das y, das aufgrund der Regel R als Folgerung in S
liegt.
Dann ist die Aussage A(x) für alle x ∈ S wahr.
Man kann die Voraussetzung 2. in diesem Satz so deuten, daß sich die Implikation in einer
induktiven Regel (x1 , x2 , . . . , xn ∈ S =⇒ y ∈ S) auf eine Implikation zwischen Aussagen
überträgt:
A(x1 ) wahr ∧ A(x2 ) wahr ∧ . . . ∧ A(xn ) wahr
=⇒
A(y) wahr .
Beweis: Es sei x ∈ S. Es muß nun gezeigt werden, daß A(x) wahr ist, wenn die Voraussetzungen 1. und 2. im Satz erfüllt sind. Hierzu greifen wir auf den Zeile-für-Zeile - Beweis
zurück, der wegen x ∈ S die Zugehörigkeit von x zu S durch die induktive Definition von S
belegt. Dieser Zeile-für-Zeile - Beweis wird als eine endliche Folge (x0 , x1 , . . . , xm ) interpretiert, wobei xm = x ist und jedes der anderen xi entweder aufgrund einer Basisregel oder
aufgrund einer induktiven Regel in S liegt. Für das Wort abba aus Beispiel 3.5 etwa lautet
diese Folge (x0 , x1 , x2 , x3 ) = (ε, ab, ba, abba). Liegt ein xi aufgund einer induktiven Regel in
S, so gibt es wenigstens ein j < i, so daß xj in der Hypothese der induktiven Regel für xi
vorkommt. Bei abba etwa findet man x0 in der Hypothese zu x1 und in der Hypothese zu
x2 , während x1 und x2 in der Hypothese zu x3 vorkommen. Mit Hilfe des starken Induktionsprinzips aus Satz 3.3 wird nun gezeigt, daß die Aussage A(xk ) für alle k = 0, 1, 2, . . . , m
wahr ist.
Der Induktionsanfang ist für i = 0. Da x0 nur aufgrund einer Basisregel in S liegen kann,
erzwingt die Voraussetzung 1. die Gültigkeit von A(x0 ). Als Induktionsvoraussetzung beim
starken Induktionsprinzip wird nun für eine natürliche Zahl k ≤ m angenommen, daß die
Aussagen A(xi ) für alle i = 0, 1, 2, . . . , k − 1 wahr sind (bzw. daß A(xi−1 ) wahr ist für
i = 1, 2, . . . , k). Es müssen nun zwei Fälle unterschieden werden. Gilt xk ∈ S aufgrund einer
Basisregel, so ist wieder aufgrund der Voraussetzung 1. der Wahrheitsgehalt von A(xk ) garantiert. Ist aber xk ∈ S aufgrund der Folgerung einer induktiven Regel R, so gibt es gewisse
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
61
xi mit i ∈ {0, 1, 2, . . . , k − 1}, die alle in der Hypothese der Regel R vorkommen. Auf diese
Situation ist nun die Induktionsvoraussetzung des starken Induktionsprinzips anwendbar: für
alle diese i sind die Aussagen A(xi ) wahr. Daher sind in der Voraussetzung 2. des Satzes die
Bedingungen erfüllt, und da xk aufgrund der Regel R durch diese xi in S ist, ist die Aussage
A(xk ) wahr. Damit ist der Induktionsschritt beim starken Induktionsprinzip vollzogen und
es wurde gezeigt, daß die Aussagen A(xi ) für alle i = 0, 1, 2, . . . , m wahr sind. Insbesondere
ist die Aussage A(xm ) = A(x) wahr. Da x ∈ S beliebig gewählt war, ist der Satzes bewiesen.
Es ist nun leicht einzusehen, daß dieses Beweisprinzip stärker als die zuvor eingeführten Induktionsprinzipien ist. Im wesentlichen liegt das daran, daß die natürlichen Zahlen N eine
spezielle induktiv definierte Menge sind (vgl. Beispiel 3.4). Man wähle also speziell S = N.
Dann reduziert sich die Voraussetzung 1. in Satz 3.4 auf die Aussage
A(0) ist wahr.
In Beispiel 3.4 gibt es nur eine induktive Regel, und in deren Hypothese kommt nur das
Element n vor. Die Folgerung dieser Regel ist n + 1 ∈ N. Aus der Voraussetzung 2. in Satz
3.4 wird also die Aussage
A(n) ist wahr
=⇒
A(n + 1) ist wahr .
Die Folgerung aus den beiden Voraussetzungen in Satz 3.4 besteht dann darin, daß A(x)
für alle x ∈ N wahr ist, und das ist genau die Aussage von Satz 3.1. Damit erweist sich
das Prinzip der strukturellen Induktion stärker als das der einfachen Induktion. Auch das
erweiterte Induktionsprinzip (Satz 3.2) und das starke Induktionsprinzip (Satz 3.3) können
als Spezialfälle des Prinzips der strukturellen Induktion angesehen werden. Man definiere
dafür induktiv die folgenden Mengen S1 bzw. S2 für S in Satz 3.4. Für das erweiterte Induktionsprinzip wähle die Regeln
n0 ∈ S1
n ∈ S1
=⇒
n + 1 ∈ S1 ,
für das starke Induktionsprinzip hingegen
0 ∈ S2
0 ∈ S2 ∧ 1 ∈ S2 ∧ . . . ∧ n ∈ S2
=⇒
n + 1 ∈ S2 .
Auf S = S1 bzw. S = S2 wende man nun Satz 3.4 an.
Es wird nun eine typische Anwendung der strukturellen Induktion vorgestellt. In Beispiel
3.5 am Schluß des vorigen Abschnitts wurde eine Sprache S konstruiert, von der behauptet
wurde, daß alle ihre Wörter stets die gleiche Anzahl an Buchstaben a und b enthalten. Für
die Menge
T := { w | w ∈ {a, b}∗ ∧ Die Anzahl der a’s in w ist gleich der Anzahl der b’s in w }
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
62
wird also
S = T
(3.9)
behauptet. Zum Beweis dieser Mengengleichheit werden die beiden Inklusionen S ⊆ T und
T ⊆ S gezeigt. Für die erste Inklusion S ⊆ T wird die strukturelle Induktion verwendet.
Es sind jetzt in Satz 3.4 die beiden Voraussetzungen 1. und 2. nachzuweisen. Es gibt nur
eine Basisregel, nämlich ε ∈ S, und ε enthält genauso viele a’s wie b’s, nämlich keine. Zur
Überprüfung der Voraussetzung 2. muß für alle drei induktiven Regeln R folgendes nachgewiesen werden: Werden alle Elemente, die in der Hypothese einer Regel R vorkommen, als zu
T gehörig angenommen, so liegt auch das aufgrund der Regel R in S konstruierte Element
schon in T . Dies gilt offensichtlich für Regel 2, denn hier kommen zu w ∈ T je ein a und
ein b hinzu. Die Anzahl der a’s und b’s wird dabei jeweils um 1 erhöht, so daß nach wie vor
die Anzahl der a’s gleich der Anzahl der b’s ist. Das gleiche gilt auch für Regel 3. In Regel 4
werden zwei Worte w und u konkateniert. Hatten beide Worte jeweils die gleiche Anzahl von
a’s und b’s, so gilt dies dann auch für das Wort wu. Somit ist Satz 3.4 anwendbar, woraus
sich hier die gleiche Anzahl von a’s und b’s in jedem Wort von S ergibt. Das bedeutet aber
S ⊆ T.
Für den Nachweis der Inklusion T ⊆ S genügt die Anwendung des starken Induktionsprinzips. Die Details werden dem Leser als Übungsaufgabe empfohlen.
3.4 Rekursiv definierte Funktionen.
Eine der gängigen Methoden zur Definition einer mathematischen Funktion besteht darin,
explizit eine ’Formel’ oder eine ’Rechenvorschrift’ anzugeben. Man führt so beispielsweise
die Funktionen
√
f (x) = 1 + x2 oder g(x) = x3 + 4x2 − 8x + 1
ein. Allgemein schreibt man also f (x) = . . ., wobei anstelle der Punkte ein Term steht, in
dem x enthalten ist. Gelegentlich werden Funktionen auf den natürlichen Zahlen N aber
auch als sog. Zählfunktionen eingeführt. So gibt die Funktion
X
f (n) = |{ p | p ≤ n ∧ p ist Primzahl }| =
1
p∈P
p≤n
zu jeder natürlichen Zahl n die Anzahl der Primzahlen im Intervall [0; n] an. In der Zahlentheorie wird diese Funktion mit π(n) (anstelle von f (n)) bezeichnet. Funktionen f : A → B
wurden in Definition 2.4 als spezielle Relationen eingeführt. Funktionen kann man daher
auch als gewisse Teilmengen von A × B auffassen und entsprechend beschreiben. So stellt
z.B.
f = { (0, 0), (1, 1), (2, 4), (3, 9), (4, 16), . . . }
die Funktion f (n) = n2 mit Dom (f ) = N dar. Aber unabhängig von der Art der Beschreibung einer Funktion kamen bisher bei der Definition (also auf der rechten Seite des
Gleichheitszeichens) immer bereits bekannte Größen vor, deren Bedeutung von vorneherein
klar ist.
Manchmal erscheint aber f wieder als Teil der Definition rechts vom Gleichheitszeichen. Solche Definitionen scheinen vordergründig betrachtet unsinnig zu sein, denn um die Funktion f
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
63
zu verstehen, muß man die Definitionsvorschrift für f rechts vom Gleichheitszeichen verstehen. In dieser kommt aber wieder f vor, also muß man f eigentlich vorher schon verstanden
haben. Das scheint nicht möglich zu sein. Allerdings sind solche Definitionen nicht immer
unsinnig, sondern in manchen Fällen sogar viel kürzer als eine explizite Formel (falls es für
die Funktion f eine solche explizite Darstellung durch einen geschlossenen Term überhaupt
gibt). In der Tat kann man leicht unsinnige Definitionen konstruieren, wo f links und rechts
vom Gleichheitszeichen vorkommt und wodurch entweder keine Funktion beschrieben wird
oder sogar mehrere Funktionen gleichzeitig festgelegt werden. Letzteres ist natürlich auch
unerwünscht. In diesem Abschnitt soll geklärt werden, unter welchen Bedingungen durch
eine solche Art der Festlegung genau eine Funktion definiert wird. Zur Einführung in diese
Problematik werden einige Beispiele rekursiv definierter Funktionen vorgeführt.
1.) Die Fakultätsfunktion f acult : N → N kann durch
f acult (0)
f acult (n)
= 1
= n · f acult (n − 1)
für n ≥ 1
definiert werden. Statt f acult (n) schreibt man in der Mathematik üblicherweise n!. Eine
nicht rekursive Definition (also die explizite Angabe einer Rechenvorschrift) für die Fakultätsfunktion lautet
f acult (n) = 1 · 2 · 3 · · · · · n .
In vielen Anwendungen der Informatik erweist sich allerdings die rekursive Definition der
Fakultätsfunktion als nützlicher.
2.) Eine andere Definition einer rekursiven Funktion f : N → N ist
f (n) = f (n) .
Diese Vorschrift ist unsinnig, denn jede Funktion erfüllt diese Gleichung. Ebenso unsinnig
ist auch die Festlegung
f (n) = f (n) + 1 ,
denn keine Funktion erfüllt diese Gleichung. Auf den ersten Blick scheint auch die Definition
f (n) = 2 · f (n)
unsinnig zu sein, doch ist hierdurch überraschenderweise genau eine Funktion festgelegt,
nämlich die konstante Funktion f (n) = 0 (die sog. Nullfunktion).
Untersucht man noch einmal die rekursive Definition der Fakultätsfunktion genauer, so wird
ein Zusammenhang zwischen induktiv definierten Mengen und rekursiv definierten Funktionen klar. Denn konkrete Werte für f acult (also lediglich der Funktionswert für 0) sind genau
auf solchen Elementen natürlicher Zahlen definiert, die in Beispiel 3.4 durch eine Basisregel
als natürliche Zahl definiert werden. Werte, die durch eine rekursive Berechnung (also durch
wiederholte Anwendung von f acult auf kleinere Werte) bestimmt werden müssen, sind genau
diejenigen Zahlen, die im obigen Beispiel durch induktive Regeln in den natürlichen Zahlen
N vorkommen. Zu diesem Sachverhalt gibt es noch ein weiteres bekanntes Beispiel.
Beispiel 3.6 (Die Fibonacci - Zahlen)
Die Fibonacci - Zahlen werden durch die folgende Funktion

 0
1
f ib (n) =

f ib (n − 1) + f ib (n − 2)
f ib : N → N definiert:
für
für
für
n=0
n=1
n≥2
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
64
Hierbei wird eine weitere induktive Definition von N verwendet. Die Definition der Fibonacci
- Zahlen ist sinnvoll, denn man kann f ib (n) für jede natürliche Zahl n ausrechnen, indem
man alle vorausgegangenen Werte f ib (0) = 0 , f ib (1) = 1 , f ib (2) = 1 , . . . , f ib (n − 1)
bestimmt und anschließend die letzten beiden davon addiert. Für die Fibonacci - Zahlen ist
auch die Schreibweise F0 = 0, F1 = 1 sowie Fn = Fn−1 + Fn−2 für n ≥ 2 gebräuchlich. Die
ersten Fibonacci - Zahlen lauten:
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13
Fn 0 1 1 2 3 5 8 13 21 34 55 89 144 233
Es gibt auch eine explizite Formel zur Berechnung der Fibonacci - Zahlen:
√ n !
√ n 1
1− 5
1+ 5
Fn = √ ·
−
(n ≥ 0) .
2
2
5
Es wird nun eine allgemeine Beschreibung für die rekursive Definition einer Funktion gegeben, wenn der Definitionsbereich der Funktion selbst rekursiv bestimmt ist.
Definition 3.1 Es sei S eine induktiv definierte Menge und T eine weitere beliebige Menge.
Unter der rekursiven Definition einer Funktion f : S → T aufgrund der induktiven Definition von S versteht man die Festlegung der Funktion f nach dem folgenden Schema:
1.) Es existiert eine bereits bekannte Funktion h, so daß f (y) für jedes Element y, das aufgrund einer Basisregel in S vorkommt, durch f (y) = h(y) berechnet wird.
2.) Zu jeder induktiven Regel von S , in deren Hypothese m Elemente x0 , x1 , . . . , xm−1 vorkommen, existiert eine vollständig bekannte Funktion h : S × T m → T mit
f (y) = h(y, f (x0 ), f (x1 ), . . . , f (xm−1 )) .
(3.10)
Das Bild von y unter f bei jedem Element y, das aufgrund dieser induktiven Regel in S
vorkommt, wird dann mittels (3.10) bestimmt.
Bei der Fakultätsfunktion f acult : N → N greift man auf die erste rekursive Definition von
N in Beispiel 3.4 zu. Zur (einzigen) induktiven Regel, nämlich n − 1 ∈ N =⇒ n ∈ N, gehört
dann die Funktion h : N × N → N mit h(m1 , m2 ) = m1 m2 . Gemäß (3.10) (mit m = 1 und
x0 = y − 1) ist dann
f acult (y) = h(y, f acult (y − 1)) = y · f acult (y − 1) .
Bei der rekursiven Definition der Fibonacci - Zahlen f ib : N → N greift man auf die folgende
rekursive Definition von N zu:
0∈N,
1∈N,
( n − 2 ∈ N ∧ n − 1 ∈ N =⇒ n ∈ N ) .
Zu der (einzigen) induktiven Regel gehört dann die Funktion h : N × N × N → N mit
h(m1 , m2 , m3 ) = m2 + m3 . Bemerkenswert ist hierbei, daß die Funktion h von ihrem ersten
Argument m1 nicht explizit abhängt. In (3.10) wähle man nun m = 2, x0 = y − 1 und
x1 = y − 2. Dann kommt:
f ib (y) = h(y, f ib (y − 1), f ib (y − 2)) = f ib (y − 1) + f ib (y − 2) .
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
65
In den bisherigen Beispielen kamen nur rekursiv definierte Funktionen auf den natürlichen
Zahlen vor. In der Informatik hat man es jedoch auch mit anderen induktiv definierten
Mengen zu tun, über denen Funktionen definiert werden. Ein typisches Beispiel hierfür ist
die induktiv definierte Menge EXP aller arithmetischen Ausdrücke aus Beispiel 3.3. Über
EXP soll nun eine Funktion EV AL rekursiv definiert werden, die die Ausdrücke numerisch
auswertet. Sie soll also z.B. EV AL (3+7) = 10 liefern oder auch EV AL (2·x) = 22 ausgeben,
falls die Variable x mit dem Wert 11 belegt ist. Für das letzte Beispiel muß auf der Menge
V AR der Variablen in EXP bereits eine Funktion M EM angenommen werden, die für jedes
x ∈ V ar denjenigen Wert liefert, der unter der Adresse x gespeichert ist.
Beispiel 3.7 (Rekursive Definition einer Auswertefunktion)
Auf der Menge EXP der arithmetischen Ausdrücke wird eine Auswertefunktion EV AL folgendermaßen im Sinne von Definition 3.1 rekursiv definiert. Hierbei seien E, E1 , E2 ∈ EXP .
Den beiden Basisregeln für EXP entsprechen die beiden Festlegungen
1.
2.
EV AL (c) = c
EV AL (x) = M EM (x)
für alle c ∈ CON ST
für alle x ∈ V AR
Zu den sieben induktiven Regeln für EXP kommen die folgenden Festlegungen
3.
4.
5.
6.
7.
8.
9.
EV AL ((E))
= EV AL (E)
EV AL (+E)
= EV AL (E)
EV AL (−E)
= −EV AL (E)
EV AL (E1 + E2 ) = EV AL (E1 ) + EV AL (E2 )
EV AL (E1 − E2 ) = EV AL (E1 ) − EV AL (E2 )
EV AL (E1 ∗ E2 ) = EV AL (E1 ) ∗ EV AL (E2 )
EV AL (E1 /E2 )
= EV AL (E1 )/EV AL (E2 )
Auf die Problematik undefinierter Werte soll hier nicht eingegangen werden. Diese Probleme
treten z.B. bei der Division mit Null auf, also wenn in Regel 9 der Fall EV AL (E2 ) = 0
eintritt.
Viel bedeutsamer ist die Frage, wie nun mit Hilfe dieser Regeln konkrete Ausdrücke ausgewertet werden. Beispielsweise soll der Ausdruck 2 ∗ 3 + 4 ausgewertet werden. Dies kann
folgendermaßen geschehen:
EV AL (2 ∗ 3 + 4) = (Regel 6) EV AL (2 ∗ 3) + EV AL (4)
= (Regel 8) (EV AL (2) ∗ EV AL (3)) + EV AL (4) = (Regel 1) (2 ∗ 3) + 4 = 10 .
Aber auch eine andere Auswertung ist möglich:
EV AL (2 ∗ 3 + 4) = (Regel 8) EV AL (2) ∗ EV AL (3 + 4)
= (Regel 6) EV AL (2) ∗ (EV AL (3) + EV AL (4)) = (Regel 1) 2 ∗ (3 + 4) = 14 .
In dieses Dilemma sind wir geraten, weil es keine Vorschriften über die Auswertereihenfolge
gibt. Offensichtlich ist die Funktion EV AL durch die obigen Festlegungen nicht eindeutig
definiert! Oder anders ausgedrückt:
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
66
Es gibt mehrere Funktionen, die die rekursive Definition aus Beispiel 3.7 erfüllen.
Um diesen unerwünschten Effekt zu beseitigen, benötigt man ein Kriterium, durch das
gewährleistet ist, daß rekursiv auf induktiven Mengen definierte Funktionen eindeutig sind.
Im Beispiel der Auswertefunktion EV AL ist weniger die Definition von EV AL selbst Schuld
an ihrer Mehrdeutigkeit, sondern vielmehr die Definition der Menge EXP (in Beispiel 3.3).
Es gibt nämlich Elemente in EXP , die ihre Zugehörigkeit zu EXP durch mehrere Sequenzen von Regelanwendungen begründen können. Auch der Ausdruck 2 ∗ 3 + 4 gehört dazu.
Für diesen Term gibt es zwei verschiedene Zeile-für-Zeile - Beweise:
a)
b)
c)
d)
e)
Behauptung
2 ∈ EXP
3 ∈ EXP
4 ∈ EXP
2 ∗ 3 ∈ EXP
2 ∗ 3 + 4 ∈ EXP
Begründung
Regel 1.
Regel 1.
Regel 1.
Regel 8. und a) und b)
Regel 6. und c) und d)
a)
b)
c)
d)
e)
Behauptung
2 ∈ EXP
3 ∈ EXP
4 ∈ EXP
3 + 4 ∈ EXP
2 ∗ 3 + 4 ∈ EXP
Begründung
Regel 1.
Regel 1.
Regel 1.
Regel 6. und b) und c)
Regel 8. und a) und d)
und
Definition 3.2 (Die Bedingung der eindeutigen Lesbarkeit)
Eine induktiv definierte Menge S erfüllt die Bedingung der eindeutigen Lesbarkeit, wenn folgendes gilt:
1.
d.h. 2.
Für jedes Element x ∈ S gibt es genau eine Regel, die x ∈ S begründet.
Wenn ein Element aufgrund einer induktiven Regel in S ist, so gibt es genau
einen Zeile-für-Zeile - Beweis dafür.
Diese Bedingung der eindeutigen Lesbarkeit betrifft allerdings nur die Definition einer Menge, aber nicht die Menge selbst. So kann es durchaus sein, daß für eine Menge S eine Definition existiert, die die Bedingung der eindeutigen Lesbarkeit aus Definition 3.2 erfüllt, aber
es kann auch eine weitere Definition für S geben, die sie nicht erfüllt. Ein einfaches Beispiel
für diese Nichteindeutigkeit der Definition einer Menge kann man schon für die natürlichen
Zahlen N angeben:
1. 0 ∈ N
2. 1 ∈ N
3. n ∈ N =⇒ n + 1 ∈ N
Diese Definition erfüllt nun die Bedingung der eindeutigen Lesbarkeit im Gegensatz zu den
Definitionen von N im Beispiel 3.4 nicht mehr, denn die Zahl 1 gelangt nach N entweder
allein durch die zweite Regel oder durch die Anwendung der ersten Regel gefolgt von der
dritten Regel.
Die Bedeutung der Bedingung der eindeutigen Lesbarkeit bei der rekursiven Definition von
Funktionen wird durch den folgenden Satz ersichtlich, der ohne Beweis angeführt wird.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
67
Satz 3.5 Es sei S eine induktiv definierte Menge, für die eine induktive Definition existiert,
die die Bedingung der eindeutigen Lesbarkeit erfüllt. Dann stellt jede rekursive Funktionsdefinition auf Basis dieser induktiven Definition eine eindeutige Funktion dar.
Offensichtlich ist die Definition der Menge EXP der arithmetischen Ausdrücke in Beispiel 3.3
nicht eindeutig lesbar, denn anderenfalls wäre die Definition der Auswertefunktion EV AL
in Beispiel 3.7 eindeutig gewesen. Die eindeutige Lesbarkeit wird nämlich durch den Term
2 ∗ 3 + 4 verletzt. Dieser Term kann nämlich sowohl durch Regel 6 als auch durch Regel 8
erzeugt werden (man beachte jeweils die letzte Zeile e) in den obigen Tabellen!), wodurch
die eindeutige Lesbarkeit nicht mehr gegeben ist. Terme der Form 3 + 4 + 5 verstoßen gegen
die Bedingungen in Definition 3.2, denn der Ausdruck kann einerseits durch Anwendung der
Additions - Regel 6. in Beispiel 3.3 auf 2 + 3 und 4 in EXP erzeugt werden, andererseits
aber auch durch die Anwendung derselben Regel auf 2 und 3 + 4.
Jedoch ist jede rekursive Funktion, die auf Basis einer (eindeutig lesbaren) Definition von N
erklärt ist, eindeutig. Das gilt so insbesondere für die Funktionen f acult und f ib. Letztere
basiert auf der eindeutig lesbaren Definition
0∈N,
1∈N,
( n − 2 ∈ N ∧ n − 1 ∈ N =⇒ n ∈ N )
von N.
Abschließend werden noch drei Beispiele für eindeutig definierte rekursive Funktionen angeführt, die auf der Basis von eindeutig lesbaren Definitionen aus den Beispielen 3.4 und 3.5
erklärt sind.
Beispiel 3.8 (Eindeutig definierte rekursive Funktionen)
1.) Addition einer Zahl a ∈ N: Die Funktion adda : N → N ist definiert durch
adda (0)
=
adda (n + 1) =
a,
S(adda (n)) .
Hierbei bezeichnet S die sog. Nachfolgerfunktion S(m) = m + 1.
2.) Länge eines Wortes: Die Funktion |.| : A∗ → N ist definiert durch
0
falls v = ε
|v| =
|w| + 1 falls v = wx mit w ∈ A∗ ∧ x ∈ A
3.) Die Konkatenation concatu eines Wortes u ∈ A∗ mit einem beliebigen anderen Wort aus
A∗ : Die Funktion concatu : A∗ → A∗ ist definiert durch
u
falls v = ε
concatu (v) =
(concatu (w))x falls v = wx mit w ∈ A∗ ∧ x ∈ A
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
68
4 Ordnungen
In diesem letzten Kapitel soll nun eine weitere Klasse von Relationen untersucht werden. In
Abschnitt 2.4 wurden Relationen betrachtet, bei denen Mengen partitioniert wurden. Jetzt
geht es darum, die Elemente von Mengen mit Hilfe von Relationen zu ordnen. Es liegt auf
der Hand, daß es hierfür zahlreiche Anwendungen gibt. So sind die natürlichen Zahlen mittels der Vergleichsoperation ’≤’ geordnet, Buchstaben sind nach dem Alphabet geordnet,
Zeichenketten werden lexikographisch geordnet, usw. Andere wichtige Anwendungsmöglichkeiten von Ordnungsrelationen ergeben sich auch in der Programmierung.
4.1 Partielle und totale Ordnungen.
Der wesentliche Begriff dieses Kapitels wird in der folgenden Definition festgelegt.
Definition 4.1 (Partielle Ordnung)
Eine partielle Ordnung auf einer Menge A ist eine Relation R ⊆ A × A, die reflexiv, antisymmetrisch und transitiv ist. Dabei heißt eine Relation R antisymmetrisch, falls gilt:
(a, b) ∈ R ∧ (b, a) ∈ R
=⇒ a = b .
Das Paar (A, R) wird eine partiell geordnete Menge genannt.
Beispiel 4.1 Es sei S eine Menge. A = ℘(S) bezeichne die Potenzmenge von S. Auf A wird
die folgende Relation definiert:
(X, Y ) ∈ R
⇐⇒
X⊆Y .
Diese Teilmengenrelation ist eine partielle Ordnung, denn sie ist reflexiv (weil stets X ⊆ X
gilt), antisymmetrisch (denn aus X ⊆ Y ∧ Y ⊆ X folgt X = Y ) und transitiv (denn aus
X ⊆ Y ∧ Y ⊆ Z folgt X ⊆ Z - siehe auch Satz 1.5).
Die in diesem Beispiel angeführte Teilmengenrelation ist eine der wichtigsten partiellen Ordnungen. Weitere wichtige partielle Ordnungen sind die Teilerrelation und die Relation ’≤’ auf
den natürlichen Zahlen sowie die sog. Vererbungsrelation in der objektorientierten SoftwareEntwicklung. Im folgenden Beispiel wird die Menge aller partiellen Funktionen partiell geordnet.
Beispiel 4.2 Es bezeichne S die Menge aller partiellen Funktionen von A nach B. Dann
wird definiert:
f v g ⇐⇒
Dom (f ) ⊆ Dom (g) ∧
∀ x ∈ Dom (f ) : f (x) = g(x)
.
In Worten: Es ist f v g, wenn der Definitionsbereich von f vollständig von dem Definitionsbereich von g umfaßt wird und wenn auf dem Definitionsbereich von f die Funktionen f
und g auch übereinstimmen. Da partielle Funktionen als Teilmengen von A × B angesehen
werden können, kann man leicht nachweisen, daß die hier definierte Relation gleichbedeutend ist mit der Teilmengenrelation auf A × B (und damit auf den partiellen Funktionen).
Folglich ist (A
B, v) eine partiell geordnete Menge.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
69
Mit den sog. Hasse-Diagrammen werden partielle Ordnungen graphisch dargestellt. In einem
Hasse-Diagramm kommen alle Elemente aus A vor. Wenn nun R eine partielle Ordnung auf A
ist, so wird im Falle a 6= b und (a, b) ∈ R das a unter b gezeichnet und beide Elemente werden
durch eine Linie verbunden. Ist (a, b) 6∈ R, so fehlt die Verbindungslinie. Beispielsweise
betrachte man auf der Menge
M = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
(4.1)
die Teilerrelation δM (vgl. Beispiel 2.4):
δM = {(a, b) ∈ M × M | a ist ein Teiler von b} .
(4.2)
Im zugehörigen Hasse-Diagramm steht die 1 zuunterst, die Primzahlen 2,3,5,7,11 stehen
darüber, die Zahlen 4,6,9,10 (mit je genau zwei Primteilern) folgen in der darüberliegenden
Zeile, und in der obersten Zeile stehen die Zahlen mit 3 Primteilern: 8 und 12.
In einer partiell geordneten Menge sind im allgemeinen nicht alle Elemente miteinander vergleichbar; d.h. nicht für jedes Paar von Elementen a, b ist entweder (a, b) ∈ R oder (b, a) ∈ R
garantiert. Beispielsweise ist bezüglich der Teilerrelation nicht jedes beliebige Paar (m, n)
von natürlichen Zahlen vergleichbar, denn es kann vorkommen, daß m weder ein Teiler von
n ist noch umgekehrt. Dies gilt z.B. für die Paare 2, 3 und 24, 25. Andere partiell geordnete
Mengen sind jedoch durch die Eigenschaft ausgezeichnet, daß je zwei Elemente in Relation
zueinander stehen, wie z.B. in (N, ≤). Hier kann man nämlich für zwei Zahlen immer entscheiden, daß die eine kleiner als die andere ist (oder umgekehrt). Das motiviert die folgende
Definition.
Definition 4.2 (Totale Ordnung, Kette)
Eine partiell geordnete Menge (M, R) heißt eine totale Ordnung, wenn neben den Eigenschaften der partiellen Ordnung zusätzlich gilt:
∀ (a, b) ∈ M × M : (a, b) ∈ R ∨ (b, a) ∈ R .
Solche Mengen (M, R) werden auch als Kette bezeichnet.
Ein typisches Beispiel für eine totale Ordnung ist die lexikographische Ordnung auf Zeichenketten. Nur wegen der totalen Ordnung auf den Zeichenketten ist es möglich, Telefonbücher
anzulegen und darin schnell einen gesuchten Namen zu finden. In der Programmiersprache
Java gibt es den Datentyp Comparable 1 , den jeder Typ besitzen sollte, auf dessen Elementen eine totale Ordnung existiert. Wenn man beispielsweise ein Alphabet A voraussetzt, das
selbst schon total geordnet ist (etwa durch eine ASCII-Codierung), so ist es leicht, diese
Ordnung auf die Menge A∗ der Wörter zu übertragen. Zu diesem Zweck wird die Ordnung
auf dem Alphabet A mit ≤ bezeichnet. Nun seien
v1 = xw1 ,
v2 = yw2
für w1 , w2 ∈ A∗ , x, y ∈ A
zwei Elemente aus A∗ . Nun wird die Relation ’’ auf A∗ definiert, indem für den Vergleich
von v1 und v2 miteinander auf die eben angeführte Gestalt zurückgegriffen wird:
1
Comparable = vergleichbar
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
70
Es ist v1 v2 genau dann, wenn . . .
• v1 = ε , oder
• x≤y
• x = y
∧
∧
x 6= y , oder
w1 w2 .
Die erste Bedingung besagt, daß das leere Wort vor jedem anderen Wort eingeordnet wird.
Diese lexikographische Ordnung ist ein weiteres Beispiel dafür, wie man von der rekursiven
Definition der Wörter A∗ Gebrauch macht (vgl. Beispiel 3.5).
4.2 Spezielle Elemente partiell geordneter Mengen.
Im vorigen Abschnitt wurde ein Ordnungsprinzip für Mengen eingeführt, das es erlaubt,
gewisse Elemente als kleiner oder größer als andere Elemente (im Sinne der Ordnungsrelation) anzusehen. In den folgenden Definitionen werden gewisse Elemente aufgrund der
Ordnungsrelation ausgezeichnet.
Definition 4.3 (Obere Schranken)
Es sei (M, R) eine partiell geordnete Menge und K eine Teilmenge von M , also K ⊆ M .
Eine obere Schranke von K ist ein Element s ∈ M , so daß gilt:
∀x ∈ K :
(x, s) ∈ R .
Die obere Schranke s liegt nicht notwendigerweise in K, ist aber mit allen Elementen aus K
vergleichbar.
Die durch die Teilerrelation aus (4.2) partiell geordnete Menge M aus (4.1) enthält die
Teilmengen K1 = {2, 3} und K2 = {2, 3, 5}. Aus dem Hasse-Diagramm für (M, δM ) entnimmt
man, daß sowohl 6 als auch 12 obere Schranken von K1 sind. Die Menge K2 hat keine oberen
Schranken, denn kein Element aus M ist simultan durch 2, 3 und 5 teilbar. An diesen
Beispielen sieht man ein, daß es mehrere Schranken oder aber auch keine obere Schranke
geben kann. Die beiden oberen Schranken 6 und 12 von K1 liegen beide selbst nicht in K1 .
Eine weitere Teilmenge von M ist K3 = {4, 8}. Hier ist 8 die einzige obere Schranke, die auch
selbst in K3 vorkommt. Solche oberen Schranken von K ⊆ M , die selbst in K liegen, heißen
größte Elemente. Entsprechend werden auch kleinste Elemente einer Menge K definiert:
Definition 4.4 (Kleinste und größte Elemente)
Es sei (M, R) eine partiell geordnete Menge und K eine Teilmenge von M , also K ⊆ M .
• Ein kleinstes Element (Minimum) ist ein Element s ∈ K, so daß (s, x) ∈ R für alle
Elemente x ∈ K gilt.
• Ein größtes Element (Maximum) ist ein Element s ∈ K, so daß (x, s) ∈ R für alle
Elemente x ∈ K gilt.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
71
Als ausgezeichnetes Beispiel betrachten wir den Spezialfall K = M einer durch die Inklusion
’⊆’ geordneten Potenzmenge ℘(M ) einer Menge M : Die partiell geordnete Menge (℘(M ), ⊆)
hat die leere Menge ∅ als kleinstes Element und die Menge M selbst als größtes Element. Das
obige Beispiel der Teilerrelation hat uns schon gezeigt, daß Mengen nicht zwingend immer
ein größtes (oder kleinstes) Element besitzen. Ein anderes Beispiel für diesen Umstand ist
die folgende Teilmenge K der rationalen Zahlen Q:
K = {x ∈ Q : 0 < x < 1} .
Als Teilmenge der partiell geordneten Menge (Q, ≤) besitzt K weder ein kleinstes noch
ein größtes Element, denn unterhalb jeder positiven rationalen Zahl existiert eine weitere
positive rationale Zahl, und ebenso gibt es oberhalb jeder rationalen Zahl < 1 noch eine
weitere rationale Zahl unterhalb 1.
Unter allen Elementen einer Menge von oberen bzw. unteren Schranken sind (im Falle ihrer
Existenz) wieder gewisse Elemente ausgezeichnet:
Definition 4.5 (Kleinste obere und größte untere Schranke)
Es sei (M, R) eine partiell geordnete Menge und K eine Teilmenge von M , also K ⊆ M .
• K besitzt eine kleinste obere Schranke (Supremum), falls die Menge
K s = {x ∈ M | x ist obere Schranke von K}
ein kleinstes Element besitzt. Falls ein solches Element existiert, wird es mit lub (K)
bezeichnet (’least upper bound’).
• K besitzt eine größte untere Schranke (Infimum), falls die Menge
Ks = {x ∈ M | x ist untere Schranke von K}
ein größtes Element besitzt. Falls ein solches Element existiert, wird es mit glb (K)
bezeichnet (’greatest lower bound’).
Weder die kleinste obere noch die größte untere Schranke von K liegt zwingend in K
selbst, kann aber in K vorkommen.
Eine Menge K kann höchstens eine kleinste obere Schranke haben (und entsprechend auch
nur höchstens eine größte untere Schranke), denn gäbe es zwei solche Elemente l1 und l2 als
kleinste obere Schranken von K, so hätte die oben definierte Menge K s eben diese Elemente l1 und l2 als kleinste Elemente. Die Definition von kleinsten Elementen (Definition 4.4)
besagt einerseits, daß l1 und l2 beide in K s enthalten sind. Andererseits gilt (l1 , x) ∈ R für
jedes x ∈ K s , speziell für x = l2 bedeutet das (l1 , l2 ) ∈ R. Ebenso ist (l2 , x) ∈ R für jedes
x ∈ K s , speziell für x = l1 also (l2 , l1 ) ∈ R. Die Antisymmetrie der Relation R erzwingt
dann l1 = l2 , womit die Eindeutigkeit der kleinsten oberen Schranke von K (im Falle ihrer
Existenz) nachgewiesen ist. Außerdem beachte man, daß alle Elemente y aus K s zu dem
kleinsten Element x0 von K s in der Relation (x0 , y) ∈ R stehen; entsprechend hat man
(y, x1 ) ∈ R für alle Elemente y ∈ Ks und für das größte Element x1 in Ks (siehe Definition
4.4).
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
72
Beispiel 4.3 Wir untersuchen die Menge (N, δN ), also die Teilerrelation auf den natürlichen
Zahlen. Für zwei beliebig gewählte natürliche Zahlen m und n mit m 6= n sollen lub (K) und
glb (K) für die Menge K = {m, n} bestimmt werden. Für glb (K) muß unter allen Zahlen x,
die sowohl Teiler von m als auch von n sind, eine größte gesucht werden. Gesucht ist also ein
größter gemeinsamer Teiler von m und n. Diese Zahl existiert stets und wird mit ggT (m, n)
bezeichnet. So ist etwa ggT (12, 8) = 4. Wir haben also ggT (m, n) = glb (K). Entsprechend
ist lub (K) das kleinste gemeinsame Vielfache von m und n, das auch mit kgV (m, n) notiert
wird: lub (K) = kgV (m, n). Der ggT und das kgV können auch für (endlich viele) Zahlen
m1 , m2 , . . . , mk erklärt werden.
Es bezeichne M eine beliebige Menge. Mit der im folgenden beschriebenen Konstruktion wird
M mit einer einfachen, aber für die Programmierung wichtigen partiellen Ordnung versehen.
Ist nämlich ⊥ ∈
/ M irgendein (nicht zu M gehörendes) Element, so wird zunächst die Menge
M ⊥ = M ∪ {⊥}
(4.3)
eingeführt.
Definition 4.6 (Flache partielle Ordnung)
Unter der flachen partiellen Ordnung auf der Menge M ⊥ versteht man die folgende Relation:
a b ⇐⇒ (a = ⊥ ∨ a = b) .
Man prüft leicht nach, daß es sich hierbei tatsächlich um eine partielle Ordnung handelt. In
den Anwendungen der Programmierung spielt das Element ⊥ die Rolle des Undefinierten
oder einer Fehlersituation, wenn Operationen auf der Menge M ausgeführt werden. Ist etwa
M die endliche Menge M = {1, 2, 3, 4}, so wird die zugehörige flache partielle Ordnung
durch ein Hasse-Diagramm beschrieben, in dem das Element ⊥ zuunterst steht und mit
allen anderen Elementen 1,2,3,4, die nebeneinander in einer Zeile vorkommen, durch eine
Linie verbunden ist.
4.3 Funktionen auf partiell geordneten Mengen.
In der Informatik (und in anderen Gebieten der Mathematik) ist es üblich, den Begriff
Morphismus für eine Abbildung f : A → B zu benutzen, wenn f nicht nur von A nach B
abbildet, sondern auch noch strukturinvariant ist. Was bedeutet das? Mittels partiellen Ordnungen wird Mengen eine gewisse Struktur verliehen (die man z.B. durch Hasse-Diagramme
visualisieren kann). Nun ist es oft wünschenswert, daß eine Abbildung zwischen zwei partiell geordneten Mengen diese Ordnungsstrukturen bewahrt. Diese Eigenschaft wird in der
folgenden Definition präzisiert.
Definition 4.7 (Morphismus, monotone Abbildung, Isomorphismus)
Ein Morphismus zwischen zwei partiell geordneten Mengen (M1 , R1 ) und (M2 , R2 ) ist eine
Funktion f : M1 → M2 , für die zusätzlich
(x, y) ∈ R1
=⇒
(f (x), f (y)) ∈ R2
gilt. Ein Morphismus wird auch als eine monotone Abbildung bezeichnet. Ist f zusätzlich
bijektiv, so nennt man f auch einen Isomorphismus.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
73
Ein Beispiel für einen solchen Morphismus ist die Funktion f : (−π/2; +π/2) → R mit
f (x) = tan(x); dabei ist der Bild- und Urbildbereich mit der Relation ’≤’ versehen. Die
monotonieerhaltende Eigenschaft des Tangens mache man sich an seinem Graphen klar!
Ein anderes Beispiel für einen Morphismus ist die Funktion c1 : A+ → A, die den ersten
Buchstaben eines (nichtleeren) Wortes zurückgibt, wenn A mit einer Ordnung R und A+ mit
der auf R basierenden lexikographischen Ordnung versehen ist (vgl. das Beispiel im Anschluß
an Definition 4.2). Für die Programmierung ist die folgende Anwendung wichtig.
Beispiel 4.4 (Strikte Funktionen)
Es seien M ⊥ und N ⊥ zwei Mengen mit den jeweiligen flachen partiellen Ordnungen. Eine
Funktion f : M ⊥ → N ⊥ heißt strikt, wenn
f (⊥) = ⊥
(4.4)
ist. Man prüft leicht nach, daß eine strikte Funktion monoton (also ein Morphismus) ist:
Sind nämlich m, n ∈ M ⊥ mit m n (im Sinne der flachen partiellen Ordnung), so werden
bzgl. m zwei Fälle unterschieden. Ist erstens m = ⊥ (in M ⊥ ), so erzwingt die Striktheit von
f in (4.4) dann f (m) = ⊥ (in N ⊥ ). Gemäß Definition 4.6 der flachen partiellen Ordnung
gilt deshalb f (m) f (n) (in N ⊥ ), unabhängig vom Wert f (n). Zweitens kann der Fall
m = n aufgrund von m n eintreten. Hieraus folgt aber f (m) = f (n), und so ergibt die
flache partielle Ordnung in N ⊥ dann wiederum f (m) f (n). In beiden Fällen ist also
f (m) f (n) nachgewiesen.
In dem folgenden Satz wird eine partielle Ordnung auf Funktionen konstruiert.
Satz 4.1 (Partielle Ordnung auf totalen Funktionen)
Es seien (M1 , R1 ) und (M2 , R2 ) zwei partiell geordnete Mengen. Dann kann die Menge F
aller totalen Funktionen, die M1 nach M2 abbilden, mit einer partiellen Ordnung R ⊆ F × F
versehen werden:
(f1 , f2 ) ∈ R ⇐⇒
∀ a ∈ M1 : (f1 (a), f2 (a)) ∈ R2 .
Der einfache Beweis dieser Aussage sei dem Leser überlassen. Da bei der in diesem Satz
eingeführten Ordnung die Funktionen f1 und f2 genau dann gemäß (f1 , f2 ) ∈ R geordnet
sind, wenn die entsprechende Relation elementweise gemäß (f1 (a), f2 (a)) ∈ R2 bzgl. R2 gilt,
wird die Relation R auch mit R2 bezeichnet. Da die Definition der partiellen Ordnung auf
F × F den Allquantor ∀ a ∈ M1 verwendet, wurden totale Funktionen zugrundegelegt.
In der Praxis macht es oft keinen Unterschied, ob man partielle Funktionen betrachtet, die
auf einer gewissen Teilmenge U des Urbildbereiches M nicht erklärt sind, oder ob man es
mit totalen Funktionen auf M ⊥ zu tun hat, die für x ∈ U den Wert f (x) = ⊥ annehmen.
Beide Betrachtungsweisen sind prinzipiell gleichwertig. Das begründet der folgende Satz.
Satz 4.2 Die Menge A
B sei mit der aus Beispiel 4.2 bekannten partiellen Ordnung v
versehen. Ferner sei die Menge der strikten Funktionen
{ g : A⊥ → B ⊥ | g ist eine strikte Funktion }
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
74
mit der in Satz 4.1 erklärten Ordnung R versehen. Die dabei in Satz 4.1 verwendeten Ordnungen R1 und R2 sind die jeweiligen flachen partiellen Ordnungen in A⊥ und B ⊥ .
Dann gibt es einen Isomorphismus zwischen den Mengen A
B und
{ g : A⊥ → B ⊥ | g ist eine strikte Funktion }.
Die grundlegende Idee im Beweis dieses Satzes besteht in der Konstruktion einer bijektiven
Abbildung φ, die jeder partiellen Funktion f : A
B eine gewisse strikte Funkion g :
⊥
⊥
A → B zuordnet und zudem die jeweiligen Ordnungen erhält. Wir geben nur eine solche
Abbildung an und überlassen dem Leser den Nachweis ihrer geforderten Eigenschaften. Es
ist ziemlich naheliegend, die folgende Funktion φ zu wählen:
f (a) falls a ∈ Dom (f )
φ(f )(a) =
(4.5)
⊥
falls a 6∈ Dom (f ) ∨ a = ⊥
Satz 4.2 zeigt, daß man im Software-Engineering bei Funktionen nicht mehr unterscheiden
muß zwischen Eingaben, bei denen die Funktionen keine sinnvollen Resultate liefern (also für
diese Eingaben nicht definiert sind) und solchen Eingaben, für die ⊥ ausgegeben wird. Dies ist
auch folgerichtig, denn ein Programm, das etwa bei einer Division durch Null einfach seinen
Geist aufgibt, ist wenig praktikabel. Vielmehr sind Programme erwünscht, die im Fehlerfall
zumindest melden, daß ein Fehler aufgetreten ist - und diese Meldung sollte möglichst auch
noch verständlich an der Schnittstelle zum Benutzer bekanntgegeben werden. Insofern ist
es sinnvoll, partielle Funktionen im Software-Engineering gar nicht mehr zu betrachten und
immer mit totalen (aber strikten) Funktionen zu arbeiten. Satz 4.2 begründet, warum man
das auch immer tun darf.
In der folgenden Definition wird eine spezielle Teilmenge von partiell geordneten Mengen
beschrieben.
Definition 4.8 (Vollständig partiell geordnete Mengen)
Eine vollständig partiell geordnete Menge ist eine partiell geordnete Menge (M, R) mit den
folgenden zusätzlichen Eigenschaften:
• M besitzt ein kleinstes Element.
• Jede Kette in M besitzt eine kleinste obere Schranke.
Es wird nun vereinbart, daß das kleinste Element solcher vollständig partiell geordneter
Mengen (in der Programmierung) immer mit ⊥ bezeichnet wird. Im folgenden wird außerdem
die Kurzschreibweise ’vpg-Menge’ bzw. ’pg-Menge’ für eine ’vollständig partiell geordnete
Menge’ bzw. eine ’partiell geordnete Menge’ verwendet.
Die einfachsten vpg-Mengen sind die Mengen, auf denen die flache partielle Ordnung definiert
ist (vgl. Definition 4.6). Das kleinste Element in (M, ) ist das Element ⊥. Außerdem besitzt
jede Kette eine kleinste obere Schranke, denn aufgrund der Definition von haben alle
Ketten die Gestalt K = {⊥, x} mit x ∈ M ⊥ . Für diese Ketten ist lub (K) = x.
Es folgt ein weiteres wichtiges Beispiel.
Beispiel 4.5 Die in Beispiel 4.2 eingeführte und untersuchte pg-Menge (A
B, v) ist sogar eine vpg-Menge. Das kleinste Element ist offensichtlich die leere Funktion ∅ : A
B.
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
75
Um die zweite Eigenschaft für Ketten aus A
B in der Definition von vpg-Mengen nachzuweisen, wird eine beliebige Kette K ⊆ A
B solcher partieller Funktionen untersucht. Eine
kleinste obere Schranke g dieser Kette K muß eine Funktion sein, deren Definitionsbereich
sämtliche Definitionsbereiche aller Funktionen f ∈ K umfaßt. Außerdem erzwingt die Ordnung v in der Kette, daß die Identitäten g(x) = f (x) für alle x in diesem Definitionsbereich
und alle Funktionen f der Kette bestehen, die in x definiert sind. Für den Definitionsbereich
D = Dom (g) der gesuchten Funktion g ist also der Ansatz
[
D =
{Dom (f ) | f ∈ K}
(4.6)
sinnvoll. Nun sei x ∈ D. Somit existiert nach (4.6)eine Funktion f ∈ K, für die f (x)
definiert ist. Dann setzen wir g(x) := f (x). Zunächst muß man sich überlegen, daß die
Funktion g auf diese Weise wohldefiniert ist 2 , d.h. g(x) ist durch die obige Festlegung
eindeutig bestimmt. Hierzu seien f1 und f2 zwei Funktionen der Kette K, die beide in x
definiert sind. Aufgrund der Ketteneigenschaften von K hat man dann entweder f1 v f2
oder f2 v f1 . In beiden Fällen stimmen dann aber die Funktionen f1 , f2 auf der kleineren
Menge der beiden Mengen Dom (f1 ) und Dom (f2 ) überein. Zu dieser kleineren Menge gehört
in jedem Fall x, und so ist g(x) = f1 (x) = f2 (x). Das beweist die Eindeutigkeit der Festlegung von g. Es bleibt dem Leser überlassen, für jede obere Schranke h von K die Relation
g v h nachzuweisen und damit die Eigenschaft g = lub (K) zu begründen.
In diesem Zusammenhang wird noch ein weiteres nützliches Resultat angeführt.
Satz 4.3 (Die Produktordnung)
Es seien (M1 , R1 ), . . . , (Mn , Rn ) pg-Mengen (bzw. vpg-Mengen). Auf der Menge M = M1 ×
M2 × · · · × Mn wird nun mittels
(x1 , x2 , . . . , xn ), (y1 , y2 , . . . , yn ) ∈ R ⇐⇒ ∀ i ∈ {1, 2, . . . , n} : (xi , yi ) ∈ Ri
eine Relation R ⊆ M × M definiert. Dann ist R gleichfalls eine partielle Ordnung und
M wird durch diese Relation zu einer pg-Menge (bzw. zu einer vpg-Menge). Diese partielle
Ordnung heißt auch Produktordnung.
Es wird nun ein weiterer zentraler Begriff eingeführt. Hierzu sei X ⊂ A und f : A → B
eine (totale) Funktion. Mit f (X) werden alle Elemente in B bezeichnet, die als Bild eines
Elementes aus X unter f vorkommen:
f (X) = { f (x) | x ∈ X } .
(4.7)
Definition 4.9 (Stetigkeit)
Es sei (M1 , R1 ) eine vpg-Menge und (M2 , R2 ) eine pg-Menge. Eine Funktion f : M1 → M2
heißt stetig, wenn für jede Kette K ⊆ (M1 , R1 ) folgendes gilt: lub (f (K)) existiert in M2 ,
und
f (lub (K)) = lub (f (K)) .
(4.8)
Hierbei existiert lub (K) wegen der vpg-Eigenschaft von M1 .
2
g(x) darf nicht von der Wahl der speziellen Funktion f abhängen!
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
76
Mit anderen Worten:
Eine Funktion ist stetig, wenn sie kleinste obere Schranken wieder auf kleinste obere
Schranken abbildet.
Achtung: Der in der vorigen Definition eingeführte Stetigkeitsbegriff unterscheidet sich allerdings von dem in der Analysis gebräuchlichen Stetigkeitsbegriff.
Man kann leicht zeigen, daß jede stetige Funktion f : M1 → M2 auch ein Morphismus ist:
Hierzu sei gemäß Definition 4.7 (x, y) ∈ R1 . Dann ist offensichtlich K = {x, y} eine Kette in
M1 mit lub (K) = y. Aus der vorausgesetzten Stetigkeit von f : M1 → M2 folgert man dann
f (y) = f (lub (K)) = lub (f (K)) = lub ({f (x), f (y)}) .
Dies bedeutet, daß f (y) bzgl. der Relation R2 das größere der beiden Elemente f (x) und
f (y) ist, oder (f (x), f (y)) ∈ R2 . Das war zu zeigen.
Allerdings ist nicht jeder Morphismus auch stetig, wie das folgende Beispiel zeigt. Hierzu
werden die natürlichen Zahlen N um ein weiteres Element ∞ ergänzt. Anschließend wird auf
N∞ = N ∪ {∞} eine partielle Ordnung R definiert:
(x, y) ∈ R ⇐⇒
x ≤ y (mit x, y ∈ N) ∨ y = ∞ .
Mit dieser partiellen Ordnung ist N∞ eine vpg-Menge, denn 0 ∈ N∞ ist kleinstes Element
und jede Kette K hat eine kleinste obere Schranke. Denn entweder ist die Kette endlich,
dann ist das größte Element gleich lub (K), oder K ist unendlich, dann hat man lub (K) =
∞. Man beachte, daß in einer endlichen Kette ∞ vorkommen kann (K = {1, 2, 3, ∞} mit
lub (K) = ∞) , während es in einer unendlichen Kette fehlen kann (K = {2, 4, 6, 8, 10, . . . }
mit lub (K) = ∞).
Die Funktion f : N∞ → {0, 1} sei durch
0 falls n ∈ N
f (n) =
1 falls n = ∞
definiert. Hierbei ist der Bildbereich {0, 1} mit der ’≤’ - Relation geordnet. f ist offensichtlich
ein Morphismus, aber nicht stetig. Letzteres sieht man ein, wenn man N der Abbildung f
unterwirft:
lub (f (N)) = lub ({0}) = 0 6= 1 = f (∞) = f (lub (N)) .
Nun wird ein zentrales Resultat vorgestellt, das in der Informatik im Bereich der Prüfung von
Programmen auf Korrektheit wesentliche Bedeutung gewonnen hat. Man verwendet dieses
Resultat, um weitreichende Aussagen über die Korrektheit solcher Programme zu treffen, in
denen Funktionen rekursiv definiert werden.
Satz 4.4 (Über kleinste Fixpunkte stetiger Funktionen)3
Es sei (M, R) eine vpg-Menge mit ⊥ ∈ M und (⊥, x) ∈ R für alle x ∈ M . Ferner sei
f : M → M eine stetige Funktion. Dann besitzt die Menge
fix (f ) = {x ∈ M | f (x) = x}
3
Fixpunktsatz von Stephen Kleene, amerikanischer Logiker, 1909 - 1994
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
77
ein kleinstes Element, das durch die kleinste obere Schranke der Menge
K = {⊥, f (⊥), f 2 (⊥), f 3 (⊥), . . . }
gegeben ist.
Hierbei bezeichnet f n die n-fach iterierte Funktion f :
f n = f ◦ f ◦ · · · ◦ f . Im Satz wird
|
{z
}
n
also behauptet, daß
min fix (f ) = lub(K) .
Beweis: Es wird hier neben der Schreibweise (x, y) ∈ R auch die gleichbedeutende Notation
x y verwendet.
Zunächst wird gezeigt, daß die Elemente in K eine Kette bilden und lub (K) überhaupt
existiert. Weil f stetig ist, ist f nach den obigen Ausführungen auch ein Morphismus. Aus
der Minimalität von ⊥ ergibt sich:
∀x ∈ M :
⊥ x,
speziell für x = f (⊥) ∈ M ist dann ⊥ f (⊥). Jetzt wird mehrfach ausgenutzt, daß f
ein Morphismus ist: Aus ⊥ f (⊥) erhält man sukzessive f (⊥) f 2 (⊥), f 2 (⊥) f 3 (⊥),
f 3 (⊥) f 4 (⊥), usw. Insgesamt ist so
⊥ f (⊥) f 2 (⊥) f 3 (⊥) · · ·
gezeigt, was bedeutet, daß K eine Kette ist. Da M als vollständige pg-Menge vorausgesetzt
ist (Definition 4.8), besitzt K eine kleinste obere Schranke
x0 = lub (K) .
(4.9)
lub (f (K)) = lub (K) .
(4.10)
Wir zeigen nun:
Hierzu werden zwei Fälle unterschieden.
1.Fall: f (⊥) 6= ⊥.
Dann ist wegen f (K) = {f (⊥), f 2 (⊥), f 3 (⊥), . . . } = K \ {⊥}, und daraus ergibt sich sofort
(4.10).
2.Fall: f (⊥) = ⊥.
Dann hat man K = {⊥}, f (K) = {⊥}, mithin lub (f (K)) = ⊥ = lub (K). Das ist wieder
(4.10).
Unter Anwendung von (4.9), (4.10) und der Stetigkeit von f ergibt sich nun:
f (x0 ) = f (lub (K)) = lub (f (K)) = lub (K) = x0 .
Damit ist gezeigt, daß x0 ein Fixpunkt von f ist. Jetzt muß noch bewiesen werden, daß x0
auch der kleinste Fixpunkt von f ist. Dazu sei y ein weiterer beliebiger Fixpunkt von f .
Zunächst wird für y mit dem Prinzip der einfachen Induktion die Aussage
∀ n ∈ N : (f n (⊥), y) ∈ R
(4.11)
FHDW Hannover - Mathematik, Teil I - Prof.Dr.C.Elsner
78
bewiesen.
Induktionsanfang: n = 0. Wegen f 0 (⊥) = ⊥ ist die Aussage (f 0 (⊥), y) = (⊥, y) ∈ R
richtig.
Induktionsannahme: Es gelte (f n−1 (⊥), y) ∈ R für ein n > 0.
Induktionsschluß: Unter Ausnutzung der Induktionsannahme, der Morphismus-Eigenschaft
von f und der Tatsache, daß y ein Fixpunkt von f ist, ergibt sich nacheinander:
(f n−1 (⊥), y) ∈ R ⇒ (f (f n−1 (⊥)), f (y)) ∈ R ⇒ (f n (⊥), f (y)) ∈ R ⇒ (f n (⊥), y) ∈ R .
Damit ist (4.11) bewiesen. Also ist (x, y) ∈ R für alle Elemente x ∈ K. Das erweist y als eine
obere Schranke von K. Nun ist aber x0 gemäß (4.9) die kleinste obere Schranke von K. Es ist
dann (x0 , y) ∈ R (vgl. die Bemerkung im Anschluß an Definition 4.5: alle oberen Schranken
von K sind mit der kleinsten oberen Schranke vergleichbar). Da y nach Voraussetzung auch
ein beliebiger Fixpunkt von f ist, ist somit gezeigt, daß x0 der kleinste Fixpunkt von f ist.