Elementarmathematik

Elementarmathematik
Im Sommersemester 2012 hat Steffen Fröhlich die Vorlesung Elementarmathematik an der Universität Mainz gehalten und ein Skript dazu geschrieben. Für
die Vorlesung Elementarmathematik im Sommersemester 2013 hat Alan Rendall dieses Skript nach seinem Geschmack abgeändert. Der vorliegende Text
ist das Ergebnis. Die Abschnitte 2-7 basieren auf dem Text von Fröhlich. Die
Hauptquelle für die Abschnitte 9 und 10 ist das Buch von Clark und Holton [1].
Die Hauptquelle für den Abschnitt 11 ist das Buch von Feller [2].
1
Einleitung
Im Buch ’Virus Dynamics’ von M. Nowak und R. May findet man das Zitat:
... mathematics is no more, but no less, than a way of thinking clearly [3].
(... die Mathematik ist nichts mehr, aber nichts weniger, als eine Art, klar zu
denken.)
Wenn wir diese Art zu denken gut beherrschen, dann haben wir etwas, was uns
in vielen Lebenslagen helfen kann. Ausserdem ist die Mathematik an und für
sich schön. Diese Vorlesung soll den Hörern wichtige Aspekte der Mathematik
nahebringen, die praktisch eingesetzt werden können und hoffentlich auch etwas
von der Schönheit des Fachs vermitteln.
2
Zahlen
Wer an Mathematik denkt, denkt sofort an Zahlen. Zahlen spielen in der Tat
eine zentrale Rolle in der Mathematik und in dieser Vorlesung sind sie unser erstes Thema. Es gibt verschiedene Arten von Zahlen und diese möchten wir Revue passieren lassen. Es gibt natürliche Zahlen, ganze Zahlen, rationale Zahlen,
reelle Zahlen und komplexe Zahlen. Jetzt wird beschrieben, was diese unterschiedlichen Arten von Zahlen sind und was man damit machen kann.
Die einfachsten Zahlen sind die natürlichen Zahlen
{1, 2, 3, 4, . . .},
(1)
die Zahlen, die wir in der Kindheit kennenlernen. Die Menge der natürlichen
Zahlen wird mit N bezeichnet. Wenn a und b natürliche Zahlen sind, dann
1
sind die Summe a + b und das Produkt ab auch natürliche Zahlen. Im Rahmen
der natürlichen Zahlen können wir aber nicht immer subtrahieren. Z.B. gibt es
2 − 3 nicht als natürliche Zahl. Anders gesagt, gibt es keine natürliche Zahl a
mit der Eigenschaft, dass 3 + a = 2. Die Lösung dieses Problems ist schon lange
bekannt. Wir können die Null einführen (wie es schon die alten Inder getan
haben) und die negativen Zahlen. Dann können wir 2 − 3 = −1 schreiben.
Wenn die natürlichen Zahlen durch die Null und die negativen Zahlen
{−1, −2, −3, −4, . . .},
(2)
erweitert werden, dann bekommen wir die ganzen Zahlen. Die Menge der ganzen
Zahlen wird mit Z bezeichnet. Im Rahmen der ganzen Zahlen ist die Subtraktion ohne Einschränkung möglich. Wenn a und b ganze Zahlen sind, dann ist
a − b immer sinnvoll. Durch eine Erweiterung des Zahlensystems haben wir uns
mehr Möglichkeiten geschaffen. Addition und Multiplikation sind immer noch
möglich, so dass durch die Erweiterung nichts verlorengegangen ist. Einige Autoren rechnen die Null zu den natürlichen Zahlen. Diese Alternative übernehmen
wir hier nicht. Wir bezeichnen die Menge der natürlichen Zahlen mit der Null
dazu als N0 , d.h. N0 = N ∪ {0}.
Im Rahmen der ganzen Zahlen ist die Division nur begrenzt möglich. Z.B.
gibt es 32 nicht als ganze Zahl. Es gibt keine ganze Zahl a mit der Eigenschaft dass 3a = 2. Diese Einschränkung kann aufgehoben werden in dem wir
die ganzen Zahlen durch die Brüche erweitern. Die Brüche, einschliesslich der
ganzen Zahlen heissen rationale Zahlen. Das Wort ’rational’ hier soll nicht
als ’vernünftig’ interpretiert werden sondern kommt vom lateinischen ’ratio’
(Verhältnis). Die Menge der rationalen Zahlen wird mit Q bezeichnet. (Q
steht für Quotienten.) Die bekannten Regeln der Bruchrechnung erlauben es im
Rahmen der rationalen Zahlen die vier Grundrechenarten ohne Einschränkung
auszuführen bis auf die Tatsache, dass die Division durch Null nicht definiert
ist. Zusammenfassend, haben wir jetzt drei Zahlenarten N, Z, Q eingeführt mit
N ⊂ Z ⊂ Q.
Es gibt noch eine weitere Klasse von Zahlen, die sehr wichtig sind, die reellen
Zahlen,
√ die mit R bezeichnet werden. Ausser den rationalen Zahlen enthalten sie
z. B. 2 und die Kreiszahl π. Diese Zahlen sind notwendig für die Anwendungen
der Mathematik in den Naturwissenschaften und, innerhalb der Mathematik,
auf die Geometrie. Sie werden gebraucht, um die diagonale des Quadrats mit
Seitenlänge Eins oder den Umfang des Kreises mit Radius Eins auszudrücken.
Diese Zahlen sind keine rationalen Zahlen (was nicht offensichtlich ist). Auf diese
Dinge gehen wir später genauer ein. Die reellen Zahlen, die keine rationalen
Zahlen sind, heissen irrationale Zahlen.
Selbst innerhalb der reellen Zahlen hat die Gleichung z 2 = −1 keine Lösung.
Um dieses Problem zu umgehen führt man eine Grösse i ein, die imaginäre
Einheit, mit der Eigenschaft i2 = −1. Es gilt auch (−i)2 = −1. Dann hat
unsere Gleichung zwei Lösungen. Man kann eine Klasse von Zahlen definieren,
die komplexen Zahlen, die auch i enthält. Sie wird mit C bezeichnet. Die
Zahlen der Form ai mit a reell heissen imaginär und die Bezeichnung ’reelle
2
Zahlen’ entstand als Gegensatz zum Begriff ’imaginäre Zahlen’.
2.1
Die reellen Zahlen
Wir haben jetzt von den reellen Zahlen gesprochen, nicht aber genau gesagt, was
sie sind. Ein anschauliches Bild der reellen Zahlen wird durch die Zahlengerade gegeben. Betrachten wir eine Gerade auf dem ein Punkt (der Ursprung)
ausgezeichnet wird. Eine Richtung auf der Gerade wird als positiv deklariert.
Z. B. wird oft eine waagerechte Gerade genommen und die positive Richtung
als ’nach rechts’ gewählt. Der Ursprung wird mit der Zahl Null identifiziert.
Eine positive Zahl a wird mit dem Punkt identifiziert, der in positiver Richtung
im Abstand a zum Ursprung liegt. Eine negative Zahl a wird mit dem Punkt
identifiziert, der in negativer Richtung im Abstand −a zum Ursprung liegt. Auf
diese Weise bekommt insbesondere jede rationale Zahl eine Darstellung auf der
Zahlengerade. Wie schon angedeutet entsprechen aber nicht alle Punkte auf der
Gerade rationalen Zahlen.
Es ist relativ kompliziert, eine präzise und vollständige Definition der reellen
Zahlen zu geben und eine solche Definition kann im Rahmen dieser Vorlesung
nicht gebracht werden. Ein wesentlicher Umstand ist dass die rationalen Zahlen
in den reellen Zahlen dicht liegen. Das heisst, dass wenn a eine reelle Zahl
ist und > 0 es eine rationale Zahl b gibt, so dass |a − b| < . Man kann
eine reelle Zahl beliebig gut durch rationale Zahlen approximieren. Praktische
Messungen in der realen Welt haben nur eine endliche Genauigkeit. Wenn wir
die Länge eines Stabs messen wird das Ergebnis immer nur mit endlich vielen
Dezimalstellen angegeben. Das heisst, das Ergebnis ist eine rationale Zahl. Die
reellen Zahlen sind trotzdem für die Anwendungen der Mathematik von großer
Bedeutung. Die Vorteile dieses Begriffs hängen damit zusammen, dass wir ein
intuitives Bild der Gerade in uns tragen. Eine Definition der reellen Zahlen
wurde erst 1872 von Richard Dedekind aufgestellt, der damals Professor der
Mathematik in seinem Geburtsort Braunschweig war. Seine Konstruktion, der
’Dedekindsche Schnitt’ wird bis heute verwendet.
Jetzt soll gezeigt werden, warum die rationalen Zahlen für die Geometrie
nicht ausreichen. Die alten Griechen
√ wussten, dass die Diagonale eines Quadrats
der Seitenlänge eins die Länge 2 hat, und dass diese Zahl irrational ist. Der
Beweis ist ein sogenannter ’indirekter Beweis’ oder Beweis durch Widerspruch.
Man nimmt an, dass eine bestimmte Aussage wahr sei und leitet aus dieser Aussage durch logische Schritte einen Widerspruch. Daraus schliesst man, dass die
Annahme falsch
gewesen sein muss. Im Beispiel, das uns interessiert führt die
√
Annahme,
2
sei
rational zu einem Widerspruch und damit ist bewiesen, dass
√
2 irrational ist. Bevor wir den Beweis durchführen machen wir auf folgenden
Umstand aufmerksam. Wenn eine ganze Zahl a gerade ist, dann ist definitionsgemäss a = 2b für eine ganze Zahl b. Dann ist a2 = 4b2 = 2(2b2 ) auch gerade.
Wenn dagegen a ungerade ist, dann ist a = 2b + 1 für eine ganze Zahl b und
a2 = (2b + 1)2 = 2(2b2 + 2b) + 1 auch ungerade. Zusammenfassend, eine ganze
2
Zahl a ist gerade
√ wenn und nur wenn a gerade ist.
Satz Die Zahl 2 ist irrational.
3
√
Beweis Wenn√wir annehmen, dass 2 rational ist, dann gibt es natürliche Zahlen
p und q mit 2 = pq . Wir können annehmen, dass p und q teilerfremd sind, weil
wir sie sonst durch andere Zahlen ersetzten könnten die es sind. Quadrieren
und mit q 2 multiplizieren gibt p2 = 2q 2 . Deshalb ist p2 gerade. Es folgt aus der
obigen Diskussion, dass p gerade ist, also p = 2r für eine ganze Zahl r. Deshalb
ist 4r2 = 2q 2 und q 2 = 2r2 . Daraus folgt, dass q 2 und deshalb auch q gerade ist.
Die Zahlen p und q sind also beide gerade und haben den gemeinsamen Teiler
2, was der Teilerfremdheit widerspricht. Damit ist der Beweis geführt.
Es ist viel schwieriger zu beweisen, dass π irrational ist. Der erste Beweis stammt
vom schweizer Mathematiker Johann Heinrich Lambert im Jahr 1761.
3
Der Goldene Schnitt
Der Goldene Schnitt ist ein Verhältnis von Längen, das in der Kunst als besonders schön gilt. Sie kommt auch an vielen Stellen in der Natur vor, z.B. bei der
Blattstellung von Pflanzen (Phyllotaxis).
3.1
Definition des Goldenen Schnitts
Der Goldene Schnitt wird durch eine Art definiert, eine Strecke zu schneiden,
liefert aber am Ende eine reine Zahl.
Definition Eine Strecke der Länge s > 0 wird im Goldenen Schnitt s = a + b
geteilt, wenn sich die ganze Länge s sum grösseren Abschnitt a wie dieser zum
kleineren Abschnitt b verhält. Das heisst, es ist
a
s
= .
a
b
(3)
Aus dieser Beziehung folgt, dass
s
a
=
,
a
s−a
a 2
s
+
a
−1=0
s
(4)
Die Formel für die Lösung einer quadratischen Gleichung liefert
a
1 1√
5.
=− ±
s
2 2
(5)
Eine dieser Lösungen ist negativ und deshalb für das ursprüngliche Problem
nicht relevant. Die andere ist
a
1 √
= ( 5 − 1) = 0, 618 . . . .
s
2
Die Zahl
Φ=
s
a
= = 1, 618 . . .
b
a
ist das Goldene Verhältnis.
4
(6)
(7)
Es wird manchmal behauptet, dass bei bestimmten schönen Gebäuden das
Verhältnis der Dimensionen das Goldene Verhältnis ergibt (z. B. das Parthenon
in Athen, der Dom von Florenz, Notre Dame in Paris). Es gibt aber anscheinend keine Dokumente die belegen würden dass beim Bau an so etwas
bewusst gedacht wurde. Vielleicht war es der unbewusste Sinn des Architekten
nach Schönheit. In der Natur findet man das Goldene Schnitt bei der Anordnung
der Blätter bestimmter Pflanzen. Der Goldene Winkel ist, in Grad ausgedrückt,
360
Φ . Bei bestimmten Pflanzen wo die Blätter um einen Stiel herum angeord
net sind ist der Winkel zwischen aufeinanderfolgen Blättern 360 1 − Φ1 . Nach
einer Theorie erreicht die Pflanze dadurch, dass die Blätter sich möglichst wenig
überdecken und sich dadurch bei der Photosynthese möglichst wenig gegenseitig
behindern.
3.2
Harmonische Rechtecke
Ein Rechteck heisst harmonisch wenn die Längen der Seiten a, b mit a > b so
a
. In diesem Fall gilt ab = Φ. Wenn man ein Rechteck in ein
sind, dass ab = a+b
Quadrat und einen Rest zerlegt, dann ist der Rest harmonisch.
3.3
Vergleich mit der DIN-Norm für Papierformate
Wie werden die üblichen Papierformate (A0, A1, A2, A3, A4, . . .) definiert? Sie
haben die Eigenschaft, dass wenn man ein Blatt in einem dieser Formate halbiert, das Ergebnis ein Blatt im nächsten Format der Reihe ist. Alle Formate
der Reihe haben das gleiche Verhältnis der Breite zur Länge. Dieses Verhältnis
kann man folgendermassen berechnen. Wenn Länge und Breite des ersten Blattes a und b sind, dann ist die Bedingung die erfüllt werden muss ab = 2b
a . Daraus
√
folgt, dass ab = 2. Um zu wissen, wie groß die einzelnen Blätter sind muss man
noch wissen, wie groß eins der Formate ist. Es wird festgelegt, dass das A0-Blatt
die Fläche ein Quadratmeter haben soll. Die Länge des A0-Blatts ist dann die
vierte Wurzel aus zwei. Sie ist nicht rational und insbesondere keine ganze Zahl
von Millimetern. In der Praxis arbeitet man mit einer gewissen Toleranz. Der
Richtwert ergibt eine Fläche von 999.949 Quadratmillimetern.
4
4.1
Die Fibonacci-Zahlen
Definition der Fibonacci-Zahlen
Leonardo da Pisa, Fibonacci genannt, war einer der ersten, der die indo-arabischen
Ziffern in Europa bekannt gemacht hat. In seinem Buch ’Liber Abbaci’ (um 1200
erschienen) hat er folgendes Beispiel beschrieben:
Ein bestimmter Mann hat ein Kaninchenpaar an einem Ort gehalten der auf
allen Seiten von einer Mauer umgeben war. Wie viele Kaninchenpaare können
in einem Jahr aus diesem Paar produziert werden wenn angenommen wird,
5
dass jedes Paar in jedem Monat ein weiteres Paar hervorbringt, welches ab dem
zweiten Monat fruchtbar wird?
Dieses Beispiel hat natürlich wenig mit Biologie und viel mit Mathematik
zu tun. Die Fibonacci-Folge (die schon vor mehr als 2000 Jahren von anderen
betrachtet wurde) wird folgendermassen definiert
Definition Die Fibonacci-Folge {Fn } wird rekursiv durch
F1 = F2 = 1,
(8)
Fn = Fn−1 + Fn−2 ,
n = 3, 4, . . .
(9)
definiert. Die ersten Elemente der Folge sind
1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . .
4.2
(10)
Goldener Schnitt und Fibonacci-Zahlen
Betrachten wir die Zahlen
√
√
1− 5
1+ 5
= −0, 618 . . . , Φ =
= 1, 618 . . . .
(11)
φ=
2
2
Die Zahl Φ ist nichts anderes als das Goldene Verhältnis. Die Zahlen φ und Φ
sind beide Lösungen der Gleichung x2 − x − 1 = 0. Von diesem Ausgangspunkt
können wir verschiedene Gleichungen für φ herleiten:
1 + φ = φ2
1 + 2φ = φ3 ,
4
1 + 2φ = 1 + φ + φ = φ + φ2 = φ(1 + φ) = φ3
2 + 3φ = φ ,
2 + 3φ = 1 + φ + 1 + 2φ = φ2 + φ3 = φ2 (1 + φ) = φ4
3 + 5φ = φ5 ,
3 + 5φ = 1 + 2φ + 2 + 3φ = φ3 + φ4 = φ3 (1 + φ) = φ5
5 + 8φ = φ6 ,
5 + 8φ = 2 + 3φ + 3 + 5φ = φ4 + φ5 = φ4 (1 + φ) = φ6
Diese Rechnung könnten wir beliebig lange weiterführen. Die gleichen Identitäten gelten für Φ, da Φ die gleiche Ausgangsleichung erfüllt wie φ. Hier baut
sich ein Muster auf, wo die Fibonacci-Zahlen zum Vorschein kommen. Wenn
wir die Gleichungen dieser Folge für φ von den entsprechenden Gleichungen für
Φ subtrahieren dann ergeben sich die Gleichungen
Φ2 − φ 2
Φ3 − φ 3
Φ4 − φ 4
Φ5 − φ 5
= 1,
= 2,
= 3,
= 5, usw.
(12)
Φ−φ
Φ−φ
Φ−φ
Φ−φ
√
In diesen Formeln können wir den Nenner durch 5 ersetzen. Durch diese
Überlegungen kommt man auf folgende Aussage, die von de Moivre und Binet
bewiesen wurde. (Die soeben gemachten Rechnungen beweisen den Satz nicht.)
Satz Zwischen den Fibonacci-Zahlen Fn und den Goldenen Zahlen φ und Φ
besteht der Zusammenhang
1
Fn = √ (Φn − φn ),
5
6
n = 1, 2, 3, . . .
(13)
Da |φ| < 1 folgt aus diesem Satz, dass für n groß Fn ungefähr gleich
4.3
√1 Φn
5
ist.
Binomischer Lehrsatz und Pascalsches Dreieck
Die Fakultät wird durch n! = 1 · 2 · 3 · . . . · n definiert. Die Binomialkoeffizienten
werden durch
n
n!
n
n
=
,
= 1,
=1
(14)
k
k!(n − k)!
0
n
definiert. In diesem Zusammenhang ist es auch günstig 0! = 1 zu definieren.
Satz (Binomischer Lehrsatz)
n X
n n−k k
(a + b)n =
a
b .
(15)
k
k=0
Dieser Satz wird normalerweise durch vollständige Induktion bewiesen. Dieser
Beweismethode wenden wir uns im nächsten Abschnitt zu. Im Fall n = 1
reduziert sich der Satz auf die uninteressante Gleichung a + b = a + b. Dagegen
sind die Fälle n = 2 und n = 3 schon für algebraische Rechnungen sehr nützlich.
Sie lauten
(a + b)2 = a2 + 2ab + b2 ,
(16)
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 .
(17)
Wenn wir (a + b)n für grössere Werte von n auf diese Weise ermitteln wollten, dann könnten die Rechnungen langwierig werden. Sie lassen sich einfacher
sukzessiv durch die Verwendung der Identität
n+1
n
n
=
+
(18)
k
k−1
k
berechnen. Diese Identität bekommt eine geometrische Interpretation durch das
Pascalsche Dreieck. [In der Vorlesung wird das Dreieck angeschrieben.]
4.4
Pascal und Fibonacci
Wenn man im Pascalschen Dreieck geeignete diagonale Summen bildet dann
kommen wieder die Fibonacci-Zahlen zum Vorschein. [In der Vorlesung wird
dieser Umstand genauer beschrieben.]
4.5
Das Pascalsche Dreieck und Restklassen nach Division
Definition Für zwei ganze Zahlen a, b ∈ Z und eine positive natürliche Zahl
m ∈ N schreiben wir
a ≡ b mod m
bzw.
a − b ≡ 0 mod m
(19)
genau dann, wenn a und b nach Division durch m den gleichen ganzzahligen
Rest lassen. Es sind also z. B. 1 ≡ 5 mod 2 und 5 ≡ 14 mod 3. Die Division
7
durch zwei teilt die natürlichen Zahlen N offenbar in zwei disjunkte Restklassen
ein. Es sind die Restklasse aller ungeraden Zahlen (die Division durch zwei lässt
den Rest 1) und die Restklasse aller geraden Zahlen (die Division durch zwei
lässt den Rest 0). Wir schreiben
0̄ = {2, 4, 6, 8, 10 . . .},
1̄ = {1, 3, 5, 7, 9 . . .}.
Analog zerlegt die Division durch 5 die Menge N in fünf einander disjunkte
Restklassen, deren Elemente durch den gemeinsamen Rest 0, 1, 2, 3 oder 4
charakterisiert sind:
0̄ = {5, 10, 15, 20, 25 . . .},
1̄ = {1, 6, 11, 16, 21 . . .},
2̄ = {2, 7, 12, 17, 22 . . .},
3̄ = {3, 8, 13, 18, 23, . . .},
4̄ = {4, 9, 14, 19, 24 . . .}.
(20)
Wir wollen die Elemente einer solchen Restklasse als äquivalent ansehen, gekennzeichnet durch das Symbol ∼, schreiben also z. B.
5 ∼ 10,
5 ∼ 15
, 10 ∼ 15
usw.
(21)
für die Restklasse 0̄ bei Division durch 5. Für dieses Beispiel schreibt man
allgemeiner
a ∼ b genau dann, wenn a − b ≡ 0 mod 5.
(22)
Die hierdurch eingeführte Relation zwischen zwei Elementen a und b besitzt interessante Eigenschaften, die sie als sogenannte Äquivalenzrelation auszeichnen.
Definition Eine Äquivalenzrelation ist durch folgende Eigenschaften charakterisiert. Sie ist
reflexiv: es gilt stets x ∼ x
symmetrisch: wenn x ∼ y dann gilt auch y ∼ x
transitiv: wenn x ∼ y und y ∼ z dann gilt auch x ∼ z
Der Begriff der Äquivalenzrelation hat in der Mathematik viele Anwendungen.
Diese Definition kann im Rahmen der Mengenlehre präzisiert werden. Wir fangen mit einer Menge X an. Die Produktmenge X × X ist die Menge aller
Paare (a, b) mit a, b ∈ X. Eine Relation auf X wird durch eine Teilmenge R
von X × X definiert. Die Relation heisst Äquivalenzrelation wenn folgende drei
Eigenschaften gelten, die den schon oben genannten Eigenschaften entsprechen.
Für jedes Element a ∈ X ist (a, a) ∈ R. Wenn (a, b) ∈ R, dann auch (b, a).
Wenn (a, b) ∈ R und (b, c) ∈ R dann ist (a, c) ∈ R. Die Beziehung zwischen den
zwei Schreibweisen ist, dass (a, b) ∈ R der Aussage a ∼ b entspricht.
Es werden jetzt verschiedene Rechenregeln fuer Restklassen ohne Beweis
angegeben.
8
Aus a ≡ b mod m und c ∈ Z folgt a + c ≡ b + c mod m
Aus a ≡ b mod m und c ≡ d mod m folgt a + c ≡ b + d mod m
Aus a ≡ b mod m und c ∈ Z folgt ac ≡ bc mod m
Aus a ≡ b mod m und c ≡ d mod m folgt ac ≡ bd mod m
Aus a ≡ b mod m und n ∈ N folgt an ≡ b√n mod m
Denken wir an den Beweis zurück, dass 2 irrational ist. Die einzige wichtige
Eigenschaft der Zahl 2 die wir dabei verwendet haben ist, dass eine Zahl n gerade
ist wenn und nur wenn n2 gerade ist. Dies ist die Aussage dass n ≡ 0 mod 2
genau dann, wenn n ≡ 0 mod 2. In dem Fall, dass für eine andere Zahl k gilt,
dass n ≡ 0 mod k wenn und nur wenn n2 ≡ 0 mod k, dann kann man ähnlich
argumentieren wie im Fall k = 2. Dass die zweite Aussage aus der ersten folgt
sieht man aus den obigen Rechenregeln. Die Umkehrung kann man für einen
gegebenen Wert von k überprüfen, in dem man alle Fälle durchgeht. Z. B. im
Fall k = 5.
2
2
12 ≡ 1 mod 5, 22 ≡ 4 mod
√ 5, 3 ≡ 4 mod 5, 4 ≡ 1 mod 5
Damit ist bewiesen dass 5 irrational ist und dass das goldene Verhältnis irrational ist.
4.6
Fermatsche Primzahlen
In diesem Abschnitt werden die Rechenregeln für Restklassen verwendet, um
ein klassisches Beispiel zu untersuchen. Der französische Mathematiker Pierre
de Fermat hat 1637 vermutet, dass alle Zahlen der Form
n
Fn = 22 + 1
(23)
Primzahlen sind, also natürliche Zahlen, die grösser als 1 und nur durch sich
selbst teilbar sind. Diese Zahlen heissen aus diesem Grund Fermatsche Zahlen.
Sie sind beispielsweise
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537.
(24)
Leonhard Euler bewies aber dass F5 = 4294967297 keine Primzahl ist, sondern
den Teiler 641 besitzt.
5
22 + 1 = 232 + 1 ≡ 0 mod 641.
(25)
Diese Aussage wird jetzt bewiesen. Zunächst ist
641 = 640 + 1 = 5 · 27 + 1 und 5 · 27 ≡ −1 mod 641.
(26)
In dem wir die vierte Potenz bilden bekommen wir
54 · 228 ≡ 1 mod 641.
(27)
54 + 24 = 625 + 16 = 641 und 54 ≡ −24 mod 641.
(28)
Andererseits ist
Diese Gleichung wird jetzt mit 228 multipliziert, mit dem Ergebnis
232 ≡ −54 · 228 mod 641 ≡ −1 mod 641.
9
(29)
5
5.1
Summenformeln
Was sind Summenformeln?
Wir
in diesem Abschnitt explizite Darstellungen für die Summen Sp (n) =
Pn wollen
p
p
k=1 k für Potenzen k mit p ∈ N kennenlernen. An solchen Beispielen lernt
man in der Regel die Beweismethode der vollständigen Induktion. Diese Vorgehensweise hat den Nachteil, dass man die richtige Antwort kennen muss, bevor
man sie beweist. Wir wollen daher auch der Frage nachgehen, wie explizite
Darstellungen für Summen von Potenzen auf direktem Wege hergeleitet werden können. Zweitens
Pn leiten wir eine explizite Darstellung für die geometrische
Summe Gq (n) = k=0 q k ab und diskutieren an einem Beispiel ihre Anwendung
im Bereich der Zinsrechnung.
5.2
Die Summe der ersten n Zahlen
Wir beginnen mit dem
Satz Es gilt
S1 (n) =
n
X
k=
k=1
n(n + 1)
.
2
(30)
Beweis Die Idee des nachfolgenden Beweises stammt vom neunjährigen C. F.
Gauß: wir schreiben die Summe zweimal untereinander, einmal aufsteigend,
einmal absteigend, auf und summieren die Elemente in den einzelnen Spalten
1+
2
+ ...
n + (n − 1) + . . .
+(n − 1) + n
(31)
+
(32)
2
+1
Jede Spalte liefert einen Beitrag n + 1 und es gibt n davon. Das Ergebnis ist das
doppelte der Summe, die wir ausrechnen wollten. Damit ist der Satz bewiesen.
5.3
Die Summe der ersten n Quadratzahlen
Wir wollen eine explizite Darstellung für S2 (n) herleiten. Dazu benötigen wir
den
Hilfssatz Für jedes n gilt
1 + 3 + 5 + 7 + . . . + (2n − 1) = n2 .
(33)
Erster Beweis Dieser Beweis benutzt das Ergebnis des letzten Satzes. Die
Summe die uns hier interessiert kann als die Summe von drei Beiträgen geschrieben
werden. Dazu wird die Identität 2k − 1 = (k − 1) + (k − 1) + 1 benutzt. Die
Summe von k ist das bereits bekannte n(n+1)
während die Summe von 1 ist n.
2
Deshalb ist die Gesamtsumme
n(n − 1) n(n − 1)
+
+ n = n2
2
2
10
(34)
Dieser Beweis stammt von T. Weißschuh.
Zweiter Beweis Dieser geometrische Beweis wird an der Tafel gezeigt.
Satz S2 (n) = n(n+1)(2n+1)
.
6
In der Vorlesung wird eine geometrische Darstellung dieser Identität im Fall
n = 4 gegeben. Dabei werden sowohl der Hilfssatz als die Formel für die Summe
der ersten n Zahlen verwendet.
5.4
Summe der ersten n Kubikzahlen - vollständige Induktion
Eine explizite Darstellung von S3 (n) kann man mittels vollständiger Induktion
bekommen. Die Beweismethode der vollständigen Induktion können wir wie
folgt zusammenfassen.
Satz Für jedes n ∈ N ∪ {0} sei eine Aussage An der Art gegeben, so dass gelten
(i) die Aussage A0 is richtig, und
(ii) aus der Richtigkeit von An für beliebig gewähltes n ∈ N0 folgt die Richtigkeit
von An+1 . Dann gilt An für alle n ∈ N0 .
Der erste Punkt wird als Induktionsvoraussetzung bezeichnet. Der Induktionsschritt is dann Inhalt des zweiten Punktes. Der Beweis dieses Satzes ist eng mit
dem axiomatischen Aufbau der Zahlensysteme verwandt und wird hier nicht
behandelt. Jetzt wird diese Beweismethode zur Bestimmung der Grösse S3 (n)
verwendet.
Satz Es gilt
n
X
n2 (n + 1)2
(35)
k3 =
S3 (n) =
4
k=1
Beweis Es reicht zu beweisen, dass S3 (n) = (S1 (n))2 , was jetzt mit vollständiger
Induktion gemacht wird.
Induktionsanfang: (S1 (1))2 = 1 = S3 (1). Die Aussage gilt also für n = 1.
Induktionsschritt: Es sei vorausgesetzt, dass (S1 (n))2 = S3 (n) für einen bestimmten Wert von n. Dann berechnen wir
2
2 (n + 1)(n + 2)
n(n + 1)
2
+ (n + 1)
(36)
(S1 (n + 1)) =
=
2
2
= (S1 (n))2 + n(n + 1)2 + (n + 1)2
3
= S3 (n) + (n + 1) = S3 (n + 1).
(37)
(38)
Damit ist die Behauptung bewiesen.
5.5
Die geometrische Reihe
Die geometrische Reihe ist die unendliche Summe der Glieder der sogenannten
geometrischen Folge, d.h. derjenigen Zahlenfolge {ak } für welche das Verhältnis
benachbarter Folgenglieder stets konstant ist. Hier ist k ∈ N0 . Sei q = aak+1
k
11
dieses Verhältnis. Dann ist ak = a0 q k . Für die n-te Partialsumme Sn der
geometrischen Zahlenfolge ist daher
Sn =
n
X
ak = a0
k=0
n
X
qk
(39)
k=0
Satz Sei q 6= 1. Dann gilt
n
X
qk =
k=0
1 − q n+1
.
1−q
(40)
Ist ferner |q| < 1, so haben wir im Grenzfall n → ∞
∞
X
qk =
k=0
1
.
1−q
(41)
Beweis Wir schreiben die n-te Partialsumme wie folgt aus
Sn =
n
X
qk = 1 + q + q2 + . . . + qn .
(42)
k=0
Es folgt, dass
(1 − q)Sn = (1 + q + q 2 + . . . q n ) − (q + q 2 + q 3 + . . . q n+1 ))
1 − q n+1 .
(43)
Für q 6= 1 bekommen wir daraus die erste Behauptung. Um die Grenzformel
zu bekommen benutzt man die Tatsache dass |q| < 1 impliziert |q|n → 0 for
n → ∞.
Die geometrische Reihe findet insbesondere Anwendung in der Zinseszinsrechnung bei Sparanlagen. Hier ist ein Beispiel.
Zu Beginn eines jeden Jahres zahlt man 2000 Euro bei einer Bank bei einem
Zinssatz von 5% ein. Wieviel Geld hat man nach fünf Jahren angespart?
Wir gehen wie folgt vor. Zunächst berechnen wir den Zinsfaktor 1,05. Um diesen
Faktor vermehrt sich das Geld in einem Jahr. Das im ersten Jahr eingezahlte
Geld wird fünf Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)5 . Das im zweiten
Jahr eingezahlte Geld wird vier Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)4 .
Das gesamt angesparte Kapital ergibt sich also aus folgender Rechnung:
2000 · (1, 05)5 + 2000 · (1, 05)4 + 2000 · (1, 05)3 + 2000 · (1, 05)2 + 2000 · (1, 05)1
= 2000 · 1, 05 · ((1, 05)4 + (1, 05)3 + (1, 05)2 + (1, 05)1 + (1, 05)0 )
= 2000 · 1, 05 ·
4
X
(1, 05)k = 2000 · 1, 05 ·
k=0
= 11.602, 826
12
1 − (1, 05)5
1 − 1, 05
nach Rundung. Durch Zinsen hat sich das eingezahlte Kapital um 1.602,83
Euro erhöht. Hätte man die 10000 Euro am Anfang eingezählt und zu 5% auf 5
Jahre verzinst so wäre der Endbetrag 10000 · (1, 05)5 = 12.762, 82 gewesen, also
wesentlich mehr.
5.6
Beweis der binomischen Formel
Die Methode der vollständigen Induktion kann angewendet werden um die binomische Formel zu beweisen. Die Aussage An , die es zu beweisen gilt ist die
Formel für einen gegebenen P
Wert von n. Betrachten
wir zuerst die Aussage
0
A0 . (a + b)0 = 1 während k=0 a−k bk = 00 = 1. Als nächtes kommt der
Induktionschritt.
n X
n n−k k
n+1
n
(a + b)
= (a + b)(a + b) = (a + b)
a
b
k
k=0
n n X
n n−k+1 k X n n−k k+1
=
a
b +
a
b
(44)
k
k
k=0
k=0
Die zweite Summe auf der rechten Seite kann durch
n+1
X n an−k+1 bk
k−1
(45)
k=1
ersetzt werden. Deshalb ist
n n n+1 X n
n
n n+1
(a + b)n+1 =
a
+
+
an−k+1 bk +
b
0
k
k−1
n
k=1
n n n+1
n n+1 X n + 1 n−k+1 k
a
+
a
b +
b
=
k
n
0
k=1
n+1
X n + 1
=
an−k+1 bk .
(46)
k
k=0
Mit der letzten Aussage haben wir An+1 bewiesen und auch den binomischen
Lehrsatz.
6
Der Satz des Pythagoras
Abgesehen von den Zahlen ist ein anderes bekanntes Gebiet der Mathematik die
Geometrie. Sie ist eng mit unseren Vorstellungen des Raumes verbunden, der
uns umgibt. Die alten Griechen haben die Geometrie als eigenständige Theorie
aufgebaut. Das kanonische Werk dazu sind die ’Elemente’ des Euklid. Seit den
Arbeiten von René Descartes, ist bekannt, dass man die eulidischen Geometrie
auf den Zahlen aufbauen kann durch die Verwendung von Koordinaten. Es gibt
z. B. eine Korrespondenz zwischen Punkten in der Ebene und Paaren (x, y) von
reellen Zahlen.
13
6.1
Aussage und erster Beweis
Die vielleicht bekannteste Aussage der elementaren Geometrie ist der Pythagoreische Lehrsatz. Zu dessen Beweis brauchen wir nur die Tatsache, dass ein
echteck mit den Seitenlängen a uns b den Inhalt ab hat.
Satz Für ein rechtwinkliges Dreieck mit den beiden Katheten a und b und der
Hypotenuse c gilt a2 + b2 = c2 .
Beweis [In der Vorlesung kommt hier ein Bild] Wir betrachten ein Quadrat
mit der Seitenlänge a + b und Eckpunkte P1 , P2 , P3 , P4 . Die Punkte werden
in dieser Reihenfolge durchlaufen wenn wir um den Rand des Quadrats im
Uhrzeigersinn laufen. Bei diesem Umlauf sei Qi der Punkt, der einen Abstand
a nach Pi kommt. Die Geraden Qi Qi+1 teilen das Quadrat in vier Dreiecke
und ein kleineres Quadrat mit Seitenlänge c. Hier sind die Indizes mod 4 zu
verstehen. Die Fläche des Großen Quadrats is (a + b)2 . Sie ist gleich der Summe
2
der vier Dreiecke und des kleinen Quadrats, also 4 · ab
2 + c . Wenn wir diese
Ausdrücke gleichsetzten bekommen wir
a2 + 2ab + b2 = 2ab + c2 ,
(47)
was zur Behauptung des Satzes führt.
Diesen Beweis findet man in einer chinesischen Schrift von etwa 100 vor
Christi
6.2
Beweis nach Bhaskara
Hier geht es um einen Beweis des indischen Mathematikers und Astronoms
Bhaskara (1114-1185). [In der Vorlesung kommt an dieser Stelle ein Bild.]
Diesmal setzt sich ein Quadrat mit der Seitenlänge c aus vier Dreiecken mit
Seitenlängen a und b und ein Quadrat mit der Seitenlänge |a − b| zusammen.
Diesmal ergibt der Vergleich
c2 = 4 ·
6.3
ab
+ (a − b)2 = 2ab + a2 − 2ab + b2 = a2 + b2 .
2
(48)
Ähnliche Dreiecke und Beweis nach Einstein
Für einen dritten Beweis des Satzes brauchen wir den Begriff der ähnlichen
Dreiecke.
Definition Zwei Dreiecke ABC und DEF heissen ähnlich, wenn die Verhältnisse
der Längen der entsprechenden Seiten alle gleich sind, also
|AB|
|BC|
|CA|
=
=
.
|DE|
|EF |
|F D|
(49)
Eine äquivalente Bedingung, was hier nicht bewiesen wird, ist dass die entsprechenden Winkel gleich sind. Da die Summe der Winkel eines Dreiecks 180 Grad ist,
reicht es zu wissen, dass zwei der Winkel gleich sind. Auf die Idee des folgenden
14
Beweises ist Albert Einstein mit elf Jahren gekommen. Wenn die x- und yRichtung in der Ebene mit dem gleichen Faktor λ skaliert werden, dann skalieren
sich die Flächen rechtwinkliger Dreiecke mit dem Faktor λ2 . Die Dreiecke, die
durch eine solche Skalierung aus einem Dreeick hervorgehen sind alle ähnlich.
Als Referenzdreieck wählen wir ein Dreieck mit der Hypotenusenlänge 1 und
dem Inhalt Fref . Wir betrachten ein rechtwinkliges Dreieck ABC mit dem
rechten Winkel im Punkt C. Der Punkt C kann mit einem Punkt D der
gegenüberliengen Seite verbunden werden derart, dass die Gerade CD senkrecht
auf die Gerade AB steht. Bezeichnen wir mit F1 , F2 und F3 die Flächen der
Dreiecke ABC, ADC und DBC. Diese drei Dreiecke sind alle ähnlich. Es gilt
F1 = c2 Fref , F2 = a2 Fref , F3 = b2 Fref .
(50)
Auf der anderen Seite ist F1 = F2 + F3 und wir erhalten
c2 Fref = a2 Fref + b2 Fref .
(51)
2
Jetzt müssen wir nur noch den Faktor Fref
kürzen.
6.4
Großer Fermatscher Satz
Pierre de Fermat, dem wir in einem früheren Abschnitt begegnet sind ist aus
einem anderen Grund in der Mathematik sehr bekannt. Im Zusammenhang mit
dem Satz des Pythagoras weiss man, dass es unendlich viele Lösungen (a, b, c)
der Gleichung a2 + b2 = c2 gibt mit a, b und c natürliche Zahlen. Wenn man
eine Lösung hat, z. B. (3, 4, 5) kann man andere Lösungen bekommen in dem
man a, b und c mit der gleichen natürlichen Zahl k > 1 multipliziert. Das ist zu
offensichtlich, um interessant zu sein. Es gibt aber andere Möglichkeit, Lösungen
zu produzieren, die auf Euklid zurückgeht. Man fängt mit zwei natürlichen
Zahlen m und n an, die beliebig sind bis auf die Bedingung, dass m > n. Dann
definiert man
a = m2 − n2 , b = 2mn, c = m2 + n2 .
(52)
Diese Zahlen erfüllen a2 + b2 = c2 und es gibt einfache Bedingungen die dafür
sorgen, dass a, b und c nicht alle durch die gleiche Zahl k ohne Rest teilbar
sind. Ausgehend von dieser Fülle könnte man auf die Idee kommen, Lösungen
von an + bn = cn zu suchen, wobei a, b und c wieder natürliche Zahlen sind
und n eine natürliche Zahl grösser zwei. Eine vielleicht überraschende Tatsache
ist: es gibt keine. Diese Aussage wird heutzutage als großer Fermatscher Satz
bezeichnet. Es wäre aber angemessener, sie als Fermatsche Vermutung zu bezeichnen, da er sie nicht nachweislich bewiesen hat. Die Geschichte fängt damit
an, dass Fermat um 1640 etwas als Randnotiz in sein Exemplar der Arithmetika
des Diophantus geschrieben hat. Zuerst hat er die Aussage seines ’Satzes’ behauptet und dann folgenden berühmten Text (hier eine Übersetzung aus dem
ursprünglichen Latein):
Ich habe hierfür einen wahrhaft wunderbaren Beweis gefunden, doch ist der
Rand hier zu schmal, um ihn zu fassen.
15
Fermat hatte einen Beweis im Spezialfall n = 4 gefunden aber im allgemeinen
Fall hat er sich bestimmt vermacht. Jedenfalls wurde, trotz vieler Versuche
bedeutender Mathematiker in den darauffolgenden 350 Jahren kein Beweis gefunden. Erst 1995 hat der englische Mathematiker Andrew Wiles einen Beweis
vorgestellt. Sein erster Versuch enthielt noch eine Lücke aber dieser konnte
mit Hilfe seines Schülers Richard Taylor geschlossen werden. Die spannende
Geschichte wird in einem Buch von Simon Singh [4] erzählt.
7
Kegelschnitte
Wir widmen uns nun elementargeometrischen Untersuchungen zu den ebenen
Kegelschnitten Kreis, Ellipse, Hyperbel und Parabel. Wir beginnen mit der algebraischen Definition, kommen aber dann sofort zu geometrischen Charakterisierungen vermittels spezieller Abstandsregeln unter Verwendung sogenannter
Brennpunkte.
7.1
Algebraische Definition von Kegelschnitten
Auf algebraischer Art können wir die Kegelschnitte wie folgt charakterisieren.
Ein Kegelschnitt ist die Menge der Punkte (x, y) ∈ R2 die die Beziehung
ax2 + by 2 + 2cxy + dx + ey + f = 0
(53)
erfüllen mit reellen Zahlen a, b, c, d, e, f . Geometrisch handelt es sich um einen
Schnitt einer Ebene mit einem Kegel oder einem Zylinder.
7.2
Der Kreis
Eine zur Mittelpunktsachse eines Zylinders senkrechte Ebene schneidet diese
Rotationsfläche in einem Kreis.
Definition Der Kreis ist eine ebene Kurve, deren Punkte P von einem fest
gewählten Punkt M , dem Mittelpunkt, einen festen Abstand besitzen.
Dieser fest gewählte Abstand r > 0 heisst der Radius des Kreises. Mit dem Satz
von Pythagoras folgt, dass
x2 + y 2 = r 2 ,
(54)
wobei wir o.B.d.A. angenommen haben, dass M = (0, 0). Der Kreis ist geschlossen
und streng konvex. D. h. die Tangente in einem Punkt hat nur einen gemeinsamen Punkt mit dem Kreis, den Berührpunkt. Im allgemeinen liegt der Mittelpunkt nicht im Koordinaten-Ursprung, sondern in einem Punkt mit Koordinaten (xM , yM ). Dann wird die Gleichung des Kreises verallgemeinert.
Satz Die Punkte (x, y) eines Kreises mit Mittelpunkt (xM .yM ) ∈ R2 und Radius
r erfüllt die Gleichung
(x − xM )2 + (y − yM )2 = r2 .
16
(55)
Der Gelehrte Eratosthenes leitete ein halbes Jahrhundert lang die Bibliothek in
Alexandria, die bedeutendste Bibliothek der Antike. Er war sehr vielseitig in
seinen Interessen und hat sich insbesondere mit Fragen der Astronomie beschäftigt.
Seine bekannteste Errungenschaft war eine Bestimmung des Umfangs der Erde.
Über der Stadt Assuan, die fast genau südlich von Alexandria liegt, steht am
Mittag des Tages der Sommersonnenwende die Sonne genau im Zenit. Ein
Gnomon (ein vertikaler Stab auf einem nivellierten Untergrund) wirft daher zu
diesem Zeitpunkt keinen Schatten. An einem Mittag der Sommersonnenwende
bestimmte Eratosthenes im nördlich gelegenen Alexandria den Winkel zwischen
der Sonnenrichtung und einem vertikal positionierten Gnomon und konnte so
den Winkel zwischen den Vertikalen in Assuan und Alexandria schätzen. Er
kam auf die Antwort, dass dieser Winkel ein Fünfzigstel des Vollkreises war.
Der Gesamtumfang der Erde beträgt also in etwa das 50-fache der Entfernung
zwischen Alexandria und Assuan, d.h. ungefähr 40.200 Kilometer. Die heutige
Bestimmung des Erdumfangs kommt auf 40.024 Kilometer.
7.3
Die Ellipse
Eine zur Rotationsachse eines Zylinders schräge Ebene schneidet diese Fläche
in einer Ellipse. Hier aber nun unsere
Definition Eine Ellipse ist eine ebene Kurve, deren Punkte P konstante Abstandssumme von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten,
besitzen.
Der Zusammenhang zwischen der geometrischen Idee eines schrägen Schnittes
mit dem Zylinder und dieser Definition ist nicht unmittelbar einsichtig und
bedarf eines Beweises. Der Mittelpunkt der Gerade F1 F2 nennen wir Mittelpunkt des Ellipses und die Koordinaten werden so gewählt, dass dieser Punkt
der Ursprung ist. Ausserdem können wir annehmen, dass die Gerade die die
Brennpunkte verbindet auf der x-Achse liegt. Der Abstand zwischen dem Mittelpunkt und den Punkten, wo die Ellipse die x-Achse schneidet heisst große
Halbachse und der Abstand zwischen dem Mittelpunkt und den Punkten, wo
die Ellipse die y-Achse schneidet heisst kleine Halbachse.
Der Name Brennpunkt kommt von folgender physikalischer Idee. Stellen wir
uns vor, dass die Ellipse Licht das von innen kommt wie ein Spiegel zurückschickt.
Dann ist die Behauptung, dass Lichtstrahlen, die von einem der Brennpunkte
ausgehen im anderen Brennpunkt wieder aufeinander treffen. Die mathematische Aussage, die dieser Behauptung entspricht ist, dass wenn P ein Punkt auf
der Ellipse ist, die Geraden die P mit den Brennpunkten verbinden den gleichen
Winkel machen mit der Tangente zur Ellipse im Punkt P . Diese Aussage wird
hier nicht bewiesen.
Satz Wenn die Koordinaten wie oben beschrieben gewählt werden erfüllen die
Punkte der Ellipse mit großer Halbachse a und kleiner Halbachse b die Gleichung
y2
x2
a2 + b2 = 1.
Beweis Seien F1 und F2 die Brennpunkte und P ein Punkt auf der Ellipse.
Sei r1 = |F1 P |, r2 = |F2 P | und f = |OF1 | = |OF2 |. Für den Punkt P mit
17
Koordinaten (x, y) gilt nach dem Satz von Pythagoras
r12 = (f + x)2 + y 2 = f 2 + 2f x + x2 + y 2 ,
(56)
r22 = (f − x)2 + y 2 = f 2 − 2f x + x2 + y 2 .
(57)
Deshalb ist
r12 − r22 = 4f x.
(58)
Nach der Definition gilt r1 + r2 = 2λ für eine reelle Zahl λ > 0, so dass
4f x = 2λ(r1 − r2 )
und r1 − r2 =
2f x
.
λ
(59)
Wenn wir diese Beziehung mit r1 + r2 = 2λ kombinieren bekommen wir
r1 = λ +
fx
,
λ
r2 = λ −
fx
.
λ
(60)
Die Gleichung der Ellipse muss natürlich in den vier Scheitelpunkten erfüllt sein.
Im Scheitelpunkt rechts von F2 mit den Koordinaten (0, a) gilt
2λ = r1 + r2 = [f + f + (a − f )] + (a − f ) = 2a,
(61)
so dass λ = a. Im Scheitelpunkt mit den Koordinaten (0, b) gilt r1 = r2 = λ
und f 2 + b2 = a2 . Wenn wir zwei Darstellungen von r12 vergleichen, die wir oben
hergeleitet haben dann bekommen wir die Gleichung
λ2 + 2f x +
f 2 x2
= f 2 + 2f x + x2 + y 2 .
λ2
(62)
f 2 x2
= f 2 + x2 + y 2 .
λ2
(63)
Es folgt, dass
λ2 +
Da f 2 + b2 = a2 and λ = a schließen wir, dass
b2
a2 + 1 − 2 x2 = x2 + y 2 + a2 − b2 .
a
(64)
Durch subtrahieren von x2 + a2 von beiden Seiten bekommt man
−
b2 2
x = y 2 − b2 .
a2
(65)
Das Ergebnis folgt dann leicht.
7.4
Die Hyperbel
Jetzt werden die Überlegungen des letzten Abschnitts abgeändert, um die Hyperbel zu bekommen. Betrachten wir zwei Geraden L1 und L2 im dreidimensionalen Raum, die sich in einem Punkt O schneiden. Wenn L2 um den Punkt
18
O gedreht wird, während der Winkel zwischen den zwei Geraden fest bleibt
entsteht ein Doppelkegel mit Achse L1 . Die Geraden, die durch Rotation aus
L2 entstehen heissen Erzeugende des Kegels. Eine zur Kegelachse Senkrechte
Ebene die O nicht enthält schneidet den Kegel in einem Kreis. Wird die Ebene
leicht geneigt, wird der Kreis zu einer Ellipse. Wenn sie weiter geneigt wird, bis
sie mit einer Erzeugenden des Kegels parallel ist dann wird die Schnittmenge
zu einer Parabel. Diese Menge ist nicht mehr beschränkt und enthält Punkte,
die von O beliebig weit weg sind. Sie ist in einer der beiden Hälften des Doppelkegels enthalten. Wenn die Ebene noch weiter geneigt wird schneidet sie
beide Teile des Doppelkegels und ist eine Hyperbel.
Unter einer Hyperbel wollen wir in dieser Vorlesung folgende Punktmenge
verstehen.
Definition Eine Hyperbel ist eine ebene Kurve, deren Punkte P konstante Abstandsdifferenz von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten,
besitzen.
Wie im Fall der Ellipse wählen wir die Koordinaten so, dass die Brennpunkte
F1 und F2 auf der x-Achse liegen und der Mittelpunkt O der Strecke, die sie
verbindet der Koordinatenursprung ist. Die Halbachse a ist der Abstand von O
zu den Schnittpunkten der Hyperbel mit der x-Achse. Die Exzentrizität oder
Brennweite e ist der Abstand von O zu den Brennpunkten. Nach der Definition
einer Hyperbel gilt ||P F1 | − |P F2 || = 2λ für eine reelle Zahl λ. Wenn eine
‘imaginäre Halbachse’ b durch a2 + b2 = e2 definiert wird, dann gilt
Satz Mit der reellen Halbachse a und der imaginären Halbachse b gilt für die
2
2
Punkte (x, y) einer Hyperbel die Gleichung xa2 − yb2 = 1.
Der Beweis dieser Aussage ist dem der entsprechenden Aussage für die Ellipse
ähnlich und wird hier nicht ausgeführt.
7.5
Die Parabel
Aus der Ellipse lässt sich durch einen Grenzübergang die Parabel konstruieren.
Zu diesem Zweck ist es hilfreich, zu Koordinaten überzugehen wo der linke
Scheitelpunkt der Ellipse im Ursprung liegt. In den neuen Koordinaten lautet
2
2
+ yb2 = 1. Nach ausmultiplizieren der Klammer
die Gleichung der Ellipse (x−a)
a2
und multiplizieren mit a erhalten wir
x2
ay 2
− 2x + 2 = 0.
a
b
(66)
1 ay 2
x2
x=
.
+
2 b2
a
(67)
Anders ausgedrückt
Jetzt ändern wir die Parameter so, dass a sehr groß wird während
Dann geht die letzte Gleichung im Grenzfall in
h a i
x=
y2
2b2
19
a
b2
fest bleibt.
(68)
über,
Gleichungeiner Parabel. Der linke Brennpunkt hat die x-Koordinate
die
q
2
a 1 − 1 − ba · a1 . Durch die Identität
1−
√
1−c=
1+
c
√
1−c
die für jede Konstante c mit 0 < c < 1 gilt, sehen wir, dass
!
r
b2 1
b2
.
a 1− 1−
·
= q
a a
b2 1
a 1+ 1− a · a
(69)
(70)
2 b
Für a groß ist also der linke Brennpunkt in der Nähe von 2a
, 0 . Der rechte
Brennpunkt dagegen wandert nach unendlich in diesem Grenzfall.
Die physikalischen Überlegungen die wir im Fall der Ellipse gemacht haben,
sind auch im Fall der Parabel interessant. Wenn diese Strahlen an der Innenseite
der Parabel gespiegelt werden dann kommen Strahlen die vom Brennpunkt ausgehen parallel hinaus. Umgekehrt treffen sich Strahlen die parallel hineinfallen
und an der Parabel gespiegelt werden im Brennpunkt. Lichtstrahlen von einem
weit enfernten Object, z. B. von einem Stern kommen parallel an. Dass sie
durch den parabolischen Spiegel in einem Punkt konzentriert werden ist genau
das, was man sich von einem Teleskop wünscht. Isaac Newton hat diese Idee
benutzt, um ein Speigelteleskop zu entwerfen.
7.6
Normalformen der Kegelschnitte
Die in den bisherigen Abschnitten diskutierten algebraische Formen der Kegelschnitte
liegen alle in Normalform vor.
Definition Unter einer Normalform der drei Kegelschnitte verstehen wir die
folgenden algebraischen Darstellungen:
2
2
m)
m)
Ellipse. (x−x
+ (y−y
=1
a2
b2
2
2
m)
m)
Hyperbel. (x−x
− (y−y
=1
a2
b2
2
Parabel. (y − ys ) = 2p(x − xs )
mit dem Mittelpunkt (xm , ym ) und dem Scheitelpunkt (xs , ys ). Im dritten Fall
hätten wir genauso gut die Rollen von x und y vertauschen können. Die allgemeine Gleichung (53) kann durch affine Transformationen der Koordinaten
vereinfacht werden. Abgesehen von Ausnahmefällen kann die Gleichung in eine
der Drei Normalformen gebracht werden. Betrachten wir zuerst lineare Transformationen (x, y) 7→ (x0 , y 0 ) der Koordinaten:
x0 = Ax + By,
(71)
y 0 = Cx + Dy.
(72)
Es gibt einen allgemeinen Satz der sagt, dass man dadurch erreichen kann dass
die transformierten Gleichungen keinen Term der Form x0 y 0 enthalten. Diese
20
Aussage ist nicht auf quadratische Ausdrücke in zwei Variablen beschränkt - die
entsprechende Aussage gilt für jede Anzahl von Variablen. Die Gleichung lautet
dann
ax2 + by 2 + dx + ey + f = 0.
(73)
Wenn a und b beide verschwinden bekommen wir einen Ausnahmefall, wo die
Lösungsmenge sich auf eine Gerade reduziert. Wenn dieser Fall ausgeschlossen
wird können wir ohne Beschränkung der Allgemeinheit (wenn nötig durch vertauschen von x und y) annehmen, dass a 6= 0. Durch quadratische Ergänzung
bekommen wir
#
"
2
2
d
d
− 2 .
(74)
ax2 + dx = a x +
2a
4a
Im Fall b = 0 reduziert sich die Gleichung dann auf
2
d
e
f
d2
x+
+
y+ −
= 0.
2a
a
e
4ae
(75)
Es ist dann klar, dass dieser Fall eine Parabel beschreibt und dass die Gleichung
schon in Normalform ist.
Wenn auch b 6= 0 kann die quadratische Ergänzung auch bei y durchgeführt
werden. Das Ergebnis ist
2
d2
e 2
e2
d
=
+b y+
+
− f.
(76)
a x+
2a
2b
4a 4b
Falls der Ausdruck auf der rechten Seite nicht verschwindet können wir dadurch
teilen und die Normalform erhalten. Wenn ab < 0 handelt es sich um eine Hyperbel. (Um die Normalform zu erreichen muss man eventuell die Koordinaten
x und y vertauschen.) Wenn a und b das gleiche Vorzeichen haben wie die
rechte Seite handelt es sich um eine Ellipse. Wenn die Vorzeichen von a und b
dem der rechten Seite entgegengesetzt sind hat die Gleichung keine Lösungen
oder, anders gesagt, die Lösungsmenge ist leer. Es bleibt noch ein weiterer
2
d2
Ausnahmefall, nämlich der Fall 4a
+ e4b − f = 0. Wenn a und b das gleiche
Vorzeichen haben, dann besteht die Lösungsmenge aus einem Punkt. Wenn a
und b unterschiedliche Vorzeichen haben dann bekommt man zwei Geraden die
sich schneiden.
Wir betrachten als Beispiel die Gleichung
y 2 − 4x + 8y + 6 = 0,
(77)
also in der allgemeinen Notation a = 0, b = 1, c = 0, d = −4, e = 8 und f = 6.
Quadratische Ergänzung für y liefert
y 2 + 8y = (y + 4)2 − 16
und damit
(78)
5
(y + 4)2 = 2 · 2 · x +
.
(79)
2
Es handelt sich um
eine Parabel, die nach rechts geöffnet ist und den Scheitelpunkt − 52 , −4 besitzt.
21
7.7
Kepler und die Planetenbewegung
Die Ellipse hat eine bedeutende Rolle in der historischen Entwicklung der Physik
gespielt. In der Antike galt die Bewegung im Kreis als perfekt. Als man gesehen
hat, dass die Planeten sich nicht genau in Kreisen bewegten hat man ihre Bewegung mit Hilfe von Kombinationen von Kreisen (Epizyklen) beschrieben. So entstand das ptolemäische System, das viele Jahrhunderte überlebt hat. Und mit
diesem theoretischen Konstrukt konnte man die Bewegungen gut beschreiben:
man musste nur genügend viele Kreise auf die richtige Weise einführen. Von
einer perfekten Einfachheit war dieses System allerdings weit entfernt.
Bewegung kam in dieses Gebiet durch die sehr genauen Beobachtungen der
Planetenbahnen durch Tycho Brahe. Anschliessend hat Johannes Kepler, der
auch Assistent von Brahe war Gesetzmässigkeiten in diesen Daten gefunden.
Diese hat er in drei Gesetzen formuliert, die er 1619 veröffentlicht hat. Das
erste Keplersche Gesetz besagt, dass die Bahnen der Planeten Ellipsen sind.
Die Keplerschen Gesetze waren eine wichtige Grundlage für die Entwicklung
der modernen Physik durch Isaac Newton. Die Arbeit von Kepler war rein
phänomenologisch. Newton, dagegen hat allgemeine Theorien aufgestellt, die
inbesondere die Keplerschen Gesetze reproduzieren. In diesem Zusammenhang
merkt man auch, dass andere Kegelschnitte in der Himmelmechanik auftreten.
Es gibt z. B. aperiodische Kometen, die nur einmal an der Erde vorbeikommen
und sich auf Hyperbeln bewegen. Die bekannten wiederkehrenden Kometen
bewegen sich dagegen auf Ellipsen.
8
Mengenlehre und Funktionen
In diesem Abschnitt werden einige Begriffe aus der Mengenlehre in Erinnerung
gerufen. Abbildungen und Funktionen werden diskutiert.
8.1
Mengen und Abbildungen
Hier wird vorausgesetzt, dass die elementaren Begriffe der Mengenlehre, wie z.
B. Menge, Element einer Menge, Teilmenge, Vereinigung und Durchschnitt von
Mengen bekannt sind. Seien X und Y Mengen. Das Produkt X × Y ist die
Menge aller Paare (x, y) mit x ∈ X und y ∈ Y . Wenn, z. B. X die Menge [a, b]
aller reellen Zahlen x mit a ≤ x ≤ b ist und Y die Menge aller reellen Zahlen
y mit c ≤ y ≤ d, dann ist X × Y die Menge aller Zahlenpaare (x, y) die beide
Ungleichungen erfüllen oder, geometrisch gesehen, ein Rechteck in der Ebene.
Eine Abbildung f von X nach Y ist, intuitiv gesehen eine Regel, die jedem
Element x ∈ X ein Element y = f (x) ∈ Y zuordnet. Sie kann auch als eine
Teilmenge von X × Y betrachtet werden, nämlich die Menge {(x, y) ∈ X × Y :
y = f (x)}. Diese Menge heisst auch manchmal Graph von f . In dem Fall, dass
X und Y die Menge der reellen Zahlen sind entspricht sie dem Begriff ’Graph’
im üblichen Sinne. Eine Abbildung heisst injektiv, wenn f (x1 ) = f (x2 ) die
Beziehung x1 = x2 impliziert. Sie heisst surjektiv, wenn es zu jedem y ∈ Y
ein Element x ∈ X gibt mit f (x) = y. Eine Abbildung, die sowohl injektiv als
22
auch surjektiv ist heisst bijektiv. Im Fall einer bijektiven Abbildung entspricht
jedes Element x ∈ X genau einem Element f (x) von Y . Man redet auch von
einer eineindeutigen Korrespondenz. Eine bijektive Abbildung f hat immer eine
eindeutige Umkehrabbildung g mit der Eigenschaft, dass y = f (x) wenn und
nur wenn x = g(y).
Wenn f : X → Y eine Abbildung ist, und Y die Menge der reellen Zahlen
ist, nennt man f oft eine Funktion. Besonders anschaulich ist der Fall, dass
X auch die Menge der reellen Zahlen ist. Dann kann man die Funktion durch
ihren Graphen als eine Kurve in der Ebene darstellen. Hier ist etwas Vorsicht
geboten. In der Schule sehen wir Funktionen, die einen bestimmten
Namen
√
haben, wie Sinus oder durch einfache Formeln wie x2 oder x definiert sind.
Die Graphen dieser Funktionen sind normalerweise schöne glatte Funktionen.
Es gibt aber auch ganz andere Funktionen. Wenn E eine Teilmenge von X ist,
dann wird die charakteristische Funktion von E, χE als die Funktion definiert,
mit den Eigenschaften f (x) = 1 für x ∈ E und f (x) = 0 für x ∈
/ E. Wenn X
die Menge der reellen Zahlen ist und E = {x ∈ R : x > 0} dann ist χE die
sogenannte Heaviside-Funktion und sie springt bei x = 0. Wir könnten aber
auch E = Q wählen. Jetzt liegen sowohl Q als auch das Komplement R \ Q
dicht in den reellen Zahlen. In diesem Fall springt die Funktion χE ‘überall’
und es ist nicht möglich, den Graphen zu zeichnen.
8.2
Abzählbare und überabzählbare Mengen
Eine Menge X heisst endlich wenn es eine Bijektion gibt von X auf eine Menge
der Form {1, 2, . . . , n} für eine natürliche Zahl n. Wenn es keine solche Bijektion
gibt heisst die Menge unendlich. Wenn es eine Bijektion zwischen Mengen X
und Y gibt, dann sagt man dass sie die gleiche Mächtigkeit haben und schreibt
|X| = |Y |. Dieser Begriff wurde durch Georg Cantor, den Erfinder der Mengenlehre eingeführt im späten neunzehnten Jahrhundert. Intuitiv könnte man
sagen, dass zwei Mengen die gleiche Mächtigkeit haben, wenn sie genauso viele
Elemente haben. Bei unendlichen Mengen ist es allerdings so, dass X die gleiche
Mächtigkeit haben kann wie eine echte Teilmenge von X. Wenn z. B. N die
Menge der natürlichen Zahlen ist und G die Teilmenge der geraden natürlichen
Zahlen dann ist die Abbildung f : N → G, n 7→ 2n eine Bijektion. Also haben
beide Mengen die gleiche Mächtigkeit, obwohl die eine eine echte Teilmenge der
anderen ist. Bei endlichen Mengen kann das nicht passieren. Wenn es eine Injektion von X nach Y gibt, d.h. eine Bijektion von X auf eine Teilmenge von
Y schreibt man |X| ≤ |Y |. Man kann jetzt fragen ob |X| ≤ |Y | und |Y | ≤ |X|
zusammen |X| = |Y | implizieren. Die Antwort auf diese Frage ist positiv und
heisst Cantor-Schröder-Bernstein-Theorem. Der Beweis ist nicht einfach aber
elementar in dem Sinne, dass er aus Schritten besteht die sehr einfach sind.
Satz Sei X und Y Mengen, f : X → Y und g : Y → X injektive Abbildungen.
Dann gibt es eine Abbildung h : X → Y die bijektiv ist.
Beweis Sei Z die Menge deren Elemente die Elemente von X und Y sind, wobei
angenommen wird, dass X und Y keine gemeinsamen Elemente haben. Wenn
x ∈ X definieren wir eine Folge xn durch eine Vorschrift, die jetzt beschrieben
23
wird. Sei x0 = x, y0 = f (x0 ), x1 = g(y0 ), y1 = f (x1 ) und so weiter. Auf
diese Weise werden xi und yi für alle i ≥ 0 definiert. Sei jetzt y−1 ein Element
von Y mit x0 = g(y−1 ), wenn ein solches Element existiert. Wenn kein solches
Element existiert bleibt y−1 undefiniert. Man setzt diese Prozedur fort mit den
Beziehungen y−1 = f (x−1 ), x−1 = g(y−2 ) und so weiter, sofern diese Gleichungen Lösungen besitzen. Es gibt drei Möglichkeiten für einen gegeben Startwert
x. Die erste ist, dass xn und yn durch diese Vorschrift für alle ganzen Zahlen n
definiert werden können. Die zweite ist dass die Definition mit einem Element
x−N abbricht und die dritte ist dass die Definition mit einem Element y−N abbricht. Zu jedem x ∈ X gibt es eine Folge dieser Art. Wenn zwei solche Folgen
überlappen sind sie gleich. Daraus folgt, dass wenn wir für jede Folge dieser Art
eine Bijektion zwischen den Elementen xn in der Folge und den Elementen yn
in der Folge definieren können ist der Satz bewiesen. Wenn die Folge die zweite
Möglichkeit realisiert dann können wir für diese Folge h = f wählen. Wenn
die Folge die dritte Möglichkeit realisiert dann können wir h = g wählen. Im
Falle der ersten Möglichkeit könnten wir h = f oder h = g wählen. Um eine
eindeutige Regel zu haben wählen wir h = f . Damit ist der Beweis beendet.
Dieser Beweis des Satzes soll von einem gewissen Julius König stammen.
Dieser König hat auf einem internationalen Mathematikerkongress 1904 behauptet, eines der bekannten Ergebnisse von Cantor wäre fehlerhaft. Die Behauptung von König war falsch, was schon einen Tag später von einem anderen
Mathematiker gezeigt wurde. Trotzdem wurde Cantor durch den Vorfall tief
gekränkt und hat schon angefangen an sich zu zweifeln.
Wie sieht es aus mit der Mächtigkeit von Mengen die wir gut kennen? Hat
z. B. Q eine grössere Mächtigkeit als Z? Zunächst können wir beobachten, dass
|Z| = |N|. Zu zeigen, dass es eine Bijektion zwischen N und einer Menge X gibt
reicht es zu zeigen, dass man die Elemente von X als Folge xi , i = 1, 2, 3, . . .
schreiben kann. Eine solche Menge heisst abzählbar. Für Z können wir die
Folge 0, −1, 1, −2, 2, . . . wählen. Es gibt also eine Bijektion f : N → Z. Dann
ist (f, f ) eine Bijektion von N × N nach Z × Z. Die Elemente der Menge N × N
können als Folge geschrieben werden, z. B. als
{(1, 1), (1, 2), (2, 1), (3, 1), (2, 2), (1, 3), . . .}
(80)
Die Menge N × N ist also abzählbar. Schreiben wir diese Folge abstrakt als
{(an , bn )}. Definieren wir eine Folge von rationalen Zahlen auf der Basis der
Folge von Paaren mit Hilfe der folgenden Vorschrift. Wir betrachten zunächst
die Folge abnn . Dann betrachten wir nacheinander diese rationalen Zahlen. Wenn
eine solche Zahl verschieden von allen Zahlen ist, die vorher in der Folge waren
wird sie behalten. Wenn sie aber gleich einer früheren Zahl ist wird sie verworfen. Die reduzierte Folge enthält alle positiven rationalen Zahlen und definiert
eine Bijektion von N auf die Menge der positiven rationalen Zahlen. Nennen wir diese letzte Folge cn . Die rationalen Zahlen können als die Folge
{0, −c1 , c1 , −c2 , c2 , . . .} geschrieben werden und Q ist abzählbar.
Eine Menge, die nicht abzählbar ist heisst überabzählbar und ein berühmter
Satz von Cantor besagt, dass die reellen Zahlen überabzählbar sind. In dieser
24
Vorlesung wurde keine präzise Definition der reellen Zahlen gegeben aber es ist
trotzdem möglich, die Hauptidee des Beweises von Cantor zu verstehen. Es
reicht zu zeigen, dass die reellen Zahlen x die die Ungleichungen 0 ≤ x < 1
erfüllen überabzählbar sind. Diese Zahlen können durch Dezimalentwicklungen
0, a1 a2 a3 . . .
(81)
wobei die ai Elemente der Menge {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} sind. Es gibt eine
Subtilität, die den Fall betrifft, in dem alle ai nach einem bestimmten Punkt
gleich neun sind. Um diese Problematik zu vermeiden betrachten wir nur solche
Folgen {an } wo dieser Umstand nicht vorkommt.
Sei X die Menge von Folgen {an } von natürlichen Zahlen zwischen Null und
neun mit der Eigenschaft dass es beliebig große Werte von n gibt mit an 6= 9.
Es soll jetzt gezeigt werden, dass diese Menge überabzählbar ist. Dazu nehmen
wir an, dass die Elemente aufgelistet werden können und produzieren einen
Widerspruch. Sei amn das n-te Element der m-ten Folge in der Liste. Sei
bn = ann + 1 wenn ann ≤ 7 und bn = ann − 1 sonst. Dann unterscheidet sich
die Folge {bn } von jeder Folge auf der Liste, was den Widerspruch liefert. Auf
diese Weise wird gezeigt, dass die reellen Zahlen überabzählbar sind.
8.3
Mengen von Teilmengen
Sei X eine Menge. Die Menge aller Teilmengen von X wird oft als 2X bezeichnet.
Der Grund für diese Schreibweise werden wir jetzt diskutieren. Betrachten wir
den Fall, dass X eine endliche Menge ist mit n Elementen. Wie viele Teilmengen
von X mit k Elementen gibt es? Wir können eine solche Menge konstruieren,
in dem wir Elemente x1 , x2 , . . . xk nacheinander wählen, wobei darauf zu achten
ist, dass die gewählten Elemente alle unterschiedlich sind. Für die erste Wahl
gibt es n Möglichkeiten, für die zweite n − 1 Möglichkeiten, usw. Deshalb gibt
es ingesamt
n(n − 1) . . . (n − k + 1)
(82)
n!
. Wenn wir uns für die Anzahl der
Möglichkeiten. Diese Größe ist gleich (n−k)!
Teilmengen mit k Elementen interessieren ist die Reihenfolge in der die Elemente
gewählt werden unwichtig. Für eine gegebene Teilmenge gibt es k! Möglichkeiten
für diese Reihenfolge. Die Anzahl der Teilmengen mit k Elementen ist also
n
n!
/k! =
(83)
(n − k)!
k
und wir erhalten eine Interpretation für die Binomialkoeffizienten. nk ist die
Anzahl der Möglichkeiten, k von n Objekten zu wählen, ohne auf die Reihenfolge
zu achten.
Mit diesen Informationen kommen wir auf die Frage zurück, wie viele Teilmengen einer Menge mit n Elementen es gibt. Nach den soeben gemachten
Überlegungen sind es
n X
n
n
n
n
=
+
+ ...
.
(84)
k
0
1
n
k=0
25
Nach der binomischen Formel ist dieser Ausdruck nichts anderes als (1 + 1)n =
2n . Deshalb ist die Anzahl der Teilmengen einer endlichen Menge X gleich 2|X| .
Diese Tatsache motiviert die oben erwähnte Schreibweise 2X .
9
Graphentheorie
In diesem Abschnitt geht es um Objekte, die Graphen heissen. Sie haben aber
mit den Graphen, die in früheren Abschnitten eingeführt wurden nichts zu tun.
Ein Graph in diesem Sinn kann folgendermassen dargestellt werden. Man hat
endlich viele Punkte in der Ebene, die als Knoten bezeichnet werden und einige
werden miteinander verbunden durch Geraden oder Kurven, die als Kanten
bezeichnet werden. Die Knoten werden auch alternativ als Punkte, Knotenpunkte oder Ecken bezeichnet. Die Mengen der Knoten bzw. Kanten eines
Graphen G werden mit V (G) bzw. E(G) bezeichnet. Ein Graph kann benutzt werden um bestimmte Beziehungen darzustellen. Betrachten wir zum
Beispiel einen Wettbewerb, wo verschiedene Mannschaften aufeinander treffen.
Die Spiele, die zu einem bestimmten Zeitpunkt stattgefunden haben können
durch einen Graphen dargestellt werden. Nehmen wir z. B. an, dass es acht
Mannschaften A, B, C, D, E, F , G und H gibt und dass die Spiele, die schon
stattgefunden haben folgende sind: A gegen F , B gegen G, C gegen F , C gegen
D, E gegen F , E gegen H und G gegen H. Dieser Graph kann verschieden
in der Ebene dargestellt werden (mit Geraden oder Kurven, mit oder ohne
Überkreuzungen der Kanten). [In der Vorlesung werden zwei Möglichkeiten
gezeigt.]
Eine andere Variante dieser Definition bekommt man in dem man jede Kante
orientiert, so dass sie einen Anfangs- und Endknoten hat. In diesem Fall nennt
man die Kanten auch Bögen und den Anfangs- bzw. Endknoten eines solchen
Bogens den Kopf bzw. den Schwanz. In dem Fall spricht man von einem
gerichteten Graphen. Normale Graphen (ohne Orientierung) werden manchmal
als schlichte Graphen bezeichnet. In dem Fall wird nicht zugelassen, dass es
mehr als eine Kante gibt, die zwei gegebene Knoten miteinander verbinden.
Kanten, die einen Knoten mit sich selbst verbinden (Schlingen) sind auch nicht
erlaubt. Im Folgenden bedeutet das Wort Graph, wenn es nicht weiter qualifiziert wird schlichter Graph. Allgemeinere Objekte, die Mehrfachverbindungen
zwischen Knoten und Schlingen zulässen werden als Multigraphen bezeichnet,
spielen aber in dieser Vorlesung kaum eine Rolle. Bei einem gerichteten Graphen
sind zwei Kanten, die zwei gegebene Knoten miteinander verbinden nur dann
erlaubt wenn sie entgegengesetzt orientiert sind. Schlingen sind nicht erlaubt.
Jedem gerichteten Graphen kann man einen schlichten Graphen zuordnen, in
dem man die Orientierung der Kanten vergisst und in jedem Fall wo zwei Kanten die gleichen zwei Knoten verbinden, diese durch eine Kante zwischen diesen
zwei Knoten ersetzt.
Gerichtete Graphen können benutzt werden, um Systeme von chemischen
Reaktionen darzustellen. Ein Beispiel in der in der Chemie üblichen Schreibweise ist A + B → 2C. Hier sind A, B und C drei chemische Stoffe und ein
26
Molekül von A reagiert mit einem Molekül von B, um zwei Moleküle von C zu
produzieren. Die Ausdrücke auf der linken und rechten Seiten der Reaktionen
heissen chemische Komplexe. In diesem Beispiel sind die Stoffe (A, B, C), die
Komplexe (A + B, 2C) and es gibt nur die eine Reaktion. Jetzt wird diese
Beschreibung mathematisch präzisiert. Der gerichtete Graph, der ein System von chemischen Reaktionen beschreibt wird manchmal chemisches Netzwerk genannt. Ein solches Netzwerk wird durch folgende mathematische Objekte beschrieben. Es gibt endliche Mengen S, die Menge der Stoffe, C, die
Menge der Komplexe, und R, die Menge der Reaktionen. Jedes Element von
C ist eine Abbildung y von S nach N0 . Der Wert von y im Punkt s ∈ S
wird mit ys bezeichnet. Im Beispiel sind die Komplexe (1, 1, 0) und (0, 0, 2).
R = (C × C) \ (Diagonal). Anders gesagt, sind die Elemente von R geordnete
Paare unterschiedlicher Elemente von C. Für ein allgemeines chemisches Netzwerk definiert man einen dazugehörigen gerichteten Graphen G in dem man
V (G) = C wählt und E(G) = R. Die Kanten werden so orientiert, dass die
Komplexe auf der linken bzw. rechten Seite der Reaktion den Anfangs- bzw.
Endknoten entsprechen. Hier ist ein anderes Beispiel. [In der Vorlesung wird
der Graph angeschrieben.] S = {A, B, C, D, E}, C = {A, 2B, A + C, D, B + E}.
Die Reaktionen sind A → 2B, 2B → A, A + C → D, D → A + C, D → B + E,
B + E → A + C.
Wie werden Graphen mathematisch definiert?
Definition Ein Graph G besteht aus zwei endlichen Mengen, der Knotenmenge
V (G), die nicht leer ist und der Kantenmenge E(G), möglicherweise leer. Jedes
Element von E(G) ist eine Teilmenge von V (G) mit zwei Elementen (ungeordnetes Paar von Knoten). Die Elemente von e ∈ E(G) heissen Endknoten von
e.
Aus der Diskussion von chemischen Reaktionen dürfte klar sein, wie man analog
gerichtete Graphen definiert. Ein gerichteter Graph besteht aus einer Knotenmenge und einer Menge von geordneten Paaren von Knoten. In diesem Fall ist
der Anfangsknoten das erste Element des Paares und der Endknoten das zweite.
Es gibt eine Beziehung mit den Relationen, die in einem früheren Abschnitt
definiert wurden. Eine Relation R heisst anti-reflexiv wenn x ∼ x nie gilt, d.h.
wenn (x, x) nie zu R gehört. Deshalb ist ein gerichteter Graph G das Gleiche
wie eine anti-reflexive Relation auf V (G). Wenn die Relation symmetrisch ist,
dann können wir die Orientierung vergessen. Eine äquivalente Darstellung eines
Graphen ist als eine Teilmenge von V (G) × V (G), die die Diagonale nicht trifft
und unter Vertauschung der zwei Kopien von V (G) symmetrisch ist. Wenn es
uns nutzt werden wir also E(G) als Teilmenge von V (G) × V (G) betrachten.
Jetzt werden ein paar weitere Beispiele beschrieben. Das erste ist ein sogenanntes Zuteilungsproblem. Nehmen wir an, es gibt fünf Personen A, B, C, D
und E, die fünf Arbeiten a, b, c, d und e ausführen sollen. Die unterschiedlichen
Personen sind nur für einige der Aufgaben qualifiziert. Ist es möglich, jede Arbeit einer qualifizierten Person zu übertragen, so dass jede Person genau eine
Aufgabe bekommt? Hier ist ein konkreter Fall. [Der Graph wird in der Vor-
27
lesung angeschrieben.] A ist für c und d qualifiziert, B für c, C für a, b und
e, D für c und d und E für b und e. In diesem Fall ist das Problem unlösbar
wie eine Betrachtung der Personen A, B und D zeigt. Diese drei Personen sind
zusammen nur für die zwei Aufgaben c und d qualifiziert. Deshalb ist keine
Zuordnung der gewünschten Art möglich.
Im nächsten Beispiel sollen drei Häuser mit Gas, Wasser und Strom versorgt werden. Die Häuser werden durch Knoten H1 , H2 und H3 dargestellt
und die drei Arten der Versorgung durch G, W und S. [Ein entsprechender
Graph wird in der Vorlesung gezeigt.] Kann die Versorgung gelingen, wenn die
Versorgungswege sich nicht überkreuzen dürfen? Hier ist das Problem nicht
mehr als rein graphentheoretisches Problem formuliert. Es gibt eine Theorie die
man darauf anwenden kann, die Theorie der planaren Graphen. Die Antwort in
diesem Beispiel ist dass die gestellte Aufgabe keine Lösung zulässt.
Die Anzahl der Elemente der Menge V (G) wird mit v(G) bezeichnet und
heisst Ordnung von G während die Anzahl der Elemente der Menge E(G)
mit e(G) bezeichnet wird und Grösse des Graphen heisst. Der triviale (oder
leere) Graph mit n Knoten ist der bei dem die Menge der Kanten leer ist. Ein
vollständiger Graph mit n Knoten ist einer in dem jedes Paar unterschiedlicher
Kanten. Zwei
Knoten durch eine Kante verbunden ist. Dieser Graph hat n(n−1)
2
Graphen G1 und G2 heissen isomorph wenn es eine bijektive Abbildung φ von
V (G1 ) nach V (G2 ) gibt mit der Eigenschaft, dass (φ×φ)(E(G1 )) = E(G2 ). Zwei
Graphen, die durch einen solchen Isomorphismus φ miteinander in Beziehung
gesetzt werden sind im wesentlichen gleich. Zwei vollständige Graphen mit n
Knoten sind isomorph und wir sprechen deshalb vom dem vollständigen Graphen
mit n Knoten. Es ist nicht immer leicht zu sehen, ob zwei Graphen die durch
explizite Darstellungen in der Ebene angegeben werden tatsächlich isomorph
sind. Wenn G1 und G2 isomorph sind, dann müssen v(G1 ) = v(G2 ) und
e(G1 ) = e(G2 ) gelten, aber nicht umgekehrt. Bei 3 Knoten gibt es nur 4 nichtisomorphe Graphen und bei 4 Knoten nur 11. Bei 7 Knoten gibt es aber schon
1044. Der Begriff des Isomorphismus ist in der Mathematik weit verbreitet,
wobei die genaue Definition davon abhängt, um was für ein mathematisches
Objekt es sich dabei handelt.
Es sei G ein Graph. Wenn V (G) die Vereinigung zweier nichtleerer Teilmengen X und Y ist, d.h. X ∪ Y = V (G) und X ∩ Y = ∅ und jede Kante ein Ende
in X und ein Ende in Y hat wird G als paarer Graph bezeichnet. Die Zerlegung
heisst Zweiteilung von G. Ein vollständiger paarer Graph ist einer in dem jeder
Knoten von X mit jedem Knoten von Y verbunden ist. Ein solcher Graph wird
mit Km,n bezeichnet. Alle solchen Graphen mit festen Werten von m und n
sind zueinander isomorph und Km,n ist isomorph zu Kn,m .
9.1
Knotengrade
Ein Knoten eines Graphen G, der kein Endpunkt irgendeiner Kante ist, heisst
isoliert. Eine Kante e von G heisst mit dem Knoten v inzident, wenn v ein
Endknoten von e ist. In diesem Fall sagt man auch, dass v mit e inzident
ist. Zwei Kanten, die mit einem gemeinsamen Knoten inzident sind heissen
28
benachbart. Zwei Knoten, die mit einem gemeinsamen Kanten inzident sind,
heissen auch benachbart. Wenn v ein Knoten eines Graphen G ist, dann ist der
Grad d(v) von v die Anzahl der mit v inzidenten Kanten von G. Mit diesen
Definitionen hat man den
Satz 9.1 Für
Pn jeden Graphen mit e Kanten und n Knoten v1 . . . . , vn gilt die
Beziehung i=1 d(vi ) = 2e.
Beweis Jede Kante trägt zwei zu dieser Summe bei. D. h. es wird jede Kante
zweimal gezählt.
Ein Knoten eines Graphen heisst gerade bzw. ungerade wenn sein Grad
gerade bzw. ungerade ist.
Corollar In jedem Graphen G gibt es eine gerade Anzahl von ungeraden Knoten.
Beweis Sei W die Menge der ungeraden Knoten von G und U die Menge
P der geraden Knoten von G. für jedes u ∈ U ist d(u) gerade und deshalb ist u∈U d(u)
auch gerade. Satz 1 impliziert dass
X
X
X
d(u) +
d(w) =
d(v) = 2e.
(85)
u∈U
w∈W
v∈V
P
Deshalb ist w∈W d(w) gerade. Damit dies der Fall sein kann muss die Anzahl
der ungeraden Knoten gerade sein.
Es muss nicht sein, dass die Anzahl der geraden Knoten ungerade ist. Ein
Gegenbeispiel ist ein Quadrat, wo die Ecken die Knoten sind und die Seiten
die Kanten. Ein Graph G heisst k-regulär wenn d(v) = k für jeden Knoten v.
Ein Graph heisst regulär wenn er k-regulär ist für irgendeine natürliche Zahl
k. Das Quadrat ist 2-regulär. Der vollständige Graph Kn is n-regulär. Der
vollständiger paarer Graph Kn,n mit 2n Knoten ist n-regulär.
9.2
Untergraphen
Sei H ein Graph mit der Knotenmenge V (H) und der Kantenmenge E(H) und
G ein Graph mit der Knotenmenge V (G) und der Kantenmenge E(G). Dann
wird H als Untergraph von G bezeichnet wenn V (H) ⊂ V (G) und E(H) ⊂
E(G). Man sagt auch, dass H ein Untergraph von G ist, wenn H isomorph zu
einem Untergraphen von G ist. Wenn H ein Untergraph von G ist schreibt mann
H ⊂ G. Wenn in diesem Fall H 6= G, dann heisst H ein echter Untergraph von
G. Ein spannender Untergraph H von G ist einer mit den gleichen Knoten, d.h.
V (H) = V (G). Jeder Graph mit n Knoten ist Untergraph des vollständigen
Graphen Kn .
Jetzt werden ein paar Möglichkeiten beschrieben, Untergraphen zu erzeugen.
Nehmen wir an dass der Graph G so ist, dass V (G) mindestens zwei Elemente
hat. Für einen Knoten v ∈ V (G) bezeichnet G − v den Untergraphen mit der
Knotenmenge V (G) \ {v} und als Kanten alle Kanten von G, die nicht mit v
inzident sind. Wenn wir E(G) als Teilmenge von [V (G)]2 betrachten, dann ist
E(G−v) = E(G)∩[V (G−g)]2 . Um G−v von G zu erhalten entfernt man v und
alle Kanten, die mit v direkt verbunden sind. G − v wird als knotengelöschter
Untergraph bezeichnet. Wenn e eine Kante von G ist dann bezeichnet G −
29
e den Untergraphen von G, der die gleiche Knotenmenge hat wie G und die
Kantenmenge E \ {e} hat. Um G − e von G zu erhalten entfernt man die Kante
e aber nicht deren Endpunkte. G − e wird als kantengelöschter Untergraph
bezeichnet.
Diese Beispiele können verallgemeinert werden auf Fälle in denen mehrere
Ecken oder Kanten entfernt werden. Im ersten Fall entfernt man eine Teilmenge
U von V (G), zusammen mit allen Kanten, die mit Knoten aus U inzident sind.
Das Ergebnis heisst dann G − U . Es gilt die Beziehung E(G − U ) = E(G) ∩
[V (G − U )]2 . Im zweiten Fall entfernt man eine Teilmenge F von E und behält
alle Knoten. Das Ergebnis heisst G − F .
Wenn U eine nichtleere Teilmenge der Knotenmenge V (G) ist, dann ist der
durch U induzierte Untergraph G[U ] von G als der Graph G definiert, der die
Knotenmenge U hat und deren Kantenmenge aus den Kanten von G besteht, die
beide Enden in U haben. Es gilt die Beziehung G[U ] = G − (V (G) \ U ). Wenn
F eine nichtleere Teilmenge der Kantenmenge E(G) ist, dann ist der durch F
induzierte Untergraph G[F ] der Graph, dessen Knotenmenge die Menge der
Kantenenden von F ist und dessen Kantenmenge F ist. In diesem Fall ist
V (G[F ]) = π(F ), wo π die Projektion von [V (G)]2 auf einen der Faktoren ist.
Zwei Untergraphen G1 und G2 heissen disjunkt, wenn sie keinen gemeinsamen Knoten haben. Sie heissen kantendisjunkt, wenn sie keine gemeinsame
Kante haben. Disjunkt impliziert kantendisjunkt. Für zwei Untergraphen G1
und G2 von G ist die Vereinigung G1 ∪G2 der Graph mit V (G1 ∪G2 ) = V (G1 )∪
V (G2 ) und E(G1 ∪ G2 ) = E(G1 ) ∪ E(G2 ). Wenn G1 und G2 mindestens einen
gemeinsamen Knoten haben ist es auch möglich, den Durchschnitt G1 ∩ G2 zu
definieren durch V (G1 ∩G2 ) = V (G1 )∩V (G2 ) und E(G1 ∩G2 ) = E(G1 )∩E(G2 ).
9.3
Wege und Zyklen
Eine Kantenfolge in einem Graphen ist eine endliche Folge
W = v0 e1 v1 e2 v2 . . . vk−1 ek vk
(86)
deren Terme abwechselnd Knoten und Kanten sind, so dass, für 1 ≤ i ≤ k die
Kante ei die Enden vi−1 und vi hat. Wir nennen die Kantenfolge eine Kantenfolge von v0 nach vk . Der Knoten v0 heisst Anfangsknoten von W und der
Knoten vk Endknoten von W . Die Knoten v0 und vk müssen nicht voneinander
verschieden sein. Die Knoten v1 , . . . , vk−1 heissen innere Knoten. Die ganze
Zahl k heisst Länge der Kantenfolge W . In einer Kantenfolge darf es Wiederholungen von Knoten und Kanten geben. Die Kantenfolge ist durch die darin
enthaltene Folge von Knoten bestimmt und wird entsprechend oft durch die
Knotenfolge bezeichnet.
Eine triviale Kantenfolge beinhaltet keine Kanten, besteht also aus einem
einzigen Knoten. Eine Kantenfolge von u nach v heisst geschlossen, wenn u = v
ist und offen, wenn u 6= v ist. Wenn die Kanten in W unterschiedlich sind
heisst W ein Kantenzug. Wenn die Knoten in W unterschiedlich sind heisst W
ein Weg. Jeder Weg ist ein Kantenzug, aber nicht umgekehrt. Wenn u und v
30
unterschiedliche Knoten sind gibt es im allgemeinen mehrere Wege von u nach
v. Die Längen dieser Wege bilden eine endliche Menge von natürlichen Zahlen
und diese Zahlen haben ein Minimum k. Dann haben die Wege von u nach v der
Länge k die Eigenschaft, dass kein anderer Weg von u nach v kürzer ist. Wir
nennen sie die kürzesten Wege von u nach v. Im allgemeinen gibt es mehrere
solche Wege. Wenn W ein kürzester Weg von u nach v ist und u0 und v 0 Knoten,
die zu diesem Weg gehören, dann ist der Teil von W zwischen u0 und v 0 auch
ein kürzester Weg.
Satz 9.2 Wenn u und v Knoten eines Graphen G sind, beinhaltet jede Kantenfolge von u nach v einen Weg von u nach v.
Beweis Wenn u = v ist dann können wir den trivialen Weg nehmen. Wenn
u 6= v sei die Folge von Knoten in W
u = u0 , u1 , u2 , . . . , uk−1 , uk = v.
(87)
Wenn keiner der Knoten öfter als einmal in W vorkommt, dann ist W bereits ein
Weg von u nach v. Wenn es dagegen Knoten von G gibt, die in W mindestens
zweimal vorkommen dann gibt es unterschiedliche i, j mit i < j, so dass ui =
uj . Wenn man die Knoten ui , . . . , uj−1 und die nachfolgenden Kanten entfernt
dann erhält man eine Kantenfolge von u nach v, die weniger Knoten enthält als
W . Wenn die neue Kantenfolge keine wiederholte Knoten enthält, dann haben
wir schon den gesuchten Weg. Ansonsten können wir das Entfernungverfahren
wiederholen. Nach endlich vielen Schritten führt diese Vorgehensweise zum Ziel.
Der Knoten u wird als zusammenhängend mit einem Knoten v bezeichnet, wenn
es einen Weg von u nach v gibt. Wenn u mit v zusammenhängend ist, dann
ist v mit u zusammenhängend, wie man durch Umkehrung des Weges sieht.
Jeder Knoten ist mit sich selbst zusammenhängend durch den trivialen Weg.
Wenn u mit v zusammenhängend ist und v mit w, dann ist u mit w zusammenhängend. Man kann die Wege zusammenfügen. Dieses Verfahren heisst
Verkettung der Wege. Wir können eine Relation folgendermassen definieren:
u ∼ v wenn u mit v zusammenhängend ist. Die Eigenschaften, die wir gerade
bewiesen haben zeigen, dass es sich dabei um eine Äquivalenzrelation handelt.
Die Äquivalenzklassen heissen Komponenten oder Zusammenhangskomponenten von G. Die Äquivalenzklasse von u, C(u), besteht aus allen Knoten v mit
u ∼ v. Ein Graph heisst zusammenhängend, wenn er nur eine Zusammenhangskomponente hat. Die Anzahl der Komponenten von G wird mit ω(G)
bezeichnet.
Bei einem gerichteten Graphen kann man ähnliche Definitionen machen.
Ein gerichteter Kantenzug ist einer wo der Endpunkt jeder Kante mit dem
Anfangspunkt der nächsten zusammenfällt. Ein gerichteter Weg ist dann ein
gerichteter Kantenzug, der auch ein Weg ist. Der Knoten u wird als stark zusammenhängend mit einem Knoten v bezeichnet, wenn es einen gerichteten Weg von
u nach v gibt und einen gerichteten Weg von v nach u. Auf diese Weise wird eine
Äquivalenzrelation definiert und die entsprechenden Äquivalenzklassen heissen
starke Zusammenhangskomponenten. Ein Graph heisst stark zusammenhängend,
31
wenn er nur eine starke Zusammenhangskomponente hat. Bei chemischen Netzwerken heissen die Zusammenhangskomponenten Verlinkungsklassen und die
starken Zusammenhangskomponenten starke Verlinkungsklassen. Ein Netzwerk
heisst reversibel wenn es zu jedem Bogen von einem Knoten u zu einem Knoten
v einen Bogen von v nach u gibt. Es heisst schwach reversibel wenn es zu jedem
gerichteten Weg von u nach v einen gerichteten Weg von v nach u gibt. Bei
einem schwach reversiblen Netzwerk stimmen die starken Zusammenhangskomponenten mit den Zusammenhangskomponenten überein.
Ein nichttrivialer geschlossener Kantenzug in einem Graphen G heisst ein
Zyklus, wenn sein Anfangsknoten und seine inneren Knoten unterschiedlich sind.
Ein Zyklus der Länge k, d.h. mit k Kanten, heisst ein k-Zyklus. Ein k-Zyklus
heisst gerade, wenn k gerade ist und ungerade, wenn k ungerade ist. Ein 3Zyklus wird oft als Dreikreis bezeichnet. Ein n-Zyklus wird manchmal mit Cn
bezeichnet.
Satz 9.3 Es sei G ein nichtleerer Graph mit mindestens zwei Knoten. G ist
dann und nur dann ein paarer Graph, wenn er keine ungeraden Zyklen hat.
Beweis Nehmen wir an, dass G ein paarer Graph ist mit der Knotenmenge V
und der Zweiteilung V = X ∪ Y . Es sei C = v0 v1 . . . vk v0 ein Zyklus von G.
Nehmen wir an, dass die Notation so gewählt ist, dass v0 ∈ X. Es folgt, da
G ein paarer Graph ist, dass v1 ∈ Y . Dann ist v2 ∈ X usw. Deshalb liegen
die Knoten bei denen der Index gerade ist in X und die Knoten bei denen er
ungerade ist in Y . Da v0 ∈ X muss vk ∈ Y . Deshalb ist k ungerade und
der Zyklus ist gerade. Deshalb enthält G keine ungeraden Zyklen und die eine
Richtung ist bewiesen.
Um die Umkehrung zu beweisen nehmen wir an, dass G ein nichtleerer Graph
ist, der keine ungeraden Zyklen enthält. Wir wollen zeigen, dass G ein paarer
Graph ist. Nun wird G paar sein, wenn jede seiner Komponenten mit mehr
als einem Knoten paar ist, denn wenn diese Komponenten C1 , C2 , . . . Cn sind
und ihre Knotenmengen V1 , V2 , . . . Vn die Zweiteilungen V1 = X1 ∪ Y1 , C2 =
X2 ∪ Y2 , . . . Cn = Xn ∪ Yn haben, dann hat die Knotenmenge V von G die
Zweiteilung X ∪ Y , mit
X = X0 ∪ X1 ∪ . . . ∪ Xn , Y = Y0 ∪ Y1 ∪ . . . ∪ Yn ,
(88)
wobei X0 die Menge der isolierten Knoten in G ist. Es reicht also, um den
Satz zu beweisen zu zeigen, dass jeder zusammenhängende Graph G mit mehr
als einem Knoten und ohne ungerade Zyklen paar ist. Unter dieser Annahme
für G definieren wir zwei Teilmengen von V (G) wie folgt. Sei u ein Knoten
von G. X ist die Menge aller Knoten v ∈ G mit der Eigenschaft, dass jeder
kürzeste Weg von u nach v gerade ist. Y ist die Menge aller Knoten v ∈ G
mit der Eigenschaft, dass jeder kürzeste Weg von u nach v ungerade ist. Der
Punkt u selbst liegt in X. Es ist klar, dass V (G) = X ∪ Y und dass X und
Y kein gemeinsames Element besitzen. Wir wollen jetzt zeigen, dass X und Y
eine Zweiteilung von G definieren und dazu müssen wir zeigen, dass jede Kante
einen Endknoten in X hat und einen in Y .
Es seien v und w zwei Knoten in X, die benachbart sind. Es sei P ein
32
kürzester Weg von u nach v und Q ein kürzester Weg von u nach w.
P = v1 , v2 , . . . , v2n+1
und Q = w1 , v2 , . . . , w2m+1
(89)
so dass u = v1 = w1 , v = v2n+1 , w = w2n+1 . Nehmen wir an, dass w0 ein
Knoten ist, die beide Wege gemeinsam haben, und ausserdem, dass w0 der
letzte derartige Knoten ist. Die Wege von u nach w0 , die durch P und Q
definiert werden sind beide kürzeste Wege und haben deshalb die gleiche Länge.
Die Wege P und Q sind beide gerade und deshalb sind die entsprechenden Wege
von w0 nach v und w entweder beide gerade oder beide ungerade. Es gibt einen
Zyklus der aus dem Teil von P von w0 nach v, eine Kante zwischen v und w
und dem Teil von Q von w0 nach w besteht. Die Länge von diesem Zyklus ist
die Summe von Eins mit zwei Zahlen, die entweder beide gerade sind oder beide
ungerade. Der Zyklus ist also ungerade, ein Widerspruch zu den Annahmen des
Satzes. Wir können schliessen, dass es keine Kanten in G gibt, die zwei Knoten
in X verbinden. Es kann ganz analog gezeigt werden, dass es keine Kanten in
G gibt, die zwei Knoten in Y verbinden. Deshalb ist G ein paarer Graph.
9.4
Die Matrizendarstellung eines Graphen
Eine Möglichkeit, einen Graphen mit einem Computer darstellen ist die seine
Nachbarschaftsmatrix. Es sei G ein Graph mit n Knoten, durchnumeriert als
v1 , v2 , . . . vn . Die Nachbarschaftsmatrix von G, die von der gewählten Numerierung abhängig ist, ist die n × n Matrix A(G) = (aij ), in der aij gleich
der Anzahl der die Knoten verbindenden Kanten ist. Die Einträge der Matrix
aij sind alle entweder 0 oder 1. (Bei einem Multigraphen könnte man eine
ähnliche Definition machen und in dem Fall würden auch andere natürliche
Zahlen in der Matrix vorkommen.) Die diagonalen Elemente aii sind alle Null,
weil Schlingen verboten sind. Es gilt aij = aji für alle i, j, d.h. die Matrix ist
symmetrisch. Wenn eine symmetrische n × n-Matrix A mit verschwindenden
Diagonaleinträgen gegeben ist können wir einen entsprechenden Graphen konstruieren. Dieser Graph hat n Knoten vi bis vn und der Knoten vi ist mit dem
Knoten vj verbunden wenn und nur wenn aij = 1 ist. Betrachten wir die Matrix
B = A2 mit Einträgen (bij ). Die Zahl bij ist die Anzahl von Kantenfolgen der
Länge 2 von vi nach vj .
Satz 9.4 Es sei G ein Graph mit n Knoten v1 , . . . vn und sei A die Nachbarschaftsmatrix von G, die sich auf diese Numerierung der Knoten bezieht. Es
sei k eine positive ganze Zahl und Ak bezeichne die k-te Potenz der Matrix A.
Dann entspricht der (i, j)-te Eintrag von Ak der Anzahl der unterschiedlichen
Kantenfolgen der Länge k von vi nach vj .
Beweis Der Beweis erfolgt durch vollständige Induktion. Für k = 1 besagt
der Satz, dass der (i, j)-te Eintrag von A der Anzahl unterschiedlicher Kantenfolgen der Länge Eins von vi nach vj entspricht, was nach der Definition der
Nachbarschaftsmatrix richtig ist. Eine Kantenfolge der Länge Eins ist ja nichts
anderes als eine Kante, die die Knoten v1 und v2 verbindet. Damit haben wir
den Induktionsanfang.
33
Um den Induktionsschritt zu vollziehen, nehmen wir an, dass das Ergebnis
für Ak−1 richtig ist, wobei k eine ganze Zahl grösser Eins ist. Wir möchten
beweisen, dass der Satz für Ak richtig ist. Wir schreiben Ak−1 = (bij ) und Ak =
k
k−1
(cij ) Dann
A und, nach der Definition der Matrixmultiplikation
Pn ist A = A
cij = t=1 b1t atj . Nun setzt sich jede Kantenfolge der Länge k von vi nach vj
aus einer Kantenfolge der Länge k − 1 von vi nach einem Knoten vt und eine
Kante von vt nach vj zusammen. Für eine gegebene Wahl des Knoten vt gibt
es nach der Induktionsvoraussetzung genau bij Knotenfolgen dieser Art. Um
die gesante Anzahl der Knotenfolgen der Länge k von vi nach vj müssen wir
diese Zahlen P
über alle Knoten vt summieren, die mit vj verbunden sind. Das
n
Ergebnis ist t=1 b1t atj , also cij . Damit ist der Beweis vollständig.
Wir können das vorherige Resultat verwenden, um zu bestimmen, ob ein Graph
zusammenhängend ist oder nicht.
Satz 9.5 Es sei G ein Graph mit n Knoten v1 , . . . , vn und A die Nachbarschaftsmatrix von G. Es sei B = (bij ) die Matrix
B = A + A2 + . . . + An−1 .
(90)
G ist dann und nur dann zusammenhängend, wenn für jedes Paar von verschiedenen Indizes i, j gilt, dass bij 6= 0, dass heisst, wenn B keine Einträge
Null ausserhalb der Haupdiagonalen hat.
(k)
Beweis Es bezeichne aij den (i, j)-ten Eintrag der Matrix Ak für k = 1, . . . , n −
1. Dann ergibt sich
(1)
(n−1)
bij = aij + . . . aij
.
(91)
(k)
Nach dem letzten Satz ist aij die Anzahl der Kantenfolgen der Länge k von vi
nach vj . Deshalb ist bij die Anzahl der Kantenfolgen deren Länge kleiner als
n ist. Nehmen wir jetzt an, dass G zusammenhängend ist. Dann gibt es für
jedes Paar (vi , vj ) von unterschiedlichen Knoten von G einen Weg von vi nach
vj . Da G nur n Knoten hat ist die Länge des Weges nicht grösser als n − 1.
Deshalb macht dieser Weg einen Beitrag zur Summe und bij > 0. Nehmen wir
umgekehrt an, dass bij 6= 0 für jedes unterschiedliche Paar (i, j). Dann folgt aus
der Betrachtung der obigen Summe, dass es mindestens eine Kantenfolge von vi
nach vj gibt (mit einer Länge kleiner als n). Deshalb ist G zusammenhängend.
Dieser Satz kann benutzt werden um zu entscheiden, ob der Graph der durch
eine Nachbarschaftsmatrix definiert wird zusammenhängend ist. Betrachten wir
z. B. die Matrix


0 0 1 0 0
 0 0 0 1 0 



A=
(92)
 1 0 0 0 1 .
 0 1 0 0 1 
0 0 1 1 0
34
In diesem Fall zeigt eine Rechnung, dass



A+A +A +A =


2
3
4
3
1
3
1
4
1
3
1
3
4
3
1
7
5
4
1
3
5
7
4
4
4
4
4
8



.


(93)
so dass der Graph zusammenhängend ist. In diesem Fall enthält die Matrix
A + A2 + A3 noch Nullen, so dass man wirklich so weit rechnen muss.
10
10.1
Bäume und Brücken
Definition und einfache Eigenschaften
Ein Graph G heisst azyklisch, wenn er keine Zyklen enthält. Ein Graph, der
zusammenhängend und azyklisch ist heisst ein Baum.
Satz 10.1 Ein Graph T ist genau dann ein Baum, wenn es zu jedem Paar (u, v)
von unterschiedlichen Knoten genau einen Weg in T von u nach v gibt.
Beweis Sei T ein Baum und nehmen wir an, dass es zwei unterschiedliche Wege
von u nach v gibt, sagen wir P = uu1 u2 . . . um v und P 0 = uv1 v2 . . . vn v. Es sei
w der erste Knoten nach u, der beiden Wegen, P und Q, gehört. Dann ist w =
ui = vj für bestimmte Indizes i und j. Es folgt, dass C = uu1 . . . ui vj−1 . . . v1
ein Zyklus ist. Wir erhalten einen Widerspruch. Es folgt, dass es in der Tat
nicht mehr als einen Weg von u nach v gibt und da ein Baum zusammenhängend
ist, gibt es genau einen. Damit ist die eine Richtung im Satz bewiesen. Um
die andere Richtung zu beweisen nehmen wir an, dass es genau einen Weg gibt
zwischen jedem Paar von unterschiedlichen Knoten von T . Damit ist klar, dass
T zusammenhängend ist. Es bleibt nur noch zu zeigen, dass T keine Zyklen
enthält. Ein Zyklus ist von der Form C = v1 . . . vn v1 , wobei n ≥ 2 ist. Die
Kante v1 vn kommt in dem Weg v1 . . . vn nicht vor und deshalb wären v1 . . . vn
und v1 vn zwei verschiedene Wege von v1 nach vn , was unter der gegebenen
Annahme nicht möglich ist. Damit ist der Satz bewiesen.
Der nächste Satz sagt, dass jeder Baum mindestens zwei ‘Blätter’ hat.
Satz 10.2 Es sei T ein Baum mit mindestens zwei Knoten und es sei P =
u0 . . . un ein längster Weg in T (d.h. es gibt keinen Weg in T , der länger ist).
Dann haben die beiden Knoten u0 und un den Grad 1.
Beweis Nehmen wir an, dass d(u0 ) > 1. Die Kante f = u0 u1 trägt 1 zu dem
Grad von u0 bei und somit muss es eine andere Kante e von u0 zu einem Knoten
v von T geben. Wenn dieser Knoten v einer der Knoten des Weges P ist, dann
können wir v = ui setzen und dies erzeugt einen Zyklus C = u0 u1 . . . ui u0 . Da
T ein Baum ist, kann dies nicht der Fall sein. Es ist also so, dass v nicht zu P
gehört. Aber dann gibt es einen Weg P1 = vu0 . . . un der Länge n + 1, was der
Annahme widerspricht, dass P ein längster Weg ist. Es folgt, dass d(u0 ) = 1.
Genauso kann man zeigen, dass d(un ) = 1.
35
Aus diesem Satz kann man schliessen, dass ein Baum mit mindestens zwei
Knoten mehr als einen Knoten mit Grad 1 enthält.
Satz 10.3 Wenn T ein Baum mit n Knoten ist, dann hat er genau n−1 Kanten.
Beweis Der Beweis wird durch vollständige Induktion geführt. Wenn n = 1
dann hat T keine Kanten und die Behauptung für n = 1 stimmt. Nehmen wir
jetzt an, dass die Behauptung für n = k richtig ist. Wir wollen zeigen, das die
Behauptung für n = k + 1 richtig ist. Es sei T ein Baum mit k + 1 Knoten
und u ein Knoten vom Grad 1 in T (was nach dem letzten Satz existiert). Sei
e = uv die einzige Kante, die u als Endknoten hat. Wenn x und y zwei von u
verschiedene Knoten sind, dann führt jeder Weg P , der x und y verbindet nicht
durch den Knoten u. Folglich ist der Untergraph T − u zusammenhängend.
Dieser Untergraph enthält keine Zyklen. Es folgt, dass T − u ein Baum ist.
Durch die Induktionsvoraussetzung wissen wir, dass T − u genau k − 1 Kanten
hat. Der Graph T hat genau eine Kante mehr als T − u und infolgedessen k
Kanten, womit der Induktionsschritt vollzogen ist.
Wenn G ein azyklischer Graph ist hat auch jeder Untergraph von G keine Zyklen.
Deshalb ist jede Zusammenhangskomponente von G ein Baum. Aus diesem
Grund nennt man manchmal einen azyklischen Graphen einen Wald. Aus dem
Satz kann man leicht schliessen, dass ein Baum mit n Knoten und k Zusammenhangskomponenten genau n − k Kanten enthält.
10.2
Brücken
Satz 10.4 Es sei e eine Kante des Graphen G. Dann gilt ω(G) ≤ ω(G − e) ≤
ω(G) + 1.
Beweis Seien u und v die Endknoten von e und es sei C die Komponente zu der
e, u und v gehören. e bildet einen Weg von u nach v. Nehmen wir jetzt an, dass
es einen anderen Weg P von u nach v gibt. Dann gehört e nicht zu P . Also gibt
es im Untergraphen G − e einen Weg von u nach v und diese zwei Knoten sind
in G − e zusammenhängend. Wenn x und y zwei beliebige Knoten in C sind,
gibt es einen Weg von x nach y. Immer wenn e in diesem Weg vorkommt kann
er durch P ersetzt werden. Auf diese Weise bekommen wir einen Kantenzug
in G − e von x nach y. Dies zeigt, dass die Knoten von C immer noch eine
Komponente von G − e darstellen. Da die anderen Komponenten von G durch
das Entfernen von e nicht berührt werden hat G − e in diesem Fall die gleiche
Anzahl von Komponenten wie G. Es bleibt die Möglichkeit, dass e der einzige
Weg von u nach v ist. Dann ist es für einen Knoten x in C entweder so (a), dass
es einen Weg von x nach u gibt, der e nicht enthält oder (b), dass jeder Weg
von x nach u die Kante e enthält. Im Fall a) ist x in derselben Komponente
von G − e wie u. Im Fall b) muss in jedem Weg P von x nach u, da er e
enthält, e die letzte Kante im Weg sein. Deshalb muss v der vorletzte Knoten
sein. Dies erzeugt ein Weg von x nach v, dass e nicht enthält. Deshalb ist
x in der gleichen Komponente von G − e wie v. Ausserdem sind u und v in
unterschiedlichen Komponenten von G − e, da e der einzige Weg von u nach v
in G ist. Deshalb zerfällt die Komponente C durch das Entfernen von e in zwei
36
Komponenten und in diesem Fall gilt ω(G − e) = ω(G) + 1.
Eine Kante e eines Graphen G heisst eine Brücke wenn der Untergraph G − e
mehr Komponenten besitzt als G selbst. Nach Satz 10.4 hat G − e in diesem
Fall genau eine Komponente mehr als G.
Satz 10.5 Eine Kante e eines Graphen ist dann und nur dann eine Brücke,
wenn e nicht zu einem Zyklus von G gehört.
Beweis Seien u und v die Endknoten von e. Wenn e keine Brücke ist, dann
folgt aus den obigen Ausführungen, dass es einen Weg P = uu1 . . . un v gibt, in
dem die Kante e nicht enthalten ist. Dann ist C = uu1 . . . un vu ein Zyklus in
G. Also gehört die Kante e zu einem Zyklus, wenn sie keine Brücke ist. Anders
gesagt, wenn sie nicht zu einem Zyklus gehört ist sie eine Brücke.
Um die andere Hälfte des Theorems zu beweisen, nehmen wir an, dass e
zu einem Zyklus C = u0 . . . um gehört. Es sei e = ui ui+1 . Dann ist P =
ui ui−1 . . . u0 um−1 . . . ui+1 ein Weg von ui nach ui+1 , der nicht mit e identisch
ist. Deshalb ist e keine Brücke.
Satz 10.6 Es sei G ein zusammenhängender Graph. G ist dann und nur dann
ein Baum, wenn jede Kante von G eine Brücke ist, d.h. wenn der Untergraph
G − e für jede Kante e zwei Komponenten hat.
Beweis Wenn der Graph G ein Baum ist, ist er azyklisch und keine Kante von
G gehört einem Zyklus an. Mit anderen Worten ist jede Kante nach Satz 10.5
eine Brücke. Nehmen wir umgekehrt an, dass jede Kante von G eine Brücke ist.
Dann kann nach Satz 10.5 G keine Zyklen enthalten. Es folgt, dass G ein Baum
ist.
Satz 10.7 Sei G ein Graph mit n Knoten, q Kanten und ω(G) Zusammenhangskomponenten. Dann gilt q ≥ n − ω(G).
Beweis Der Beweis benutzt die vollständige Induktion, ausgehend von q = 0.
Wenn ein Graph keine Kanten hat, dann hat es so viel Komponenten wie es
Knoten gibt, also ist n = ω(G). Damit gilt die Aussage für q = 0, wobei in
dem Fall die Gleichheit gilt. Für den Induktionsschritt nehmen wir an, dass die
Aussage für einen bestimmten Wert von k gilt und es sei G ein Graph mit k + 1
Kanten. Sei e einer dieser Kanten. Dann hat der Untergraph G − e k Kanten
und durch die Induktionsannahme gilt
k ≥ n − ω(G − e).
(94)
Aus Satz 10.4 folgt ω(G−e) ≤ ω(G)+1. Wenn wir diese Ungleichung einsetzen,
bekommen wir k + 1 ≥ n − ω(G). Damit ist der Induktionsschritt vollzogen.
Aus diesem Satz kann man folgern, dass ein zusammenhängender Graph mit n
Knoten mindestens n − 1 Kanten hat. Weil in diesem Fall ist ω(G) = 1.
Satz 10.8 Es sei G ein Graph mit n Knoten. Folgende Aussagen sind äquivalent:
a) G ist ein Baum
b) G ist ein azyklischer Graph mit n − 1 Kanten
c) G ist ein zusammenhängender Graph mit n − 1 Kanten
Beweis Wir beweisen a)⇒b)⇒c)⇒a).
37
a)⇒b): Wenn G ein Baum ist, dann ist G azyklisch. Dann hat er nach Satz
10.3 n − 1 Kanten.
b)⇒c): Sei G ein azyklicher Graph mit n − 1 Kanten und sei ω(G) die Anzahl
von Zusammenhangskomponenten von G. Dann folgt aus der Bemerkung nach
Satz 10.3, dass G n − ω(G) Kanten hat. Es folgt, dass ω(G) = 1 und dass G
zusammenhängend ist.
c)⇒a): Sei G ein zusammenhängender Graph mit n − 1 Kanten. Wir wollen
zeigen, dass G azyklisch ist. Wenn die Aussage falsch ist, dann hat G einen
Zyklus und keine Kante in diesem Zyklus ist eine Brücke. Wählen wir eine
solche Kante e. Da e keine Brücke ist, ist G − e zusammenhängend. Jedoch
hat G − e n − 2 Kanten und n Knoten, was unmöglich ist. Dieser Widerspruch
liefert die gewünschte Aussage.
10.3
Spannende Bäume
Ein spannender Baum eines Graphen G ist ein spannender Untergraph von G,
der ein Baum ist.
Satz 10.9 Ein Graph ist dann und nur dann zusammenhängend, wenn er einen
spannenden Baum enthält.
Beweis Wenn G ein zusammenhängender Graph mit n Knoten und q Kanten
ist, dann folgt aus Satz 10.7, dass q ≥ n − 1. Wenn q = n − 1 dann Folgt
aus Satz 10.8, dass G ein Baum ist und deshalb ein spannender Baum für sich
selbst. Falls q > n − 1 dann ist G nach Satz 10.3 kein Baum und enthält
deshalb mindestens einen Zyklus. Sei e1 eine Kante, die zu einem derartigen
Zyklus gehört. Dann ist der Untergraph G − e1 zusammenhängend (da e1 keine
Brücke ist) und hat n Knoten und q − 1 Kanten. Falls q − 1 = n − 1, dann
ist T = G − e1 unter Wiederholung der obigen Beweisführung, ein spannender
Baum für G. Falls q −1 > n−1, dann ist G−e1 kein Baum, so dass es wie zuvor
einen Zyklus in G − e1 gibt. Das Entfernen einer Kante e2 aus einem derartigen
Zyklus führt zu einem Untergraphen G − {e1 , e2 } der zusammenhängend ist
und n Knoten und q − 2 Kanten hat. Wir fahren mit der Wiederholung dieses
Verfahrens fort, indem wir insgesamt q − n + 1 Kanten entfernen, um schliesslich
einen Untergraphen T zu erzeugen, der zusammenhängend ist und n Knoten und
n − 1 Kanten hat. T ist nach Satz 10.8 ein Baum und da er dieselbe Knotenzahl
hat wie G ist er ein spannender Baum für G.
Wenn umgekehrt G einen spannenden Unterbaum T enthält, dann sind zwei
gegebene Knoten u und v von G ebenso Knoten des zusammenhängenden Untergraphen T . Folglich sind u und v durch einen Weg in T zusammenhängend
und somit auch durch einen Weg in G. Der Graph G ist also zusammenhängend.
Ein spannender Baum des vollständigen Graphen Kn ist eine Art, n unterschiedliche Punkte miteinander zu Verbinden mit der minimalen Anzahl n − 1
von Kanten. Man kann fragen, wie viele solche Graphen es gibt und wie viele
nicht-isomorphe. Im ersten Fall ist es so, als würde man die Punkte numerieren
und bei der Zählung zwischen Kanten mit verschiedenen Nummern unterscheiden. Im zweiten Fall macht man diese Unterscheidung nicht. Bei 4 Punkten
38
gibt es 16 spannende Bäume, aber nur zwei nicht-isomorphe. Bei 6 Punkten
gibt es 1296 spannende Bäume aber nur 6 nicht-isomorphe. Im Jahre 1889 hat
der englische Mathematiker Arthur Cayley folgenden Satz bewiesen (den wir
hier nicht beweisen)
Satz 10.10 Der vollständige Graph Kn enthält nn−2 unterschiedliche spannende Bäume.
Cayley, der das Wort ’tree’ (’Baum’) 1857 im Sinne der Graphentheorie eingeführt
hat, interessierte sich für die Anzahl von gesättigten Kohlenwasserstoffen Cn H2n+2 .
10.4
Die Königsberger Brücken
Nachdem wir uns mit Objekten der Graphentheorie beschäftigt haben, die
Brücken heissen, wenden wir uns jetzt tatsächlichen Brücken, die im Zusammenhang mit den Anfängen der Graphentheorie sehr bedeutend sind. es handelt sich um Brücken in der Stadt Königsberg, der heutigen Kaliningrad. Die
Lage der preussischen Stadt Königsberg an den Ufern des Flusses Pregel im 18.
Jahrhundert war in etwa wir folgt. Im Fluss gab es zwei Inseln, die miteinander
und mit den Ufern durch Brücken verbunden waren. [In der Vorlesung wird
eine entsprechende Karte skizziert.] Die Einwohner sollen sich mit der Frage
beschäftigt haben, ob es möglich sei, einen Spaziergang zu machen bei dem
jede Brücke genau einmal überquert wird. Leonhard Euler hat das Problem
untersucht und gezeigt, dass ein solcher Spaziergang unmöglich ist.
Wir führen folgende Notation ein. Die Inseln heissen A und B und die zwei
Ufer C und D. Die sieben Brücken heissen a, b, c, d, e, f und g. (Wenn man
an dieser Stelle einen Multigraphen verwendet, kann man mit weniger Knoten
auskommen, aber diese Alternative wollen wir vermeiden.) Ein Knoten, der eine
Brücke darstellt wird mit einem Knoten, der einen Teil der Stadt darstellt genau
dann wenn ein Ende der Brücke in diesem Teil der Stadt liegt. Der Knoten A
ist mit a, b, d, e und f verbunden, B mit c, f und g, C mit a, b und c und D mit
d, e und g. [In der Vorlesung wird der Graph gezeigt.] Die Frage ist jetzt, ob es
einen Kantenzug gibt, der in L = {A, B, C, D} anfängt, alle Knoten enthält und
keinen Knoten, der einer Brücke entspricht, mehr als einmal enthält. Es gibt
einen Punkt von L, wo der Kantenzug startet und einen wo er endet (vielleicht
den gleichen). Auf jeden Fall gibt es einen Punkt Z ∈ L, wo der Kantenzug
weder startet noch endet. Wenn immer der Kantenzug in Z ankommt, muss
er Z wieder verlassen und er muss alle Kanten, die von Z ausgehen genau
einmal enthalten. Es folgt, dass die Anzahl von Kanten des Graphen, die von
Z ausgehen, gerade sein muss. Es ist aber so, dass die Anzahl von Kanten, die
von jedem Punkt von L ausgehen ungerade ist, ein Widerspruch.
11
Wahrscheinlichkeitstheorie
Die Wahrscheinlichkeitstheorie ist eine mathematische Theorie, die benutzt werden kann, um Vorgänge in der Natur zu verstehen, bei denen der Zufall eine
39
wesentliche Rolle spielt. Sie ist durch Versuche entstanden, das Glücksspiel
zu analysieren. Sie wird aber heutzutage sehr verbreitet in der Wissenschaft
angewendet. Die Theorie wird axiomatisch aufgebaut unter Verwendung von
Ideen, die in den dreissiger Jahren des letzten Jahrhunderts von Andrei Kolmogorov entwickelt wurden. Es geht darum, ein idealisiertes Zufallsexperiment zu betrachten. Beispiele solcher Experimente sind: eine Münze werfen,
Känguruhs auf dem Mond zählen, ein diffundierendes Teilchen beobachten, Telefonanrufe zählen. Zunächst müssen wir uns darauf einigen, welche Ergebnisse
des Experiments in Betracht gezogen werden, und welche Wahrscheinlichkeiten
damit verbunden werden. Um die Wahrscheinlichkeitstheorie zu verstehen ist
es wichtig, zusammen mit Kenntnissen über die mathematischen Begriffe und
Theoreme ein intuitives Verständis zu entwickeln.
11.1
Empirischer Hintergrund
Die Wahrscheinlichkeitstheorie bekommt ihre Bedeutung im Zusammenhang mit
tatsächlichen oder gedachten Experimenten, z. B. eine Münze einmal werfen, eine Münze 100 mal werfen, drei Würfel werfen, Roulette spielen, die
Lebensdauer eines radioaktiven Atoms oder eines Menschen beobachten, eine
Auswahl von Personen treffen und die Anzahl der Linkshänder beobachten,
zwei Pflanzenarten kreuzen und den Phänotyp der nachkommen beobachten,
die übliche Qualitätskontrolle eines Produktionsprozesses, die Häufigkeit von
Unfällen, usw. Diese Beschreibungen sind etwas vage und um sie zu präzisieren
müssen wir entscheiden, was wir als mögliche Ergebnisse des Experiments betrachten.
Wenn eine Münze geworfen wird muss sie nicht notwendigerweise Kopf oder
Zahl zeigen. Sie könnte wegrollen oder auf der Kante stehen bleiben. Wir
werden trotzdem annehmen, dass nur die zwei Möglichkeiten Kopf und Zahl
bestehen. Diese Konvention vereinfacht die Theorie ohne ihre Anwendung
einzuschränken. Es ist in der Praxis üblich, die Experimente auf diese Weise zu
idealisieren. Alle Messungen sind fehlerbehaftet. Es ist aber hilfreich anzunehmen,
dass die Ergebnisse präzise Zahlen sind. Z. B., welche Zahlen können als Alter eines Menschen vorkommen? Gibt es ein Maximum jenseits dessen das
Leben nicht mehr möglich ist? Wir werden kaum mit der Aussage einverstanden sein, dass ein Mensch 1000 Jahre alt werden kann. Trotzdem kennt
die Versicherungsmathematik keine obere Grenze für das Alter eines Menschen.
Nach den entsprechenden Tabellen ist die Wahrscheinlichkeit, dass ein Mensch
36
1000 Jahre alt wird etwa Eins zu 1010 . Diese Zahl hat keine biologische oder
praktische Bedeutung, widerspricht aber nicht den bekannten Beobachtungen.
Es schadet nicht, diesen Fall mitzubehandeln und diese Vorgehensweise vereinfacht die Rechnungen. Die Alternative wäre ein maximales Alter festzulegen
und das wäre künstlich - warum gerade diese Zahl und nicht eine etwas grössere?
Um eine feste Bezeichnung zu haben werden die Alternativen, die bei einem
Experiment auftreten können als Ereignisse bezeichnet. Wenn zwei Würfel
geworfen werden ist ‘Summe sechs’ ein mögliches Ereignis. Es besteht aus den
Fällen (1, 5), (2, 4), (3, 3), (4, 2) und (5, 1). Das Ereignis besteht aus fünf ele40
mentaren Ereignissen. Die elementaren Ereignisse werden oft auch als Ergbnisse
bezeichnet und die Menge aller möglichen Ergebnisse eines bestimmten Experiments als Ergebnismenge oder Ergebnisraum. Hier sehen wir, dass ein Ereignis
als Menge von Ergebnissen betrachtet werden kann. Wenn wir eine klare theoretische Definition eines Experiments formulieren wollen, müssen wir festlegen,
was die Ergebnisse sind. Die einfachen Ergebnisse werden oft als Punkte bezeichnet. Ereignisse sind Mengen solcher Punkte.
11.2
Beispiele
In diesem Abschnitt werden verschiedene Beispiele eingeführt.
(a) Verteilung von drei Bällen in drei Zellen. Hier ist die Liste aller möglichen
Zustände die bei diesem ‘Experiment’ vorkommen können.
|
} 10.{a | bc|
} 19.{
|a | bc}
2.{
|abc|
} 11.{ b |a c|
} 20.{
| b |a c}
3.{
|
} 21.{
| c|ab }
1.{abc|
|abc}
12.{ c|ab |
4.{ab | c|
} 13.{a |
| bc}
22.{a | b | c}
5.{a c| b |
} 14.{ b |
|a c}
23.{a | c| b }
6.{ bc|a |
} 15.{ c|
|ab }
24.{ b |a | c}
7.{ab |
| c}
16.{
|ab | c}
25.{ b | c|a }
8.{a c|
|b}
17.{
|a c| b }
26.{ c|a | b }
9.{ bc|
|a }
18.{
| bc|a }
27.{ c| b |a }
Das Ereignis A ’eine Zelle enthält mehr als einen Ball’ wird durch die Punkte 1.
bis 21. realisiert. Das Ereignis B ’die erste Zelle ist nicht leer’ wird durch die
Punkte 1, 4-15 und 22-27 realisiert. Das Ergebnis ’A und B werden realisiert’
entspricht den Punkten 1 und 4-15. Jeder Punkt gehört entweder zu denen,
die A entsprechen oder denen die B entsprechen oder zu beiden Klassen. Das
Ereignis ’entweder A oder B oder beides werden realisiert’ entspricht der Menge
aller Punkte und tritt mit Sicherheit ein.
(b) zufällige Verteilung von r Bällen in n Zellen. Dieser allgemeinere Fall ist
dem Spezialfall r = 3, n = 3 sehr ähnlich. Es wäre aber unpraktisch, eine
explizite Tabelle aufzustellen. Für r = n = 10 gibt es 1010 Fälle und für die
Tabelle bräuchte man einige hunderttausende Dicke Bände.
Es ist hier unwichtig, dass wir gerade von Bällen und Zellen sprechen. In Situationen in denen diese mathematische Stuktur auftritt, kann die Realisierung
dieser Elemente ganz verschieden sein. Es werden jetzt verschiedene Beispiele
aufgelistet. Die Wahrscheinlichkeiten sind in diesen Beispielen nicht immer gleich.
(b1) Geburtstage. Die Geburtstage von r Personen entsprechen dem Fall n =
365, wobei Schaltjahre nicht berücksichtigt werden.
41
(b2) Unfälle. Wenn r Unfälle nach dem Wochentag an dem sie passiert sind
klassifiziert werden dann erhalten wir den Fall n = 7.
(b3) Schiessen auf n Ziele. Die Treffer entsprechen den Bällen, die Ziele den
Zellen.
(b4) Bestrahlung in der Biologie. Wenn Lichtteilchen die lichtempfindlichen
Zellen in der Netzhaut treffen, dann sind die Photonen die Bälle und die ’Zellen’
des abstrakten Modells sind die biologischen Zellen. Bei der Untersuchung der
genetischen Auswirkung einer Bestrahlung durch α-Teilchen sind die Teilchen
die Bälle und die Chromosomen die Zellen.
(b5) ein Aufzug fährt mit r Personen los und hält in n verschiedenen Stockwerken und wir betrachten die verschiedenen Möglichkeiten, wie viele Personen
in welchen Stockwerken aussteigen.
(b6) r mal würfeln ist der Fall n = 6. Münzen werfen entspricht dem Fall n = 2.
(b7) Zufallszahlen. Ein zufälliger Zahl mit r Ziffern entspricht dem Fall n = 10
des allgemeinen Modells. Die Zellen sind in diesem Fall die natürlichen Zahlen
zwischen 0 und 9.
c) Ununterscheidbare Bälle. Wir kehren zurück auf den Fall a) aber nehmen an,
dass es nicht möglich ist, zwischen den Bällen zu unterscheiden. Dann gibt es z.
B. keinen Unterschied zwischen den Fällen 4., 5. und 6. oben. Die verschiedenen
möglichen Fälle sind dann nur noch
1.{∗ ∗ ∗|
|
2.{
|∗∗∗|
3.{
|
}
6.{∗ | ∗ ∗ |
} 7.{∗ |
| ∗ ∗∗}
4.{∗ ∗ | ∗ |
5.{∗ ∗ |
8.{
}
9.{
}
|∗∗ }
| ∗ ∗ |∗ }
|∗ |∗∗ }
|∗ } 10.{∗ | ∗ |∗ }
(95)
Ob die Bälle als unterscheidbar betrachtet werden is eine Frage der Modellierung. Die Personen in (b5) können vermutlich leicht voneinander unterschieden werden aber die Unterschiede zwischen Ihnen sind vielleicht irrelevant
für das, was wir modellieren wollen. Man könnte das Experiment betrachten,
wo die Bewegungen der Personen nicht direkt, sonderen nur durch einen Bewegungsmelder beobachtet werden. Die Würfel in (b6) haben vielleicht verschiedene Farben, so dass man sie unterscheiden kann, Die Farben werden aber
für die meisten Spiele in denen die Würfel eingesetzt werden ohne Bedeutung
sein.
d) Münzen werfen. Wenn man eine Münze dreimal wirft, dann gibt es folgende
acht Möglichkeiten:
KKK, KKZ, KZK, ZKK, KZZ, ZKZ, ZZK, ZZZ
(96)
Das Ergebnis A, ’zweimal oder mehr Kopf’ is die Menge der ersten vier Möglichkeiten.
Das Ergebnis B, ’nur einmal Zahl’ ist die Menge {KKZ, KZK, ZKK}.
42
11.3
Der Ergebnisraum
Wenn wir hier von Wahrscheinlichkeiten sprechen, dann nur im Zusammenhang
mit einem gegebenen Ergebnisraum und seinen Punkten, die als gegeben betrachtet werden. Ein Ereignis A ist eine Teilmenge des Ergebnisraums. Im Beispiel
a) ist die Menge U = {1, 7, 13} ein Ereignis im Sinne dieser Definition. Es
gibt verschiedene äquivalente Möglichkeiten, diese Menge zu beschreiben. Zum
Beispiel ist U das Ereignis, dass folgende drei Bedingungen alle erfüllt sind: die
zweite Zelle ist leer, der Ball a ist in der letzten Zelle und der Ball b erscheint
nie nach c, Hier wird ein Ereignis beschrieben als Kombination von verschiedenen anderen Ereignissen. Jetzt werden Möglichkeiten eingeführt, Ereignisse zu
kombinieren.
11.4
Beziehungen zwischen Ereignissen
Wir nehmen jetzt an, dass ein fester Ergebnisraum S gegeben ist. Grosse Buchstaben bezeichnen Ereignisse und kleine Buchstaben Punkte von S. Die Leere
Menge ist ein Ereignis und kann im Rahmen der Wahrscheinlichkeitstheorie als
ein unmögliches Ereignis betrachten werden. Das Komplement S \ A der Menge
A hat die Interpretation, dass das Ereignis A nicht stattfindet. Wenn A und
B Ereignisse sind, dann hat das Ereignis A ∪ B die Interpretation, dass A oder
B (oder beide) stattfindet. Das Ereignis A ∩ B hat die Interpretation, dass A
und B stattfinden. Wenn A ∩ B = ∅ sagt man, dass die Ereignisse A und B
sich gegenseitig ausschliessen. Die Vereinigungen und Durchschnitte von mehr
als zwei Ereignissen haben natürlich entsprechende Interpretationen. Man sagt,
dass Ereignisse A1 , A2 , A3 , . . . sich gegenseitig ausschliessen, wenn Ai ∩ Aj = ∅
für alle i 6= j. A ⊂ B bedeutet, dass B immer dann stattfindet, wenn A stattfindet. Mit anderen Worten, A impliziert B. Damit haben wir die gängigen
Begriffe der Mengenlehre mit Begriffen, die sich auf Experimente beziehen, im
Fall, dass die Menge ein Ereignisraum ist in Verbindung gebracht. Betrachten
wir Beispiel a). Sei Ei das Ereignis, dass die Zelle i leer ist. Seien Si , Di , Ti
die Ereignisse, dass die Zelle I einen, zwei oder drei Bälle enthält. Dann ist
E1 ∩ E2 = T3 , S1 ∩ S2 ⊂ S3 , D1 ∩ D2 = ∅.
11.5
Diskrete Ergebnisräume
Die einfachsten Ergebnisräume sind die, die nur endlich viele Punkte enthalten. Man kann sie sich relativ leicht vorstellen. Es ist aber so, dass auch
unendliche Ergebnisräume nützlich sind. Betrachten wir z. B. das Experiment,
dass wir eine Münze so lange werfen, bis sich ein Kopf zeigt. Die Punkte des
Ergebnisraums sind dann E1 = K, E2 = ZK, E3 = ZZK, E4 = ZZZK
usw. Wie können auch eventuell die Möglichkeit in Betracht ziehen das K
nie auftritt. Wenn wir dass machen, dann muss diese Möglichkeit durch einen
zusätzlichen Punkt E0 dargestellt werden. In diesem Fall ist der Ergebnisraum
abzählbar. Ein Ergebnisraum heisst diskret, wenn sie endlich ist oder unendlich
aber abzählbar. Wir wissen, dass nach dem Satz von Cantor die reellen Zahlen
43
überabzählbar sind. Es ist also durchaus möglich, Ergebnisräume zu betrachten, die nicht diskret sind. Im Folgenden betrachten wir aber nur diskrete
Ergebnisräume.
11.6
Wahrscheinlichkeiten in diskreten Ergebnisräumen:
Vorbereitungen
In der Wahrscheinlichkeitstheorie nehmen wir an, dass die Wahrscheinlichkeiten
von bestimmtem Ereignissen gegeben sind. Wir sagen aber nichts darüber wie
sie in der Praxis bestimmt werden. Betrachten wir z. B. eine ideale Münze,
die wenn sie sehr oft geworfen wird, ungefähr gleich oft Kopf und Zahl zeigt.
Keine echte Münze hat diese Eigenschaft und es bleibt etwas unklar, wie oft man
werfen muss, um diese Eigenschaft festzustellen. Die ideale Münze ist trotzdem
ein nützlicher Begriff in der Wahrscheinlichkeitstheorie und lässt sich manchmal
gut anwenden. Für eine ideale Münze sagen wir, dass die Wahrscheinlichkeit,
dass die Münze Kopf zeigt bei einem gegebenen Wurf 12 ist, oder dass Kopf
und Zahl gleich wahrscheinlich sind. Wenn die Münze n-mal geworfen wird
haben alle möglichen Ergebnisse die gleiche Wahrscheinlichkeit. Betrachten wir
jetzt das Beispiel von unterscheidbaren Bällen. Im Beispiel a) ist es natürlich
anzunehmen, dass jeder Punkt im Ergebnisraum gleich wahrscheinlich ist. Jeder
1
mögliche Punkt hat die Wahrscheinlichkeit 27
. Ob diese Wahl angemessen ist
hängt von der Anwendung ab. In den Beisnnen, scheint es vernünftig, die
Wahrscheinlichkeiten aus dem letzten Beispiel zu übernehmen. Dann haben die
Fälle 1.-10. die Wahrscheinlichkeiten
1 1 1 1 1 1 1 1 1 2
, , , , , , , , ,
(97)
27 27 27 9 9 9 9 9 9 9
In der kinetischen Theorie der Gase wurden früher solche Wahrscheinlichkeiten
benutzt für die Zustände der Gasmoleküle. Dies führt auf die sogenannte
Maxwell-Boltzmann-Verteilung. In Wirklichkeit werden die Moleküle durch die
Quantentheorie beschrieben und verhalten sich ganz anders. Das Analogon der
daraus enstehenden Bose-Einstein-Verteilung im Falle der ununterscheidbaren
1
Bälle ist dass alle zehn Möglichkeiten die gleiche Wahrscheinlichkeit 10
besizten.
Diese Bemerkungen sollen darauf hinweisen, dass die Wahl von Wahrscheinlichkeiten nicht selbstverständlich ist, sondern ein wichtiger Teil des Modellierungsprozesses.
11.7
Fundamentale Definitionen und Regeln
Wenn ein diskreter Ergebnisraum S gegeben ist, wird jedem Punkt Ei von S
eine Zahl P (Ei ) zugeordnet, die Wahrscheinlichkeit von Ei . Für jeden Punkt
Ei ist die entsprechende Wahrscheinlichkeit nicht negativ and die Summe der
Wahrscheinlichkeiten aller Punkte ist Eins. Es wird zugelassen, dass P (Ei ) = 0
für einen Punkt Ei und die Bedeutung ist, dass Ei unmöglich ist. Dies mag
unnatürlich erscheinen und wir könnten solche Punkte aus dem Raum entfernen.
In der Praxis ist es aber nützlich, sie zu behalten. Man weiss nicht immer im
44
voraus, welche Wahrscheinlichkeiten Null sind. Die Wahrscheinlichkeit P (A)
von einem Ereignis A ist die Summe der Wahrscheinlichkeiten P (Ei ) über alle
Punkte Ei ∈ A. Die Wahrscheinlichkeit des ganzen Raums ist P (S) = 1 und
für alle Ereignisse A gilt 0 ≤ P (A) ≤ 1.
Seien jetzt A1 und A2 zwei beliebige Ergebnisse. Wir möchten P (A1 ∪ A2 )
untersuchen. Es ist klar, dass P (A1 ∪ A2 ) ≤ P (A1 ) + P (A2 ). Der Unterschied
ist, dass man im Ausdruck auf der rechten Seite bestimmte Punkte zweimal
zählt. Es gilt die Beziehung
P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 ∩ A2 ).
(98)
Wenn A1 und A2 sich gegenseitig ausschliessen, dann ist P (A1 ∪ A2 ) = P (A1 ) +
P (A2 ).
Betrachten wir das Beispiel bei dem eine Münze zweimal geworfen wird. Der
Ergebnisraum besteht aus vier Punkten KK, KZ, ZK und ZZ. Seien A1 bzw.
A2 die Ereignisse ’das erste mal Kopf’ und ’das zweite mal Kopf’. Dann ist
A1 = {KZ, KK} und A2 = {ZK, KK}. Dann ist
P (A1 ∪ A2 ) =
3
1 1 1
+ − = .
2 2 4
4
(99)
Die Ungleichung für die Vereinigung von zwei Ereignissen kann auf n Ereignissen
verallgemeinert werden, oder sogar auf unendlich viele
P (A1 ∪ A2 ∪ . . .) ≤ P (A1 ) + P (A2 ) + . . . .
(100)
Wenn die Ereignisse Ai sich gegenseitig ausschliessen, dann gilt die Gleichheit
in dieser Beziehung.
11.8
Bedingte Wahrscheinlichkeit
Wir fangen mit einem Beispiel an. Angenommen eine Population von N Menschen enthält NA farbenblinde und NH Frauen. Seien die Ereignisse, dass eine
zufällig gewählte Person farbenblind bzw. eine Frau A bzw. H. ‘Zufällig
gewählt’ bedeutet, dass die Wahrscheinlichkeit gewählt zu werden für alle Personen gleich ist. Daraus folgen die Wahrscheinlichkeiten
P (A) =
NA
,
N
P (H) =
NH
.
N
(101)
Wir betrachten jetzt die Population von Frauen. Die Wahrscheinlichkeit, dass
eine Person die aus dieser Population zufällig gewählt wird farbenblind ist ist
N
, wobei NH,A die Anzahl der farbenblinden Frauen ist. Hier ist kein
gleich NH,A
H
neuer Begriff benutzt worden, aber wir brauchen eine neue Notation, um klar
zu machen, von welcher Population wir reden. Man schreibt P (A|H) und nennt
diese Grösse die Wahrscheinlichkeit eines Ereignisses A (Farbenblindheit) unter
der Voraussetzung des Ereignisses A (die gewählte Person ist eine Frau). In
Symbolen
NH,A
P (A ∩ H)
P (A|H) =
=
.
(102)
NH
P (H)
45
Diese Formel definiert die bedingte Wahrscheinlichkeit P (A|H) für ein beliebiges
Ereignis A und ein beliebiges Ereignis H mit P (H) 6= 0 (Hypothese).
Die bedingte Wahrscheinlichkeit eines Ereignisses A ist eine übliche Wahrscheinlichkeit, wo der Ergebnisraum durch die Hypothese gegeben wird. Deshalb gelten viele Eigenschaften von absoluten Wahrscheinlichkeiten auch für bedingte
Wahrscheinlichkeiten. Z. B.
P (A1 ∪ A2 |H) = P (A1 |H) + P (A2 |H) − P (A1 ∩ A2 |H).
(103)
Die Definition der bedingten Wahrscheinlichkeit kann umgeschrieben werden
als P (A ∩ H) = P (A|H)P (H). Wenn wir A = A1 und H = A2 ∩ A3 setzen
bekommen wir die Beziehung
P (A1 ∩ A2 ∩ A3 ) = P (A1 |A2 ∩ A3 )P (A2 |A3 )P (A3 ).
(104)
Diese Formel kann ohne weiteres auf eine beliebige Anzahl von Ereignissen verallgemeinert werden. Folgende Formel ist manchmal nützlich. Seien H1 , H2 , . . . Hn
Ereignisse, die sich gegenseitig ausschliessen und von denen eines stattfinden
muss. (Das heisst, die Vereinigung der Hi ist der ganz Ereignisraum.) In Symbolen
A = (A ∩ H1 ) ∪ (A ∩ H2 ) ∪ . . . ∪ (A ∩ Hn ).
(105)
In diesem Fall gilt
P (A) =
n
X
P (A|Hj )P (Hj ).
(106)
j=1
11.9
Urnenmodelle
Manchmal werden die Wahrscheinlichkeiten in einem bestimmten Modell durch
bedingte Wahrscheinlichkeiten definiert. Mit anderen Worten: wir verlangen,
dass bestimmte bedingte Wahrscheinlichkeiten bestimmte Werte haben und daraus müssen die absoluten Wahrscheinlichkeiten berechnet werden. Eine bekannte Klasse von Modellen dieser Art sind die sogenannten Urnenmodelle.
Betrachten wir eine Fabrik, wo Unfälle passieren können. Diese Situation
können wir als eine Art übermenschliches Glücksspiel betrachten. Der Schicksal
hat eine Urne in der es schwarze und rote Bälle gibt. In regelmässigen zeitlichen
Abständen wird ein Ball der Urne entnommen und ein roter Ball bedeutet, dass
ein Unfall passiert. Wenn die Wahrscheinlichkeit eines Unfalls konstant bleibt,
dann ist die Zusammensetzung der Urne immer gleich. Es ist aber denkbar, dass
der Unfall Nachwirkungen hat, wodurch die Wahrscheinlichkeit eines späteren
Unfalls erhöht oder verringert wird. Diese Situation entspricht einer Urne,
deren Zusammensetzung von den Ergebnissen der Ziehungen abhängt, die schon
stattgefunden haben. Es gibt verschiedene Möglichkeiten, Regeln zu erfinden,
die ein solches Modell definieren. Hier betrachten wir nur ein Beispiel.
Eine Urne enthält b schwarze und r rote Bälle. Ein Ball wird zufällig gezogen. Er wird wieder in die Urne gelegt und dazu werden c Bälle der gezogenen
Farbe und d Bälle der anderen Farbe hinzugefügt. Jetzt wird erneut aus der
46
Urne gezogen, der inzwischen r + b + c + d Bälle enthält und diese Prozedur
wird wiederholt. Dabei sind c und d beliebige ganze Zahlen. Sie dürfen negativ
gewählt werden, wobei es in dem Fall passieren kann, dass die Prozedur nach
endlich vielen Schritten aufhört, weil nicht genug Bälle übrigbleiben. Im Fall
c = −1 und d = 0 haben wir das Modell von zufälligen Ziehungen ohne Ersatz,
in dem die Prozedur nach r + b Schritten aufhört. Dieses intuitive Bild soll jetzt
in Mathematik übersetzt werden, wobei die Formulierung bedingte Wahrscheinlichkeiten verwendet. Ein typischer Punkt des Ergebnisraums kann man durch
eine Folge von Buchstaben B und R darstellen. Das Ereignis ‘schwarz bei der
b
. Wenn der erste Ball schwarz ist,
ersten Ziehung’ hat die Wahrscheinlichkeit b+r
dann ist die bedingte Wahrscheinlichkeit eines schwarzen Balls bei der zweiten
Ziehung
b+c
.
(107)
b+r+c+d
Die absolute Wahrscheinlichkeit der Folge BB ist also
b
b+c
.
(108)
b+r
b+r+c+d
Die Wahrscheinlichkeit von BBB ist die soeben genannte mal (b + 2c)/(b +
r + 2c + 2d) usw. Auf diesem Weg können die Wahrscheinlichkeiten von allen
Ergebnispunkten berechnet werden. Man kann durch Induktion beweisen, das
die Wahrscheinlichkeit von allen Punkten sich zu Eins addieren. Es ist im allgemeinen schwer, explizite Ausdrücke für die Wahrscheinlichkeiten zu bekommen.
Eine Ausnahme ist der wichtigste und bekannteste Spezialfall, das Urnenschema
von Polya. Dieses Schema wird durch d = 0, c > 0 charakterisiert. Es liefert ein
grobes Modell für eine Infektionskrankheit. Die Wahrscheinlichkeit, das nach
n1 + n2 Ziehungen die ersten n1 Bälle schwarz und die verbleibenden n2 rot sind
ist
b(b + c)(b + 2c) . . . (b + n1 c − c)r(r + c) . . . (r + n2 c − c)
.
(109)
(b + r)(b + r + c)(b + r + 2c) . . . (b + r + nc − c)
Betrachten wir jetzt eine beliebige Ziehung von n1 schwarzen und n2 roten
Bällen. Wenn wir die Wahrscheinlichkeit berechnen finden wir die gleichen
Faktoren, nur in einer anderen Reihenfolge. Es folgt, dass alle Folgen von n1
schwarzen und n2 roten Bällen die gleiche Wahrscheinlichkeit haben. Die Einfachheit des Polya-Modells ist eine Folge dieser Eigenschaft. Um die Wahrscheinlichkeit pn1 ,n zu bekommen, dass n Ziehungen n1 schwarze und n2 rote Bälle in
beliebiger
Reihenfolge produzieren müssen wir die Wahrscheinlichkeit oben mit
n
multiplizieren,
der Anzahl der möglichen Reihenfolgen. Die Benutzung von
n1
allgemeinen Binomialkoeffizienten erlaubt es, das Ergebnis in folgender Form zu
schreiben:
b
r
pn1 ,n =
−c −c
n1
n2
− b+r
c
n
(110)
Dazu bleibt zu erklären, was unter ‘allgemeinen Binomialkoeffizienten’ zu verstehen ist. Wir haben die Grösse nk für natürliche Zahlen definiert und es gilt
47
die Beziehung
n
n(n − 1) . . . (n − k)
=
.
k
k(k − 1) . . . 1
(111)
Wir können beobachten, dass so lange k eine natürliche Zahl ist der letzte
Ausdruck für beliebige reelle Zahlen n sinnvoll ist. Er kann also benutzt werden,
um die Definition der Binomialkoeffizienten zu erweitern.
References
[1] Clark, J. und Holton, D. A. Graphentheorie. Spektrum Akademischer Verlag, Heidelberg.
[2] Feller, W. 1950 An introduction to probability theory and its applications.
Wiley, New York.
[3] Nowak, M. A. und May, R. M. 2000 Virus Dynamics. Oxford University
Press, Oxford.
[4] Singh, S. 2000 Fermats letzter Satz - die abenteuerliche Geschichte eines
mathematischen Rätsels. DTV, München.
48