Elementarmathematik

Werbung
Elementarmathematik
Im Sommersemester 2012 hat Steffen Fröhlich die Vorlesung Elementarmathematik an der Universität Mainz gehalten und ein Skript dazu geschrieben. Für
die Vorlesung Elementarmathematik im Sommersemester 2013 hat Alan Rendall dieses Skript nach seinem Geschmack abgeändert. Der vorliegende Text
ist das Ergebnis. Die Abschnitte 2-7 basieren auf dem Text von Fröhlich. Die
Hauptquelle für die Abschnitte 9 und 10 ist das Buch von Clark und Holton [1].
Die Hauptquelle für den Abschnitt 11 ist das Buch von Feller [2].
1
Einleitung
Im Buch ’Virus Dynamics’ von M. Nowak und R. May findet man das Zitat:
... mathematics is no more, but no less, than a way of thinking clearly [3].
(... die Mathematik ist nichts mehr, aber nichts weniger, als eine Art, klar zu
denken.)
Wenn wir diese Art zu denken gut beherrschen, dann haben wir etwas, was uns
in vielen Lebenslagen helfen kann. Ausserdem ist die Mathematik an und für
sich schön. Diese Vorlesung soll den Hörern wichtige Aspekte der Mathematik
nahebringen, die praktisch eingesetzt werden können und hoffentlich auch etwas
von der Schönheit des Fachs vermitteln.
2
Zahlen
Wer an Mathematik denkt, denkt sofort an Zahlen. Zahlen spielen in der Tat
eine zentrale Rolle in der Mathematik und in dieser Vorlesung sind sie unser erstes Thema. Es gibt verschiedene Arten von Zahlen und diese möchten wir Revue passieren lassen. Es gibt natürliche Zahlen, ganze Zahlen, rationale Zahlen,
reelle Zahlen und komplexe Zahlen. Jetzt wird beschrieben, was diese unterschiedlichen Arten von Zahlen sind und was man damit machen kann.
Die einfachsten Zahlen sind die natürlichen Zahlen
{1, 2, 3, 4, . . .},
(1)
die Zahlen, die wir in der Kindheit kennenlernen. Die Menge der natürlichen
Zahlen wird mit N bezeichnet. Wenn a und b natürliche Zahlen sind, dann
1
sind die Summe a + b und das Produkt ab auch natürliche Zahlen. Im Rahmen
der natürlichen Zahlen können wir aber nicht immer subtrahieren. Z.B. gibt es
2 − 3 nicht als natürliche Zahl. Anders gesagt, gibt es keine natürliche Zahl a
mit der Eigenschaft, dass 3 + a = 2. Die Lösung dieses Problems ist schon lange
bekannt. Wir können die Null einführen (wie es schon die alten Inder getan
haben) und die negativen Zahlen. Dann können wir 2 − 3 = −1 schreiben.
Wenn die natürlichen Zahlen durch die Null und die negativen Zahlen
{−1, −2, −3, −4, . . .},
(2)
erweitert werden, dann bekommen wir die ganzen Zahlen. Die Menge der ganzen
Zahlen wird mit Z bezeichnet. Im Rahmen der ganzen Zahlen ist die Subtraktion ohne Einschränkung möglich. Wenn a und b ganze Zahlen sind, dann ist
a − b immer sinnvoll. Durch eine Erweiterung des Zahlensystems haben wir uns
mehr Möglichkeiten geschaffen. Addition und Multiplikation sind immer noch
möglich, so dass durch die Erweiterung nichts verlorengegangen ist. Einige Autoren rechnen die Null zu den natürlichen Zahlen. Diese Alternative übernehmen
wir hier nicht. Wir bezeichnen die Menge der natürlichen Zahlen mit der Null
dazu als N0 , d.h. N0 = N ∪ {0}.
Im Rahmen der ganzen Zahlen ist die Division nur begrenzt möglich. Z.B.
gibt es 32 nicht als ganze Zahl. Es gibt keine ganze Zahl a mit der Eigenschaft dass 3a = 2. Diese Einschränkung kann aufgehoben werden in dem wir
die ganzen Zahlen durch die Brüche erweitern. Die Brüche, einschliesslich der
ganzen Zahlen heissen rationale Zahlen. Das Wort ’rational’ hier soll nicht
als ’vernünftig’ interpretiert werden sondern kommt vom lateinischen ’ratio’
(Verhältnis). Die Menge der rationalen Zahlen wird mit Q bezeichnet. (Q
steht für Quotienten.) Die bekannten Regeln der Bruchrechnung erlauben es im
Rahmen der rationalen Zahlen die vier Grundrechenarten ohne Einschränkung
auszuführen bis auf die Tatsache, dass die Division durch Null nicht definiert
ist. Zusammenfassend, haben wir jetzt drei Zahlenarten N, Z, Q eingeführt mit
N ⊂ Z ⊂ Q.
Es gibt noch eine weitere Klasse von Zahlen, die sehr wichtig sind, die reellen
Zahlen,
√ die mit R bezeichnet werden. Ausser den rationalen Zahlen enthalten sie
z. B. 2 und die Kreiszahl π. Diese Zahlen sind notwendig für die Anwendungen
der Mathematik in den Naturwissenschaften und, innerhalb der Mathematik,
auf die Geometrie. Sie werden gebraucht, um die diagonale des Quadrats mit
Seitenlänge Eins oder den Umfang des Kreises mit Radius Eins auszudrücken.
Diese Zahlen sind keine rationalen Zahlen (was nicht offensichtlich ist). Auf diese
Dinge gehen wir später genauer ein. Die reellen Zahlen, die keine rationalen
Zahlen sind, heissen irrationale Zahlen.
Selbst innerhalb der reellen Zahlen hat die Gleichung z 2 = −1 keine Lösung.
Um dieses Problem zu umgehen führt man eine Grösse i ein, die imaginäre
Einheit, mit der Eigenschaft i2 = −1. Es gilt auch (−i)2 = −1. Dann hat
unsere Gleichung zwei Lösungen. Man kann eine Klasse von Zahlen definieren,
die komplexen Zahlen, die auch i enthält. Sie wird mit C bezeichnet. Die
Zahlen der Form ai mit a reell heissen imaginär und die Bezeichnung ’reelle
2
Zahlen’ entstand als Gegensatz zum Begriff ’imaginäre Zahlen’.
2.1
Die reellen Zahlen
Wir haben jetzt von den reellen Zahlen gesprochen, nicht aber genau gesagt, was
sie sind. Ein anschauliches Bild der reellen Zahlen wird durch die Zahlengerade gegeben. Betrachten wir eine Gerade auf dem ein Punkt (der Ursprung)
ausgezeichnet wird. Eine Richtung auf der Gerade wird als positiv deklariert.
Z. B. wird oft eine waagerechte Gerade genommen und die positive Richtung
als ’nach rechts’ gewählt. Der Ursprung wird mit der Zahl Null identifiziert.
Eine positive Zahl a wird mit dem Punkt identifiziert, der in positiver Richtung
im Abstand a zum Ursprung liegt. Eine negative Zahl a wird mit dem Punkt
identifiziert, der in negativer Richtung im Abstand −a zum Ursprung liegt. Auf
diese Weise bekommt insbesondere jede rationale Zahl eine Darstellung auf der
Zahlengerade. Wie schon angedeutet entsprechen aber nicht alle Punkte auf der
Gerade rationalen Zahlen.
Es ist relativ kompliziert, eine präzise und vollständige Definition der reellen
Zahlen zu geben und eine solche Definition kann im Rahmen dieser Vorlesung
nicht gebracht werden. Ein wesentlicher Umstand ist dass die rationalen Zahlen
in den reellen Zahlen dicht liegen. Das heisst, dass wenn a eine reelle Zahl
ist und > 0 es eine rationale Zahl b gibt, so dass |a − b| < . Man kann
eine reelle Zahl beliebig gut durch rationale Zahlen approximieren. Praktische
Messungen in der realen Welt haben nur eine endliche Genauigkeit. Wenn wir
die Länge eines Stabs messen wird das Ergebnis immer nur mit endlich vielen
Dezimalstellen angegeben. Das heisst, das Ergebnis ist eine rationale Zahl. Die
reellen Zahlen sind trotzdem für die Anwendungen der Mathematik von großer
Bedeutung. Die Vorteile dieses Begriffs hängen damit zusammen, dass wir ein
intuitives Bild der Gerade in uns tragen. Eine Definition der reellen Zahlen
wurde erst 1872 von Richard Dedekind aufgestellt, der damals Professor der
Mathematik in seinem Geburtsort Braunschweig war. Seine Konstruktion, der
’Dedekindsche Schnitt’ wird bis heute verwendet.
Jetzt soll gezeigt werden, warum die rationalen Zahlen für die Geometrie
nicht ausreichen. Die alten Griechen
√ wussten, dass die Diagonale eines Quadrats
der Seitenlänge eins die Länge 2 hat, und dass diese Zahl irrational ist. Der
Beweis ist ein sogenannter ’indirekter Beweis’ oder Beweis durch Widerspruch.
Man nimmt an, dass eine bestimmte Aussage wahr sei und leitet aus dieser Aussage durch logische Schritte einen Widerspruch. Daraus schliesst man, dass die
Annahme falsch
gewesen sein muss. Im Beispiel, das uns interessiert führt die
√
Annahme,
2
sei
rational zu einem Widerspruch und damit ist bewiesen, dass
√
2 irrational ist. Bevor wir den Beweis durchführen machen wir auf folgenden
Umstand aufmerksam. Wenn eine ganze Zahl a gerade ist, dann ist definitionsgemäss a = 2b für eine ganze Zahl b. Dann ist a2 = 4b2 = 2(2b2 ) auch gerade.
Wenn dagegen a ungerade ist, dann ist a = 2b + 1 für eine ganze Zahl b und
a2 = (2b + 1)2 = 2(2b2 + 2b) + 1 auch ungerade. Zusammenfassend, eine ganze
2
Zahl a ist gerade
√ wenn und nur wenn a gerade ist.
Satz Die Zahl 2 ist irrational.
3
√
Beweis Wenn√wir annehmen, dass 2 rational ist, dann gibt es natürliche Zahlen
p und q mit 2 = pq . Wir können annehmen, dass p und q teilerfremd sind, weil
wir sie sonst durch andere Zahlen ersetzten könnten die es sind. Quadrieren
und mit q 2 multiplizieren gibt p2 = 2q 2 . Deshalb ist p2 gerade. Es folgt aus der
obigen Diskussion, dass p gerade ist, also p = 2r für eine ganze Zahl r. Deshalb
ist 4r2 = 2q 2 und q 2 = 2r2 . Daraus folgt, dass q 2 und deshalb auch q gerade ist.
Die Zahlen p und q sind also beide gerade und haben den gemeinsamen Teiler
2, was der Teilerfremdheit widerspricht. Damit ist der Beweis geführt.
Es ist viel schwieriger zu beweisen, dass π irrational ist. Der erste Beweis stammt
vom schweizer Mathematiker Johann Heinrich Lambert im Jahr 1761.
3
Der Goldene Schnitt
Der Goldene Schnitt ist ein Verhältnis von Längen, das in der Kunst als besonders schön gilt. Sie kommt auch an vielen Stellen in der Natur vor, z.B. bei der
Blattstellung von Pflanzen (Phyllotaxis).
3.1
Definition des Goldenen Schnitts
Der Goldene Schnitt wird durch eine Art definiert, eine Strecke zu schneiden,
liefert aber am Ende eine reine Zahl.
Definition Eine Strecke der Länge s > 0 wird im Goldenen Schnitt s = a + b
geteilt, wenn sich die ganze Länge s sum grösseren Abschnitt a wie dieser zum
kleineren Abschnitt b verhält. Das heisst, es ist
a
s
= .
a
b
(3)
Aus dieser Beziehung folgt, dass
s
a
=
,
a
s−a
a 2
s
+
a
−1=0
s
(4)
Die Formel für die Lösung einer quadratischen Gleichung liefert
a
1 1√
5.
=− ±
s
2 2
(5)
Eine dieser Lösungen ist negativ und deshalb für das ursprüngliche Problem
nicht relevant. Die andere ist
a
1 √
= ( 5 − 1) = 0, 618 . . . .
s
2
Die Zahl
Φ=
s
a
= = 1, 618 . . .
b
a
ist das Goldene Verhältnis.
4
(6)
(7)
Es wird manchmal behauptet, dass bei bestimmten schönen Gebäuden das
Verhältnis der Dimensionen das Goldene Verhältnis ergibt (z. B. das Parthenon
in Athen, der Dom von Florenz, Notre Dame in Paris). Es gibt aber anscheinend keine Dokumente die belegen würden dass beim Bau an so etwas
bewusst gedacht wurde. Vielleicht war es der unbewusste Sinn des Architekten
nach Schönheit. In der Natur findet man das Goldene Schnitt bei der Anordnung
der Blätter bestimmter Pflanzen. Der Goldene Winkel ist, in Grad ausgedrückt,
360
Φ . Bei bestimmten Pflanzen wo die Blätter um einen Stiel herum angeord
net sind ist der Winkel zwischen aufeinanderfolgen Blättern 360 1 − Φ1 . Nach
einer Theorie erreicht die Pflanze dadurch, dass die Blätter sich möglichst wenig
überdecken und sich dadurch bei der Photosynthese möglichst wenig gegenseitig
behindern.
3.2
Harmonische Rechtecke
Ein Rechteck heisst harmonisch wenn die Längen der Seiten a, b mit a > b so
a
. In diesem Fall gilt ab = Φ. Wenn man ein Rechteck in ein
sind, dass ab = a+b
Quadrat und einen Rest zerlegt, dann ist der Rest harmonisch.
3.3
Vergleich mit der DIN-Norm für Papierformate
Wie werden die üblichen Papierformate (A0, A1, A2, A3, A4, . . .) definiert? Sie
haben die Eigenschaft, dass wenn man ein Blatt in einem dieser Formate halbiert, das Ergebnis ein Blatt im nächsten Format der Reihe ist. Alle Formate
der Reihe haben das gleiche Verhältnis der Breite zur Länge. Dieses Verhältnis
kann man folgendermassen berechnen. Wenn Länge und Breite des ersten Blattes a und b sind, dann ist die Bedingung die erfüllt werden muss ab = 2b
a . Daraus
√
folgt, dass ab = 2. Um zu wissen, wie groß die einzelnen Blätter sind muss man
noch wissen, wie groß eins der Formate ist. Es wird festgelegt, dass das A0-Blatt
die Fläche ein Quadratmeter haben soll. Die Länge des A0-Blatts ist dann die
vierte Wurzel aus zwei. Sie ist nicht rational und insbesondere keine ganze Zahl
von Millimetern. In der Praxis arbeitet man mit einer gewissen Toleranz. Der
Richtwert ergibt eine Fläche von 999.949 Quadratmillimetern.
4
4.1
Die Fibonacci-Zahlen
Definition der Fibonacci-Zahlen
Leonardo da Pisa, Fibonacci genannt, war einer der ersten, der die indo-arabischen
Ziffern in Europa bekannt gemacht hat. In seinem Buch ’Liber Abbaci’ (um 1200
erschienen) hat er folgendes Beispiel beschrieben:
Ein bestimmter Mann hat ein Kaninchenpaar an einem Ort gehalten der auf
allen Seiten von einer Mauer umgeben war. Wie viele Kaninchenpaare können
in einem Jahr aus diesem Paar produziert werden wenn angenommen wird,
5
dass jedes Paar in jedem Monat ein weiteres Paar hervorbringt, welches ab dem
zweiten Monat fruchtbar wird?
Dieses Beispiel hat natürlich wenig mit Biologie und viel mit Mathematik
zu tun. Die Fibonacci-Folge (die schon vor mehr als 2000 Jahren von anderen
betrachtet wurde) wird folgendermassen definiert
Definition Die Fibonacci-Folge {Fn } wird rekursiv durch
F1 = F2 = 1,
(8)
Fn = Fn−1 + Fn−2 ,
n = 3, 4, . . .
(9)
definiert. Die ersten Elemente der Folge sind
1, 1, 2, 3, 5, 8, 13, 21, 34, 55, . . .
4.2
(10)
Goldener Schnitt und Fibonacci-Zahlen
Betrachten wir die Zahlen
√
√
1− 5
1+ 5
= −0, 618 . . . , Φ =
= 1, 618 . . . .
(11)
φ=
2
2
Die Zahl Φ ist nichts anderes als das Goldene Verhältnis. Die Zahlen φ und Φ
sind beide Lösungen der Gleichung x2 − x − 1 = 0. Von diesem Ausgangspunkt
können wir verschiedene Gleichungen für φ herleiten:
1 + φ = φ2
1 + 2φ = φ3 ,
4
1 + 2φ = 1 + φ + φ = φ + φ2 = φ(1 + φ) = φ3
2 + 3φ = φ ,
2 + 3φ = 1 + φ + 1 + 2φ = φ2 + φ3 = φ2 (1 + φ) = φ4
3 + 5φ = φ5 ,
3 + 5φ = 1 + 2φ + 2 + 3φ = φ3 + φ4 = φ3 (1 + φ) = φ5
5 + 8φ = φ6 ,
5 + 8φ = 2 + 3φ + 3 + 5φ = φ4 + φ5 = φ4 (1 + φ) = φ6
Diese Rechnung könnten wir beliebig lange weiterführen. Die gleichen Identitäten gelten für Φ, da Φ die gleiche Ausgangsleichung erfüllt wie φ. Hier baut
sich ein Muster auf, wo die Fibonacci-Zahlen zum Vorschein kommen. Wenn
wir die Gleichungen dieser Folge für φ von den entsprechenden Gleichungen für
Φ subtrahieren dann ergeben sich die Gleichungen
Φ2 − φ 2
Φ3 − φ 3
Φ4 − φ 4
Φ5 − φ 5
= 1,
= 2,
= 3,
= 5, usw.
(12)
Φ−φ
Φ−φ
Φ−φ
Φ−φ
√
In diesen Formeln können wir den Nenner durch 5 ersetzen. Durch diese
Überlegungen kommt man auf folgende Aussage, die von de Moivre und Binet
bewiesen wurde. (Die soeben gemachten Rechnungen beweisen den Satz nicht.)
Satz Zwischen den Fibonacci-Zahlen Fn und den Goldenen Zahlen φ und Φ
besteht der Zusammenhang
1
Fn = √ (Φn − φn ),
5
6
n = 1, 2, 3, . . .
(13)
Da |φ| < 1 folgt aus diesem Satz, dass für n groß Fn ungefähr gleich
4.3
√1 Φn
5
ist.
Binomischer Lehrsatz und Pascalsches Dreieck
Die Fakultät wird durch n! = 1 · 2 · 3 · . . . · n definiert. Die Binomialkoeffizienten
werden durch
n
n!
n
n
=
,
= 1,
=1
(14)
k
k!(n − k)!
0
n
definiert. In diesem Zusammenhang ist es auch günstig 0! = 1 zu definieren.
Satz (Binomischer Lehrsatz)
n X
n n−k k
(a + b)n =
a
b .
(15)
k
k=0
Dieser Satz wird normalerweise durch vollständige Induktion bewiesen. Dieser
Beweismethode wenden wir uns im nächsten Abschnitt zu. Im Fall n = 1
reduziert sich der Satz auf die uninteressante Gleichung a + b = a + b. Dagegen
sind die Fälle n = 2 und n = 3 schon für algebraische Rechnungen sehr nützlich.
Sie lauten
(a + b)2 = a2 + 2ab + b2 ,
(16)
(a + b)3 = a3 + 3a2 b + 3ab2 + b3 .
(17)
Wenn wir (a + b)n für grössere Werte von n auf diese Weise ermitteln wollten, dann könnten die Rechnungen langwierig werden. Sie lassen sich einfacher
sukzessiv durch die Verwendung der Identität
n+1
n
n
=
+
(18)
k
k−1
k
berechnen. Diese Identität bekommt eine geometrische Interpretation durch das
Pascalsche Dreieck. [In der Vorlesung wird das Dreieck angeschrieben.]
4.4
Pascal und Fibonacci
Wenn man im Pascalschen Dreieck geeignete diagonale Summen bildet dann
kommen wieder die Fibonacci-Zahlen zum Vorschein. [In der Vorlesung wird
dieser Umstand genauer beschrieben.]
4.5
Das Pascalsche Dreieck und Restklassen nach Division
Definition Für zwei ganze Zahlen a, b ∈ Z und eine positive natürliche Zahl
m ∈ N schreiben wir
a ≡ b mod m
bzw.
a − b ≡ 0 mod m
(19)
genau dann, wenn a und b nach Division durch m den gleichen ganzzahligen
Rest lassen. Es sind also z. B. 1 ≡ 5 mod 2 und 5 ≡ 14 mod 3. Die Division
7
durch zwei teilt die natürlichen Zahlen N offenbar in zwei disjunkte Restklassen
ein. Es sind die Restklasse aller ungeraden Zahlen (die Division durch zwei lässt
den Rest 1) und die Restklasse aller geraden Zahlen (die Division durch zwei
lässt den Rest 0). Wir schreiben
0̄ = {2, 4, 6, 8, 10 . . .},
1̄ = {1, 3, 5, 7, 9 . . .}.
Analog zerlegt die Division durch 5 die Menge N in fünf einander disjunkte
Restklassen, deren Elemente durch den gemeinsamen Rest 0, 1, 2, 3 oder 4
charakterisiert sind:
0̄ = {5, 10, 15, 20, 25 . . .},
1̄ = {1, 6, 11, 16, 21 . . .},
2̄ = {2, 7, 12, 17, 22 . . .},
3̄ = {3, 8, 13, 18, 23, . . .},
4̄ = {4, 9, 14, 19, 24 . . .}.
(20)
Wir wollen die Elemente einer solchen Restklasse als äquivalent ansehen, gekennzeichnet durch das Symbol ∼, schreiben also z. B.
5 ∼ 10,
5 ∼ 15
, 10 ∼ 15
usw.
(21)
für die Restklasse 0̄ bei Division durch 5. Für dieses Beispiel schreibt man
allgemeiner
a ∼ b genau dann, wenn a − b ≡ 0 mod 5.
(22)
Die hierdurch eingeführte Relation zwischen zwei Elementen a und b besitzt interessante Eigenschaften, die sie als sogenannte Äquivalenzrelation auszeichnen.
Definition Eine Äquivalenzrelation ist durch folgende Eigenschaften charakterisiert. Sie ist
reflexiv: es gilt stets x ∼ x
symmetrisch: wenn x ∼ y dann gilt auch y ∼ x
transitiv: wenn x ∼ y und y ∼ z dann gilt auch x ∼ z
Der Begriff der Äquivalenzrelation hat in der Mathematik viele Anwendungen.
Diese Definition kann im Rahmen der Mengenlehre präzisiert werden. Wir fangen mit einer Menge X an. Die Produktmenge X × X ist die Menge aller
Paare (a, b) mit a, b ∈ X. Eine Relation auf X wird durch eine Teilmenge R
von X × X definiert. Die Relation heisst Äquivalenzrelation wenn folgende drei
Eigenschaften gelten, die den schon oben genannten Eigenschaften entsprechen.
Für jedes Element a ∈ X ist (a, a) ∈ R. Wenn (a, b) ∈ R, dann auch (b, a).
Wenn (a, b) ∈ R und (b, c) ∈ R dann ist (a, c) ∈ R. Die Beziehung zwischen den
zwei Schreibweisen ist, dass (a, b) ∈ R der Aussage a ∼ b entspricht.
Es werden jetzt verschiedene Rechenregeln fuer Restklassen ohne Beweis
angegeben.
8
Aus a ≡ b mod m und c ∈ Z folgt a + c ≡ b + c mod m
Aus a ≡ b mod m und c ≡ d mod m folgt a + c ≡ b + d mod m
Aus a ≡ b mod m und c ∈ Z folgt ac ≡ bc mod m
Aus a ≡ b mod m und c ≡ d mod m folgt ac ≡ bd mod m
Aus a ≡ b mod m und n ∈ N folgt an ≡ b√n mod m
Denken wir an den Beweis zurück, dass 2 irrational ist. Die einzige wichtige
Eigenschaft der Zahl 2 die wir dabei verwendet haben ist, dass eine Zahl n gerade
ist wenn und nur wenn n2 gerade ist. Dies ist die Aussage dass n ≡ 0 mod 2
genau dann, wenn n ≡ 0 mod 2. In dem Fall, dass für eine andere Zahl k gilt,
dass n ≡ 0 mod k wenn und nur wenn n2 ≡ 0 mod k, dann kann man ähnlich
argumentieren wie im Fall k = 2. Dass die zweite Aussage aus der ersten folgt
sieht man aus den obigen Rechenregeln. Die Umkehrung kann man für einen
gegebenen Wert von k überprüfen, in dem man alle Fälle durchgeht. Z. B. im
Fall k = 5.
2
2
12 ≡ 1 mod 5, 22 ≡ 4 mod
√ 5, 3 ≡ 4 mod 5, 4 ≡ 1 mod 5
Damit ist bewiesen dass 5 irrational ist und dass das goldene Verhältnis irrational ist.
4.6
Fermatsche Primzahlen
In diesem Abschnitt werden die Rechenregeln für Restklassen verwendet, um
ein klassisches Beispiel zu untersuchen. Der französische Mathematiker Pierre
de Fermat hat 1637 vermutet, dass alle Zahlen der Form
n
Fn = 22 + 1
(23)
Primzahlen sind, also natürliche Zahlen, die grösser als 1 und nur durch sich
selbst teilbar sind. Diese Zahlen heissen aus diesem Grund Fermatsche Zahlen.
Sie sind beispielsweise
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537.
(24)
Leonhard Euler bewies aber dass F5 = 4294967297 keine Primzahl ist, sondern
den Teiler 641 besitzt.
5
22 + 1 = 232 + 1 ≡ 0 mod 641.
(25)
Diese Aussage wird jetzt bewiesen. Zunächst ist
641 = 640 + 1 = 5 · 27 + 1 und 5 · 27 ≡ −1 mod 641.
(26)
In dem wir die vierte Potenz bilden bekommen wir
54 · 228 ≡ 1 mod 641.
(27)
54 + 24 = 625 + 16 = 641 und 54 ≡ −24 mod 641.
(28)
Andererseits ist
Diese Gleichung wird jetzt mit 228 multipliziert, mit dem Ergebnis
232 ≡ −54 · 228 mod 641 ≡ −1 mod 641.
9
(29)
5
5.1
Summenformeln
Was sind Summenformeln?
Wir
in diesem Abschnitt explizite Darstellungen für die Summen Sp (n) =
Pn wollen
p
p
k=1 k für Potenzen k mit p ∈ N kennenlernen. An solchen Beispielen lernt
man in der Regel die Beweismethode der vollständigen Induktion. Diese Vorgehensweise hat den Nachteil, dass man die richtige Antwort kennen muss, bevor
man sie beweist. Wir wollen daher auch der Frage nachgehen, wie explizite
Darstellungen für Summen von Potenzen auf direktem Wege hergeleitet werden können. Zweitens
Pn leiten wir eine explizite Darstellung für die geometrische
Summe Gq (n) = k=0 q k ab und diskutieren an einem Beispiel ihre Anwendung
im Bereich der Zinsrechnung.
5.2
Die Summe der ersten n Zahlen
Wir beginnen mit dem
Satz Es gilt
S1 (n) =
n
X
k=
k=1
n(n + 1)
.
2
(30)
Beweis Die Idee des nachfolgenden Beweises stammt vom neunjährigen C. F.
Gauß: wir schreiben die Summe zweimal untereinander, einmal aufsteigend,
einmal absteigend, auf und summieren die Elemente in den einzelnen Spalten
1+
2
+ ...
n + (n − 1) + . . .
+(n − 1) + n
(31)
+
(32)
2
+1
Jede Spalte liefert einen Beitrag n + 1 und es gibt n davon. Das Ergebnis ist das
doppelte der Summe, die wir ausrechnen wollten. Damit ist der Satz bewiesen.
5.3
Die Summe der ersten n Quadratzahlen
Wir wollen eine explizite Darstellung für S2 (n) herleiten. Dazu benötigen wir
den
Hilfssatz Für jedes n gilt
1 + 3 + 5 + 7 + . . . + (2n − 1) = n2 .
(33)
Erster Beweis Dieser Beweis benutzt das Ergebnis des letzten Satzes. Die
Summe die uns hier interessiert kann als die Summe von drei Beiträgen geschrieben
werden. Dazu wird die Identität 2k − 1 = (k − 1) + (k − 1) + 1 benutzt. Die
Summe von k ist das bereits bekannte n(n+1)
während die Summe von 1 ist n.
2
Deshalb ist die Gesamtsumme
n(n − 1) n(n − 1)
+
+ n = n2
2
2
10
(34)
Dieser Beweis stammt von T. Weißschuh.
Zweiter Beweis Dieser geometrische Beweis wird an der Tafel gezeigt.
Satz S2 (n) = n(n+1)(2n+1)
.
6
In der Vorlesung wird eine geometrische Darstellung dieser Identität im Fall
n = 4 gegeben. Dabei werden sowohl der Hilfssatz als die Formel für die Summe
der ersten n Zahlen verwendet.
5.4
Summe der ersten n Kubikzahlen - vollständige Induktion
Eine explizite Darstellung von S3 (n) kann man mittels vollständiger Induktion
bekommen. Die Beweismethode der vollständigen Induktion können wir wie
folgt zusammenfassen.
Satz Für jedes n ∈ N ∪ {0} sei eine Aussage An der Art gegeben, so dass gelten
(i) die Aussage A0 is richtig, und
(ii) aus der Richtigkeit von An für beliebig gewähltes n ∈ N0 folgt die Richtigkeit
von An+1 . Dann gilt An für alle n ∈ N0 .
Der erste Punkt wird als Induktionsvoraussetzung bezeichnet. Der Induktionsschritt is dann Inhalt des zweiten Punktes. Der Beweis dieses Satzes ist eng mit
dem axiomatischen Aufbau der Zahlensysteme verwandt und wird hier nicht
behandelt. Jetzt wird diese Beweismethode zur Bestimmung der Grösse S3 (n)
verwendet.
Satz Es gilt
n
X
n2 (n + 1)2
(35)
k3 =
S3 (n) =
4
k=1
Beweis Es reicht zu beweisen, dass S3 (n) = (S1 (n))2 , was jetzt mit vollständiger
Induktion gemacht wird.
Induktionsanfang: (S1 (1))2 = 1 = S3 (1). Die Aussage gilt also für n = 1.
Induktionsschritt: Es sei vorausgesetzt, dass (S1 (n))2 = S3 (n) für einen bestimmten Wert von n. Dann berechnen wir
2
2 (n + 1)(n + 2)
n(n + 1)
2
+ (n + 1)
(36)
(S1 (n + 1)) =
=
2
2
= (S1 (n))2 + n(n + 1)2 + (n + 1)2
3
= S3 (n) + (n + 1) = S3 (n + 1).
(37)
(38)
Damit ist die Behauptung bewiesen.
5.5
Die geometrische Reihe
Die geometrische Reihe ist die unendliche Summe der Glieder der sogenannten
geometrischen Folge, d.h. derjenigen Zahlenfolge {ak } für welche das Verhältnis
benachbarter Folgenglieder stets konstant ist. Hier ist k ∈ N0 . Sei q = aak+1
k
11
dieses Verhältnis. Dann ist ak = a0 q k . Für die n-te Partialsumme Sn der
geometrischen Zahlenfolge ist daher
Sn =
n
X
ak = a0
k=0
n
X
qk
(39)
k=0
Satz Sei q 6= 1. Dann gilt
n
X
qk =
k=0
1 − q n+1
.
1−q
(40)
Ist ferner |q| < 1, so haben wir im Grenzfall n → ∞
∞
X
qk =
k=0
1
.
1−q
(41)
Beweis Wir schreiben die n-te Partialsumme wie folgt aus
Sn =
n
X
qk = 1 + q + q2 + . . . + qn .
(42)
k=0
Es folgt, dass
(1 − q)Sn = (1 + q + q 2 + . . . q n ) − (q + q 2 + q 3 + . . . q n+1 ))
1 − q n+1 .
(43)
Für q 6= 1 bekommen wir daraus die erste Behauptung. Um die Grenzformel
zu bekommen benutzt man die Tatsache dass |q| < 1 impliziert |q|n → 0 for
n → ∞.
Die geometrische Reihe findet insbesondere Anwendung in der Zinseszinsrechnung bei Sparanlagen. Hier ist ein Beispiel.
Zu Beginn eines jeden Jahres zahlt man 2000 Euro bei einer Bank bei einem
Zinssatz von 5% ein. Wieviel Geld hat man nach fünf Jahren angespart?
Wir gehen wie folgt vor. Zunächst berechnen wir den Zinsfaktor 1,05. Um diesen
Faktor vermehrt sich das Geld in einem Jahr. Das im ersten Jahr eingezahlte
Geld wird fünf Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)5 . Das im zweiten
Jahr eingezahlte Geld wird vier Jahre verzinst, mit dem Ergebnis 2000 · (1, 05)4 .
Das gesamt angesparte Kapital ergibt sich also aus folgender Rechnung:
2000 · (1, 05)5 + 2000 · (1, 05)4 + 2000 · (1, 05)3 + 2000 · (1, 05)2 + 2000 · (1, 05)1
= 2000 · 1, 05 · ((1, 05)4 + (1, 05)3 + (1, 05)2 + (1, 05)1 + (1, 05)0 )
= 2000 · 1, 05 ·
4
X
(1, 05)k = 2000 · 1, 05 ·
k=0
= 11.602, 826
12
1 − (1, 05)5
1 − 1, 05
nach Rundung. Durch Zinsen hat sich das eingezahlte Kapital um 1.602,83
Euro erhöht. Hätte man die 10000 Euro am Anfang eingezählt und zu 5% auf 5
Jahre verzinst so wäre der Endbetrag 10000 · (1, 05)5 = 12.762, 82 gewesen, also
wesentlich mehr.
5.6
Beweis der binomischen Formel
Die Methode der vollständigen Induktion kann angewendet werden um die binomische Formel zu beweisen. Die Aussage An , die es zu beweisen gilt ist die
Formel für einen gegebenen P
Wert von n. Betrachten
wir zuerst die Aussage
0
A0 . (a + b)0 = 1 während k=0 a−k bk = 00 = 1. Als nächtes kommt der
Induktionschritt.
n X
n n−k k
n+1
n
(a + b)
= (a + b)(a + b) = (a + b)
a
b
k
k=0
n n X
n n−k+1 k X n n−k k+1
=
a
b +
a
b
(44)
k
k
k=0
k=0
Die zweite Summe auf der rechten Seite kann durch
n+1
X n an−k+1 bk
k−1
(45)
k=1
ersetzt werden. Deshalb ist
n n n+1 X n
n
n n+1
(a + b)n+1 =
a
+
+
an−k+1 bk +
b
0
k
k−1
n
k=1
n n n+1
n n+1 X n + 1 n−k+1 k
a
+
a
b +
b
=
k
n
0
k=1
n+1
X n + 1
=
an−k+1 bk .
(46)
k
k=0
Mit der letzten Aussage haben wir An+1 bewiesen und auch den binomischen
Lehrsatz.
6
Der Satz des Pythagoras
Abgesehen von den Zahlen ist ein anderes bekanntes Gebiet der Mathematik die
Geometrie. Sie ist eng mit unseren Vorstellungen des Raumes verbunden, der
uns umgibt. Die alten Griechen haben die Geometrie als eigenständige Theorie
aufgebaut. Das kanonische Werk dazu sind die ’Elemente’ des Euklid. Seit den
Arbeiten von René Descartes, ist bekannt, dass man die eulidischen Geometrie
auf den Zahlen aufbauen kann durch die Verwendung von Koordinaten. Es gibt
z. B. eine Korrespondenz zwischen Punkten in der Ebene und Paaren (x, y) von
reellen Zahlen.
13
6.1
Aussage und erster Beweis
Die vielleicht bekannteste Aussage der elementaren Geometrie ist der Pythagoreische Lehrsatz. Zu dessen Beweis brauchen wir nur die Tatsache, dass ein
echteck mit den Seitenlängen a uns b den Inhalt ab hat.
Satz Für ein rechtwinkliges Dreieck mit den beiden Katheten a und b und der
Hypotenuse c gilt a2 + b2 = c2 .
Beweis [In der Vorlesung kommt hier ein Bild] Wir betrachten ein Quadrat
mit der Seitenlänge a + b und Eckpunkte P1 , P2 , P3 , P4 . Die Punkte werden
in dieser Reihenfolge durchlaufen wenn wir um den Rand des Quadrats im
Uhrzeigersinn laufen. Bei diesem Umlauf sei Qi der Punkt, der einen Abstand
a nach Pi kommt. Die Geraden Qi Qi+1 teilen das Quadrat in vier Dreiecke
und ein kleineres Quadrat mit Seitenlänge c. Hier sind die Indizes mod 4 zu
verstehen. Die Fläche des Großen Quadrats is (a + b)2 . Sie ist gleich der Summe
2
der vier Dreiecke und des kleinen Quadrats, also 4 · ab
2 + c . Wenn wir diese
Ausdrücke gleichsetzten bekommen wir
a2 + 2ab + b2 = 2ab + c2 ,
(47)
was zur Behauptung des Satzes führt.
Diesen Beweis findet man in einer chinesischen Schrift von etwa 100 vor
Christi
6.2
Beweis nach Bhaskara
Hier geht es um einen Beweis des indischen Mathematikers und Astronoms
Bhaskara (1114-1185). [In der Vorlesung kommt an dieser Stelle ein Bild.]
Diesmal setzt sich ein Quadrat mit der Seitenlänge c aus vier Dreiecken mit
Seitenlängen a und b und ein Quadrat mit der Seitenlänge |a − b| zusammen.
Diesmal ergibt der Vergleich
c2 = 4 ·
6.3
ab
+ (a − b)2 = 2ab + a2 − 2ab + b2 = a2 + b2 .
2
(48)
Ähnliche Dreiecke und Beweis nach Einstein
Für einen dritten Beweis des Satzes brauchen wir den Begriff der ähnlichen
Dreiecke.
Definition Zwei Dreiecke ABC und DEF heissen ähnlich, wenn die Verhältnisse
der Längen der entsprechenden Seiten alle gleich sind, also
|AB|
|BC|
|CA|
=
=
.
|DE|
|EF |
|F D|
(49)
Eine äquivalente Bedingung, was hier nicht bewiesen wird, ist dass die entsprechenden Winkel gleich sind. Da die Summe der Winkel eines Dreiecks 180 Grad ist,
reicht es zu wissen, dass zwei der Winkel gleich sind. Auf die Idee des folgenden
14
Beweises ist Albert Einstein mit elf Jahren gekommen. Wenn die x- und yRichtung in der Ebene mit dem gleichen Faktor λ skaliert werden, dann skalieren
sich die Flächen rechtwinkliger Dreiecke mit dem Faktor λ2 . Die Dreiecke, die
durch eine solche Skalierung aus einem Dreeick hervorgehen sind alle ähnlich.
Als Referenzdreieck wählen wir ein Dreieck mit der Hypotenusenlänge 1 und
dem Inhalt Fref . Wir betrachten ein rechtwinkliges Dreieck ABC mit dem
rechten Winkel im Punkt C. Der Punkt C kann mit einem Punkt D der
gegenüberliengen Seite verbunden werden derart, dass die Gerade CD senkrecht
auf die Gerade AB steht. Bezeichnen wir mit F1 , F2 und F3 die Flächen der
Dreiecke ABC, ADC und DBC. Diese drei Dreiecke sind alle ähnlich. Es gilt
F1 = c2 Fref , F2 = a2 Fref , F3 = b2 Fref .
(50)
Auf der anderen Seite ist F1 = F2 + F3 und wir erhalten
c2 Fref = a2 Fref + b2 Fref .
(51)
2
Jetzt müssen wir nur noch den Faktor Fref
kürzen.
6.4
Großer Fermatscher Satz
Pierre de Fermat, dem wir in einem früheren Abschnitt begegnet sind ist aus
einem anderen Grund in der Mathematik sehr bekannt. Im Zusammenhang mit
dem Satz des Pythagoras weiss man, dass es unendlich viele Lösungen (a, b, c)
der Gleichung a2 + b2 = c2 gibt mit a, b und c natürliche Zahlen. Wenn man
eine Lösung hat, z. B. (3, 4, 5) kann man andere Lösungen bekommen in dem
man a, b und c mit der gleichen natürlichen Zahl k > 1 multipliziert. Das ist zu
offensichtlich, um interessant zu sein. Es gibt aber andere Möglichkeit, Lösungen
zu produzieren, die auf Euklid zurückgeht. Man fängt mit zwei natürlichen
Zahlen m und n an, die beliebig sind bis auf die Bedingung, dass m > n. Dann
definiert man
a = m2 − n2 , b = 2mn, c = m2 + n2 .
(52)
Diese Zahlen erfüllen a2 + b2 = c2 und es gibt einfache Bedingungen die dafür
sorgen, dass a, b und c nicht alle durch die gleiche Zahl k ohne Rest teilbar
sind. Ausgehend von dieser Fülle könnte man auf die Idee kommen, Lösungen
von an + bn = cn zu suchen, wobei a, b und c wieder natürliche Zahlen sind
und n eine natürliche Zahl grösser zwei. Eine vielleicht überraschende Tatsache
ist: es gibt keine. Diese Aussage wird heutzutage als großer Fermatscher Satz
bezeichnet. Es wäre aber angemessener, sie als Fermatsche Vermutung zu bezeichnen, da er sie nicht nachweislich bewiesen hat. Die Geschichte fängt damit
an, dass Fermat um 1640 etwas als Randnotiz in sein Exemplar der Arithmetika
des Diophantus geschrieben hat. Zuerst hat er die Aussage seines ’Satzes’ behauptet und dann folgenden berühmten Text (hier eine Übersetzung aus dem
ursprünglichen Latein):
Ich habe hierfür einen wahrhaft wunderbaren Beweis gefunden, doch ist der
Rand hier zu schmal, um ihn zu fassen.
15
Fermat hatte einen Beweis im Spezialfall n = 4 gefunden aber im allgemeinen
Fall hat er sich bestimmt vermacht. Jedenfalls wurde, trotz vieler Versuche
bedeutender Mathematiker in den darauffolgenden 350 Jahren kein Beweis gefunden. Erst 1995 hat der englische Mathematiker Andrew Wiles einen Beweis
vorgestellt. Sein erster Versuch enthielt noch eine Lücke aber dieser konnte
mit Hilfe seines Schülers Richard Taylor geschlossen werden. Die spannende
Geschichte wird in einem Buch von Simon Singh [4] erzählt.
7
Kegelschnitte
Wir widmen uns nun elementargeometrischen Untersuchungen zu den ebenen
Kegelschnitten Kreis, Ellipse, Hyperbel und Parabel. Wir beginnen mit der algebraischen Definition, kommen aber dann sofort zu geometrischen Charakterisierungen vermittels spezieller Abstandsregeln unter Verwendung sogenannter
Brennpunkte.
7.1
Algebraische Definition von Kegelschnitten
Auf algebraischer Art können wir die Kegelschnitte wie folgt charakterisieren.
Ein Kegelschnitt ist die Menge der Punkte (x, y) ∈ R2 die die Beziehung
ax2 + by 2 + 2cxy + dx + ey + f = 0
(53)
erfüllen mit reellen Zahlen a, b, c, d, e, f . Geometrisch handelt es sich um einen
Schnitt einer Ebene mit einem Kegel oder einem Zylinder.
7.2
Der Kreis
Eine zur Mittelpunktsachse eines Zylinders senkrechte Ebene schneidet diese
Rotationsfläche in einem Kreis.
Definition Der Kreis ist eine ebene Kurve, deren Punkte P von einem fest
gewählten Punkt M , dem Mittelpunkt, einen festen Abstand besitzen.
Dieser fest gewählte Abstand r > 0 heisst der Radius des Kreises. Mit dem Satz
von Pythagoras folgt, dass
x2 + y 2 = r 2 ,
(54)
wobei wir o.B.d.A. angenommen haben, dass M = (0, 0). Der Kreis ist geschlossen
und streng konvex. D. h. die Tangente in einem Punkt hat nur einen gemeinsamen Punkt mit dem Kreis, den Berührpunkt. Im allgemeinen liegt der Mittelpunkt nicht im Koordinaten-Ursprung, sondern in einem Punkt mit Koordinaten (xM , yM ). Dann wird die Gleichung des Kreises verallgemeinert.
Satz Die Punkte (x, y) eines Kreises mit Mittelpunkt (xM .yM ) ∈ R2 und Radius
r erfüllt die Gleichung
(x − xM )2 + (y − yM )2 = r2 .
16
(55)
Der Gelehrte Eratosthenes leitete ein halbes Jahrhundert lang die Bibliothek in
Alexandria, die bedeutendste Bibliothek der Antike. Er war sehr vielseitig in
seinen Interessen und hat sich insbesondere mit Fragen der Astronomie beschäftigt.
Seine bekannteste Errungenschaft war eine Bestimmung des Umfangs der Erde.
Über der Stadt Assuan, die fast genau südlich von Alexandria liegt, steht am
Mittag des Tages der Sommersonnenwende die Sonne genau im Zenit. Ein
Gnomon (ein vertikaler Stab auf einem nivellierten Untergrund) wirft daher zu
diesem Zeitpunkt keinen Schatten. An einem Mittag der Sommersonnenwende
bestimmte Eratosthenes im nördlich gelegenen Alexandria den Winkel zwischen
der Sonnenrichtung und einem vertikal positionierten Gnomon und konnte so
den Winkel zwischen den Vertikalen in Assuan und Alexandria schätzen. Er
kam auf die Antwort, dass dieser Winkel ein Fünfzigstel des Vollkreises war.
Der Gesamtumfang der Erde beträgt also in etwa das 50-fache der Entfernung
zwischen Alexandria und Assuan, d.h. ungefähr 40.200 Kilometer. Die heutige
Bestimmung des Erdumfangs kommt auf 40.024 Kilometer.
7.3
Die Ellipse
Eine zur Rotationsachse eines Zylinders schräge Ebene schneidet diese Fläche
in einer Ellipse. Hier aber nun unsere
Definition Eine Ellipse ist eine ebene Kurve, deren Punkte P konstante Abstandssumme von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten,
besitzen.
Der Zusammenhang zwischen der geometrischen Idee eines schrägen Schnittes
mit dem Zylinder und dieser Definition ist nicht unmittelbar einsichtig und
bedarf eines Beweises. Der Mittelpunkt der Gerade F1 F2 nennen wir Mittelpunkt des Ellipses und die Koordinaten werden so gewählt, dass dieser Punkt
der Ursprung ist. Ausserdem können wir annehmen, dass die Gerade die die
Brennpunkte verbindet auf der x-Achse liegt. Der Abstand zwischen dem Mittelpunkt und den Punkten, wo die Ellipse die x-Achse schneidet heisst große
Halbachse und der Abstand zwischen dem Mittelpunkt und den Punkten, wo
die Ellipse die y-Achse schneidet heisst kleine Halbachse.
Der Name Brennpunkt kommt von folgender physikalischer Idee. Stellen wir
uns vor, dass die Ellipse Licht das von innen kommt wie ein Spiegel zurückschickt.
Dann ist die Behauptung, dass Lichtstrahlen, die von einem der Brennpunkte
ausgehen im anderen Brennpunkt wieder aufeinander treffen. Die mathematische Aussage, die dieser Behauptung entspricht ist, dass wenn P ein Punkt auf
der Ellipse ist, die Geraden die P mit den Brennpunkten verbinden den gleichen
Winkel machen mit der Tangente zur Ellipse im Punkt P . Diese Aussage wird
hier nicht bewiesen.
Satz Wenn die Koordinaten wie oben beschrieben gewählt werden erfüllen die
Punkte der Ellipse mit großer Halbachse a und kleiner Halbachse b die Gleichung
y2
x2
a2 + b2 = 1.
Beweis Seien F1 und F2 die Brennpunkte und P ein Punkt auf der Ellipse.
Sei r1 = |F1 P |, r2 = |F2 P | und f = |OF1 | = |OF2 |. Für den Punkt P mit
17
Koordinaten (x, y) gilt nach dem Satz von Pythagoras
r12 = (f + x)2 + y 2 = f 2 + 2f x + x2 + y 2 ,
(56)
r22 = (f − x)2 + y 2 = f 2 − 2f x + x2 + y 2 .
(57)
Deshalb ist
r12 − r22 = 4f x.
(58)
Nach der Definition gilt r1 + r2 = 2λ für eine reelle Zahl λ > 0, so dass
4f x = 2λ(r1 − r2 )
und r1 − r2 =
2f x
.
λ
(59)
Wenn wir diese Beziehung mit r1 + r2 = 2λ kombinieren bekommen wir
r1 = λ +
fx
,
λ
r2 = λ −
fx
.
λ
(60)
Die Gleichung der Ellipse muss natürlich in den vier Scheitelpunkten erfüllt sein.
Im Scheitelpunkt rechts von F2 mit den Koordinaten (0, a) gilt
2λ = r1 + r2 = [f + f + (a − f )] + (a − f ) = 2a,
(61)
so dass λ = a. Im Scheitelpunkt mit den Koordinaten (0, b) gilt r1 = r2 = λ
und f 2 + b2 = a2 . Wenn wir zwei Darstellungen von r12 vergleichen, die wir oben
hergeleitet haben dann bekommen wir die Gleichung
λ2 + 2f x +
f 2 x2
= f 2 + 2f x + x2 + y 2 .
λ2
(62)
f 2 x2
= f 2 + x2 + y 2 .
λ2
(63)
Es folgt, dass
λ2 +
Da f 2 + b2 = a2 and λ = a schließen wir, dass
b2
a2 + 1 − 2 x2 = x2 + y 2 + a2 − b2 .
a
(64)
Durch subtrahieren von x2 + a2 von beiden Seiten bekommt man
−
b2 2
x = y 2 − b2 .
a2
(65)
Das Ergebnis folgt dann leicht.
7.4
Die Hyperbel
Jetzt werden die Überlegungen des letzten Abschnitts abgeändert, um die Hyperbel zu bekommen. Betrachten wir zwei Geraden L1 und L2 im dreidimensionalen Raum, die sich in einem Punkt O schneiden. Wenn L2 um den Punkt
18
O gedreht wird, während der Winkel zwischen den zwei Geraden fest bleibt
entsteht ein Doppelkegel mit Achse L1 . Die Geraden, die durch Rotation aus
L2 entstehen heissen Erzeugende des Kegels. Eine zur Kegelachse Senkrechte
Ebene die O nicht enthält schneidet den Kegel in einem Kreis. Wird die Ebene
leicht geneigt, wird der Kreis zu einer Ellipse. Wenn sie weiter geneigt wird, bis
sie mit einer Erzeugenden des Kegels parallel ist dann wird die Schnittmenge
zu einer Parabel. Diese Menge ist nicht mehr beschränkt und enthält Punkte,
die von O beliebig weit weg sind. Sie ist in einer der beiden Hälften des Doppelkegels enthalten. Wenn die Ebene noch weiter geneigt wird schneidet sie
beide Teile des Doppelkegels und ist eine Hyperbel.
Unter einer Hyperbel wollen wir in dieser Vorlesung folgende Punktmenge
verstehen.
Definition Eine Hyperbel ist eine ebene Kurve, deren Punkte P konstante Abstandsdifferenz von zwei fest gewählten Punkten F1 und F2 , den Brennpunkten,
besitzen.
Wie im Fall der Ellipse wählen wir die Koordinaten so, dass die Brennpunkte
F1 und F2 auf der x-Achse liegen und der Mittelpunkt O der Strecke, die sie
verbindet der Koordinatenursprung ist. Die Halbachse a ist der Abstand von O
zu den Schnittpunkten der Hyperbel mit der x-Achse. Die Exzentrizität oder
Brennweite e ist der Abstand von O zu den Brennpunkten. Nach der Definition
einer Hyperbel gilt ||P F1 | − |P F2 || = 2λ für eine reelle Zahl λ. Wenn eine
‘imaginäre Halbachse’ b durch a2 + b2 = e2 definiert wird, dann gilt
Satz Mit der reellen Halbachse a und der imaginären Halbachse b gilt für die
2
2
Punkte (x, y) einer Hyperbel die Gleichung xa2 − yb2 = 1.
Der Beweis dieser Aussage ist dem der entsprechenden Aussage für die Ellipse
ähnlich und wird hier nicht ausgeführt.
7.5
Die Parabel
Aus der Ellipse lässt sich durch einen Grenzübergang die Parabel konstruieren.
Zu diesem Zweck ist es hilfreich, zu Koordinaten überzugehen wo der linke
Scheitelpunkt der Ellipse im Ursprung liegt. In den neuen Koordinaten lautet
2
2
+ yb2 = 1. Nach ausmultiplizieren der Klammer
die Gleichung der Ellipse (x−a)
a2
und multiplizieren mit a erhalten wir
x2
ay 2
− 2x + 2 = 0.
a
b
(66)
1 ay 2
x2
x=
.
+
2 b2
a
(67)
Anders ausgedrückt
Jetzt ändern wir die Parameter so, dass a sehr groß wird während
Dann geht die letzte Gleichung im Grenzfall in
h a i
x=
y2
2b2
19
a
b2
fest bleibt.
(68)
über,
Gleichungeiner Parabel. Der linke Brennpunkt hat die x-Koordinate
die
q
2
a 1 − 1 − ba · a1 . Durch die Identität
1−
√
1−c=
1+
c
√
1−c
die für jede Konstante c mit 0 < c < 1 gilt, sehen wir, dass
!
r
b2 1
b2
.
a 1− 1−
·
= q
a a
b2 1
a 1+ 1− a · a
(69)
(70)
2 b
Für a groß ist also der linke Brennpunkt in der Nähe von 2a
, 0 . Der rechte
Brennpunkt dagegen wandert nach unendlich in diesem Grenzfall.
Die physikalischen Überlegungen die wir im Fall der Ellipse gemacht haben,
sind auch im Fall der Parabel interessant. Wenn diese Strahlen an der Innenseite
der Parabel gespiegelt werden dann kommen Strahlen die vom Brennpunkt ausgehen parallel hinaus. Umgekehrt treffen sich Strahlen die parallel hineinfallen
und an der Parabel gespiegelt werden im Brennpunkt. Lichtstrahlen von einem
weit enfernten Object, z. B. von einem Stern kommen parallel an. Dass sie
durch den parabolischen Spiegel in einem Punkt konzentriert werden ist genau
das, was man sich von einem Teleskop wünscht. Isaac Newton hat diese Idee
benutzt, um ein Speigelteleskop zu entwerfen.
7.6
Normalformen der Kegelschnitte
Die in den bisherigen Abschnitten diskutierten algebraische Formen der Kegelschnitte
liegen alle in Normalform vor.
Definition Unter einer Normalform der drei Kegelschnitte verstehen wir die
folgenden algebraischen Darstellungen:
2
2
m)
m)
Ellipse. (x−x
+ (y−y
=1
a2
b2
2
2
m)
m)
Hyperbel. (x−x
− (y−y
=1
a2
b2
2
Parabel. (y − ys ) = 2p(x − xs )
mit dem Mittelpunkt (xm , ym ) und dem Scheitelpunkt (xs , ys ). Im dritten Fall
hätten wir genauso gut die Rollen von x und y vertauschen können. Die allgemeine Gleichung (53) kann durch affine Transformationen der Koordinaten
vereinfacht werden. Abgesehen von Ausnahmefällen kann die Gleichung in eine
der Drei Normalformen gebracht werden. Betrachten wir zuerst lineare Transformationen (x, y) 7→ (x0 , y 0 ) der Koordinaten:
x0 = Ax + By,
(71)
y 0 = Cx + Dy.
(72)
Es gibt einen allgemeinen Satz der sagt, dass man dadurch erreichen kann dass
die transformierten Gleichungen keinen Term der Form x0 y 0 enthalten. Diese
20
Aussage ist nicht auf quadratische Ausdrücke in zwei Variablen beschränkt - die
entsprechende Aussage gilt für jede Anzahl von Variablen. Die Gleichung lautet
dann
ax2 + by 2 + dx + ey + f = 0.
(73)
Wenn a und b beide verschwinden bekommen wir einen Ausnahmefall, wo die
Lösungsmenge sich auf eine Gerade reduziert. Wenn dieser Fall ausgeschlossen
wird können wir ohne Beschränkung der Allgemeinheit (wenn nötig durch vertauschen von x und y) annehmen, dass a 6= 0. Durch quadratische Ergänzung
bekommen wir
#
"
2
2
d
d
− 2 .
(74)
ax2 + dx = a x +
2a
4a
Im Fall b = 0 reduziert sich die Gleichung dann auf
2
d
e
f
d2
x+
+
y+ −
= 0.
2a
a
e
4ae
(75)
Es ist dann klar, dass dieser Fall eine Parabel beschreibt und dass die Gleichung
schon in Normalform ist.
Wenn auch b 6= 0 kann die quadratische Ergänzung auch bei y durchgeführt
werden. Das Ergebnis ist
2
d2
e 2
e2
d
=
+b y+
+
− f.
(76)
a x+
2a
2b
4a 4b
Falls der Ausdruck auf der rechten Seite nicht verschwindet können wir dadurch
teilen und die Normalform erhalten. Wenn ab < 0 handelt es sich um eine Hyperbel. (Um die Normalform zu erreichen muss man eventuell die Koordinaten
x und y vertauschen.) Wenn a und b das gleiche Vorzeichen haben wie die
rechte Seite handelt es sich um eine Ellipse. Wenn die Vorzeichen von a und b
dem der rechten Seite entgegengesetzt sind hat die Gleichung keine Lösungen
oder, anders gesagt, die Lösungsmenge ist leer. Es bleibt noch ein weiterer
2
d2
Ausnahmefall, nämlich der Fall 4a
+ e4b − f = 0. Wenn a und b das gleiche
Vorzeichen haben, dann besteht die Lösungsmenge aus einem Punkt. Wenn a
und b unterschiedliche Vorzeichen haben dann bekommt man zwei Geraden die
sich schneiden.
Wir betrachten als Beispiel die Gleichung
y 2 − 4x + 8y + 6 = 0,
(77)
also in der allgemeinen Notation a = 0, b = 1, c = 0, d = −4, e = 8 und f = 6.
Quadratische Ergänzung für y liefert
y 2 + 8y = (y + 4)2 − 16
und damit
(78)
5
(y + 4)2 = 2 · 2 · x +
.
(79)
2
Es handelt sich um
eine Parabel, die nach rechts geöffnet ist und den Scheitelpunkt − 52 , −4 besitzt.
21
7.7
Kepler und die Planetenbewegung
Die Ellipse hat eine bedeutende Rolle in der historischen Entwicklung der Physik
gespielt. In der Antike galt die Bewegung im Kreis als perfekt. Als man gesehen
hat, dass die Planeten sich nicht genau in Kreisen bewegten hat man ihre Bewegung mit Hilfe von Kombinationen von Kreisen (Epizyklen) beschrieben. So entstand das ptolemäische System, das viele Jahrhunderte überlebt hat. Und mit
diesem theoretischen Konstrukt konnte man die Bewegungen gut beschreiben:
man musste nur genügend viele Kreise auf die richtige Weise einführen. Von
einer perfekten Einfachheit war dieses System allerdings weit entfernt.
Bewegung kam in dieses Gebiet durch die sehr genauen Beobachtungen der
Planetenbahnen durch Tycho Brahe. Anschliessend hat Johannes Kepler, der
auch Assistent von Brahe war Gesetzmässigkeiten in diesen Daten gefunden.
Diese hat er in drei Gesetzen formuliert, die er 1619 veröffentlicht hat. Das
erste Keplersche Gesetz besagt, dass die Bahnen der Planeten Ellipsen sind.
Die Keplerschen Gesetze waren eine wichtige Grundlage für die Entwicklung
der modernen Physik durch Isaac Newton. Die Arbeit von Kepler war rein
phänomenologisch. Newton, dagegen hat allgemeine Theorien aufgestellt, die
inbesondere die Keplerschen Gesetze reproduzieren. In diesem Zusammenhang
merkt man auch, dass andere Kegelschnitte in der Himmelmechanik auftreten.
Es gibt z. B. aperiodische Kometen, die nur einmal an der Erde vorbeikommen
und sich auf Hyperbeln bewegen. Die bekannten wiederkehrenden Kometen
bewegen sich dagegen auf Ellipsen.
8
Mengenlehre und Funktionen
In diesem Abschnitt werden einige Begriffe aus der Mengenlehre in Erinnerung
gerufen. Abbildungen und Funktionen werden diskutiert.
8.1
Mengen und Abbildungen
Hier wird vorausgesetzt, dass die elementaren Begriffe der Mengenlehre, wie z.
B. Menge, Element einer Menge, Teilmenge, Vereinigung und Durchschnitt von
Mengen bekannt sind. Seien X und Y Mengen. Das Produkt X × Y ist die
Menge aller Paare (x, y) mit x ∈ X und y ∈ Y . Wenn, z. B. X die Menge [a, b]
aller reellen Zahlen x mit a ≤ x ≤ b ist und Y die Menge aller reellen Zahlen
y mit c ≤ y ≤ d, dann ist X × Y die Menge aller Zahlenpaare (x, y) die beide
Ungleichungen erfüllen oder, geometrisch gesehen, ein Rechteck in der Ebene.
Eine Abbildung f von X nach Y ist, intuitiv gesehen eine Regel, die jedem
Element x ∈ X ein Element y = f (x) ∈ Y zuordnet. Sie kann auch als eine
Teilmenge von X × Y betrachtet werden, nämlich die Menge {(x, y) ∈ X × Y :
y = f (x)}. Diese Menge heisst auch manchmal Graph von f . In dem Fall, dass
X und Y die Menge der reellen Zahlen sind entspricht sie dem Begriff ’Graph’
im üblichen Sinne. Eine Abbildung heisst injektiv, wenn f (x1 ) = f (x2 ) die
Beziehung x1 = x2 impliziert. Sie heisst surjektiv, wenn es zu jedem y ∈ Y
ein Element x ∈ X gibt mit f (x) = y. Eine Abbildung, die sowohl injektiv als
22
auch surjektiv ist heisst bijektiv. Im Fall einer bijektiven Abbildung entspricht
jedes Element x ∈ X genau einem Element f (x) von Y . Man redet auch von
einer eineindeutigen Korrespondenz. Eine bijektive Abbildung f hat immer eine
eindeutige Umkehrabbildung g mit der Eigenschaft, dass y = f (x) wenn und
nur wenn x = g(y).
Wenn f : X → Y eine Abbildung ist, und Y die Menge der reellen Zahlen
ist, nennt man f oft eine Funktion. Besonders anschaulich ist der Fall, dass
X auch die Menge der reellen Zahlen ist. Dann kann man die Funktion durch
ihren Graphen als eine Kurve in der Ebene darstellen. Hier ist etwas Vorsicht
geboten. In der Schule sehen wir Funktionen, die einen bestimmten
Namen
√
haben, wie Sinus oder durch einfache Formeln wie x2 oder x definiert sind.
Die Graphen dieser Funktionen sind normalerweise schöne glatte Funktionen.
Es gibt aber auch ganz andere Funktionen. Wenn E eine Teilmenge von X ist,
dann wird die charakteristische Funktion von E, χE als die Funktion definiert,
mit den Eigenschaften f (x) = 1 für x ∈ E und f (x) = 0 für x ∈
/ E. Wenn X
die Menge der reellen Zahlen ist und E = {x ∈ R : x > 0} dann ist χE die
sogenannte Heaviside-Funktion und sie springt bei x = 0. Wir könnten aber
auch E = Q wählen. Jetzt liegen sowohl Q als auch das Komplement R \ Q
dicht in den reellen Zahlen. In diesem Fall springt die Funktion χE ‘überall’
und es ist nicht möglich, den Graphen zu zeichnen.
8.2
Abzählbare und überabzählbare Mengen
Eine Menge X heisst endlich wenn es eine Bijektion gibt von X auf eine Menge
der Form {1, 2, . . . , n} für eine natürliche Zahl n. Wenn es keine solche Bijektion
gibt heisst die Menge unendlich. Wenn es eine Bijektion zwischen Mengen X
und Y gibt, dann sagt man dass sie die gleiche Mächtigkeit haben und schreibt
|X| = |Y |. Dieser Begriff wurde durch Georg Cantor, den Erfinder der Mengenlehre eingeführt im späten neunzehnten Jahrhundert. Intuitiv könnte man
sagen, dass zwei Mengen die gleiche Mächtigkeit haben, wenn sie genauso viele
Elemente haben. Bei unendlichen Mengen ist es allerdings so, dass X die gleiche
Mächtigkeit haben kann wie eine echte Teilmenge von X. Wenn z. B. N die
Menge der natürlichen Zahlen ist und G die Teilmenge der geraden natürlichen
Zahlen dann ist die Abbildung f : N → G, n 7→ 2n eine Bijektion. Also haben
beide Mengen die gleiche Mächtigkeit, obwohl die eine eine echte Teilmenge der
anderen ist. Bei endlichen Mengen kann das nicht passieren. Wenn es eine Injektion von X nach Y gibt, d.h. eine Bijektion von X auf eine Teilmenge von
Y schreibt man |X| ≤ |Y |. Man kann jetzt fragen ob |X| ≤ |Y | und |Y | ≤ |X|
zusammen |X| = |Y | implizieren. Die Antwort auf diese Frage ist positiv und
heisst Cantor-Schröder-Bernstein-Theorem. Der Beweis ist nicht einfach aber
elementar in dem Sinne, dass er aus Schritten besteht die sehr einfach sind.
Satz Sei X und Y Mengen, f : X → Y und g : Y → X injektive Abbildungen.
Dann gibt es eine Abbildung h : X → Y die bijektiv ist.
Beweis Sei Z die Menge deren Elemente die Elemente von X und Y sind, wobei
angenommen wird, dass X und Y keine gemeinsamen Elemente haben. Wenn
x ∈ X definieren wir eine Folge xn durch eine Vorschrift, die jetzt beschrieben
23
wird. Sei x0 = x, y0 = f (x0 ), x1 = g(y0 ), y1 = f (x1 ) und so weiter. Auf
diese Weise werden xi und yi für alle i ≥ 0 definiert. Sei jetzt y−1 ein Element
von Y mit x0 = g(y−1 ), wenn ein solches Element existiert. Wenn kein solches
Element existiert bleibt y−1 undefiniert. Man setzt diese Prozedur fort mit den
Beziehungen y−1 = f (x−1 ), x−1 = g(y−2 ) und so weiter, sofern diese Gleichungen Lösungen besitzen. Es gibt drei Möglichkeiten für einen gegeben Startwert
x. Die erste ist, dass xn und yn durch diese Vorschrift für alle ganzen Zahlen n
definiert werden können. Die zweite ist dass die Definition mit einem Element
x−N abbricht und die dritte ist dass die Definition mit einem Element y−N abbricht. Zu jedem x ∈ X gibt es eine Folge dieser Art. Wenn zwei solche Folgen
überlappen sind sie gleich. Daraus folgt, dass wenn wir für jede Folge dieser Art
eine Bijektion zwischen den Elementen xn in der Folge und den Elementen yn
in der Folge definieren können ist der Satz bewiesen. Wenn die Folge die zweite
Möglichkeit realisiert dann können wir für diese Folge h = f wählen. Wenn
die Folge die dritte Möglichkeit realisiert dann können wir h = g wählen. Im
Falle der ersten Möglichkeit könnten wir h = f oder h = g wählen. Um eine
eindeutige Regel zu haben wählen wir h = f . Damit ist der Beweis beendet.
Dieser Beweis des Satzes soll von einem gewissen Julius König stammen.
Dieser König hat auf einem internationalen Mathematikerkongress 1904 behauptet, eines der bekannten Ergebnisse von Cantor wäre fehlerhaft. Die Behauptung von König war falsch, was schon einen Tag später von einem anderen
Mathematiker gezeigt wurde. Trotzdem wurde Cantor durch den Vorfall tief
gekränkt und hat schon angefangen an sich zu zweifeln.
Wie sieht es aus mit der Mächtigkeit von Mengen die wir gut kennen? Hat
z. B. Q eine grössere Mächtigkeit als Z? Zunächst können wir beobachten, dass
|Z| = |N|. Zu zeigen, dass es eine Bijektion zwischen N und einer Menge X gibt
reicht es zu zeigen, dass man die Elemente von X als Folge xi , i = 1, 2, 3, . . .
schreiben kann. Eine solche Menge heisst abzählbar. Für Z können wir die
Folge 0, −1, 1, −2, 2, . . . wählen. Es gibt also eine Bijektion f : N → Z. Dann
ist (f, f ) eine Bijektion von N × N nach Z × Z. Die Elemente der Menge N × N
können als Folge geschrieben werden, z. B. als
{(1, 1), (1, 2), (2, 1), (3, 1), (2, 2), (1, 3), . . .}
(80)
Die Menge N × N ist also abzählbar. Schreiben wir diese Folge abstrakt als
{(an , bn )}. Definieren wir eine Folge von rationalen Zahlen auf der Basis der
Folge von Paaren mit Hilfe der folgenden Vorschrift. Wir betrachten zunächst
die Folge abnn . Dann betrachten wir nacheinander diese rationalen Zahlen. Wenn
eine solche Zahl verschieden von allen Zahlen ist, die vorher in der Folge waren
wird sie behalten. Wenn sie aber gleich einer früheren Zahl ist wird sie verworfen. Die reduzierte Folge enthält alle positiven rationalen Zahlen und definiert
eine Bijektion von N auf die Menge der positiven rationalen Zahlen. Nennen wir diese letzte Folge cn . Die rationalen Zahlen können als die Folge
{0, −c1 , c1 , −c2 , c2 , . . .} geschrieben werden und Q ist abzählbar.
Eine Menge, die nicht abzählbar ist heisst überabzählbar und ein berühmter
Satz von Cantor besagt, dass die reellen Zahlen überabzählbar sind. In dieser
24
Vorlesung wurde keine präzise Definition der reellen Zahlen gegeben aber es ist
trotzdem möglich, die Hauptidee des Beweises von Cantor zu verstehen. Es
reicht zu zeigen, dass die reellen Zahlen x die die Ungleichungen 0 ≤ x < 1
erfüllen überabzählbar sind. Diese Zahlen können durch Dezimalentwicklungen
0, a1 a2 a3 . . .
(81)
wobei die ai Elemente der Menge {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} sind. Es gibt eine
Subtilität, die den Fall betrifft, in dem alle ai nach einem bestimmten Punkt
gleich neun sind. Um diese Problematik zu vermeiden betrachten wir nur solche
Folgen {an } wo dieser Umstand nicht vorkommt.
Sei X die Menge von Folgen {an } von natürlichen Zahlen zwischen Null und
neun mit der Eigenschaft dass es beliebig große Werte von n gibt mit an 6= 9.
Es soll jetzt gezeigt werden, dass diese Menge überabzählbar ist. Dazu nehmen
wir an, dass die Elemente aufgelistet werden können und produzieren einen
Widerspruch. Sei amn das n-te Element der m-ten Folge in der Liste. Sei
bn = ann + 1 wenn ann ≤ 7 und bn = ann − 1 sonst. Dann unterscheidet sich
die Folge {bn } von jeder Folge auf der Liste, was den Widerspruch liefert. Auf
diese Weise wird gezeigt, dass die reellen Zahlen überabzählbar sind.
8.3
Mengen von Teilmengen
Sei X eine Menge. Die Menge aller Teilmengen von X wird oft als 2X bezeichnet.
Der Grund für diese Schreibweise werden wir jetzt diskutieren. Betrachten wir
den Fall, dass X eine endliche Menge ist mit n Elementen. Wie viele Teilmengen
von X mit k Elementen gibt es? Wir können eine solche Menge konstruieren,
in dem wir Elemente x1 , x2 , . . . xk nacheinander wählen, wobei darauf zu achten
ist, dass die gewählten Elemente alle unterschiedlich sind. Für die erste Wahl
gibt es n Möglichkeiten, für die zweite n − 1 Möglichkeiten, usw. Deshalb gibt
es ingesamt
n(n − 1) . . . (n − k + 1)
(82)
n!
. Wenn wir uns für die Anzahl der
Möglichkeiten. Diese Größe ist gleich (n−k)!
Teilmengen mit k Elementen interessieren ist die Reihenfolge in der die Elemente
gewählt werden unwichtig. Für eine gegebene Teilmenge gibt es k! Möglichkeiten
für diese Reihenfolge. Die Anzahl der Teilmengen mit k Elementen ist also
n
n!
/k! =
(83)
(n − k)!
k
und wir erhalten eine Interpretation für die Binomialkoeffizienten. nk ist die
Anzahl der Möglichkeiten, k von n Objekten zu wählen, ohne auf die Reihenfolge
zu achten.
Mit diesen Informationen kommen wir auf die Frage zurück, wie viele Teilmengen einer Menge mit n Elementen es gibt. Nach den soeben gemachten
Überlegungen sind es
n X
n
n
n
n
=
+
+ ...
.
(84)
k
0
1
n
k=0
25
Nach der binomischen Formel ist dieser Ausdruck nichts anderes als (1 + 1)n =
2n . Deshalb ist die Anzahl der Teilmengen einer endlichen Menge X gleich 2|X| .
Diese Tatsache motiviert die oben erwähnte Schreibweise 2X .
9
Graphentheorie
In diesem Abschnitt geht es um Objekte, die Graphen heissen. Sie haben aber
mit den Graphen, die in früheren Abschnitten eingeführt wurden nichts zu tun.
Ein Graph in diesem Sinn kann folgendermassen dargestellt werden. Man hat
endlich viele Punkte in der Ebene, die als Knoten bezeichnet werden und einige
werden miteinander verbunden durch Geraden oder Kurven, die als Kanten
bezeichnet werden. Die Knoten werden auch alternativ als Punkte, Knotenpunkte oder Ecken bezeichnet. Die Mengen der Knoten bzw. Kanten eines
Graphen G werden mit V (G) bzw. E(G) bezeichnet. Ein Graph kann benutzt werden um bestimmte Beziehungen darzustellen. Betrachten wir zum
Beispiel einen Wettbewerb, wo verschiedene Mannschaften aufeinander treffen.
Die Spiele, die zu einem bestimmten Zeitpunkt stattgefunden haben können
durch einen Graphen dargestellt werden. Nehmen wir z. B. an, dass es acht
Mannschaften A, B, C, D, E, F , G und H gibt und dass die Spiele, die schon
stattgefunden haben folgende sind: A gegen F , B gegen G, C gegen F , C gegen
D, E gegen F , E gegen H und G gegen H. Dieser Graph kann verschieden
in der Ebene dargestellt werden (mit Geraden oder Kurven, mit oder ohne
Überkreuzungen der Kanten). [In der Vorlesung werden zwei Möglichkeiten
gezeigt.]
Eine andere Variante dieser Definition bekommt man in dem man jede Kante
orientiert, so dass sie einen Anfangs- und Endknoten hat. In diesem Fall nennt
man die Kanten auch Bögen und den Anfangs- bzw. Endknoten eines solchen
Bogens den Kopf bzw. den Schwanz. In dem Fall spricht man von einem
gerichteten Graphen. Normale Graphen (ohne Orientierung) werden manchmal
als schlichte Graphen bezeichnet. In dem Fall wird nicht zugelassen, dass es
mehr als eine Kante gibt, die zwei gegebene Knoten miteinander verbinden.
Kanten, die einen Knoten mit sich selbst verbinden (Schlingen) sind auch nicht
erlaubt. Im Folgenden bedeutet das Wort Graph, wenn es nicht weiter qualifiziert wird schlichter Graph. Allgemeinere Objekte, die Mehrfachverbindungen
zwischen Knoten und Schlingen zulässen werden als Multigraphen bezeichnet,
spielen aber in dieser Vorlesung kaum eine Rolle. Bei einem gerichteten Graphen
sind zwei Kanten, die zwei gegebene Knoten miteinander verbinden nur dann
erlaubt wenn sie entgegengesetzt orientiert sind. Schlingen sind nicht erlaubt.
Jedem gerichteten Graphen kann man einen schlichten Graphen zuordnen, in
dem man die Orientierung der Kanten vergisst und in jedem Fall wo zwei Kanten die gleichen zwei Knoten verbinden, diese durch eine Kante zwischen diesen
zwei Knoten ersetzt.
Gerichtete Graphen können benutzt werden, um Systeme von chemischen
Reaktionen darzustellen. Ein Beispiel in der in der Chemie üblichen Schreibweise ist A + B → 2C. Hier sind A, B und C drei chemische Stoffe und ein
26
Molekül von A reagiert mit einem Molekül von B, um zwei Moleküle von C zu
produzieren. Die Ausdrücke auf der linken und rechten Seiten der Reaktionen
heissen chemische Komplexe. In diesem Beispiel sind die Stoffe (A, B, C), die
Komplexe (A + B, 2C) and es gibt nur die eine Reaktion. Jetzt wird diese
Beschreibung mathematisch präzisiert. Der gerichtete Graph, der ein System von chemischen Reaktionen beschreibt wird manchmal chemisches Netzwerk genannt. Ein solches Netzwerk wird durch folgende mathematische Objekte beschrieben. Es gibt endliche Mengen S, die Menge der Stoffe, C, die
Menge der Komplexe, und R, die Menge der Reaktionen. Jedes Element von
C ist eine Abbildung y von S nach N0 . Der Wert von y im Punkt s ∈ S
wird mit ys bezeichnet. Im Beispiel sind die Komplexe (1, 1, 0) und (0, 0, 2).
R = (C × C) \ (Diagonal). Anders gesagt, sind die Elemente von R geordnete
Paare unterschiedlicher Elemente von C. Für ein allgemeines chemisches Netzwerk definiert man einen dazugehörigen gerichteten Graphen G in dem man
V (G) = C wählt und E(G) = R. Die Kanten werden so orientiert, dass die
Komplexe auf der linken bzw. rechten Seite der Reaktion den Anfangs- bzw.
Endknoten entsprechen. Hier ist ein anderes Beispiel. [In der Vorlesung wird
der Graph angeschrieben.] S = {A, B, C, D, E}, C = {A, 2B, A + C, D, B + E}.
Die Reaktionen sind A → 2B, 2B → A, A + C → D, D → A + C, D → B + E,
B + E → A + C.
Wie werden Graphen mathematisch definiert?
Definition Ein Graph G besteht aus zwei endlichen Mengen, der Knotenmenge
V (G), die nicht leer ist und der Kantenmenge E(G), möglicherweise leer. Jedes
Element von E(G) ist eine Teilmenge von V (G) mit zwei Elementen (ungeordnetes Paar von Knoten). Die Elemente von e ∈ E(G) heissen Endknoten von
e.
Aus der Diskussion von chemischen Reaktionen dürfte klar sein, wie man analog
gerichtete Graphen definiert. Ein gerichteter Graph besteht aus einer Knotenmenge und einer Menge von geordneten Paaren von Knoten. In diesem Fall ist
der Anfangsknoten das erste Element des Paares und der Endknoten das zweite.
Es gibt eine Beziehung mit den Relationen, die in einem früheren Abschnitt
definiert wurden. Eine Relation R heisst anti-reflexiv wenn x ∼ x nie gilt, d.h.
wenn (x, x) nie zu R gehört. Deshalb ist ein gerichteter Graph G das Gleiche
wie eine anti-reflexive Relation auf V (G). Wenn die Relation symmetrisch ist,
dann können wir die Orientierung vergessen. Eine äquivalente Darstellung eines
Graphen ist als eine Teilmenge von V (G) × V (G), die die Diagonale nicht trifft
und unter Vertauschung der zwei Kopien von V (G) symmetrisch ist. Wenn es
uns nutzt werden wir also E(G) als Teilmenge von V (G) × V (G) betrachten.
Jetzt werden ein paar weitere Beispiele beschrieben. Das erste ist ein sogenanntes Zuteilungsproblem. Nehmen wir an, es gibt fünf Personen A, B, C, D
und E, die fünf Arbeiten a, b, c, d und e ausführen sollen. Die unterschiedlichen
Personen sind nur für einige der Aufgaben qualifiziert. Ist es möglich, jede Arbeit einer qualifizierten Person zu übertragen, so dass jede Person genau eine
Aufgabe bekommt? Hier ist ein konkreter Fall. [Der Graph wird in der Vor-
27
lesung angeschrieben.] A ist für c und d qualifiziert, B für c, C für a, b und
e, D für c und d und E für b und e. In diesem Fall ist das Problem unlösbar
wie eine Betrachtung der Personen A, B und D zeigt. Diese drei Personen sind
zusammen nur für die zwei Aufgaben c und d qualifiziert. Deshalb ist keine
Zuordnung der gewünschten Art möglich.
Im nächsten Beispiel sollen drei Häuser mit Gas, Wasser und Strom versorgt werden. Die Häuser werden durch Knoten H1 , H2 und H3 dargestellt
und die drei Arten der Versorgung durch G, W und S. [Ein entsprechender
Graph wird in der Vorlesung gezeigt.] Kann die Versorgung gelingen, wenn die
Versorgungswege sich nicht überkreuzen dürfen? Hier ist das Problem nicht
mehr als rein graphentheoretisches Problem formuliert. Es gibt eine Theorie die
man darauf anwenden kann, die Theorie der planaren Graphen. Die Antwort in
diesem Beispiel ist dass die gestellte Aufgabe keine Lösung zulässt.
Die Anzahl der Elemente der Menge V (G) wird mit v(G) bezeichnet und
heisst Ordnung von G während die Anzahl der Elemente der Menge E(G)
mit e(G) bezeichnet wird und Grösse des Graphen heisst. Der triviale (oder
leere) Graph mit n Knoten ist der bei dem die Menge der Kanten leer ist. Ein
vollständiger Graph mit n Knoten ist einer in dem jedes Paar unterschiedlicher
Kanten. Zwei
Knoten durch eine Kante verbunden ist. Dieser Graph hat n(n−1)
2
Graphen G1 und G2 heissen isomorph wenn es eine bijektive Abbildung φ von
V (G1 ) nach V (G2 ) gibt mit der Eigenschaft, dass (φ×φ)(E(G1 )) = E(G2 ). Zwei
Graphen, die durch einen solchen Isomorphismus φ miteinander in Beziehung
gesetzt werden sind im wesentlichen gleich. Zwei vollständige Graphen mit n
Knoten sind isomorph und wir sprechen deshalb vom dem vollständigen Graphen
mit n Knoten. Es ist nicht immer leicht zu sehen, ob zwei Graphen die durch
explizite Darstellungen in der Ebene angegeben werden tatsächlich isomorph
sind. Wenn G1 und G2 isomorph sind, dann müssen v(G1 ) = v(G2 ) und
e(G1 ) = e(G2 ) gelten, aber nicht umgekehrt. Bei 3 Knoten gibt es nur 4 nichtisomorphe Graphen und bei 4 Knoten nur 11. Bei 7 Knoten gibt es aber schon
1044. Der Begriff des Isomorphismus ist in der Mathematik weit verbreitet,
wobei die genaue Definition davon abhängt, um was für ein mathematisches
Objekt es sich dabei handelt.
Es sei G ein Graph. Wenn V (G) die Vereinigung zweier nichtleerer Teilmengen X und Y ist, d.h. X ∪ Y = V (G) und X ∩ Y = ∅ und jede Kante ein Ende
in X und ein Ende in Y hat wird G als paarer Graph bezeichnet. Die Zerlegung
heisst Zweiteilung von G. Ein vollständiger paarer Graph ist einer in dem jeder
Knoten von X mit jedem Knoten von Y verbunden ist. Ein solcher Graph wird
mit Km,n bezeichnet. Alle solchen Graphen mit festen Werten von m und n
sind zueinander isomorph und Km,n ist isomorph zu Kn,m .
9.1
Knotengrade
Ein Knoten eines Graphen G, der kein Endpunkt irgendeiner Kante ist, heisst
isoliert. Eine Kante e von G heisst mit dem Knoten v inzident, wenn v ein
Endknoten von e ist. In diesem Fall sagt man auch, dass v mit e inzident
ist. Zwei Kanten, die mit einem gemeinsamen Knoten inzident sind heissen
28
benachbart. Zwei Knoten, die mit einem gemeinsamen Kanten inzident sind,
heissen auch benachbart. Wenn v ein Knoten eines Graphen G ist, dann ist der
Grad d(v) von v die Anzahl der mit v inzidenten Kanten von G. Mit diesen
Definitionen hat man den
Satz 9.1 Für
Pn jeden Graphen mit e Kanten und n Knoten v1 . . . . , vn gilt die
Beziehung i=1 d(vi ) = 2e.
Beweis Jede Kante trägt zwei zu dieser Summe bei. D. h. es wird jede Kante
zweimal gezählt.
Ein Knoten eines Graphen heisst gerade bzw. ungerade wenn sein Grad
gerade bzw. ungerade ist.
Corollar In jedem Graphen G gibt es eine gerade Anzahl von ungeraden Knoten.
Beweis Sei W die Menge der ungeraden Knoten von G und U die Menge
P der geraden Knoten von G. für jedes u ∈ U ist d(u) gerade und deshalb ist u∈U d(u)
auch gerade. Satz 1 impliziert dass
X
X
X
d(u) +
d(w) =
d(v) = 2e.
(85)
u∈U
w∈W
v∈V
P
Deshalb ist w∈W d(w) gerade. Damit dies der Fall sein kann muss die Anzahl
der ungeraden Knoten gerade sein.
Es muss nicht sein, dass die Anzahl der geraden Knoten ungerade ist. Ein
Gegenbeispiel ist ein Quadrat, wo die Ecken die Knoten sind und die Seiten
die Kanten. Ein Graph G heisst k-regulär wenn d(v) = k für jeden Knoten v.
Ein Graph heisst regulär wenn er k-regulär ist für irgendeine natürliche Zahl
k. Das Quadrat ist 2-regulär. Der vollständige Graph Kn is n-regulär. Der
vollständiger paarer Graph Kn,n mit 2n Knoten ist n-regulär.
9.2
Untergraphen
Sei H ein Graph mit der Knotenmenge V (H) und der Kantenmenge E(H) und
G ein Graph mit der Knotenmenge V (G) und der Kantenmenge E(G). Dann
wird H als Untergraph von G bezeichnet wenn V (H) ⊂ V (G) und E(H) ⊂
E(G). Man sagt auch, dass H ein Untergraph von G ist, wenn H isomorph zu
einem Untergraphen von G ist. Wenn H ein Untergraph von G ist schreibt mann
H ⊂ G. Wenn in diesem Fall H 6= G, dann heisst H ein echter Untergraph von
G. Ein spannender Untergraph H von G ist einer mit den gleichen Knoten, d.h.
V (H) = V (G). Jeder Graph mit n Knoten ist Untergraph des vollständigen
Graphen Kn .
Jetzt werden ein paar Möglichkeiten beschrieben, Untergraphen zu erzeugen.
Nehmen wir an dass der Graph G so ist, dass V (G) mindestens zwei Elemente
hat. Für einen Knoten v ∈ V (G) bezeichnet G − v den Untergraphen mit der
Knotenmenge V (G) \ {v} und als Kanten alle Kanten von G, die nicht mit v
inzident sind. Wenn wir E(G) als Teilmenge von [V (G)]2 betrachten, dann ist
E(G−v) = E(G)∩[V (G−g)]2 . Um G−v von G zu erhalten entfernt man v und
alle Kanten, die mit v direkt verbunden sind. G − v wird als knotengelöschter
Untergraph bezeichnet. Wenn e eine Kante von G ist dann bezeichnet G −
29
e den Untergraphen von G, der die gleiche Knotenmenge hat wie G und die
Kantenmenge E \ {e} hat. Um G − e von G zu erhalten entfernt man die Kante
e aber nicht deren Endpunkte. G − e wird als kantengelöschter Untergraph
bezeichnet.
Diese Beispiele können verallgemeinert werden auf Fälle in denen mehrere
Ecken oder Kanten entfernt werden. Im ersten Fall entfernt man eine Teilmenge
U von V (G), zusammen mit allen Kanten, die mit Knoten aus U inzident sind.
Das Ergebnis heisst dann G − U . Es gilt die Beziehung E(G − U ) = E(G) ∩
[V (G − U )]2 . Im zweiten Fall entfernt man eine Teilmenge F von E und behält
alle Knoten. Das Ergebnis heisst G − F .
Wenn U eine nichtleere Teilmenge der Knotenmenge V (G) ist, dann ist der
durch U induzierte Untergraph G[U ] von G als der Graph G definiert, der die
Knotenmenge U hat und deren Kantenmenge aus den Kanten von G besteht, die
beide Enden in U haben. Es gilt die Beziehung G[U ] = G − (V (G) \ U ). Wenn
F eine nichtleere Teilmenge der Kantenmenge E(G) ist, dann ist der durch F
induzierte Untergraph G[F ] der Graph, dessen Knotenmenge die Menge der
Kantenenden von F ist und dessen Kantenmenge F ist. In diesem Fall ist
V (G[F ]) = π(F ), wo π die Projektion von [V (G)]2 auf einen der Faktoren ist.
Zwei Untergraphen G1 und G2 heissen disjunkt, wenn sie keinen gemeinsamen Knoten haben. Sie heissen kantendisjunkt, wenn sie keine gemeinsame
Kante haben. Disjunkt impliziert kantendisjunkt. Für zwei Untergraphen G1
und G2 von G ist die Vereinigung G1 ∪G2 der Graph mit V (G1 ∪G2 ) = V (G1 )∪
V (G2 ) und E(G1 ∪ G2 ) = E(G1 ) ∪ E(G2 ). Wenn G1 und G2 mindestens einen
gemeinsamen Knoten haben ist es auch möglich, den Durchschnitt G1 ∩ G2 zu
definieren durch V (G1 ∩G2 ) = V (G1 )∩V (G2 ) und E(G1 ∩G2 ) = E(G1 )∩E(G2 ).
9.3
Wege und Zyklen
Eine Kantenfolge in einem Graphen ist eine endliche Folge
W = v0 e1 v1 e2 v2 . . . vk−1 ek vk
(86)
deren Terme abwechselnd Knoten und Kanten sind, so dass, für 1 ≤ i ≤ k die
Kante ei die Enden vi−1 und vi hat. Wir nennen die Kantenfolge eine Kantenfolge von v0 nach vk . Der Knoten v0 heisst Anfangsknoten von W und der
Knoten vk Endknoten von W . Die Knoten v0 und vk müssen nicht voneinander
verschieden sein. Die Knoten v1 , . . . , vk−1 heissen innere Knoten. Die ganze
Zahl k heisst Länge der Kantenfolge W . In einer Kantenfolge darf es Wiederholungen von Knoten und Kanten geben. Die Kantenfolge ist durch die darin
enthaltene Folge von Knoten bestimmt und wird entsprechend oft durch die
Knotenfolge bezeichnet.
Eine triviale Kantenfolge beinhaltet keine Kanten, besteht also aus einem
einzigen Knoten. Eine Kantenfolge von u nach v heisst geschlossen, wenn u = v
ist und offen, wenn u 6= v ist. Wenn die Kanten in W unterschiedlich sind
heisst W ein Kantenzug. Wenn die Knoten in W unterschiedlich sind heisst W
ein Weg. Jeder Weg ist ein Kantenzug, aber nicht umgekehrt. Wenn u und v
30
unterschiedliche Knoten sind gibt es im allgemeinen mehrere Wege von u nach
v. Die Längen dieser Wege bilden eine endliche Menge von natürlichen Zahlen
und diese Zahlen haben ein Minimum k. Dann haben die Wege von u nach v der
Länge k die Eigenschaft, dass kein anderer Weg von u nach v kürzer ist. Wir
nennen sie die kürzesten Wege von u nach v. Im allgemeinen gibt es mehrere
solche Wege. Wenn W ein kürzester Weg von u nach v ist und u0 und v 0 Knoten,
die zu diesem Weg gehören, dann ist der Teil von W zwischen u0 und v 0 auch
ein kürzester Weg.
Satz 9.2 Wenn u und v Knoten eines Graphen G sind, beinhaltet jede Kantenfolge von u nach v einen Weg von u nach v.
Beweis Wenn u = v ist dann können wir den trivialen Weg nehmen. Wenn
u 6= v sei die Folge von Knoten in W
u = u0 , u1 , u2 , . . . , uk−1 , uk = v.
(87)
Wenn keiner der Knoten öfter als einmal in W vorkommt, dann ist W bereits ein
Weg von u nach v. Wenn es dagegen Knoten von G gibt, die in W mindestens
zweimal vorkommen dann gibt es unterschiedliche i, j mit i < j, so dass ui =
uj . Wenn man die Knoten ui , . . . , uj−1 und die nachfolgenden Kanten entfernt
dann erhält man eine Kantenfolge von u nach v, die weniger Knoten enthält als
W . Wenn die neue Kantenfolge keine wiederholte Knoten enthält, dann haben
wir schon den gesuchten Weg. Ansonsten können wir das Entfernungverfahren
wiederholen. Nach endlich vielen Schritten führt diese Vorgehensweise zum Ziel.
Der Knoten u wird als zusammenhängend mit einem Knoten v bezeichnet, wenn
es einen Weg von u nach v gibt. Wenn u mit v zusammenhängend ist, dann
ist v mit u zusammenhängend, wie man durch Umkehrung des Weges sieht.
Jeder Knoten ist mit sich selbst zusammenhängend durch den trivialen Weg.
Wenn u mit v zusammenhängend ist und v mit w, dann ist u mit w zusammenhängend. Man kann die Wege zusammenfügen. Dieses Verfahren heisst
Verkettung der Wege. Wir können eine Relation folgendermassen definieren:
u ∼ v wenn u mit v zusammenhängend ist. Die Eigenschaften, die wir gerade
bewiesen haben zeigen, dass es sich dabei um eine Äquivalenzrelation handelt.
Die Äquivalenzklassen heissen Komponenten oder Zusammenhangskomponenten von G. Die Äquivalenzklasse von u, C(u), besteht aus allen Knoten v mit
u ∼ v. Ein Graph heisst zusammenhängend, wenn er nur eine Zusammenhangskomponente hat. Die Anzahl der Komponenten von G wird mit ω(G)
bezeichnet.
Bei einem gerichteten Graphen kann man ähnliche Definitionen machen.
Ein gerichteter Kantenzug ist einer wo der Endpunkt jeder Kante mit dem
Anfangspunkt der nächsten zusammenfällt. Ein gerichteter Weg ist dann ein
gerichteter Kantenzug, der auch ein Weg ist. Der Knoten u wird als stark zusammenhängend mit einem Knoten v bezeichnet, wenn es einen gerichteten Weg von
u nach v gibt und einen gerichteten Weg von v nach u. Auf diese Weise wird eine
Äquivalenzrelation definiert und die entsprechenden Äquivalenzklassen heissen
starke Zusammenhangskomponenten. Ein Graph heisst stark zusammenhängend,
31
wenn er nur eine starke Zusammenhangskomponente hat. Bei chemischen Netzwerken heissen die Zusammenhangskomponenten Verlinkungsklassen und die
starken Zusammenhangskomponenten starke Verlinkungsklassen. Ein Netzwerk
heisst reversibel wenn es zu jedem Bogen von einem Knoten u zu einem Knoten
v einen Bogen von v nach u gibt. Es heisst schwach reversibel wenn es zu jedem
gerichteten Weg von u nach v einen gerichteten Weg von v nach u gibt. Bei
einem schwach reversiblen Netzwerk stimmen die starken Zusammenhangskomponenten mit den Zusammenhangskomponenten überein.
Ein nichttrivialer geschlossener Kantenzug in einem Graphen G heisst ein
Zyklus, wenn sein Anfangsknoten und seine inneren Knoten unterschiedlich sind.
Ein Zyklus der Länge k, d.h. mit k Kanten, heisst ein k-Zyklus. Ein k-Zyklus
heisst gerade, wenn k gerade ist und ungerade, wenn k ungerade ist. Ein 3Zyklus wird oft als Dreikreis bezeichnet. Ein n-Zyklus wird manchmal mit Cn
bezeichnet.
Satz 9.3 Es sei G ein nichtleerer Graph mit mindestens zwei Knoten. G ist
dann und nur dann ein paarer Graph, wenn er keine ungeraden Zyklen hat.
Beweis Nehmen wir an, dass G ein paarer Graph ist mit der Knotenmenge V
und der Zweiteilung V = X ∪ Y . Es sei C = v0 v1 . . . vk v0 ein Zyklus von G.
Nehmen wir an, dass die Notation so gewählt ist, dass v0 ∈ X. Es folgt, da
G ein paarer Graph ist, dass v1 ∈ Y . Dann ist v2 ∈ X usw. Deshalb liegen
die Knoten bei denen der Index gerade ist in X und die Knoten bei denen er
ungerade ist in Y . Da v0 ∈ X muss vk ∈ Y . Deshalb ist k ungerade und
der Zyklus ist gerade. Deshalb enthält G keine ungeraden Zyklen und die eine
Richtung ist bewiesen.
Um die Umkehrung zu beweisen nehmen wir an, dass G ein nichtleerer Graph
ist, der keine ungeraden Zyklen enthält. Wir wollen zeigen, dass G ein paarer
Graph ist. Nun wird G paar sein, wenn jede seiner Komponenten mit mehr
als einem Knoten paar ist, denn wenn diese Komponenten C1 , C2 , . . . Cn sind
und ihre Knotenmengen V1 , V2 , . . . Vn die Zweiteilungen V1 = X1 ∪ Y1 , C2 =
X2 ∪ Y2 , . . . Cn = Xn ∪ Yn haben, dann hat die Knotenmenge V von G die
Zweiteilung X ∪ Y , mit
X = X0 ∪ X1 ∪ . . . ∪ Xn , Y = Y0 ∪ Y1 ∪ . . . ∪ Yn ,
(88)
wobei X0 die Menge der isolierten Knoten in G ist. Es reicht also, um den
Satz zu beweisen zu zeigen, dass jeder zusammenhängende Graph G mit mehr
als einem Knoten und ohne ungerade Zyklen paar ist. Unter dieser Annahme
für G definieren wir zwei Teilmengen von V (G) wie folgt. Sei u ein Knoten
von G. X ist die Menge aller Knoten v ∈ G mit der Eigenschaft, dass jeder
kürzeste Weg von u nach v gerade ist. Y ist die Menge aller Knoten v ∈ G
mit der Eigenschaft, dass jeder kürzeste Weg von u nach v ungerade ist. Der
Punkt u selbst liegt in X. Es ist klar, dass V (G) = X ∪ Y und dass X und
Y kein gemeinsames Element besitzen. Wir wollen jetzt zeigen, dass X und Y
eine Zweiteilung von G definieren und dazu müssen wir zeigen, dass jede Kante
einen Endknoten in X hat und einen in Y .
Es seien v und w zwei Knoten in X, die benachbart sind. Es sei P ein
32
kürzester Weg von u nach v und Q ein kürzester Weg von u nach w.
P = v1 , v2 , . . . , v2n+1
und Q = w1 , v2 , . . . , w2m+1
(89)
so dass u = v1 = w1 , v = v2n+1 , w = w2n+1 . Nehmen wir an, dass w0 ein
Knoten ist, die beide Wege gemeinsam haben, und ausserdem, dass w0 der
letzte derartige Knoten ist. Die Wege von u nach w0 , die durch P und Q
definiert werden sind beide kürzeste Wege und haben deshalb die gleiche Länge.
Die Wege P und Q sind beide gerade und deshalb sind die entsprechenden Wege
von w0 nach v und w entweder beide gerade oder beide ungerade. Es gibt einen
Zyklus der aus dem Teil von P von w0 nach v, eine Kante zwischen v und w
und dem Teil von Q von w0 nach w besteht. Die Länge von diesem Zyklus ist
die Summe von Eins mit zwei Zahlen, die entweder beide gerade sind oder beide
ungerade. Der Zyklus ist also ungerade, ein Widerspruch zu den Annahmen des
Satzes. Wir können schliessen, dass es keine Kanten in G gibt, die zwei Knoten
in X verbinden. Es kann ganz analog gezeigt werden, dass es keine Kanten in
G gibt, die zwei Knoten in Y verbinden. Deshalb ist G ein paarer Graph.
9.4
Die Matrizendarstellung eines Graphen
Eine Möglichkeit, einen Graphen mit einem Computer darstellen ist die seine
Nachbarschaftsmatrix. Es sei G ein Graph mit n Knoten, durchnumeriert als
v1 , v2 , . . . vn . Die Nachbarschaftsmatrix von G, die von der gewählten Numerierung abhängig ist, ist die n × n Matrix A(G) = (aij ), in der aij gleich
der Anzahl der die Knoten verbindenden Kanten ist. Die Einträge der Matrix
aij sind alle entweder 0 oder 1. (Bei einem Multigraphen könnte man eine
ähnliche Definition machen und in dem Fall würden auch andere natürliche
Zahlen in der Matrix vorkommen.) Die diagonalen Elemente aii sind alle Null,
weil Schlingen verboten sind. Es gilt aij = aji für alle i, j, d.h. die Matrix ist
symmetrisch. Wenn eine symmetrische n × n-Matrix A mit verschwindenden
Diagonaleinträgen gegeben ist können wir einen entsprechenden Graphen konstruieren. Dieser Graph hat n Knoten vi bis vn und der Knoten vi ist mit dem
Knoten vj verbunden wenn und nur wenn aij = 1 ist. Betrachten wir die Matrix
B = A2 mit Einträgen (bij ). Die Zahl bij ist die Anzahl von Kantenfolgen der
Länge 2 von vi nach vj .
Satz 9.4 Es sei G ein Graph mit n Knoten v1 , . . . vn und sei A die Nachbarschaftsmatrix von G, die sich auf diese Numerierung der Knoten bezieht. Es
sei k eine positive ganze Zahl und Ak bezeichne die k-te Potenz der Matrix A.
Dann entspricht der (i, j)-te Eintrag von Ak der Anzahl der unterschiedlichen
Kantenfolgen der Länge k von vi nach vj .
Beweis Der Beweis erfolgt durch vollständige Induktion. Für k = 1 besagt
der Satz, dass der (i, j)-te Eintrag von A der Anzahl unterschiedlicher Kantenfolgen der Länge Eins von vi nach vj entspricht, was nach der Definition der
Nachbarschaftsmatrix richtig ist. Eine Kantenfolge der Länge Eins ist ja nichts
anderes als eine Kante, die die Knoten v1 und v2 verbindet. Damit haben wir
den Induktionsanfang.
33
Um den Induktionsschritt zu vollziehen, nehmen wir an, dass das Ergebnis
für Ak−1 richtig ist, wobei k eine ganze Zahl grösser Eins ist. Wir möchten
beweisen, dass der Satz für Ak richtig ist. Wir schreiben Ak−1 = (bij ) und Ak =
k
k−1
(cij ) Dann
A und, nach der Definition der Matrixmultiplikation
Pn ist A = A
cij = t=1 b1t atj . Nun setzt sich jede Kantenfolge der Länge k von vi nach vj
aus einer Kantenfolge der Länge k − 1 von vi nach einem Knoten vt und eine
Kante von vt nach vj zusammen. Für eine gegebene Wahl des Knoten vt gibt
es nach der Induktionsvoraussetzung genau bij Knotenfolgen dieser Art. Um
die gesante Anzahl der Knotenfolgen der Länge k von vi nach vj müssen wir
diese Zahlen P
über alle Knoten vt summieren, die mit vj verbunden sind. Das
n
Ergebnis ist t=1 b1t atj , also cij . Damit ist der Beweis vollständig.
Wir können das vorherige Resultat verwenden, um zu bestimmen, ob ein Graph
zusammenhängend ist oder nicht.
Satz 9.5 Es sei G ein Graph mit n Knoten v1 , . . . , vn und A die Nachbarschaftsmatrix von G. Es sei B = (bij ) die Matrix
B = A + A2 + . . . + An−1 .
(90)
G ist dann und nur dann zusammenhängend, wenn für jedes Paar von verschiedenen Indizes i, j gilt, dass bij 6= 0, dass heisst, wenn B keine Einträge
Null ausserhalb der Haupdiagonalen hat.
(k)
Beweis Es bezeichne aij den (i, j)-ten Eintrag der Matrix Ak für k = 1, . . . , n −
1. Dann ergibt sich
(1)
(n−1)
bij = aij + . . . aij
.
(91)
(k)
Nach dem letzten Satz ist aij die Anzahl der Kantenfolgen der Länge k von vi
nach vj . Deshalb ist bij die Anzahl der Kantenfolgen deren Länge kleiner als
n ist. Nehmen wir jetzt an, dass G zusammenhängend ist. Dann gibt es für
jedes Paar (vi , vj ) von unterschiedlichen Knoten von G einen Weg von vi nach
vj . Da G nur n Knoten hat ist die Länge des Weges nicht grösser als n − 1.
Deshalb macht dieser Weg einen Beitrag zur Summe und bij > 0. Nehmen wir
umgekehrt an, dass bij 6= 0 für jedes unterschiedliche Paar (i, j). Dann folgt aus
der Betrachtung der obigen Summe, dass es mindestens eine Kantenfolge von vi
nach vj gibt (mit einer Länge kleiner als n). Deshalb ist G zusammenhängend.
Dieser Satz kann benutzt werden um zu entscheiden, ob der Graph der durch
eine Nachbarschaftsmatrix definiert wird zusammenhängend ist. Betrachten wir
z. B. die Matrix


0 0 1 0 0
 0 0 0 1 0 



A=
(92)
 1 0 0 0 1 .
 0 1 0 0 1 
0 0 1 1 0
34
In diesem Fall zeigt eine Rechnung, dass



A+A +A +A =


2
3
4
3
1
3
1
4
1
3
1
3
4
3
1
7
5
4
1
3
5
7
4
4
4
4
4
8



.


(93)
so dass der Graph zusammenhängend ist. In diesem Fall enthält die Matrix
A + A2 + A3 noch Nullen, so dass man wirklich so weit rechnen muss.
10
10.1
Bäume und Brücken
Definition und einfache Eigenschaften
Ein Graph G heisst azyklisch, wenn er keine Zyklen enthält. Ein Graph, der
zusammenhängend und azyklisch ist heisst ein Baum.
Satz 10.1 Ein Graph T ist genau dann ein Baum, wenn es zu jedem Paar (u, v)
von unterschiedlichen Knoten genau einen Weg in T von u nach v gibt.
Beweis Sei T ein Baum und nehmen wir an, dass es zwei unterschiedliche Wege
von u nach v gibt, sagen wir P = uu1 u2 . . . um v und P 0 = uv1 v2 . . . vn v. Es sei
w der erste Knoten nach u, der beiden Wegen, P und Q, gehört. Dann ist w =
ui = vj für bestimmte Indizes i und j. Es folgt, dass C = uu1 . . . ui vj−1 . . . v1
ein Zyklus ist. Wir erhalten einen Widerspruch. Es folgt, dass es in der Tat
nicht mehr als einen Weg von u nach v gibt und da ein Baum zusammenhängend
ist, gibt es genau einen. Damit ist die eine Richtung im Satz bewiesen. Um
die andere Richtung zu beweisen nehmen wir an, dass es genau einen Weg gibt
zwischen jedem Paar von unterschiedlichen Knoten von T . Damit ist klar, dass
T zusammenhängend ist. Es bleibt nur noch zu zeigen, dass T keine Zyklen
enthält. Ein Zyklus ist von der Form C = v1 . . . vn v1 , wobei n ≥ 2 ist. Die
Kante v1 vn kommt in dem Weg v1 . . . vn nicht vor und deshalb wären v1 . . . vn
und v1 vn zwei verschiedene Wege von v1 nach vn , was unter der gegebenen
Annahme nicht möglich ist. Damit ist der Satz bewiesen.
Der nächste Satz sagt, dass jeder Baum mindestens zwei ‘Blätter’ hat.
Satz 10.2 Es sei T ein Baum mit mindestens zwei Knoten und es sei P =
u0 . . . un ein längster Weg in T (d.h. es gibt keinen Weg in T , der länger ist).
Dann haben die beiden Knoten u0 und un den Grad 1.
Beweis Nehmen wir an, dass d(u0 ) > 1. Die Kante f = u0 u1 trägt 1 zu dem
Grad von u0 bei und somit muss es eine andere Kante e von u0 zu einem Knoten
v von T geben. Wenn dieser Knoten v einer der Knoten des Weges P ist, dann
können wir v = ui setzen und dies erzeugt einen Zyklus C = u0 u1 . . . ui u0 . Da
T ein Baum ist, kann dies nicht der Fall sein. Es ist also so, dass v nicht zu P
gehört. Aber dann gibt es einen Weg P1 = vu0 . . . un der Länge n + 1, was der
Annahme widerspricht, dass P ein längster Weg ist. Es folgt, dass d(u0 ) = 1.
Genauso kann man zeigen, dass d(un ) = 1.
35
Aus diesem Satz kann man schliessen, dass ein Baum mit mindestens zwei
Knoten mehr als einen Knoten mit Grad 1 enthält.
Satz 10.3 Wenn T ein Baum mit n Knoten ist, dann hat er genau n−1 Kanten.
Beweis Der Beweis wird durch vollständige Induktion geführt. Wenn n = 1
dann hat T keine Kanten und die Behauptung für n = 1 stimmt. Nehmen wir
jetzt an, dass die Behauptung für n = k richtig ist. Wir wollen zeigen, das die
Behauptung für n = k + 1 richtig ist. Es sei T ein Baum mit k + 1 Knoten
und u ein Knoten vom Grad 1 in T (was nach dem letzten Satz existiert). Sei
e = uv die einzige Kante, die u als Endknoten hat. Wenn x und y zwei von u
verschiedene Knoten sind, dann führt jeder Weg P , der x und y verbindet nicht
durch den Knoten u. Folglich ist der Untergraph T − u zusammenhängend.
Dieser Untergraph enthält keine Zyklen. Es folgt, dass T − u ein Baum ist.
Durch die Induktionsvoraussetzung wissen wir, dass T − u genau k − 1 Kanten
hat. Der Graph T hat genau eine Kante mehr als T − u und infolgedessen k
Kanten, womit der Induktionsschritt vollzogen ist.
Wenn G ein azyklischer Graph ist hat auch jeder Untergraph von G keine Zyklen.
Deshalb ist jede Zusammenhangskomponente von G ein Baum. Aus diesem
Grund nennt man manchmal einen azyklischen Graphen einen Wald. Aus dem
Satz kann man leicht schliessen, dass ein Baum mit n Knoten und k Zusammenhangskomponenten genau n − k Kanten enthält.
10.2
Brücken
Satz 10.4 Es sei e eine Kante des Graphen G. Dann gilt ω(G) ≤ ω(G − e) ≤
ω(G) + 1.
Beweis Seien u und v die Endknoten von e und es sei C die Komponente zu der
e, u und v gehören. e bildet einen Weg von u nach v. Nehmen wir jetzt an, dass
es einen anderen Weg P von u nach v gibt. Dann gehört e nicht zu P . Also gibt
es im Untergraphen G − e einen Weg von u nach v und diese zwei Knoten sind
in G − e zusammenhängend. Wenn x und y zwei beliebige Knoten in C sind,
gibt es einen Weg von x nach y. Immer wenn e in diesem Weg vorkommt kann
er durch P ersetzt werden. Auf diese Weise bekommen wir einen Kantenzug
in G − e von x nach y. Dies zeigt, dass die Knoten von C immer noch eine
Komponente von G − e darstellen. Da die anderen Komponenten von G durch
das Entfernen von e nicht berührt werden hat G − e in diesem Fall die gleiche
Anzahl von Komponenten wie G. Es bleibt die Möglichkeit, dass e der einzige
Weg von u nach v ist. Dann ist es für einen Knoten x in C entweder so (a), dass
es einen Weg von x nach u gibt, der e nicht enthält oder (b), dass jeder Weg
von x nach u die Kante e enthält. Im Fall a) ist x in derselben Komponente
von G − e wie u. Im Fall b) muss in jedem Weg P von x nach u, da er e
enthält, e die letzte Kante im Weg sein. Deshalb muss v der vorletzte Knoten
sein. Dies erzeugt ein Weg von x nach v, dass e nicht enthält. Deshalb ist
x in der gleichen Komponente von G − e wie v. Ausserdem sind u und v in
unterschiedlichen Komponenten von G − e, da e der einzige Weg von u nach v
in G ist. Deshalb zerfällt die Komponente C durch das Entfernen von e in zwei
36
Komponenten und in diesem Fall gilt ω(G − e) = ω(G) + 1.
Eine Kante e eines Graphen G heisst eine Brücke wenn der Untergraph G − e
mehr Komponenten besitzt als G selbst. Nach Satz 10.4 hat G − e in diesem
Fall genau eine Komponente mehr als G.
Satz 10.5 Eine Kante e eines Graphen ist dann und nur dann eine Brücke,
wenn e nicht zu einem Zyklus von G gehört.
Beweis Seien u und v die Endknoten von e. Wenn e keine Brücke ist, dann
folgt aus den obigen Ausführungen, dass es einen Weg P = uu1 . . . un v gibt, in
dem die Kante e nicht enthalten ist. Dann ist C = uu1 . . . un vu ein Zyklus in
G. Also gehört die Kante e zu einem Zyklus, wenn sie keine Brücke ist. Anders
gesagt, wenn sie nicht zu einem Zyklus gehört ist sie eine Brücke.
Um die andere Hälfte des Theorems zu beweisen, nehmen wir an, dass e
zu einem Zyklus C = u0 . . . um gehört. Es sei e = ui ui+1 . Dann ist P =
ui ui−1 . . . u0 um−1 . . . ui+1 ein Weg von ui nach ui+1 , der nicht mit e identisch
ist. Deshalb ist e keine Brücke.
Satz 10.6 Es sei G ein zusammenhängender Graph. G ist dann und nur dann
ein Baum, wenn jede Kante von G eine Brücke ist, d.h. wenn der Untergraph
G − e für jede Kante e zwei Komponenten hat.
Beweis Wenn der Graph G ein Baum ist, ist er azyklisch und keine Kante von
G gehört einem Zyklus an. Mit anderen Worten ist jede Kante nach Satz 10.5
eine Brücke. Nehmen wir umgekehrt an, dass jede Kante von G eine Brücke ist.
Dann kann nach Satz 10.5 G keine Zyklen enthalten. Es folgt, dass G ein Baum
ist.
Satz 10.7 Sei G ein Graph mit n Knoten, q Kanten und ω(G) Zusammenhangskomponenten. Dann gilt q ≥ n − ω(G).
Beweis Der Beweis benutzt die vollständige Induktion, ausgehend von q = 0.
Wenn ein Graph keine Kanten hat, dann hat es so viel Komponenten wie es
Knoten gibt, also ist n = ω(G). Damit gilt die Aussage für q = 0, wobei in
dem Fall die Gleichheit gilt. Für den Induktionsschritt nehmen wir an, dass die
Aussage für einen bestimmten Wert von k gilt und es sei G ein Graph mit k + 1
Kanten. Sei e einer dieser Kanten. Dann hat der Untergraph G − e k Kanten
und durch die Induktionsannahme gilt
k ≥ n − ω(G − e).
(94)
Aus Satz 10.4 folgt ω(G−e) ≤ ω(G)+1. Wenn wir diese Ungleichung einsetzen,
bekommen wir k + 1 ≥ n − ω(G). Damit ist der Induktionsschritt vollzogen.
Aus diesem Satz kann man folgern, dass ein zusammenhängender Graph mit n
Knoten mindestens n − 1 Kanten hat. Weil in diesem Fall ist ω(G) = 1.
Satz 10.8 Es sei G ein Graph mit n Knoten. Folgende Aussagen sind äquivalent:
a) G ist ein Baum
b) G ist ein azyklischer Graph mit n − 1 Kanten
c) G ist ein zusammenhängender Graph mit n − 1 Kanten
Beweis Wir beweisen a)⇒b)⇒c)⇒a).
37
a)⇒b): Wenn G ein Baum ist, dann ist G azyklisch. Dann hat er nach Satz
10.3 n − 1 Kanten.
b)⇒c): Sei G ein azyklicher Graph mit n − 1 Kanten und sei ω(G) die Anzahl
von Zusammenhangskomponenten von G. Dann folgt aus der Bemerkung nach
Satz 10.3, dass G n − ω(G) Kanten hat. Es folgt, dass ω(G) = 1 und dass G
zusammenhängend ist.
c)⇒a): Sei G ein zusammenhängender Graph mit n − 1 Kanten. Wir wollen
zeigen, dass G azyklisch ist. Wenn die Aussage falsch ist, dann hat G einen
Zyklus und keine Kante in diesem Zyklus ist eine Brücke. Wählen wir eine
solche Kante e. Da e keine Brücke ist, ist G − e zusammenhängend. Jedoch
hat G − e n − 2 Kanten und n Knoten, was unmöglich ist. Dieser Widerspruch
liefert die gewünschte Aussage.
10.3
Spannende Bäume
Ein spannender Baum eines Graphen G ist ein spannender Untergraph von G,
der ein Baum ist.
Satz 10.9 Ein Graph ist dann und nur dann zusammenhängend, wenn er einen
spannenden Baum enthält.
Beweis Wenn G ein zusammenhängender Graph mit n Knoten und q Kanten
ist, dann folgt aus Satz 10.7, dass q ≥ n − 1. Wenn q = n − 1 dann Folgt
aus Satz 10.8, dass G ein Baum ist und deshalb ein spannender Baum für sich
selbst. Falls q > n − 1 dann ist G nach Satz 10.3 kein Baum und enthält
deshalb mindestens einen Zyklus. Sei e1 eine Kante, die zu einem derartigen
Zyklus gehört. Dann ist der Untergraph G − e1 zusammenhängend (da e1 keine
Brücke ist) und hat n Knoten und q − 1 Kanten. Falls q − 1 = n − 1, dann
ist T = G − e1 unter Wiederholung der obigen Beweisführung, ein spannender
Baum für G. Falls q −1 > n−1, dann ist G−e1 kein Baum, so dass es wie zuvor
einen Zyklus in G − e1 gibt. Das Entfernen einer Kante e2 aus einem derartigen
Zyklus führt zu einem Untergraphen G − {e1 , e2 } der zusammenhängend ist
und n Knoten und q − 2 Kanten hat. Wir fahren mit der Wiederholung dieses
Verfahrens fort, indem wir insgesamt q − n + 1 Kanten entfernen, um schliesslich
einen Untergraphen T zu erzeugen, der zusammenhängend ist und n Knoten und
n − 1 Kanten hat. T ist nach Satz 10.8 ein Baum und da er dieselbe Knotenzahl
hat wie G ist er ein spannender Baum für G.
Wenn umgekehrt G einen spannenden Unterbaum T enthält, dann sind zwei
gegebene Knoten u und v von G ebenso Knoten des zusammenhängenden Untergraphen T . Folglich sind u und v durch einen Weg in T zusammenhängend
und somit auch durch einen Weg in G. Der Graph G ist also zusammenhängend.
Ein spannender Baum des vollständigen Graphen Kn ist eine Art, n unterschiedliche Punkte miteinander zu Verbinden mit der minimalen Anzahl n − 1
von Kanten. Man kann fragen, wie viele solche Graphen es gibt und wie viele
nicht-isomorphe. Im ersten Fall ist es so, als würde man die Punkte numerieren
und bei der Zählung zwischen Kanten mit verschiedenen Nummern unterscheiden. Im zweiten Fall macht man diese Unterscheidung nicht. Bei 4 Punkten
38
gibt es 16 spannende Bäume, aber nur zwei nicht-isomorphe. Bei 6 Punkten
gibt es 1296 spannende Bäume aber nur 6 nicht-isomorphe. Im Jahre 1889 hat
der englische Mathematiker Arthur Cayley folgenden Satz bewiesen (den wir
hier nicht beweisen)
Satz 10.10 Der vollständige Graph Kn enthält nn−2 unterschiedliche spannende Bäume.
Cayley, der das Wort ’tree’ (’Baum’) 1857 im Sinne der Graphentheorie eingeführt
hat, interessierte sich für die Anzahl von gesättigten Kohlenwasserstoffen Cn H2n+2 .
10.4
Die Königsberger Brücken
Nachdem wir uns mit Objekten der Graphentheorie beschäftigt haben, die
Brücken heissen, wenden wir uns jetzt tatsächlichen Brücken, die im Zusammenhang mit den Anfängen der Graphentheorie sehr bedeutend sind. es handelt sich um Brücken in der Stadt Königsberg, der heutigen Kaliningrad. Die
Lage der preussischen Stadt Königsberg an den Ufern des Flusses Pregel im 18.
Jahrhundert war in etwa wir folgt. Im Fluss gab es zwei Inseln, die miteinander
und mit den Ufern durch Brücken verbunden waren. [In der Vorlesung wird
eine entsprechende Karte skizziert.] Die Einwohner sollen sich mit der Frage
beschäftigt haben, ob es möglich sei, einen Spaziergang zu machen bei dem
jede Brücke genau einmal überquert wird. Leonhard Euler hat das Problem
untersucht und gezeigt, dass ein solcher Spaziergang unmöglich ist.
Wir führen folgende Notation ein. Die Inseln heissen A und B und die zwei
Ufer C und D. Die sieben Brücken heissen a, b, c, d, e, f und g. (Wenn man
an dieser Stelle einen Multigraphen verwendet, kann man mit weniger Knoten
auskommen, aber diese Alternative wollen wir vermeiden.) Ein Knoten, der eine
Brücke darstellt wird mit einem Knoten, der einen Teil der Stadt darstellt genau
dann wenn ein Ende der Brücke in diesem Teil der Stadt liegt. Der Knoten A
ist mit a, b, d, e und f verbunden, B mit c, f und g, C mit a, b und c und D mit
d, e und g. [In der Vorlesung wird der Graph gezeigt.] Die Frage ist jetzt, ob es
einen Kantenzug gibt, der in L = {A, B, C, D} anfängt, alle Knoten enthält und
keinen Knoten, der einer Brücke entspricht, mehr als einmal enthält. Es gibt
einen Punkt von L, wo der Kantenzug startet und einen wo er endet (vielleicht
den gleichen). Auf jeden Fall gibt es einen Punkt Z ∈ L, wo der Kantenzug
weder startet noch endet. Wenn immer der Kantenzug in Z ankommt, muss
er Z wieder verlassen und er muss alle Kanten, die von Z ausgehen genau
einmal enthalten. Es folgt, dass die Anzahl von Kanten des Graphen, die von
Z ausgehen, gerade sein muss. Es ist aber so, dass die Anzahl von Kanten, die
von jedem Punkt von L ausgehen ungerade ist, ein Widerspruch.
11
Wahrscheinlichkeitstheorie
Die Wahrscheinlichkeitstheorie ist eine mathematische Theorie, die benutzt werden kann, um Vorgänge in der Natur zu verstehen, bei denen der Zufall eine
39
wesentliche Rolle spielt. Sie ist durch Versuche entstanden, das Glücksspiel
zu analysieren. Sie wird aber heutzutage sehr verbreitet in der Wissenschaft
angewendet. Die Theorie wird axiomatisch aufgebaut unter Verwendung von
Ideen, die in den dreissiger Jahren des letzten Jahrhunderts von Andrei Kolmogorov entwickelt wurden. Es geht darum, ein idealisiertes Zufallsexperiment zu betrachten. Beispiele solcher Experimente sind: eine Münze werfen,
Känguruhs auf dem Mond zählen, ein diffundierendes Teilchen beobachten, Telefonanrufe zählen. Zunächst müssen wir uns darauf einigen, welche Ergebnisse
des Experiments in Betracht gezogen werden, und welche Wahrscheinlichkeiten
damit verbunden werden. Um die Wahrscheinlichkeitstheorie zu verstehen ist
es wichtig, zusammen mit Kenntnissen über die mathematischen Begriffe und
Theoreme ein intuitives Verständis zu entwickeln.
11.1
Empirischer Hintergrund
Die Wahrscheinlichkeitstheorie bekommt ihre Bedeutung im Zusammenhang mit
tatsächlichen oder gedachten Experimenten, z. B. eine Münze einmal werfen, eine Münze 100 mal werfen, drei Würfel werfen, Roulette spielen, die
Lebensdauer eines radioaktiven Atoms oder eines Menschen beobachten, eine
Auswahl von Personen treffen und die Anzahl der Linkshänder beobachten,
zwei Pflanzenarten kreuzen und den Phänotyp der nachkommen beobachten,
die übliche Qualitätskontrolle eines Produktionsprozesses, die Häufigkeit von
Unfällen, usw. Diese Beschreibungen sind etwas vage und um sie zu präzisieren
müssen wir entscheiden, was wir als mögliche Ergebnisse des Experiments betrachten.
Wenn eine Münze geworfen wird muss sie nicht notwendigerweise Kopf oder
Zahl zeigen. Sie könnte wegrollen oder auf der Kante stehen bleiben. Wir
werden trotzdem annehmen, dass nur die zwei Möglichkeiten Kopf und Zahl
bestehen. Diese Konvention vereinfacht die Theorie ohne ihre Anwendung
einzuschränken. Es ist in der Praxis üblich, die Experimente auf diese Weise zu
idealisieren. Alle Messungen sind fehlerbehaftet. Es ist aber hilfreich anzunehmen,
dass die Ergebnisse präzise Zahlen sind. Z. B., welche Zahlen können als Alter eines Menschen vorkommen? Gibt es ein Maximum jenseits dessen das
Leben nicht mehr möglich ist? Wir werden kaum mit der Aussage einverstanden sein, dass ein Mensch 1000 Jahre alt werden kann. Trotzdem kennt
die Versicherungsmathematik keine obere Grenze für das Alter eines Menschen.
Nach den entsprechenden Tabellen ist die Wahrscheinlichkeit, dass ein Mensch
36
1000 Jahre alt wird etwa Eins zu 1010 . Diese Zahl hat keine biologische oder
praktische Bedeutung, widerspricht aber nicht den bekannten Beobachtungen.
Es schadet nicht, diesen Fall mitzubehandeln und diese Vorgehensweise vereinfacht die Rechnungen. Die Alternative wäre ein maximales Alter festzulegen
und das wäre künstlich - warum gerade diese Zahl und nicht eine etwas grössere?
Um eine feste Bezeichnung zu haben werden die Alternativen, die bei einem
Experiment auftreten können als Ereignisse bezeichnet. Wenn zwei Würfel
geworfen werden ist ‘Summe sechs’ ein mögliches Ereignis. Es besteht aus den
Fällen (1, 5), (2, 4), (3, 3), (4, 2) und (5, 1). Das Ereignis besteht aus fünf ele40
mentaren Ereignissen. Die elementaren Ereignisse werden oft auch als Ergbnisse
bezeichnet und die Menge aller möglichen Ergebnisse eines bestimmten Experiments als Ergebnismenge oder Ergebnisraum. Hier sehen wir, dass ein Ereignis
als Menge von Ergebnissen betrachtet werden kann. Wenn wir eine klare theoretische Definition eines Experiments formulieren wollen, müssen wir festlegen,
was die Ergebnisse sind. Die einfachen Ergebnisse werden oft als Punkte bezeichnet. Ereignisse sind Mengen solcher Punkte.
11.2
Beispiele
In diesem Abschnitt werden verschiedene Beispiele eingeführt.
(a) Verteilung von drei Bällen in drei Zellen. Hier ist die Liste aller möglichen
Zustände die bei diesem ‘Experiment’ vorkommen können.
|
} 10.{a | bc|
} 19.{
|a | bc}
2.{
|abc|
} 11.{ b |a c|
} 20.{
| b |a c}
3.{
|
} 21.{
| c|ab }
1.{abc|
|abc}
12.{ c|ab |
4.{ab | c|
} 13.{a |
| bc}
22.{a | b | c}
5.{a c| b |
} 14.{ b |
|a c}
23.{a | c| b }
6.{ bc|a |
} 15.{ c|
|ab }
24.{ b |a | c}
7.{ab |
| c}
16.{
|ab | c}
25.{ b | c|a }
8.{a c|
|b}
17.{
|a c| b }
26.{ c|a | b }
9.{ bc|
|a }
18.{
| bc|a }
27.{ c| b |a }
Das Ereignis A ’eine Zelle enthält mehr als einen Ball’ wird durch die Punkte 1.
bis 21. realisiert. Das Ereignis B ’die erste Zelle ist nicht leer’ wird durch die
Punkte 1, 4-15 und 22-27 realisiert. Das Ergebnis ’A und B werden realisiert’
entspricht den Punkten 1 und 4-15. Jeder Punkt gehört entweder zu denen,
die A entsprechen oder denen die B entsprechen oder zu beiden Klassen. Das
Ereignis ’entweder A oder B oder beides werden realisiert’ entspricht der Menge
aller Punkte und tritt mit Sicherheit ein.
(b) zufällige Verteilung von r Bällen in n Zellen. Dieser allgemeinere Fall ist
dem Spezialfall r = 3, n = 3 sehr ähnlich. Es wäre aber unpraktisch, eine
explizite Tabelle aufzustellen. Für r = n = 10 gibt es 1010 Fälle und für die
Tabelle bräuchte man einige hunderttausende Dicke Bände.
Es ist hier unwichtig, dass wir gerade von Bällen und Zellen sprechen. In Situationen in denen diese mathematische Stuktur auftritt, kann die Realisierung
dieser Elemente ganz verschieden sein. Es werden jetzt verschiedene Beispiele
aufgelistet. Die Wahrscheinlichkeiten sind in diesen Beispielen nicht immer gleich.
(b1) Geburtstage. Die Geburtstage von r Personen entsprechen dem Fall n =
365, wobei Schaltjahre nicht berücksichtigt werden.
41
(b2) Unfälle. Wenn r Unfälle nach dem Wochentag an dem sie passiert sind
klassifiziert werden dann erhalten wir den Fall n = 7.
(b3) Schiessen auf n Ziele. Die Treffer entsprechen den Bällen, die Ziele den
Zellen.
(b4) Bestrahlung in der Biologie. Wenn Lichtteilchen die lichtempfindlichen
Zellen in der Netzhaut treffen, dann sind die Photonen die Bälle und die ’Zellen’
des abstrakten Modells sind die biologischen Zellen. Bei der Untersuchung der
genetischen Auswirkung einer Bestrahlung durch α-Teilchen sind die Teilchen
die Bälle und die Chromosomen die Zellen.
(b5) ein Aufzug fährt mit r Personen los und hält in n verschiedenen Stockwerken und wir betrachten die verschiedenen Möglichkeiten, wie viele Personen
in welchen Stockwerken aussteigen.
(b6) r mal würfeln ist der Fall n = 6. Münzen werfen entspricht dem Fall n = 2.
(b7) Zufallszahlen. Ein zufälliger Zahl mit r Ziffern entspricht dem Fall n = 10
des allgemeinen Modells. Die Zellen sind in diesem Fall die natürlichen Zahlen
zwischen 0 und 9.
c) Ununterscheidbare Bälle. Wir kehren zurück auf den Fall a) aber nehmen an,
dass es nicht möglich ist, zwischen den Bällen zu unterscheiden. Dann gibt es z.
B. keinen Unterschied zwischen den Fällen 4., 5. und 6. oben. Die verschiedenen
möglichen Fälle sind dann nur noch
1.{∗ ∗ ∗|
|
2.{
|∗∗∗|
3.{
|
}
6.{∗ | ∗ ∗ |
} 7.{∗ |
| ∗ ∗∗}
4.{∗ ∗ | ∗ |
5.{∗ ∗ |
8.{
}
9.{
}
|∗∗ }
| ∗ ∗ |∗ }
|∗ |∗∗ }
|∗ } 10.{∗ | ∗ |∗ }
(95)
Ob die Bälle als unterscheidbar betrachtet werden is eine Frage der Modellierung. Die Personen in (b5) können vermutlich leicht voneinander unterschieden werden aber die Unterschiede zwischen Ihnen sind vielleicht irrelevant
für das, was wir modellieren wollen. Man könnte das Experiment betrachten,
wo die Bewegungen der Personen nicht direkt, sonderen nur durch einen Bewegungsmelder beobachtet werden. Die Würfel in (b6) haben vielleicht verschiedene Farben, so dass man sie unterscheiden kann, Die Farben werden aber
für die meisten Spiele in denen die Würfel eingesetzt werden ohne Bedeutung
sein.
d) Münzen werfen. Wenn man eine Münze dreimal wirft, dann gibt es folgende
acht Möglichkeiten:
KKK, KKZ, KZK, ZKK, KZZ, ZKZ, ZZK, ZZZ
(96)
Das Ergebnis A, ’zweimal oder mehr Kopf’ is die Menge der ersten vier Möglichkeiten.
Das Ergebnis B, ’nur einmal Zahl’ ist die Menge {KKZ, KZK, ZKK}.
42
11.3
Der Ergebnisraum
Wenn wir hier von Wahrscheinlichkeiten sprechen, dann nur im Zusammenhang
mit einem gegebenen Ergebnisraum und seinen Punkten, die als gegeben betrachtet werden. Ein Ereignis A ist eine Teilmenge des Ergebnisraums. Im Beispiel
a) ist die Menge U = {1, 7, 13} ein Ereignis im Sinne dieser Definition. Es
gibt verschiedene äquivalente Möglichkeiten, diese Menge zu beschreiben. Zum
Beispiel ist U das Ereignis, dass folgende drei Bedingungen alle erfüllt sind: die
zweite Zelle ist leer, der Ball a ist in der letzten Zelle und der Ball b erscheint
nie nach c, Hier wird ein Ereignis beschrieben als Kombination von verschiedenen anderen Ereignissen. Jetzt werden Möglichkeiten eingeführt, Ereignisse zu
kombinieren.
11.4
Beziehungen zwischen Ereignissen
Wir nehmen jetzt an, dass ein fester Ergebnisraum S gegeben ist. Grosse Buchstaben bezeichnen Ereignisse und kleine Buchstaben Punkte von S. Die Leere
Menge ist ein Ereignis und kann im Rahmen der Wahrscheinlichkeitstheorie als
ein unmögliches Ereignis betrachten werden. Das Komplement S \ A der Menge
A hat die Interpretation, dass das Ereignis A nicht stattfindet. Wenn A und
B Ereignisse sind, dann hat das Ereignis A ∪ B die Interpretation, dass A oder
B (oder beide) stattfindet. Das Ereignis A ∩ B hat die Interpretation, dass A
und B stattfinden. Wenn A ∩ B = ∅ sagt man, dass die Ereignisse A und B
sich gegenseitig ausschliessen. Die Vereinigungen und Durchschnitte von mehr
als zwei Ereignissen haben natürlich entsprechende Interpretationen. Man sagt,
dass Ereignisse A1 , A2 , A3 , . . . sich gegenseitig ausschliessen, wenn Ai ∩ Aj = ∅
für alle i 6= j. A ⊂ B bedeutet, dass B immer dann stattfindet, wenn A stattfindet. Mit anderen Worten, A impliziert B. Damit haben wir die gängigen
Begriffe der Mengenlehre mit Begriffen, die sich auf Experimente beziehen, im
Fall, dass die Menge ein Ereignisraum ist in Verbindung gebracht. Betrachten
wir Beispiel a). Sei Ei das Ereignis, dass die Zelle i leer ist. Seien Si , Di , Ti
die Ereignisse, dass die Zelle I einen, zwei oder drei Bälle enthält. Dann ist
E1 ∩ E2 = T3 , S1 ∩ S2 ⊂ S3 , D1 ∩ D2 = ∅.
11.5
Diskrete Ergebnisräume
Die einfachsten Ergebnisräume sind die, die nur endlich viele Punkte enthalten. Man kann sie sich relativ leicht vorstellen. Es ist aber so, dass auch
unendliche Ergebnisräume nützlich sind. Betrachten wir z. B. das Experiment,
dass wir eine Münze so lange werfen, bis sich ein Kopf zeigt. Die Punkte des
Ergebnisraums sind dann E1 = K, E2 = ZK, E3 = ZZK, E4 = ZZZK
usw. Wie können auch eventuell die Möglichkeit in Betracht ziehen das K
nie auftritt. Wenn wir dass machen, dann muss diese Möglichkeit durch einen
zusätzlichen Punkt E0 dargestellt werden. In diesem Fall ist der Ergebnisraum
abzählbar. Ein Ergebnisraum heisst diskret, wenn sie endlich ist oder unendlich
aber abzählbar. Wir wissen, dass nach dem Satz von Cantor die reellen Zahlen
43
überabzählbar sind. Es ist also durchaus möglich, Ergebnisräume zu betrachten, die nicht diskret sind. Im Folgenden betrachten wir aber nur diskrete
Ergebnisräume.
11.6
Wahrscheinlichkeiten in diskreten Ergebnisräumen:
Vorbereitungen
In der Wahrscheinlichkeitstheorie nehmen wir an, dass die Wahrscheinlichkeiten
von bestimmtem Ereignissen gegeben sind. Wir sagen aber nichts darüber wie
sie in der Praxis bestimmt werden. Betrachten wir z. B. eine ideale Münze,
die wenn sie sehr oft geworfen wird, ungefähr gleich oft Kopf und Zahl zeigt.
Keine echte Münze hat diese Eigenschaft und es bleibt etwas unklar, wie oft man
werfen muss, um diese Eigenschaft festzustellen. Die ideale Münze ist trotzdem
ein nützlicher Begriff in der Wahrscheinlichkeitstheorie und lässt sich manchmal
gut anwenden. Für eine ideale Münze sagen wir, dass die Wahrscheinlichkeit,
dass die Münze Kopf zeigt bei einem gegebenen Wurf 12 ist, oder dass Kopf
und Zahl gleich wahrscheinlich sind. Wenn die Münze n-mal geworfen wird
haben alle möglichen Ergebnisse die gleiche Wahrscheinlichkeit. Betrachten wir
jetzt das Beispiel von unterscheidbaren Bällen. Im Beispiel a) ist es natürlich
anzunehmen, dass jeder Punkt im Ergebnisraum gleich wahrscheinlich ist. Jeder
1
mögliche Punkt hat die Wahrscheinlichkeit 27
. Ob diese Wahl angemessen ist
hängt von der Anwendung ab. In den Beisnnen, scheint es vernünftig, die
Wahrscheinlichkeiten aus dem letzten Beispiel zu übernehmen. Dann haben die
Fälle 1.-10. die Wahrscheinlichkeiten
1 1 1 1 1 1 1 1 1 2
, , , , , , , , ,
(97)
27 27 27 9 9 9 9 9 9 9
In der kinetischen Theorie der Gase wurden früher solche Wahrscheinlichkeiten
benutzt für die Zustände der Gasmoleküle. Dies führt auf die sogenannte
Maxwell-Boltzmann-Verteilung. In Wirklichkeit werden die Moleküle durch die
Quantentheorie beschrieben und verhalten sich ganz anders. Das Analogon der
daraus enstehenden Bose-Einstein-Verteilung im Falle der ununterscheidbaren
1
Bälle ist dass alle zehn Möglichkeiten die gleiche Wahrscheinlichkeit 10
besizten.
Diese Bemerkungen sollen darauf hinweisen, dass die Wahl von Wahrscheinlichkeiten nicht selbstverständlich ist, sondern ein wichtiger Teil des Modellierungsprozesses.
11.7
Fundamentale Definitionen und Regeln
Wenn ein diskreter Ergebnisraum S gegeben ist, wird jedem Punkt Ei von S
eine Zahl P (Ei ) zugeordnet, die Wahrscheinlichkeit von Ei . Für jeden Punkt
Ei ist die entsprechende Wahrscheinlichkeit nicht negativ and die Summe der
Wahrscheinlichkeiten aller Punkte ist Eins. Es wird zugelassen, dass P (Ei ) = 0
für einen Punkt Ei und die Bedeutung ist, dass Ei unmöglich ist. Dies mag
unnatürlich erscheinen und wir könnten solche Punkte aus dem Raum entfernen.
In der Praxis ist es aber nützlich, sie zu behalten. Man weiss nicht immer im
44
voraus, welche Wahrscheinlichkeiten Null sind. Die Wahrscheinlichkeit P (A)
von einem Ereignis A ist die Summe der Wahrscheinlichkeiten P (Ei ) über alle
Punkte Ei ∈ A. Die Wahrscheinlichkeit des ganzen Raums ist P (S) = 1 und
für alle Ereignisse A gilt 0 ≤ P (A) ≤ 1.
Seien jetzt A1 und A2 zwei beliebige Ergebnisse. Wir möchten P (A1 ∪ A2 )
untersuchen. Es ist klar, dass P (A1 ∪ A2 ) ≤ P (A1 ) + P (A2 ). Der Unterschied
ist, dass man im Ausdruck auf der rechten Seite bestimmte Punkte zweimal
zählt. Es gilt die Beziehung
P (A1 ∪ A2 ) = P (A1 ) + P (A2 ) − P (A1 ∩ A2 ).
(98)
Wenn A1 und A2 sich gegenseitig ausschliessen, dann ist P (A1 ∪ A2 ) = P (A1 ) +
P (A2 ).
Betrachten wir das Beispiel bei dem eine Münze zweimal geworfen wird. Der
Ergebnisraum besteht aus vier Punkten KK, KZ, ZK und ZZ. Seien A1 bzw.
A2 die Ereignisse ’das erste mal Kopf’ und ’das zweite mal Kopf’. Dann ist
A1 = {KZ, KK} und A2 = {ZK, KK}. Dann ist
P (A1 ∪ A2 ) =
3
1 1 1
+ − = .
2 2 4
4
(99)
Die Ungleichung für die Vereinigung von zwei Ereignissen kann auf n Ereignissen
verallgemeinert werden, oder sogar auf unendlich viele
P (A1 ∪ A2 ∪ . . .) ≤ P (A1 ) + P (A2 ) + . . . .
(100)
Wenn die Ereignisse Ai sich gegenseitig ausschliessen, dann gilt die Gleichheit
in dieser Beziehung.
11.8
Bedingte Wahrscheinlichkeit
Wir fangen mit einem Beispiel an. Angenommen eine Population von N Menschen enthält NA farbenblinde und NH Frauen. Seien die Ereignisse, dass eine
zufällig gewählte Person farbenblind bzw. eine Frau A bzw. H. ‘Zufällig
gewählt’ bedeutet, dass die Wahrscheinlichkeit gewählt zu werden für alle Personen gleich ist. Daraus folgen die Wahrscheinlichkeiten
P (A) =
NA
,
N
P (H) =
NH
.
N
(101)
Wir betrachten jetzt die Population von Frauen. Die Wahrscheinlichkeit, dass
eine Person die aus dieser Population zufällig gewählt wird farbenblind ist ist
N
, wobei NH,A die Anzahl der farbenblinden Frauen ist. Hier ist kein
gleich NH,A
H
neuer Begriff benutzt worden, aber wir brauchen eine neue Notation, um klar
zu machen, von welcher Population wir reden. Man schreibt P (A|H) und nennt
diese Grösse die Wahrscheinlichkeit eines Ereignisses A (Farbenblindheit) unter
der Voraussetzung des Ereignisses A (die gewählte Person ist eine Frau). In
Symbolen
NH,A
P (A ∩ H)
P (A|H) =
=
.
(102)
NH
P (H)
45
Diese Formel definiert die bedingte Wahrscheinlichkeit P (A|H) für ein beliebiges
Ereignis A und ein beliebiges Ereignis H mit P (H) 6= 0 (Hypothese).
Die bedingte Wahrscheinlichkeit eines Ereignisses A ist eine übliche Wahrscheinlichkeit, wo der Ergebnisraum durch die Hypothese gegeben wird. Deshalb gelten viele Eigenschaften von absoluten Wahrscheinlichkeiten auch für bedingte
Wahrscheinlichkeiten. Z. B.
P (A1 ∪ A2 |H) = P (A1 |H) + P (A2 |H) − P (A1 ∩ A2 |H).
(103)
Die Definition der bedingten Wahrscheinlichkeit kann umgeschrieben werden
als P (A ∩ H) = P (A|H)P (H). Wenn wir A = A1 und H = A2 ∩ A3 setzen
bekommen wir die Beziehung
P (A1 ∩ A2 ∩ A3 ) = P (A1 |A2 ∩ A3 )P (A2 |A3 )P (A3 ).
(104)
Diese Formel kann ohne weiteres auf eine beliebige Anzahl von Ereignissen verallgemeinert werden. Folgende Formel ist manchmal nützlich. Seien H1 , H2 , . . . Hn
Ereignisse, die sich gegenseitig ausschliessen und von denen eines stattfinden
muss. (Das heisst, die Vereinigung der Hi ist der ganz Ereignisraum.) In Symbolen
A = (A ∩ H1 ) ∪ (A ∩ H2 ) ∪ . . . ∪ (A ∩ Hn ).
(105)
In diesem Fall gilt
P (A) =
n
X
P (A|Hj )P (Hj ).
(106)
j=1
11.9
Urnenmodelle
Manchmal werden die Wahrscheinlichkeiten in einem bestimmten Modell durch
bedingte Wahrscheinlichkeiten definiert. Mit anderen Worten: wir verlangen,
dass bestimmte bedingte Wahrscheinlichkeiten bestimmte Werte haben und daraus müssen die absoluten Wahrscheinlichkeiten berechnet werden. Eine bekannte Klasse von Modellen dieser Art sind die sogenannten Urnenmodelle.
Betrachten wir eine Fabrik, wo Unfälle passieren können. Diese Situation
können wir als eine Art übermenschliches Glücksspiel betrachten. Der Schicksal
hat eine Urne in der es schwarze und rote Bälle gibt. In regelmässigen zeitlichen
Abständen wird ein Ball der Urne entnommen und ein roter Ball bedeutet, dass
ein Unfall passiert. Wenn die Wahrscheinlichkeit eines Unfalls konstant bleibt,
dann ist die Zusammensetzung der Urne immer gleich. Es ist aber denkbar, dass
der Unfall Nachwirkungen hat, wodurch die Wahrscheinlichkeit eines späteren
Unfalls erhöht oder verringert wird. Diese Situation entspricht einer Urne,
deren Zusammensetzung von den Ergebnissen der Ziehungen abhängt, die schon
stattgefunden haben. Es gibt verschiedene Möglichkeiten, Regeln zu erfinden,
die ein solches Modell definieren. Hier betrachten wir nur ein Beispiel.
Eine Urne enthält b schwarze und r rote Bälle. Ein Ball wird zufällig gezogen. Er wird wieder in die Urne gelegt und dazu werden c Bälle der gezogenen
Farbe und d Bälle der anderen Farbe hinzugefügt. Jetzt wird erneut aus der
46
Urne gezogen, der inzwischen r + b + c + d Bälle enthält und diese Prozedur
wird wiederholt. Dabei sind c und d beliebige ganze Zahlen. Sie dürfen negativ
gewählt werden, wobei es in dem Fall passieren kann, dass die Prozedur nach
endlich vielen Schritten aufhört, weil nicht genug Bälle übrigbleiben. Im Fall
c = −1 und d = 0 haben wir das Modell von zufälligen Ziehungen ohne Ersatz,
in dem die Prozedur nach r + b Schritten aufhört. Dieses intuitive Bild soll jetzt
in Mathematik übersetzt werden, wobei die Formulierung bedingte Wahrscheinlichkeiten verwendet. Ein typischer Punkt des Ergebnisraums kann man durch
eine Folge von Buchstaben B und R darstellen. Das Ereignis ‘schwarz bei der
b
. Wenn der erste Ball schwarz ist,
ersten Ziehung’ hat die Wahrscheinlichkeit b+r
dann ist die bedingte Wahrscheinlichkeit eines schwarzen Balls bei der zweiten
Ziehung
b+c
.
(107)
b+r+c+d
Die absolute Wahrscheinlichkeit der Folge BB ist also
b
b+c
.
(108)
b+r
b+r+c+d
Die Wahrscheinlichkeit von BBB ist die soeben genannte mal (b + 2c)/(b +
r + 2c + 2d) usw. Auf diesem Weg können die Wahrscheinlichkeiten von allen
Ergebnispunkten berechnet werden. Man kann durch Induktion beweisen, das
die Wahrscheinlichkeit von allen Punkten sich zu Eins addieren. Es ist im allgemeinen schwer, explizite Ausdrücke für die Wahrscheinlichkeiten zu bekommen.
Eine Ausnahme ist der wichtigste und bekannteste Spezialfall, das Urnenschema
von Polya. Dieses Schema wird durch d = 0, c > 0 charakterisiert. Es liefert ein
grobes Modell für eine Infektionskrankheit. Die Wahrscheinlichkeit, das nach
n1 + n2 Ziehungen die ersten n1 Bälle schwarz und die verbleibenden n2 rot sind
ist
b(b + c)(b + 2c) . . . (b + n1 c − c)r(r + c) . . . (r + n2 c − c)
.
(109)
(b + r)(b + r + c)(b + r + 2c) . . . (b + r + nc − c)
Betrachten wir jetzt eine beliebige Ziehung von n1 schwarzen und n2 roten
Bällen. Wenn wir die Wahrscheinlichkeit berechnen finden wir die gleichen
Faktoren, nur in einer anderen Reihenfolge. Es folgt, dass alle Folgen von n1
schwarzen und n2 roten Bällen die gleiche Wahrscheinlichkeit haben. Die Einfachheit des Polya-Modells ist eine Folge dieser Eigenschaft. Um die Wahrscheinlichkeit pn1 ,n zu bekommen, dass n Ziehungen n1 schwarze und n2 rote Bälle in
beliebiger
Reihenfolge produzieren müssen wir die Wahrscheinlichkeit oben mit
n
multiplizieren,
der Anzahl der möglichen Reihenfolgen. Die Benutzung von
n1
allgemeinen Binomialkoeffizienten erlaubt es, das Ergebnis in folgender Form zu
schreiben:
b
r
pn1 ,n =
−c −c
n1
n2
− b+r
c
n
(110)
Dazu bleibt zu erklären, was unter ‘allgemeinen Binomialkoeffizienten’ zu verstehen ist. Wir haben die Grösse nk für natürliche Zahlen definiert und es gilt
47
die Beziehung
n
n(n − 1) . . . (n − k)
=
.
k
k(k − 1) . . . 1
(111)
Wir können beobachten, dass so lange k eine natürliche Zahl ist der letzte
Ausdruck für beliebige reelle Zahlen n sinnvoll ist. Er kann also benutzt werden,
um die Definition der Binomialkoeffizienten zu erweitern.
References
[1] Clark, J. und Holton, D. A. Graphentheorie. Spektrum Akademischer Verlag, Heidelberg.
[2] Feller, W. 1950 An introduction to probability theory and its applications.
Wiley, New York.
[3] Nowak, M. A. und May, R. M. 2000 Virus Dynamics. Oxford University
Press, Oxford.
[4] Singh, S. 2000 Fermats letzter Satz - die abenteuerliche Geschichte eines
mathematischen Rätsels. DTV, München.
48
Herunterladen