Diskrete Mathematik Anusch Taraz 15. Januar 2009 2 Inhaltsverzeichnis I Grundlagen 1 Mengen und Mengenoperationen . . . . . . . . . . . . . . . . . . . 2 Vollständige Induktion . . . . . . . . . . . . . . . . . . . . . . . . . 3 Relationen und Funktionen . . . . . . . . . . . . . . . . . . . . . . 5 5 7 9 II Zählen 4 Elementares Zählen . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Teilmengen und Partitionen zählen . . . . . . . . . . . . . . . . . . 6 Erzeugende Funktionen . . . . . . . . . . . . . . . . . . . . . . . . 15 15 19 25 III Relationale Strukturen 7 Graphen . . . . . . . . . . . . . . . 8 Exkurs: Diskrete Optimierung . . . 9 Euler–Touren und Hamilton–Kreise 10 Matchings . . . . . . . . . . . . . . 11 Färbungen planarer Graphen . . . 12 Partielle Ordnungen . . . . . . . . . . . . . . 35 35 41 43 45 50 53 IV Konstruierte Regularität 13 Endliche projektive Ebenen . . . . . . . . . . . . . . . . . . . . . . 14 Codierungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 61 67 V Ramseytheorie 15 Satz von Ramsey . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Konvexe Polygone . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Arithmetische Progressionen . . . . . . . . . . . . . . . . . . . . . . 75 75 80 82 VI Probabilistische Methoden 18 Grundlagen und Ramseyzahlen . . . . . . . . . . . . . . . . . . . . 19 Graphen ohne kurze Kreise . . . . . . . . . . . . . . . . . . . . . . 20 Dreiecke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 90 92 94 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Inhaltsverzeichnis VIIAlgebraische Methoden 21 Zyklenraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 Intersecting families . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Färbungen des Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 97 97 98 Kapitel I Grundlagen Wir werden in diesem Kapitel die grundlegende Terminologie festlegen und an einigen Beispielen veranschaulichen. 1 Mengen und Mengenoperationen Wir gehen in dieser Vorlesung davon aus, dass Sie mit dem abstrakten Begriff einer Menge bereits intuitiv vertraut sind. Wir beschreiben eine Menge M hier entweder durch die explizite Angabe aller ihrer Elemente, also zum Beispiel M = {1, 4, 9}, oder in dem wir eine Bildungsvorschrift nennen, also zum Beispiel: M sei die Menge der Quadratzahlen zwischen 1 und 10. Um solche Beschreibungen möglichst kurz und trotzdem präzise zu halten, führen wir die Abkürzungen ∀ ( für alle“) und ” ∃ ( es existiert“) ein, sowie den Doppelpunkt :“ innerhalb einer Mengenklammer, ” ” der für den Ausdruck für die gilt“ steht. Also, noch einmal zurück zu unserem ” Beispiel: M = {x : 1 ≤ x ≤ 10 und ∃ eine natürliche Zahl y mit x = y 2 }. Die leere Menge bezeichnen wir mit ∅. Bei unendlichen Mengen greifen wir auch manchmal auf die Pünktchenschreibweise zurück und vertrauen darauf, dass damit die Bildungsvorschrift implizit klar ist. So wird beispielsweise die Menge der natürlichen Zahlen ohne Null mit N = {1, 2, 3, . . . } bezeichnet, die Menge der natürlichen Zahlen mit Null mit N0 := N ∪ {0}. Weitere wichtige Zahlenräume bezeichnen wir wie folgt: • Z, die Menge der ganzen Zahlen, • Q, die Menge der rationalen Zahlen, 6 Kapitel I. Grundlagen • R, die Menge der reellen Zahlen. Wenn n ∈ N, dann setzen wir [n] := {1, 2, . . . , n}. Unsere obige Menge M könnten wir also noch knapper schreiben als M = {y 2 : y ∈ [3]}. Wenn x ∈ R, dann definieren wir bxc als die größte ganze Zahl n mit n ≤ x; und analog dxe als die kleinste ganze Zahl n mit n ≥ x. Unter der Kardinalität einer beliebigen Menge M versteht man die Anzahl der Elemente von M . Sie wird mit |M | bezeichnet. Zwei ebenfalls sehr geläufige Abkürzungen bezeichnen die Summe und das Produkt von mehreren Termen. Zu a1 , . . . , an ∈ R bezeichnen wir mit n X ai := a1 + . . . + an i=1 bzw. n Y ai := a1 · . . . · an i=1 die Summe bzw. das Produkt dieser Zahlen. Ausgehend von einer oder mehreren Mengen lassen sich weitere Mengen konstruieren. Sei k ∈ N. Das kartesische Produkt von Mengen M1 , . . . , Mk ist eine Menge, deren Elemente aus sogenannten Tupeln der Elemente der einzelnen Mengen besteht: M1 × · · · × Mk := {(x1 , . . . , xk ) : xi ∈ Mi ∀i ∈ [k]} . Das geht natürlich auch, wenn die Mengen Mi untereinander gleich sind. In diesem Spezialfall schreiben wir für eine Menge M : M k := M × · · · × M = {(x1 , . . . , xk ) : xi ∈ M ∀i ∈ [k]} . {z } | k−mal Im Gegensatz dazu bezeichnen wir mit M k die Menge der k-elementigen Teilmengen von M : M := {S : S ⊆ M, |S| = k} k Der Unterschied zwischen den beiden Konstruktionen besteht also darin, dass die Elemente von M k Folgen von Elementen aus M sind, bei denen es auf die Reihenfolge ankommt und bei denen ein Element aus M auch mehrfach auftreten kann, während die Elemente von M (ungeordnete) Mengen sind, die k verschiedene k Elemente aus M enthalten müssen. Wenn man alle (also nicht nur die k-elementigen) Teilmengen von M in einer Menge zusammenfassen möchte, dann spricht man von der Potenzmenge P(M ): P(M ) := {S : S ⊆ M } Man beachte, dass insbesondere die Menge ∅ und die Menge M Elemente von P(M ) sind. 2. Vollständige Induktion 7 Beispiel. R2 ist die Menge aller 2-Tupel (d.h. geordnete Paare) von reellen Zahlen, R 2 besteht aus allen zweielementigen Mengen reeller Zahlen. Insbesondere gilt beispielsweise: (7, 7) ∈ R2 und (7, 8) 6= (8, 7); hingegen ist {7, 7} = {7} 6∈ R2 und {7, 8} = {8, 7}. Ein Beispiel zur Potenzmenge: Wenn M = {0, 1}, dann ist P(M ) = {∅, {0}, {1}, {0, 1}}. Zwei weitere geläufige abkürzende Schreibweisen befassen sich mit der Vereinigung und der Schnittmenge von mehreren Mengen M1 , . . . , Mk . Wir setzen k [ Mi := M1 ∪ · · · ∪ Mk und i=1 k \ Mi := M1 ∩ · · · ∩ Mk . i=1 Schließlich sagen wir, dass die Mengen M1 , . . . , Mk eine Partition von M bilden, wenn k [ M= Mi und Mi ∩ Mj = ∅ für alle i 6= j ∈ [k] i=1 · k · · S gilt. In diesem Fall schreiben wir M = i=1 Mi = M1 ∪ . . . ∪ Mk . Offensichtlich Pk gilt dann |M | = i=1 |Mi |. Beispiel. Es sei M eine Menge mit |M | = n Elementen. Wir können die Teilmengen von M , also die Mitglieder der Potenzmenge P(M ), nach der Anzahl ihrer Elemente gruppieren: erst die Teilmengen mit null Elementen, dann die mit einem Element, dann die mit zwei, zuletzt die mit n. Offensichtlich gehört jede Teilmenge in genau eine dieser Kategorien und wir erhalten · n [ P(M ) = i=0 2 M k Vollständige Induktion Die Beweismethode der vollständigen Induktion ist ein wichtiges Werkzeug, um Aussagen zu beweisen, die für alle natürlichen Zahlen n gelten sollen. Sei A(n) eine solche Aussage. Dann überprüfen wir zunächst ob A(1), also die Aussage für n = 1, stimmt (Induktionsanfang). Nun sei k ∈ N beliebig und wir nehmen an, dass die Aussage A(k) wahr ist (Induktionsannahme). Wenn es uns dann gelingt, daraus zu folgern, dass auch die Aussage A(k + 1) stimmt, haben wir die Aussage A(n) für alle n ∈ N gezeigt (Induktionsschritt). Drei einfache Beispiele folgen. Beispiel. Für jede natürliche Zahl n gilt die folgende Aussage: A(n) : Die Zahl 22n − 1 ist durch 3 teilbar. (2.1) Beweis. durch vollständige Induktion über n. Induktionsanfang: Für n = 1 ist 22n − 1 = 22 − 1 = 3 durch 3 teilbar, also stimmt 8 Kapitel I. Grundlagen die Aussage A(1). Induktionsannahme: Sei k ∈ N beliebig. Wir nehmen an, dass die Aussage A(k) wahr ist, dass also 22k − 1 durch 3 teilbar ist. Induktionsschritt: Für n = k +1 lautet die Aussage A(k +1), dass 22(k+1) −1 durch 3 teilbar ist und das müssen wir jetzt zeigen. Dabei dürfen wir uns auf unser in der Induktionsannahme formuliertes Wissen berufen, und daher formen wir den Ausdruck 22(k+1) − 1 so lange um, bis wir, irgendwo in ihm versteckt, den alten Ausdruck 22k − 1 wieder finden: 22(k+1) − 1 = 22k+2 − 1 = 4 · 22k − 1 = 4(22k − 1) + 3. Dem letzten Ausdruck können wir nun ganz leicht ansehen, dass er durch 3 teilbar ist: Nach Induktionsannahme ist (22k − 1) durch 3 teilbar, also ist auch 4(22k − 1) durch 3 teilbar, und also ist auch 4(22k − 1) + 3 durch 3 teilbar. Damit ist unser Induktionsbeweis abgeschlossen. Unser nächstes Beispiel befasst sich mit einer Folge von natürlichen Zahlen, die durch eine rekursive Definition gegeben ist, und für die wir eine explizite Formel beweisen wollen. Beispiel. Wir betrachten die Die Folge a0 , a1 , a2 , . . . sei gegeben durch den Startwert a0 := 2 und die Rekursion an := 3an−1 + 1 für alle n ∈ N. Dadurch folgt beispielsweise, dass a1 = 3a0 + 1 = 3 · 2 + 1 = 7, a2 = 3a1 + 1 = 3 · 7 + 1 = 22, usw. Behauptung: Für jede Zahl n ∈ N0 gilt die folgende Aussage: A(n) : an = 1 (5 · 3n − 1). 2 (2.2) Beweis. durch vollständige Induktion über n. Induktionsanfang: Für n = 0 ist a0 = 2 und 21 (5 · 30 − 1) = 12 (5 − 1) = 2, also stimmt die Aussage A(0). Induktionsannahme: Sei k ∈ N0 beliebig. Wir nehmen an, dass die Aussage A(k) wahr ist. Induktionsschritt: Für n = k + 1 müssen wir zeigen, dass ak+1 = 21 (5 · 3k+1 − 1). Mit Hilfe der rekursiven Definition und der Induktionsannahme A(k) sehen wir, dass 1 1 1 (5 · 3k − 1) + 1 = (5 · 3k+1 − 3) + 1 = (5 · 3k+1 − 1), ak+1 = 3ak + 1 = 3 2 2 2 was zu zeigen war. Nächstes Beispiel: Beispiel. Sei M eine Menge mit n := |M | ∈ N0 . Dann gilt: A(n) : |P(M )| = 2n . (2.3) 3. Relationen und Funktionen 9 Beweis. durch vollständige Induktion über n. Induktionsanfang: liegt diesmal bereits bei n = 0. Die einzige Menge M mit |M | = 0 ist M = ∅. Also ist P(M ) = {∅} und somit beträgt die linke Seite in (2.3) genau 1. Die rechte Seite ist 20 = 1, also stimmt die Aussage A(0). Induktionsannahme: Sei k ∈ N beliebig. Wir nehmen an, dass die Aussage A(k) wahr ist. Induktionsschritt: Sei M eine Menge mit |M | = n = k+1. Wir wählen ein Element x aus M beliebig aus und betrachten die Menge M̃ := M \ {x}. Der Hintergedanke ist natürlich, dass jetzt |M̃ | = k ist und wir die Induktionsannahme auf M̃ anwenden können. Wir partitionieren die Potenzmenge von M in zwei Teile: P(M ) = {S : S ⊆ M } n o · n o = S : S ⊆ M̃ ∪ S : S 6⊆ M̃ , S ⊆ M o n o · n = S : S ⊆ M̃ ∪ S̃ ∪ {x} : S̃ ⊆ M̃ . (2.4) Nach A(k) gilt, dass |P(M̃ )| = 2k . Somit haben die beiden in (2.4) genannten Mengen jeweils 2k Elemente, und insgesamt folgt |P(M )| = 2k + 2k = 2k+1 , was mit der rechten Seite von (2.3) für den Fall n = k + 1 übereinstimmt. Ein paar Bemerkungen noch: 1) Der Induktionsanfang muss immer die Aussage A(n) für die kleinste Zahl n überprüfen, für die die Aussage geltend gemacht wird. 2) Es ist auch zulässig, wenn man im Induktionsschritt nicht nur auf die Korrektheit von A(k) alleine zurückgreift, sondern auf die von allen A(1), . . . , A(k). 3) Will man sich im Induktionsschritt immer auf beide vorangegangenen Aussagen A(k − 1) und A(k) berufen, dann müssen beim Induktionsanfang auch die Aussagen A(n) für die ersten beiden Zahlen n (für die die Aussage gelten soll) überprüft werden. 3 Relationen und Funktionen Definition. Sei k ∈ N mit k ≥ 2. Eine k-stellige Relation über den Mengen A1 , . . . , Ak ist eine Teilmenge R ⊆ A1 ×· · ·×Ak . In dem Spezialfall R ⊆ M ×· · ·×M spricht man auch von einer Relation über der Menge M . Eine zweistellige Relation nennt man auch binäre Relation, und im Folgenden werden wir uns fast nur mit binären Relationen befassen. Eine binäre Relation R ⊆ M × M heißt • reflexiv, wenn für alle a ∈ M gilt: (a, a) ∈ R, • irreflexiv, wenn für alle a ∈ M gilt: (a, a) 6∈ R, • symmetrisch, wenn für alle a, b ∈ M gilt: wenn (a, b) ∈ R, dann (b, a) ∈ R, 10 Kapitel I. Grundlagen • asymmetrisch, wenn für alle a, b ∈ M gilt: wenn (a, b) ∈ R, dann (b, a) 6∈ R, • antisymmetrisch, wenn für alle a, b ∈ M gilt: wenn (a, b) ∈ R und (b, a) ∈ R, dann a = b, • transitiv, wenn für alle a, b, c ∈ M gilt: wenn (a, b) ∈ R und (b, c) ∈ R, dann (a, c) ∈ R. Man schreibt oft abkürzend aRb oder a ∼R b für (a, b) ∈ R und sagt, dass a und b zu einander in Relation stehen. Beispiel. a) Die Relation Rteilt ⊆ N × N, die wir durch Rteilt := {(a, b) : a ist Teiler von b} definieren, ist reflexiv, antisymmetrisch, und transitiv. b) Die Relation Rkleiner ⊆ R × R, die wir durch Rkleiner := {(a, b) : a < b} definieren, ist irreflexiv, asymmetrisch, und transitiv. c) Die Relation Rnix ⊆ Z × Z, die wir durch Rnix := {(1, 1), (1, 2), (2, 1)(1, 3)} definieren, hat keine der gerade definierten Eigenschaften. Relationen, die besondere Eigenschaften haben, haben sich besondere Bezeichnungen verdient. So wird beispielsweise eine irreflexive, symmetrische Relation als Graph bezeichnet, eine reflexive, antisymmetrische und transitive Relation als partielle Ordnung, und eine Relation, die reflexiv, symmetrisch und transitiv ist, nennt man auch Äquivalenzrelation. Definition. Wenn R eine Äquivalenzrelation über M ist und (a, b) ∈ R ist, dann sagt man auch, dass a und b äquivalent sind. Die Menge aller Elemente aus M , die zu a äquivalent sind, und heißt Äquivalenzklasse von a und wird mit [a]R := {b ∈ M : (a, b) ∈ R} bezeichnet. Die Menge der Äquivalenzklassen heißt Quotientenmenge und wird mit M/ ∼R := {[a]R : a ∈ M } bezeichnet. Für eine Quotientenmenge sind sozusagen einander äquivalente Elemente gleich“ und bilden gemeinsam ein einziges Element. ” 3. Relationen und Funktionen 11 Beispiel. Wir definieren die folgende Relation R ⊆ Z × Z: für enthalte R genau die Paare (a, b), bei denen a und b bei Division durch 5 den gleichen Rest lassen. Etwas formaler sagen wir: R = {(a, b) : ∃na , nb ∈ Z ∃r ∈ {0, 1, 2, 3, 4} mit a = 5na + r und b = 5nb + r}. Beispielsweise ist (−4, 11) ∈ R, denn sowohl −4 = (−1) · 5 + 1 und 11 = 2 · 5 + 1 lassen sich als ganzzahliges Vielfaches von 5 plus 1 schreiben. Man überprüft leicht, dass R eine Äquivalenzrelation ist. Die Äquivalenzklasse von 3, beispielswiese, ist gegeben durch [3]R = {. . . , −7, −2, 3, 8, . . . }, und allgemeiner gilt für eine Zahl k∈Z [k]R = {k + 5n : n ∈ Z} = {. . . , k − 10, k − 5, k, k + 5, k + 10, . . . } und damit Z/ ∼R := {[0]R , [1]R , [2]R , [3]R , [4]R } Natürlich hat nicht jede Relation nur endlich viele Äquivalenzklassen. Aber es ist immer wahr, dass zwei Äquivalenzklassen entweder disjunkt oder identisch sind: Satz. Sei R eine Äquivalenzrelation über der Menge M . Dann bilden die Äquivalenzklassen eine Partition von M . Etwas genauer: Für zwei beliebige Elemente a, b ∈ M gilt: [a]R ∩ [b]R 6= ∅ ⇔ [a]R = [b]R ⇔ (a, b) ∈ R. Beweis. Wir bezeichnen die drei obigen Bedingungen mit (i), (ii) und (iii). (i) ⇒ (iii): Sei c ∈ [a]R ∩[b]R . Dann ist (a, c) ∈ R und (b, c) ∈ R, wegen Symmetrie also auch (c, b) ∈ R, und daher wegen Transitivität (a, b) ∈ R. (iii) ⇒ (ii): Sei c ∈ M ein beliebiges Element mit c ∈ [a]R , d.h. (a, c) ∈ R. Wegen (iii) und Symmetrie gilt, dass (b, a) ∈ R, also durch Transitivität auch (b, c) ∈ R, also c ∈ [b]R . Damit ist [a]R ⊆ [b]R gezeigt, die umgekehrte Inklusion geht komplett analog. (ii) ⇒ (i): klar, denn wegen der Reflexivität gilt (a, a) ∈ R und somit a ∈ [a]R = [b]R . Mit Hilfe von Relationen können wir nun noch Funktionen einführen. Definition. Sei f ⊆ A × B eine binäre Relation mit der Eigenschaft, dass jedem Element a ∈ A durch f genau ein Element b ∈ B zugeordnet wird, d.h. dass ∀a ∈ A : |{b ∈ B : (a, b) ∈ f }| = 1 gilt. In diesem Fall nennt man f eine Abbildung oder Funktion. Sei f nun eine Funktion. Um den Zuordnungscharakter auszudrücken schreibt man auch f : A → B und f : a 7→ b und nennt zu jedem a ∈ A das eindeutige Element f (a) := b ∈ B mit (a, b) ∈ f 12 Kapitel I. Grundlagen das Bild von a unter f . Das Urbild von b ∈ B ist definiert als f −1 (b) := {a ∈ A : f (a) = b} ⊆ A und muss nicht notwendigerweise aus genau einem Element bestehen (kann übrigens auch leer sein). Analog definiert man auch Bild bzw. Urbild einer Menge X ⊆ A bzw. Y ⊆ B durch [ [ f (X) := {f (a)} ⊆ B und f −1 (Y ) := f −1 (b) ⊆ A. a∈X b∈Y Eine Funktion f : A → B heißt • injektiv, wenn für alle b ∈ B gilt: |f −1 (b)| ≤ 1, • surjektiv, wenn für alle b ∈ B gilt: |f −1 (b)| ≥ 1, • bijektiv, wenn für alle b ∈ B gilt: |f −1 (b)| = 1. Beispiel. Sei R≥0 := {x ∈ R : x ≥ 0}. Die Funktion f1 : R → R mit f1 : x 7→ x2 ist weder injektiv noch surjektiv, f2 : R≥0 → R mit f2 : x 7→ x2 ist injektiv, aber nicht surjektiv, f3 : R → R≥0 mit f3 : x 7→ x2 ist nicht injektiv, aber surjektiv, f4 : R≥0 → R≥0 mit f4 : x 7→ x2 ist injektiv und surjektiv. Lemma 3.1. Es seien A und B nicht-leere, endliche Mengen und f : A → B eine Funktion. Dann gilt: a) Wenn f bijektiv, dann |A| = |B|. b) Wenn |A| = |B|, dann gilt: f injektiv ⇔ f surjektiv ⇔ f bijektiv. Beweis. S a) Es gilt immer, dass A = b∈B f −1 (b). Da für b 6= b0 die Mengen f −1 (b) und f −1 (b0 ) disjunkt sind, haben wir X |A| = |f −1 (b)|. (3.5) b∈B −1 Wegen der Bijektivität ist |f (b)| = 1 für alle b ∈ B, und daraus folgt |A| = |B|. b) Zu zeigen ist, dass unter der Voraussetzung |A| = |B| aus Injektivität oder aus Surjektivität bereits Bijektivität folgt. Wir betrachten wieder die Gleichung (3.5): X |B| = |A| = |f −1 (b)|, (3.6) b∈B im Durchschnitt sind also die Summanden gleich 1. Wenn f injektiv ist, dann sind nach Definition alle Summanden höchstens 1, und damit wegen (3.6) auch genau 1, also ist f bijektiv. Und analog gilt: Wenn f surjektiv ist, dann sind nach Definition alle Summanden mindestens 1, und damit wegen (3.6) auch genau 1, also ist f wiederum bijektiv. 3. Relationen und Funktionen 13 Ausblick 1: Im nächsten Kapitel werden wir diese einfache Proposition manchmal benutzen und die Kardinalität einer Menge A dadurch bestimmen, dass wir eine Bijektion in eine Menge B angeben, deren Kardinalität wir schon kennen oder einfach berechnen können. Ausblick 2: Im Unendlichen sehen die Dinge etwas anders aus. Es gibt beispielsweise Bijektionen f : N → Z (z. Bsp. n 7→ (−1)n bn/2c) oder f : N → Q. Mengen M für die es eine surjektive Funktion f : N → M gilt, heißen abzählbar. Gibt es eine Bijektion f : N → R? Übungsaufgaben 1. Zeigen Sie: Wenn R eine asymmetrische binäre Relation auf M ist, dann ist M auch antisymmetrisch. 2. Zeigen Sie: Sei R eine binäre Relation über M und (a, a) ∈ R. Dann kann R nicht asymmetrisch sein. Literaturhinweise zu Kapitel I Weiteres Material zu Mengen, Mengenoperationen, Relationen und vollständiger Induktion findet sich beispielsweise bei [MN] in Kapitel 1.2 bis 1.6 oder bei [S] in Kapitel 0.1 bis 0.3. 14 Kapitel I. Grundlagen Kapitel II Zählen 4 Elementares Zählen Wir versammeln (und benennen) hier fünf einfache Zählprinzipien, von denen die meisten so offensichtlich sind, das sie keinen Beweis benötigen. Summenregel. Wenn M1 , . . . , Mk endliche Mengen sind, und · · wenn M = M1 ∪ . . . ∪ Mk , dann |M | = |M1 | + · · · + |Mk | = k X |Mi |. (4.1) i=1 Hierbei ist es natürlich essentiell, dass die Mengen Mi paarweise disjunkt sind, andernfalls würden gemeinsame Elemente mehrfach gezählt - ist das der Fall, dann muss man die Formel für Inklusion-Exklusion (siehe Satz 4.1) benutzen. Die Summenformel haben wir schon mehrfach (heimlich) benutzt, so zum Beispiel in der Herleitung von (3.5). Produktregel. Wenn M1 , . . . , Mk endliche Mengen sind, und wenn M = M1 × · · · × Mk , dann |M | = |M1 | · · · · · |Mk | = k Y |Mi |. (4.2) i=1 Anders als bei der Summenregel müssen die Mengen Mi hier nicht disjunkt sein. Stattdessen ist es bei der Produktregel wichtig, dass die Entscheidungen welches Element wähle ich aus Mi ?“ unabhängig voneinander sind: die Tatsache, ” dass ich mich für xi ∈ Mi entschieden habe, darf mich nicht bei der Wahl des xj ∈ Mj für j 6= i einschränken. Ein Beispiel: Beispiel. Wir ermitteln die Kardinalität der Menge M von Autokennzeichen der Form K−XY abcd“, wobei K fixiert ist, X, Y Buchstaben aus einem 26-elementigen ” Alphabet und a, b, c, d Ziffern von 0 bis 9 sind, also M = {K}×{A, . . . , Z}×{A, . . . , Z}×{0, . . . , 9}×{0, . . . , 9}×{0, . . . , 9}×{0, . . . , 9}. 16 Kapitel II. Zählen Dementsprechend gibt es |M | = 1·262 ·104 = 6.760.000 verschiedene Kennzeichen. Zählen durch Bijektion. Wenn A und B zwei endliche Mengen, und wenn f : A → B eine Bijektion ist, dann |A| = |B|. (4.3) Diese Aussage haben wir bereits in Lemma 3.1 a) bewiesen. Hier geben wir ein kleines Anwendungsbeispiel: Beispiel. Es sei M := {m1 , . . . , mn } eine Menge mit n ∈ N0 Elementen. Wir suchen nach einem Bijektionsbeweis dafür, dass |P(M )| = 2n ist (was wir ja auf Seite ?? bereits durch Induktion bewiesen haben). Dazu betrachten wir die folgende Funktion f : P(M ) → {0, 1}n , die jeder Teilmenge S ⊆ M = {m1 , . . . , mn } ein n-Tupel (x1 , . . . , xn ) wie folgt zuordnet: ( 0 wenn mi 6∈ S f (S) := (x1 , . . . , xn ) mit xi := für alle i ∈ [n]. 1 wenn mi ∈ S Beispielsweise gilt für M := {2, 3, 5} und S := {2, 5}, dass f (S) = (1, 0, 1). Das n-Tupel f (S) nennt man auch charakteristischen Vektor von S. Man überprüft leicht, dass f eine Bijektion ist. Damit folgt (4.3) (4.2) |P(M )| = |{0, 1}n | = |{0, 1}|n = 2n . Die folgende Aussage betrachtet eine binäre Relation R ⊆ A × B und zählt die Elemente in R einmal von A aus gesehen und einmal von B aus gesehen. Doppeltes Abzählen. Es sei R ⊆ A × B eine binäre Relation. Dann gilt X X |{b ∈ B : (a, b) ∈ R}| = |R| = |{a ∈ A : (a, b) ∈ R}|. a∈A (4.4) b∈B Diese Regel ergibt sich natürlich sofort aus der Summenregel, wenn man sie auf die Partition · [ a∈A {(a, b) ∈ R : b ∈ B} = R = · [ b∈B {(a, b) ∈ R : a ∈ A}. anwendet. Trotzdem ist es nützlich, sie für spätere Anwendungen in Form von (4.4) zu konservieren. Wir wollen dies gleich an den zwei folgenden Beispielen ausprobieren. Beispiel. Wir betrachten eine Menge G von Gartenzäunen, die eine Menge B von Blumenbeeten erzeugt. Die Gartenzäune sind Strecken in der Ebene, die sich nicht überkreuzen dürfen, und ein Blumenbeet ist ein Gebiet, das vollständig von Gartenzäunen begrenzt ist - siehe Abbildung ??. Wir behaupten: 32 |G| ≥ |B|. 4. Elementares Zählen 17 Bild Dazu betrachten wir die Relation R ⊆ G × B, die durch R := {(g, b) : g begrenzt b} definiert ist. Offensichtlich kann jeder Gartenzaun höchstens zwei Blumenbeete begrenzen, und jedes Blumenbeet braucht mindetens drei begrenzende Gartenzäune. Mit anderen Worten: ∀g ∈ G : |{b ∈ B : (g, b) ∈ R}| ≤ 2 und ∀b ∈ B : |{g ∈ G : (g, b) ∈ R}| ≥ 3. Damit ergibt sich X (4.4) X 2|G| ≥ |{b ∈ B : (g, b) ∈ R}| = |{g ∈ G : (g, b) ∈ R}| ≥ 3|B|, g∈G b∈B was zu zeigen war. Obige Abschätzung werden wir später in Abschnitt ?? noch benutzen. Hier ist noch ein weiteres Bespiel für die Verwendung des doppelten Abzählens, das wir [A] entliehen haben. Beispiel. Wir definieren eine Relation R ⊆ [n] × [n] durch (i, j) ∈ R genau dann, wenn i ein Teiler von j ist. Außerdem sei t(j) die Anzahl von Teilern von j, und t̄(n) die durchschnittliche Anzahl von Teilern, also: n t(j) := |{i ∈ [n] : (i, j) ∈ R}| und t̄(n) := 1X t(j). n j=1 Die Funktion t(j) scheint sehr ungleichmäßig zu sein, und entsprechend sieht es nicht ganz leicht aus, t̄(n) zu bestimmen. Setzen wir hingegen s(i) := |{j ∈ [n] : (i, j) ∈ R}|, dann zählen wir damit zu gegebenem i die Zahlen aus [n], die i als Teiler enthalten, also die Vielfachen von i, und davon gibt es genau bn/ic viele. Somit gilt: t̄(n) = = n n n n n 1X 1X (4.4) 1 X t(j) = |{i ∈ [n] : (i, j) ∈ R}| = |{j ∈ [n] : (i, j) ∈ R}| n j=1 n j=1 n i=1 1X 1X s(i) = bn/ic. n i=1 n i=1 (4.5) Wir versuchen jetzt, die Abrundungsklammern b.c los zu werden: es gilt, dass (n/i) − 1 < bn/ic ≤ n/i, und daher folgt aus (4.5), dass n n n n n X X 1X 1X 1X (n/i) −1 = ((n/i)−1) < t̄(n) ≤ (n/i) = (1/i) (1/i) −1 = n i=1 n i=1 n i=1 i=1 i=1 (4.6) 18 Kapitel II. Zählen Pn Die Summe i=1 (1/i) wird auch als n-te harmonische Zahl bezeichnet, und man kann mit elementaren Mitteln zeigen, dass ln(n) + 1 − ln(2) ≤ n X (1/i) ≤ ln(n) + 1. (4.7) i=1 Kombiniert man nun (4.6) und (4.7), dann ergibt sich ln(n) − ln(2) ≤ t̄(n) ≤ ln(n) + 1 Inklusion–Exklusion. Wir haben bereits die Summenregel kennengelernt, deren Anwendung aber voraussetzt, dass die beteiligten Mengen paarweise disjunkt sein müssen. Ist diese Voraussetzung nicht gegeben, müssen wir genauer rechnen“. Für ” den Spezialfall von zwei Mengen gilt beispielsweise offensichtlich, dass |M1 ∪M2 | = |M1 |+|M2 |−|M1 ∩M2 |, weil wir die Elemente in der Schnittmenge doppelt gezählt haben und daher wieder abziehen müssen. Für drei Mengen gilt |M1 ∪ M2 ∪ M3 | = |M1 | + |M2 | + |M3 | −|M1 ∩ M2 | − |M1 ∩ M3 | − |M2 ∩ M3 | +|M1 ∩ M2 ∩ M3 |, (4.8) weil wir die Elemente im Schnitt aller drei Mengen erst dreimal gezählt haben, dann wieder dreimal abgezogen haben, also noch einmal hinzuzählen müssen. Bild Im Allgemeinen gilt die folgende Formel: Satz 4.1. Für endliche Mengen M1 , . . . , Mn gilt: | n [ i=1 Mi | = n X r=1 (−1)r−1 X | r \ M ij | . (4.9) 1≤i1 <···<ir ≤n j=1 Die innere Summe läuft dabei über alle r-Tupel (i1 , . . . , ir ) mit 1 ≤ i1 < · · · < ir ≤ n und legt damit fest, über welche Mij die Schnittmenge gebildet werden soll. Der Beweis lässt sich zum Beispiel durch vollständige Induktion über n führen, ist wegen des involvierten Indexgeschachers aber etwas aufwändig (wenn auch nicht schwierig) und wird daher zunächst vertagt. Statt dessen überprüfen wir kurz, dass im Fall n = 3 die drei Summanden für r = 1, 2, 3 der rechten Seite 5. Teilmengen und Partitionen zählen 19 von (4.9) mit den Summanden aus (4.8) übereinstimmen (−1)1−1 X | 1 \ 1≤i1 ≤3 j=1 (−1)2−1 X | 2 \ 1≤i1 <i2 ≤3 j=1 (−1)3−1 X | 3 \ M ij | = X |Mi1 | 1≤i1 ≤3 X M ij | = − |Mi1 ∩ Mi2 | 1≤i1 <i2 ≤3 Mij | = |M1 ∩ M2 ∩ M3 |. 1≤i1 <i2 <i3 ≤3 j=1 5 Teilmengen und Partitionen zählen Wir wollen in diesem Abschnitt zählen, auf wieviele verschiedene Weisen man aus einer Menge eine Teilmenge auswählen kann. Ein einfaches Beispiel für diese Aufgabenstellung ist das Ziehen von k Lotto-Zahlen aus einer Menge von n verschiedenen möglichen Zahlen ( 6 aus 49“). Dabei müssen wir festlegen, ob es ” auf die Reihenfolge ankommt, und ob Zahlen, nachdem sie gezogen wurden, noch einmal gezogen werden können (Auswahl mit oder ohne Zurücklegen). Alle diese Fälle werden in den zwei folgenden Sätzen behandelt. Satz 5.1. Seien n, k ∈ N0 und M eine Menge mit |M | = n. a) Geordnet, mit Zurücklegen: Für die Menge M k = {(c1 , . . . , ck ) : ci ∈ M ∀i ∈ [k]} gilt, dass |M k | = nk . b) Geordnet, ohne Zurücklegen: Für die Menge M k := {(c1 , . . . , ck ) : ci ∈ M ∀i ∈ [k], ci 6= cj ∀i 6= j ∈ [k]} gilt: |M k | = n · (n − 1) · . . . · (n − k + 1) =: nk Die Funktion x 7→ xk für x ∈ R und k ∈ N0 nennt man auch fallende Faktorielle. Die Spezialfälle lauten: x0 = 1 für alle x ∈ R und nn = n · (n − 1) · · · · · 1 =: n!, nennt man Fakultät. Insbesondere zählt n! die Anzahl von möglichen Reihenfolgen von n verschiedenen Elementen. c) Ungeordnet, ohne Zurücklegen: Für die Menge M = {{c1 , . . . , ck } : ci ∈ M ∀i ∈ [k], ci 6= cj ∀i 6= j ∈ [k]} k gilt: k M = n =: n . k k! k 20 Kapitel II. Zählen Beweis. Die Aussage in a) folgt direkt aus der Produktregel. Auch die für b) behauptete Kardinalitätsaussage ist intuitiv einsichtig, denn für die Auswahl von c1 haben wir n Möglichkeiten, für die von c2 dann n − 1 Möglichkeiten, usw. Allerdings lässt sich dieser Ansatz nicht unmittelbar mit der Produktregel formalisieren, denn die Menge, aus der wir das Element c2 auswählen, ist eben abhängig von dem Element c1 . Für einen formalen Beweis der Aussage in b) verweisen wir daher auf Aufgabe 1. Um die Formel in Aussage c) zu beweisen, wählen wir zunächst ein k-Tupel aus M k und machen daraus eine k-elementige Teilmenge, im dem wir die Reihenfolge der wir eine Funktion f : k Elemente ”vergessen“. Formal betrachten k Mk → M , die einem k-Tupel (c , . . . , c ) ∈ M die zugrundeliegende Menge 1 k k M {c1 , . . . , ck } ∈ k zuordnet. Es gilt: X k M k −1 k! n = M = |f (T )| = k T ∈(M k) und daraus folgt die behauptete Formel. Es fehlt nun noch der Fall, bei dem wir ungeordnete Elemente eventuell mehrfach auswählen. Offensichtlich können wir das daher weder durch ein k-Tupel noch durch eine Teilmenge modellieren, sondern wir benötigen einen neuen ObjektTyp, und zwar den der Muttimenge. Dazu zunächst ein kleines Beispiel: Sei M := {a, b, c, d, e}. Die Multimenge T := {c, a, b, a, c, c, e} soll beispielsweise mit der Multimenge {a, a, b, c, c, c, e} identisch sein soll, weil die Reihenfolge der Elemente irrelevant ist, sich aber von der Multimenge {a, b, c, e} unterscheiden, weil es darauf ankommt, wie oft ein Element aus M in T enthalten ist. Formal definieren wir eine Multimenge durch Angabe der Grundmenge M und eine Funktion ϕ, die zu jedem Element aus M aussagt, wie oft es in der Multimenge enthalten sein soll, also ϕ(a) = 2, ϕ(b) = 1, ϕ(c) = 3, ϕ(d) = 0 und ϕ(e) = P1 in obigem Beispiel. Die Kardinalität der Multimenge ist dann gegeben durch m∈M ϕ(m). Satz 5.2 (Ungeordnet, mit Zurücklegen). Seien n, k ∈ N0 und M eine Menge mit |M | = n. Für die Menge der k-elementigen Multimengen über M , bezeichnet mit ( ) X M := (M, ϕ) : ϕ : M → N0 mit ϕ(m) = k , k m∈M gilt, dass M = n + k − 1 =: n . k k k 5. Teilmengen und Partitionen zählen 21 Beweis. Um die Kardinalität von M k zu bestimmen, kodieren wir die Multimen M gen in k wie folgt. Sei Y die Menge aller Folgen der Länge n + k − 1, die genau k mal Die Abbildung das Zeichen ∗ und genau n − 1 mal das Zeichen |Mverwenden. f: M → Y ordnet einer Multimenge T = (M, φ) ∈ die Folge k k ∗ . · · · ∗} | |∗ . . {z . · · · ∗} | . . . . . . | |∗ . . {z . · · · ∗} | . . {z ϕ(m1 )mal ϕ(m2 )mal ϕ(mn )mal aus Y zu. Die Multimenge {a, a, b, c, c, c, e} beispielsweise wird also durch f auf das Wort ∗ ∗ | ∗ | ∗ ∗ ∗ ||∗ abgebildet. Man kann leicht überprüfen, dass f eine Bijektion ist. Wir können uns also dank des Zählens durch Bijektion darauf zurückziehen, die Anzahl der Elemente in Y zu bestimmen, und das ist einfach: wir wählen (ungeordnet, ohne Zurücklegen) die k Positionen für die ∗ Zeichen aus den n+k−1 Positionen in der Folge aus. Dafür gibt es gemäß c) genau n+k−1 Möglichkeiten. k Somit gilt: M (4.3) = |Y | = n + k − 1 . k k Dazu noch ein paar Bemerkungen. Wenn M eine M Menge und n eine Zahl ist, M k k dann bezeichnen die Ausdrücke M , M , und k k also Mengen, während die Ausdrücke nk , nk , nk und nk Zahlen darstellen. In den Fällen b) und c) muss zwingend k ≤ n sein, bei a) und d) ist das nicht notwendig. Wir listen einige nützliche Eigenschaften dieser Zählfunktionen auf. Lemma 5.3. Es seien m, n, k ∈ N0 mit k ≤ n und k ≤ m. Ferner seien x, y ∈ R. Dann gelten: n! a) nk = k!(n−k)! . n n b) k = n−k . n−1 c) n−1 = nk für n, k ≥ 1. k−1 + k Pn d) (x + y)n = i=0 ni xi y n−i . Pn e) 2n = i=0 ni . f ) xn+k = xn (x − n)k . Pn g) (x + y)n = i=0 ni xi y n−i . m Pn h) i=0 ni k−i = n+m . k Beweis. Die Aussagen a),b),c) und f) folgen unmittelbar aus den Definitionen. Aussagen d) und f) kann man leicht mit Induktion über n beweisen. Aussage e) folgt mit x := 1 und y := 1 aus d). Alternativ kann man hier auch wie folgt argumentieren: Die linke Seite der Gleichung beschreibt die Anzahl der Teilmengen 22 Kapitel II. Zählen einer n-elementigen Menge (siehe (2.3)). Und auch die rechte Seite der Gleichung zählt die Anzahl dieser Teilmengen, allerdings sortiert nach der Größe (also i) der Teilmengen. Ein solches Argument nennt man auch kombinatorischen Beweis für eine numerische Formel. Für die Aussage h) geben wir auch einen kombinatorischen Beweis an: Die rechte Seite der Gleichung zählt (zum Beispiel) die k-elementigen Teilmengen einer Menge, die sich aus n Frauen und m Männern zusammensetzt. Und die linke Seite tut das auch, und zwar sortiert nach der Anzahl i von Frauen in der k-elementigen Teilmenge. Formal aufschreiben könnte man das zum Beispiel so: es seien N und M Mengen mit N ∩ M = ∅ und |N | = n und |M | = m. Dann ist · · M N ∪M N N M × → ∪ ... ∪ f: × 0 k k 0 k m M mit f : (S, T ) 7→ S ∪ T eine Bijektion, und da | Ni × k−i | = ni k−i ist, ergibt sich mit der Summenregel die Formel in Aussage h). Wir gehen nun dazu über, Partitionen zu zählen. Definition. Es seien k, n ∈ N0 und M eine Menge mit |M | = n. Eine k-Partition der Menge M ist eine Zerlegung von M in k disjunkte, nicht-leere Mengen: M = · · M1 ∪ . . . ∪ Mk . Die Anzahl von k-Partitionen einer n-elementigen Menge wird mit Sn,k bezeichnet (und heißt Stirling-Zahl zweiter Art1 ). Man setzt S0,0 := 1. Ein Beispiel: Die Menge M = {1, 2, 3} hat drei 2-Partitionen, nämlich · · · M = {1, 2} ∪ {3} = {1, 3} ∪ {2} = {2, 3} ∪ {1}. Satz 5.4. Es seien k, n ∈ N0 . a) Für k > n gilt: Sn,k = 0. b) Für n ≥ 1 gilt: Sn,0 = 0. c) Für 1 ≤ k ≤ n gilt: Sn,k = Sn−1,k−1 + k · Sn−1,k . Beweis. Die Aussagen a) und b) sind offensichtlich. Um c) zu beweisen, betrachten wir eine Menge M = {m1 , . . . , mn } deren k-Partitionen wir zählen möchten. Wir zählen zunächst nur diejenigen k-Partitionen, in denen eine Partitionsklasse aus genau dem Element mn besteht. Davon gibt es genau Sn−1,k−1 viele, denn die Möglichkeiten erschöpfen sich jetzt darin, die Elemente m1 , . . . , mn−1 in k − 1 Partitionsklassen zu gruppieren. Für alle anderen Partitionen gilt, dass das Element mn nicht alleine in einer Partitionsklasse liegt. Wir verteilen also zunächst alle Elemente m1 , . . . , mn−1 auf k Partitionsklassen, und wählen dann aus, zu welcher Klasse wir das Element mn dazu stecken. Dafür gibt es insgesamt k · Sn−1,k Möglichkeiten. Somit folgt die Behauptung aus der Summenregel. 1 Stirling-Zahlen erster Art werden mit s n,k bezeichnet und zählen Permutationen der Menge [n] mit k Zyklen. 5. Teilmengen und Partitionen zählen 23 Mit Hilfe der obigen Rekursion lässt sich auch eine Formel für Sn,k beweisen: Satz 5.5. Für 1 ≤ k ≤ n gilt: Sn,k = k X r=0 (−1)r (k − r)n . r!(k − r)! Beweis. Diese Aussage lässt sich entweder durch Induktion beweisen, oder alternativ auch durch einen kombinatorischen Beweis (siehe Aufgabe 2) herleiten. Eine Partition einer Menge induziert natürlich automatisch auch eine Zerlegung ihrer Kardinalität in positive Summanden – und auch hier wollen wir untersuchen, wieviele mögliche Kombinationen es gibt. Definition. Es seien wieder k, n ∈ N0 . Eine k-Partition der Zahl n ist eine Zerlegung von n in k Summanden: n = n1 + · · · + nk mit ni ∈ N für alle i ∈ [k]. Bei einer geordneten Partition kommt es auf die Reihenfolge der Summanden an, bei einer ungeordneten nicht. Die Anzahl von ungeordneten k-Partitionen der Zahl n wird mit Pn,k bezeichnet, man setzt P0,0 := 1. Ein Beispiel: n = 4 und k = 2. Dann gibt es zwei ungeordnete 2-Partitionen von 4, nämlich 4 = 1 + 3 = 2 + 2, aber drei geordnete 2-Partitionen, nämlich 4 = 1 + 3 = 3 + 1 = 2 + 2. Satz 5.6. Es seien k, n ∈ N0 . a) Für k > n gilt: Pn,k = 0. b) Für n ≥ 1 gilt: Pn,0 = 0. Pk−1 c) Für 1 ≤ k ≤ n gilt: Pn+k,k = i=0 Pn,k−1 . d) Für 1 ≤ k ≤ n gilt: Es gibt genau n−1 k−1 geordnete k-Partitionen der Zahl n. Beweis. Die Aussagen a) und b) sind wieder offensichtlich. Um c) zu beweisen wollen wir jeden Summanden in einer Partition, der gleich 1 ist, einen Einser“ nennen. Eine k-Partition der Zahl n + k kann offensichtlich ” zwischen 0 und k − 1 viele Einser haben. Wir behaupten, dass die Anzahl der k-Partitionen der Zahl n + k mit genau i Einsern Pn,k−i beträgt, woraus die Aussage c) folgen würde. Dazu geben wir eine Bijektion von der Menge der k-Partitionen der Zahl n + k mit genau i Einsern in die Menge der (k − i)-Partitionen der Zahl n wie folgt an: Schreibe zunächst n + k = 1 + 1 + · · · + 1 + ni+1 + ni+2 + · · · + nk . {z } | | {z } i Einsen k−i Summanden ≥ 2 Setze dann n0i+1 := ni+1 − 1, n0i+2 := ni+2 − 1, ..., n0k := nk − 1. Dann ist n0i+1 + · · · + n0k = n + k − i − (k − i) = n, und also stellen die n0i+1 , . . . , n0k eine (k − i)-Partition der Zahl n dar. Diese Abbildung ist bijektiv, denn man 24 Kapitel II. Zählen kommt umgekehrt von jeder (k − i)-Partition der Zahl n durch Addition von 1 zu jedem Summanden und Hinzufügen von i Einsern wieder zurück zu genau einer k-Partition der Zahl n + k mit genau i Einsern. Der Beweis von d) ist noch einfacher. Wir schreiben n = 1 + 1 + 1 + · · · + 1 als Summe von n Einsen, und entsprechend mit genau n − 1 Pluszeichen. Eine geordnete k-Partition der Zahl n entspricht jetzt einfach einer Auswahl von k − 1 Pluszeichen (ungeordnet, ohne Zurücklegen – dafür gibt es n−1 Möglichkeiten), k−1 und an diesen Pluszeichen beginnt“ dann der nächste Summand: ” n = 1 + ··· + 1⊕1 + ··· + 1⊕··· ⊕ 1 + ··· + 1. | {z } | {z } | {z } =n1 =n2 =nk Anfang VL 28.11.07 Partitionen von Mengen und Zahlen kann man sich gut visualisieren, wenn man sich vorstellt, dass eine Menge von Bällen auf Körbe zu verteilen sind. Folgerung. Wir werfen n Bälle in k Körbe. Wieviele Verteilungsmöglichkeiten gibt es? Jeder Ball wird genau einmal geworfen. Trotzdem müssen wir erstens unterscheiden, ob die Bälle und die Körbe unterscheidbar sind. Außerdem wollen wir noch spezifizieren, ob es weitere Bedingungen gibt, nämlich ob die Verteilung der Bälle beliebig, oder injektiv (d.h. höchstens ein Ball pro Korb), oder surjektiv (d.h. mindestens ein Ball pro Korb), oder bijektiv ist. Dann ist die Anzahl der möglichen Verteilungen gegeben durch: n Bälle, k Körbe beliebig a) Bälle unt.bar, Körbe unt.bar b) Bälle nicht unt.bar, Körbe unt.bar k n n+k−1 c) Bälle unt.bar, Körbe nicht unt.bar d) Bälle nicht unt.bar, Körbe nicht unt.bar Pk i=1 i=1 k n k surj. bij. k!Sn,k n−1 n! n k−1 1 Sn,i 1 Sn,k 1 Pn,i 1 Pn,k 1 n Pk inj. (Hierbei ist natürlich klar, dass für injektive Verteilungen notwendigerweise n ≤ k gelten muss, für surjektive n ≥ k, und für bijektive n = k; andernfalls gibt es überhaupt keine solche Verteilung.) Beweis. a) In diesem Fall zählen wir eigentlich Funktionen f : [n] → [k]. Also gibt es offensichtlich k n beliebige Funktionen, und k n injektive. Um die surjektiven zu zählen, machen wir uns klar, dass die Urbilder f −1 (y) für y = 1, . . . , k die Menge [n] in k Mengen partitionieren. Von diesen Partitionen gibt es gemäß Definition 5 genau Sn,k viele. Nun können wir noch für jede Partitionsklasse aussuchen, auf welches y ∈ [k] sie abgebildet wird, dafür gibt es k! Möglichkeiten. Für bijektive Zuordnungen gibt es genau n! verschiedene Möglichkeiten. 6. Erzeugende Funktionen 25 b) Da die Bälle nicht unterscheidbar, die Körbe aber unterscheidbar sind, zählen wir in diesem Fall eigentlich so etwas wie Wahlausgänge. Einen beliebige Ballverteilung können wir uns als Auflistung der getroffenen Korbnummern vorstellen, also etwa {1, . . . , 1, 2, . . . , 2, . . . , k, . . . , k} und das ist dann genau eine n-elementige Multimenge über der Menge [k], wovon es gemäß Satz 5.2 genau n+k−1 gibt. n Wenn wir injektive Ballverteilungen zählen, dann wird jeder Korb entweder gar nicht oder einmal getroffen, und daher besteht unsere Freiheit genau darin, die n Körbe auszuwählen, die getroffen werden sollen – dafür gibt es nk Möglichkeiten. Eine surjektive Ballverteilung entspricht einer geordneten Zerlegung der Zahl n in k Summanden, und davon gibt es gemäß Satz 5.6d) genau n−1 k−1 viele. Es gibt nur eine bijektive Zuordnung, nämlich in jeden Korb einen Ball. c) Da jetzt die Körbe nicht mehr unterscheidbar sind, zählen wir in diesem Fall die Partitionen der Menge der n Bälle. Gemäß Definition 5 zählt Sn,i genau Pk die Anzahl solcher Partitionen in i nicht–leere Körbe. Entsprechend ist i=1 Sn,i die Gesamtanzahl der Partitionen. Da die Körbe nicht unterscheidbar sind, gibt es nur eine injektive Verteilung, nämlich je ein Ball in n (beliebige) der k Körbe. Die Anzahl der surjektiven Ballverteilungen beträgt Sn,k , wie schon aus unserer Diskussion im vorangegangenen Absatz folgt. Bijektive Zuordnungen gibt es nur genau eine. d) Im Unterschied zu c) sind jetzt auch die Bälle nicht mehr unterscheidbar, das heißt, wir zählen jetzt Partitionen der Zahl n der Bälle. Entsprechend übertragen sich alle Ergebnisse von Fall c), wenn wir Sn,i durch Pn,i ersetzen. 6 Erzeugende Funktionen Angenommen, wir kennen die ersten Werte einer Folge von Zahlen, und außerdem eine Rekursionsvorschrift, die besagt, wie sich spätere Folgengliedern aus früheren berechnen. Unser Ziel in diesem Abschnitt ist es, ein Verfahren kennenzulernen, mit dem wir dann eine explizite Formel für das n-te Folgenglied herleiten können. Wir wollen dies zunächst an einem einfachen Beispiel tun, ohne uns viele Gedanken darüber zu machen, was wir dort eigentlich machen, wieso wir es dürfen, und warum es funktioniert. Anschließend werden wir dann den theoretischen Unterbau nachliefern, und ihn an weiteren Beispielen testen. Beispiel. Die Folge a0 , a1 , a2 , . . . sei gegeben durch den Startwert a0 := 2 und die Rekursion an := 3an−1 + 1 für alle n ∈ N. Wir suchen eine explizite Formel für an . Dazu entwickeln wir eine Methode, die aus sechs Schritten besteht. Schritt 1: Potenzreihe aufstellen. P∞ Wir definieren A(x) := n=0 an xn . 26 Kapitel II. Zählen Schritt 2: Setze Anfangswerte und Rekursion in die Potenzreihe ein. A(x) = a0 + ∞ X an xn = 2 + n=1 ∞ X (3an−1 + 1)xn n=1 Schritt 3: Ersetze die auftretenden an unter Verwendung von A(x). A(x) = 1 + 3x = 1 + 3x ∞ X n=1 ∞ X an−1 xn−1 + 1 + ∞ X xn n=1 an xn + n=0 ∞ X xn n=0 1 . 1 + 3xA(x) + 1−x = Bei der letzten Umformung haben wir die Summenformel für die geometrische Reihe benutzt: ∞ X qn = n=0 1 1−q für alle q ∈ R mit 0 ≤ q < 1. (6.10) Schritt 4: Nach A(x) auflösen. A(x) − 3xA(x) ⇒ A(x) 1 1−x = 1+ = 1 1 + . 1 − 3x (1 − x)(1 − 3x) Schritt 5: Stelle die gebrochen rationale Funktion als Potenzreihe dar. Dazu finden wir zunächst eine Partialbruchzerlegung für den zweiten Bruch: 1 (1 − x)(1 − 3x) = 3 − 21 2 + . 1 − x 1 − 3x wie man durch Mulitiplikation beider Seiten mit (1 − x)(1 − 3x) schnell verifiziert. Damit haben wir gezeigt, dass A(x) = (6.10) = 3 − 21 5 1 1 1 1 2 + + = − 1 − 3x 1 − x 1 − 3x 2 1 − 3x 2 1 − x ∞ ∞ ∞ X 5X 1X n 5 1 n n n (3x) − x = (3x) − x 2 n=0 2 n=0 2 2 n=0 Schritt 6: Koeffizientenvergleich. Wir haben gezeigt, dass ∞ X n=0 an x n ∞ X 1 = A(x) = (5 · 3n − 1)xn 2 n=0 6. Erzeugende Funktionen 27 für unendlich viele Werte von x ∈ R gilt, und damit ergibt sich (wir müssen später noch thematisieren, warum), dass die Koeffizienten links und rechts alle übereinstimmen müssen: für alle n ∈ N0 gilt: an = 1 (5 · 3n − 1), 2 womit die gewünschte Formel für an gefunden wäre. Nicht ganz überraschenderweise stimmt sie tatsächlich mit der Formel überein, die wir für genau dieses Beispiel in Abschnitt 2 (siehe Gleichung (2.2)) erst geraten und dann durch vollständige Induktion bewiesen haben. Das Bemerkenswerte an der hier vorgestellten Methode ist, dass man mit ihrer Hilfe eine solche Formel, ohne sie zu raten, herleiten kann. Mehrere Stellen in dem obigen Kochrezept“ bedürfen noch einer genaueren ” Begründung, beispielsweise die Frage, ob unsere Potenzreihen überhaupt konvergieren, oder warum wir im letzten Schritt auf die Gleichheit der Koeffizienten schließen dürfen. Dazu stellen wir jetztim Folgenden den formalen Rahmen bereit, der sich an einigen Stellen auf Hilfsmittel aus der Analysis stützen wird. Definition. Es sei (an )n∈N = a0 , a1 , a2 , . . . eine unendliche Folge von reellen Zahlen. Dann nennt man ∞ X an xn , n=0 eine formale Potenzreihe. Wenn für eine Zahl x ∈ R die Summe vergiert, dann ist die Funktion A:R→R mit A(x) := ∞ X P∞ n=0 an xn kon- an xn n=0 dort wohldefiniert. Wir wollen für das Folgende vereinbaren, dass, wann immer wir A(x) schreiben, wir damit den Grenzwert der Potenzreihe meinen, unter der Voraussetzung, dass sie konvergiert – auch wenn wir diese Voraussetzung nicht jedes Mal explizit nennen. Eine weitere Verabredung: Wann immer wir in der Zukunft bei einer Summe auf die Angabe des Laufindex n und seiner Grenzen verzichten und nur P schreiben, meinen wir die Summe mit Laufindex n mit Grenzen 0 und ∞, also P∞ . n=0 Einer Folge (an ) wird also eine Funktion A(x) zugeordnet. Können zwei verschiedene Folgen die gleiche Funktion generieren? Der folgende Satz, den Sie in der Analysis noch beweisen werden, sagt nein. Satz 6.1. Seien (an )n∈N und (bn )n∈N zwei Folgen und A(x) := X an xn und B(x) := X bn xn . 28 Kapitel II. Zählen Wenn es ein ε > 0 gibt, so dass für alle x ∈ R mit 0 ≤ x ≤ ε gilt, dass A(x) und B(x) sind wohldefiniert und es gilt A(x) = B(x), dann folgt ∀n ∈ N0 : an = bn . Durch diesen Satz ist also klar, dass die Zuordnung Folge“ → Funktion“ ” ” im obigen Sinne injektiv ist und wir daher auch die Umkehrabbildung betrachten können. Wir werden später (siehe 6.4) noch sehen, wie man aus P einer gegebenen Funktion A(x) die Folgenglieder an so berechnet, dass A(x) = n≥0 an xn gilt. Man sagt dann auch, dass A(x) die erzeugende Funktion der Folge (an )n∈N ist. Wir definieren nun die grundlegenden Operationen Addition, Multiplikation, Inversion und Ableitung von formalen Potenzreihen. P P Definition. Es seien an xn und bn xn zwei formale Potenzreihen. P P n n a) P Dien Summe von an x und bn x ist definiert als die formale Potenzreihe cn x mit cn := an + bn für alle n ∈ N0 . P P n n b) P Dasn Produkt von Pn an x und bn x ist definiert als die formale Potenzreihe cn x mit cn := k=0 ak bn−k für alle n ∈ N0 . P P c) Die Potenzreihe bn xn heißt inverse Potenzreihe von an xn , wenn für ihr P Produkt cn xn (das wie in b) definiert ist) gilt: c0 = 1 und cn = 0 für alle n ∈ N. P d) Die Ableitung von an xn ist definiert als die formale Potenzreihe ∞ X nan xn−1 = n=1 ∞ X (n + 1)an+1 xn . n=0 Betrachtet man formale Potenzreihen als Funktionen, dann leisten die obigen Operationen das, was ihre Namen suggerieren. P P Satz 6.2. Es seien A(x) = an xn und B(x) = bn xn für x ∈ R konvergent. P a) Wenn C(x) = cn xn mit cn = an + bn ist, dann gilt C(x) = A(x) + B(x). P Pn b) Wenn C(x) = cn xn mit cn = k=0 ak bn−k ist, dann gilt C(x) = A(x) · B(x). c) Wenn A(x) in xPdifferenzierbar ist und wir die Ableitung mit A0 (x) bezeichnen, ∞ dann gilt A0 (x) = n=0 (n + 1)an+1 xn . Beweis. siehe Analysis. P P Lemma 6.3. an xn hat genau dann eine inverse Potenzreihe bn xn , wenn a0 6= 0 ist. In diesem Fall gilt b0 = 1 a0 und bn = − n 1 X ak bn−k a0 k=1 ∀n ∈ N. 6. Erzeugende Funktionen 29 P P n Beweis. einePbeliebige Potenzreihe und cn xn das P Sein bn xP zunächst P Produkt von an x und bn xn . Wenn bn xn die inverse Potenzreihe von an xn ist, dann folgt aus 1 = c0 und 0 = cn und n X cn = für alle n ∈ N0 , aj bn−k k=0 dass 1 = c0 = a0 b0 und 0 = cn = n X ak bn−k ∀n ∈ N k=0 ⇔ ⇔ 1 = b0 a0 und 1 = b0 a0 und n X ak bn−k ∀n ∈ N n 1 X ak bn−k = bn a0 ∀n ∈ N. 0 = a0 bn + k=1 − k=1 Wenn umgekehrt diese Gleichungen gegeben sind, dann ist inverse Potenzreihe. P bn xn die zu P an xn Beispiel. P a) Sei γ ∈ R beliebig und A(x) := n≥0 an xn mit an := γ n . A(x) ist also die sogenannte geometrische Reihe. Wir wollen die zu A(x) inverse Potenzreihe B(x) bestimmen Pn und wenden dazu Proposition 6.3 an. Dann ist b0 = 1/a0 = 1 und bn = − k=1 ak bn−k , also b1 = −a1 b0 = −γ und b2 = −(a1 b1 + a2 b0 ) = −(−γ 2 + γ 2 ) = 0. Auch für n ≥ 3 folgt dann, dass bn = 0 ist, wie man sich induktiv leicht klar macht: bn = −(a1 bn−1 + a2 bn−2 + · · · + an−2 b2 +an−1 b1 + an b0 ) {z } | =0 weil bn−1 = · · · = b2 = 0 = −(γ n−1 (−γ) + γ n ) = 0. Also P ist B(x) = b0 + b1 x = 1 − γx die inverse Potenzreihe zu A(x), das heißt n n (1 − γx) = 1, also n≥0 γ x X n≥0 γ n xn = 1 . 1 − γx (6.11) P b) Nach a) gilt (mit γ = 1), dass n≥0 xn = (1 − x)−1 . Bildet man auf beiden Seiten die k-fache Ableitung, dann erhält man X k! n(n − 1) · · · · · (n − k + 1)xn−k = (1 − x)k+1 n≥k 30 Kapitel II. Zählen und daraus folgt X n + k X n 1 n x = xn−k = k (1 − x)k+1 k n≥0 (6.12) n≥k für alle k ∈ N, sofern die Summe konvergiert. Der folgende Satz aus der Analysis – über die sogenannte Taylor–Entwicklung – befasst sich nun mit der schon angerissenen Frage, P wie man an einer Funktion A(x) abliest, welche Folge (an )n∈N0 mit A(x) = n≥0 an xn sie erzeugt. Satz 6.4. Sei A : R → R eine Funktion, die in 0 unendlich oft differenzierbar ist, und bezeichne mit A(k) (x) die k-te Ableitung an der Stelle x. Dann gilt: A(x) = X A(n) (0) xn , n! n≥0 vorausgesetzt, die Summe konvergiert. Mit anderen Worten: A(x) ist die erzeugende Funktion für die Folge (an )n∈N0 mit an := A(n) (0)/n!. Satz 6.4 werden Sie in der Analysis–Vorlesung beweisen. Beispiel. Wir hatten in Proposition 5.3 d) bereits gesehen, dass für m ∈ N0 gilt: m (1 + y) = m X m n=0 n yn . Nun wollen wir eine ähnliche Formel für den Fall m ∈ R herleiten. Sei also r ∈ R und setze A(y) := (1 + y)r . Dann gilt für die r-te Ableitung an der Stelle 0: A(n) (0) = r · (r − 1) · · · · · (r − n + 1) · (1 + 0)r−n = rn , also 6.4 (1 + y)r = A(y) = X A(n) (0) X rn X r yn = yn = yn . n! n! n n≥0 n≥0 (6.13) n≥0 Nach dieser kurzen Einführung in die Theorie der erzeugenden Funktionen wollen wir die Methode jetzt noch einmal auf ein konkretes Beispiel anwenden. Beispiel. Die Folge der Fibonacci-Zahlen ist gegeben durch die Startwerte F0 = 0 und F1 = 1 und die rekursive Vorschrift Fn+2 = Fn+1 + Fn , für alle n ∈ N0 . Wir suchen eine explizite Formel für Fn . 6. Erzeugende Funktionen 31 Schritt 1: Potenzreihe aufstellen. P Wir definieren F (x) := n∈N0 Fn xn . Schritt 2: Setze Anfangswerte und Rekursion in die Potenzreihe ein. X Fn xn F (x) = F0 + F1 x + n≥2 = x+ X Fn+2 xn+2 = x + n≥0 X (Fn+1 + Fn )xn+2 . n≥0 Schritt 3: Ersetze die auftretenden Fn unter Verwendung von F (x). X X F (x) = x + Fn+1 xn+2 + Fn xn+2 n≥0 = x+x· X n≥0 Fn+1 x n+1 + x2 · n≥0 X Fn xn n≥0 = x + x(F (x) − F0 ) + x2 F (x) = x + xF (x) + x2 F (x). Schritt 4: Nach F (x) auflösen. F (x) − xF (x) − x2 F (x) F (x) = x = x . 1 − x − x2 Schritt 5: Stelle die gebrochen rationale Funktion als Potenzreihe dar. Dazu machen wir folgenden Ansatz. Bestimme α, β, γ, δ ∈ R, so dass für alle x ∈ R gilt: F (x) = x α β α(1 − δx) + β(1 − γx) = + = 2 1−x−x 1 − γx 1 − δx (1 − γx)(1 − δx) (6.14) . Wir versuchen, die vier Variablen so zu wählen, dass die beiden Zähler und die beiden Nenner jeweils übereinstimmen und erhalten so die zwei Gleichungen: x 1 − x − x2 = α(1 − δx) + β(1 − γx) = (1 − γx)(1 − δx) = γ( (6.15) 1 1 − x)δ( − x) γ δ (6.16) Aus Gleichung (6.16) erkennen wir, dass 1/γ und 1/δ die Lösungen der Gleichung 1 − x − x2 = 0 sind. Mit Hilfe der Lösungsformel für quadratische Gleichungen ergibt sich daraus √ √ √ √ 1 1+ 5 −2 −2 (1 − 5) −2 + 2 5 1− 5 √ = √ √ = = , also γ = = , γ −2 1−5 2 1+ 5 (1 + 5) (1 − 5) und analog √ √ 1 1− 5 −2 1+ 5 √ = = , also δ = . δ −2 2 1− 5 32 Kapitel II. Zählen Um β zu berechnen, setzen wir in (6.15) x = 1/δ und erhalten 1 γ 1 δ = β(1 − ), also β = = δ δ δδ−γ 1 √ √ 1+ 5−1+ 5 2 1 =√ . 5 Um α zu berechnen, setzen wir in (6.15) x = 0 und erhalten 1 0 = α + β, also α = −β = − √ . 5 Man sollte sich allerdings klar machen, dass wir auf diesem Wege die Werte für α und β nicht streng hergeleitet haben, weil wir x = 1/δ in Gleichung (6.15) gesetzt haben, letztere aber aus Gleichung (6.14) gewonnen hatten, die offensichtlich für genau diesen Wert von x gar nicht gilt. Nichtsdestotrotz lässt sich natürlich jetzt, da wir Werte für α, β, γ, δ geraten“ haben, leicht überprüfen, dass sie die ” ursprüngliche Gleichung (6.14) für unendlich viele Werte von x erfüllen. Wir haben also gezeigt, dass für diese Werte von α, β, γ, δ F (x) = x α β = + 2 1−x−x 1 − γx 1 − δx (6.11) = α ∞ X γ n xn + β n=0 ∞ X δ n xn . n=0 Schritt 6: Koeffizientenvergleich. Wir haben gezeigt, dass X Fn xn = F (x) = ∞ X (αγ n + βδ n ) xn . n=0 n≥0 Nach Satz 6.1 folgt damit, dass √ !n 1 1− 5 +√ 2 5 1 Fn = αγ + βδ = − √ 5 n n √ !n 1+ 5 . 2 womit die gewünschte Formel für Fn gefunden wäre. Sie darf sicher schon insofern als Überraschung gelten, als dass beim ersten Anblick nicht einmal klar, dass sie für jedes n ∈ N0 eine natürliche Zahl erzeugt. Übungsaufgaben 1. Finden Sie einen formalen Beweis für die Aussage von Satz 5.1b): k |M | = k−1 Y (n − i) i=0 6. Erzeugende Funktionen 33 Ein möglicher Ansatz dafür: Wählen Sie ein beliebiges Element x aus M aus, finden Sie eine Bijektion · f : (M \ {x})k ∪ (M \ {x})k−1 × [k − 1] → M k und beweisen Sie dann die gesuchte Formel durch Induktion über |M |. 2. Es sei Tn,k die Anzahl geordneter k-Partitionen einer n-elementigen Menge. a) Welche Abbildungen von [n] nach [k] zählt Tn,k und in welchem Zusammenhang stehen Tn,k und Sn,k ? b) Beweisen Sie, dass für 1 ≤ k ≤ n Tn,k k X r k (−1) (k − r)n = r r=0 und leiten Sie daraus die Formel in Satz 5.5 her. Literaturhinweise zu Kapitel II Weiteres Material zu den Abschnitten 4 und 5 findet sich beispielsweise bei [A] in Kapitel 1.1, 1.2 und 2.4; bei [MN] in Kapitel 3.1 bis 3.3 sowie 3.7; und bei [S] in Kapitel 1.1 bis 1.3. Zusätzliche Informationen zu Abschnitt 6 finden sich bei [A] in Kapitel 3.1 und 3.2, bei [MN] in Kapitel 12 und [S] in Kapitel 4.2. 34 Kapitel II. Zählen Kapitel III Relationale Strukturen 7 Graphen Definition (Graph, Nachbar, Grad). Ein Graph G = (V, E) besteht aus einer Knotenmenge V und einer Kantenmenge E ⊆ V2 . Wir wollen hier voraussetzen, dass V endlich und nicht leer ist. Zwei Knoten x, y ∈ V eines Graphen G = (V, E) heißen benachbart, wenn {x, y} ∈ E. Alle zu x benachbarten Knoten bilden die Nachbarschaft von x, die mit N (x) := {y ∈ V : {x, y} ∈ E} bezeichnet wird. Die Anzahl der Nachbarn von x heißt der Grad von x und wird mit deg(x) := |N (x)| notiert. Einen Knoten mit Grad 0 nennt man isoliert, einen Knoten mit Grad 1 ein Blatt. Der Minimalgrad ist der kleinste in G auftretende Grad und wird mit δ(G) bezeichnet, der Maximalgrad ist der größte in G auftretende Grad und wird mit ∆(G) bezeichnet. Graphen werden oft durch ein Diagramm angegeben (oder veranschaulicht), bei dem man die Knoten als Knubbel malt und jede Kante dadurch kennzeichnet, dass die beiden an ihr beteiligten Knoten durch eine Linie verbunden werden. Dabei spielt die Lage der Knoten und der Kanten keine Rolle, es kommt nur darauf an, welche Paare von Knoten eine Kante bilden: Beispiel. Sei G = (V, E) mit V = {a, b, c, d} und E = {{a, b}, {b, c}}. Bild 36 Kapitel III. Relationale Strukturen Hier sind ein paar einfachste Erkenntnisse über Graphen und Knotengrade. Satz P7.1. Sei G = (V, E) ein Graph. Dann gilt: a) v∈V deg(v) = 2|E|. b) G hat eine gerade Anzahl von Knoten ungeraden Grades. c) Wenn |V | ≥ 2, dann hat G mindestens zwei Knoten gleichen Grades. Beweis. a) Wenn wir die Summe der Grade betrachten, stellen wir fest, dass wir jede Kante genau zweimal gezählt haben - je einmal von ihren beiden Endknoten. b) Wir spalten die Summe der Grade wie folgt auf: a) 2|E| = X deg(v) = v inV X v∈V :deg(v) ist gerade deg(v) + X deg(v). v∈V :deg(v) ist ungerade Offensichtlich ist 2|E| eine gerade Zahl, und da die erste Summe nur gerade Summanden enthält, ist auch sie eine gerade Zahl. Also muss auch die zweite Summe eine gerade Zahl sein. Da sie aber nur ungerade Summanden enthält, folgt, dass die Anzahl ihrer Summanden gerade sein muss. Das war zu zeigen. Der Beweis von Teil c) verbleibt als einfache Übung. Definition (isomorph, Subgraph). Zwei Graphen G1 = (V1 , E1 ) und G2 = (V2 , E2 ) heißen isomorph, in Zeichen G1 ∼ = G2 , falls es eine Bijektion f : V1 → V2 gibt, so dass für alle Knoten u, v ∈ V1 gilt: {u, v} ∈ E1 ⇔ {f (u), f (v)} ∈ E2 . Die Funktion f nennt man in diesem Fall einen (Graphen–) Isomorphismus. Ein Graph H = (W, F ) ist ein Subgraph von G = (V, E), wenn W ⊆ V und F ⊆ E. Wir schreiben dann H ⊆ G. Ein Graph H = (W, F ) ist induzierter Subgraph von G = (V, E), wenn W ⊆ V und F = E ∩ W 2 . Wir schreiben dann H = G[W ] und nennen H den durch W induzierten Subgraphen von G. Beispiel. Bild Definition (spezielle Graphen). Die folgenden Graphen werden so oft benutzt, dass sie sich eigene Namen verdient haben. Für n ∈ N0 definieren wir: Pn := ({0, . . . , n}, E) mit E := {i − 1, i} : i ∈ [n] , für n ≥ 0, Cn := ([n], E) mit E := {i, i + 1} : i ∈ [n − 1] ∪ {n, 1} , für n ≥ 3, [n] Kn := [n], und En := ([n], ∅) für n ≥ 1. 2 Ein Graph, der isomorph zu Pn ist, heißt Weg der Länge n. Wenn G = (V, E) ∼ = Pn und f : V → [n] der entsprechende Isomorphismus ist, dann heißen die Knoten x 7. Graphen 37 mit f (x) = 0 und y mit f (y) = n Anfangs– und Endknoten von G und wir nennen G einen x, y-Weg. Ein Graph, der isomorph zu Cn ist, heißt Kreis der Länge n. Ein Graph, der isomorph zu Kn ist, heißt Clique auf n Knoten, oder kurz: n-Clique. Ein Graph, der isomorph zu En ist, heißt stabile Menge auf n Knoten, oder kurz: n-stabile Menge.1 Mit diesen und Subgraphen sind die beiden folgenden Graphenparamter verknüpft. Für einen Graphen G = (V, E) sind die Cliquenzahl ω(G) und die Stabilitätszahl α(G) definiert als die Kardinalität einer größtmöglichen Clique bzw. stabilen Menge in G: ω(G) α(G) max{` ∈ N : ∃S ⊆ V mit G[S] ∼ = K` }, := max{` ∈ N : ∃S ⊆ V mit G[S] ∼ = E` }. := Beispiel. Wir berechnen die Cliquen– und die Stabilitätszahl von den oben eingeführten speziellen Graphen: a) ω(Kn ) = n, α(Kn ) = 1 für alle n ∈ N, b) ω(En ) = 1, α(En ) = n für alle n ∈ N, c) ω(Pn ) = 2, α(P2n ) = α(P2n+1 ) = n + 1, für alle n ∈ N, d) ω(C3 ) = 3 und ω(Cn ) = 2 wenn n ≥ 4, α(C2n ) = α(C2n+1 ) = n wenn n ≥ 2. Mit Hilfe der Konzepte von Wegen und Kreisen können wir nun die Struktur von Graphen genauer diskutieren. Definition (kreisfrei, zusammenhängend, Baum). Sei G = (V, E) ein Graph. a) G heißt kreisfrei (oder Wald ), wenn G keinen Kreis als Subgraphen enthält. b) G heißt zusammenhängend, wenn es zu jedem Paar von Knoten x, y ∈ V einen x, y-Weg als Subgraphen in G gibt. c) Ein inklusionsmaximaler zusammenhängender Subgraph H von G heißt Zusammenhangskomponente von G. d) Wenn G kreisfrei und zusammenhängend ist, dann nennt man G einen Baum. Bild Bevor wir ein paar einfache Eigenschaften von Bäumen kennenlernen werden, treffen wir noch ein paar Vereinbarungen: Wenn G = (V, E) ein Graph ist, x ∈ V , S ⊆ V , e ∈ E und F ⊆ E, dann setzen wir G − x := G[V \ {x}], G − e := (V, E \ {e}), G − S := G[V \ S], G − F := (V, E \ F ). Die folgenden Aussagen sind aus botanischer Sicht einleuchtend und mathematisch auch schnell zu beweisen. 1 Statt von einer Clique spricht man manchmal auch von einem vollständigen Graphen, und eine stabile Menge kann auch als unabhängig bezeichnet werden. 38 Kapitel III. Relationale Strukturen Lemma 7.2. a) Die Zusammenhangskomponenten eines Waldes sind Bäume. b) Jeder Baum G mit mindestens zwei Knoten hat mindestens zwei Blätter. c) Wenn G ein Baum und b ein Blatt in G ist, dann ist G − b ein Baum. Beweis. Aussage a) folgt unmittelbar aus der Definition. Um b) zu beweisen, betrachten wir einen x, y-Weg als Subgraph in G, der nicht verlängert werden kann. Wir behaupten, dass seine Anfangs– und Endknoten x 6= y Blätter sein müssen: Offensichtlich haben sie (dank des Weges, auf dem sie liegen) mindestens jeweils einen Nachbarn. Wenn sie noch einen weiteren Nachbarn hätten, dann könnte der nicht auf dem Weg liegen (sonst hätte G einen Kreis) aber auch nicht außerhalb des Weges liegen (sonst könnten wir den Weg ja verlängern). Bild Bei dem Beweis von Aussage c) ist klar, dass wenn G kreisfrei ist, auch G − b kreisfrei sein muss. Um zu zeigen, dass G − b auch zusammenhängend ist, seien zwei beliebige Knoten x und y in G − b gegeben. Da G zusammenhängend ist, gibt es in G einen x, y-Weg. Dieser kann (weil x 6= b 6= y und deg(b) = 1 ist) aber b nicht benutzt haben, folglich existiert er auch in G − b. Mit diesen Hilfsmitteln können wir nun Bäume auf verschiedene Arten charakterisieren. Satz 7.3. Für einen Graphen G = (V, E) mit n = |V | und m = |E| sind äquivalent: a) G ist ein Baum, b) G ist zusammenhängend und m = n − 1, c) G ist kreisfrei und m = n − 1, d) G ist Kanten-maximal kreisfrei, e) G ist Kanten-minimal zusammenhängend, f ) zu je zwei Knoten x, y aus V gibt es genau einen x, y-Weg in G. Zur Erläuterung: Ein Graph heißt Kanten-maximal kreisfrei, wenn er kreisfrei ist und das Hinzufügen jeder neuen Kante einen Kreis erzwingen würde. Er heißt Kanten-minimal zusammenhängend, wenn er zusammenhängend ist und das Entfernen jeder Kante den Zusammenhang zerstören würde. Beweis. Wir zeigen hier nur exemplarisch, dass a) ⇒ b) ⇒ c) ⇒ a). Den Nachweis der restlichen Äquivalenzen verschieben wir in die Übungsaufgaben. a) ⇒ b). Diese Aussage zeigen wir durch Induktion über n. Für n = 1 und n = 2 ist die Aussage offensichtlich. Sei also G = (V, E) ein Baum auf n ≥ 3 Knoten und m Kanten. Zu zeigen ist, dass m = n − 1 ist. Nach Lemma 7.2b) existiert in 7. Graphen 39 G ein Blatt b, und nach Lemma 7.2c) ist G − b wiederum ein Baum. der offensichtlich n − 1 Knoten und m − 1 Kanten hat. Auf diesen Baum können wir die Induktionsannahme anwenden, die besagt, dass m − 1 = (n − 1) − 1 ist, woraus das gewünschte m = n − 1 folgt. b) ⇒ c). Sei G ein zusammenhängender Graph mit n Knoten und m = n − 1 Kanten. Zu zeigen ist, dass G kreisfrei ist. Angenommen, G wäre nicht kreisfrei und C = (VC , EC ) wäre ein Kreis als Subgraph von G. Unser Ziel ist es, zu zeigen, dass G dann mindestens n Kanten haben muss. Wir wählen dazu zunächst einen Knoten w ∈ VC . Da G zusammenhängend ist, existiert für jeden Knoten v ∈ V \VC ein kürzester v, w-Weg. Sei ev die erste Kante (von v kommend) auf diesem Weg. Diese Kante liegt nicht in EC und für zwei verschiedene Knoten v, v 0 ∈ V \ V 0 gilt, dass ev 6= ev0 ist. Somit muss G mindestens |V \ VC | + |EC | = |V \ VC | + |VC | = |V | = n Kanten haben, im Widerspruch zur Voraussetzung m = n − 1. c) ⇒ a). Sei G = (V, E) ein kreisfreier Graph mit n Knoten und m = n − 1 Kanten. Es ist zu zeigen, dass G dann auch zusammenhängend ist. Seien (V1 , F1 ), . . . , (Vk , Fk ) die Zusammenhangskomponenten von G. Für diese Zusammenhangskomponenten gilt, dass ihre Knotenmengen eine Partition von V und ihre Kantenmengen eine Partition von E bilden. Ferner sind sie nach Lemma 7.2a) Bäume und daher gilt, wegen der schon gezeigten Implikation a) ⇒ b), dass |Fi | = |Vi | − 1. Somit folgt n − 1 = m = |E| = k X i=1 |Fi | = k X (|Vi | − 1) = i=1 k X |Vi | − k = n − k. i=1 Also muss k = 1 sein, und das bedeutet, dass G zusammenhängend ist. Alle bisher eingeführten Parameter haben sich vorrangig mit der lokalen Struktur eines Graphen befasst. Das im folgenden eingeführte Konzept der Graphenfärbung versucht stattdessen, seine globale Komplexität zu messen. Definition (Graphenfärbung). Sei k ∈ N und G = (V, E) ein Graph. Eine kFärbung von G ist eine Funktion f : V → [k] mit der Eigenschaft, dass benachbarte Knoten nicht die gleiche Farbe erhalten: ∀{x, y} ∈ E : f (x) 6= f (y)}. Die chromatische Zahl (oder Färbungszahl ) von G ist definiert als χ(G) := min{k ∈ N : G hat k-Färbung }. Wenn χ(G) = 2 ist, nennt man G auch bipartit. 40 Kapitel III. Relationale Strukturen Beispiel. Bild Zwei offensichtliche Beobachtungen: Ein Graph G hat genau dann eine kFärbung hat, wenn alle Subgraphen von G eine k-Färbung besitzen. Und: G hat genau dann eine k-Färbung, wenn alle Zusammenhangskomponenten von G eine k-Färbung haben. Wenn ein Graph G eine k-Färbung f besitzt, dann induziert für jedes i ∈ [k] die Menge f −1 (i) (also die Menge der Knoten, die durch f die Farbe i erhalten) eine stabile Menge. Man nennt f −1 (i) auch die i-te Farbklasse von f in G. Auf der Suche nach einfachen Graphen, die nicht bipartit sind, treffen wir zuerst auf Kreise ungerader Länge: Cn ist genau dann bipartit, wenn n gerade ist. Der folgende Satz besagt, dass Kreise ungerader Länge tatsächlich das einzige Hindernis darstellen, das einen Graphen daran hindern kann, bipartit zu sein. Satz 7.4 (König 1936). Sei G = (V, E) ein Graph. Dann gilt: G ist genau dann bipartit, wenn G keinen Kreis ungerader Länge als Subgraphen enthält. Beweis. Wenn G bipartit ist, dann sind alle seine Subgraphen bipartit, also kann kein Subgraph ein Kreis ungerader Länge sein. Für die umgekehrte Implikation nehmen wir ohne Beschränkung der Allgemeinheit an, dass G zusammenhängend ist, andernfalls betrachten wir die Zusammenhangskomponenten von G. Wir wählen weiterhin einen beliebigen Knoten v ∈ V aus und partitionieren V wie folgt: A := {w ∈ V : ein kürzester w, v-Weg hat gerade Länge}, B := {w ∈ V : ein kürzester w, v-Weg hat ungerade Länge}. (7.1) · Damit ist klar: V = A ∪ B und insbesondere v ∈ A. Wenn wir zeigen können, dass G[A] und G[B] stabile Mengen sind. Angenommen, dies wäre nicht der Fall: dann existiert eine Kante {x, y} mit x ∈ A, y ∈ A oder x ∈ B, y ∈ B. Wir betrachten einen kürzesten x, v-Weg Px , und einen kürzesten y, v-Weg Py . Sei z der erste gemeinsame Knoten von Px und Py (eventuell gilt z = v). Dann muss das Wegstück in Px von z nach v die gleiche Länge haben wie das Wegstück in Py von z nach v. Bild Somit folgt: Da Px und Py entweder beide gerade Länge (wenn x ∈ A, y ∈ A) oder beide ungerade Länge (wenn x ∈ B, y ∈ B) haben, müssen auch die Teilstücke in Px von x nach z bzw. in Py von y nach z beide gerade Länge oder beide ungerade Länge haben. In jedem Fall bilden diese Teilstücke zusammen mit der Kante {x, y} 8. Exkurs: Diskrete Optimierung 41 einen Kreis ungerader Länge, im Widerspruch zur Annahme, dass G keine Kreise ungerader Länge als Subgraphen enthält. 8 Exkurs: Diskrete Optimierung Die grundlegenden Konzepte der Graphentheorie eignen sich bestens dafür, natürliche Optimierungsprobleme kurz und präzise zu modellieren und zu lösen. Wir führen dazu die Definition eines gewichteten Graphen G = (V, E, `) ein, der durch einen Graphen (V, E) und eine Gewichtsfunktion ` : E → R gegeben ist. Durch diese Gwichtsfunktion P erhält auch jeder Subgraph H = (W, F ) ⊆ G sein eigenes Gewicht `(H) := e∈F `(e). Wir betrachten nun exemplarisch einige Aufgabenstellungen aus der diskreten Optimierung: • Kürzeste Wege. Gegeben ein gewichteter Graph G = (V, E, `) und zwei ausgezeichnete Knoten s, t ∈ V . Finde einen s, t-Weg H als Subgraphen von G, der `(H) minimiert. Bild Wenn man beispielsweise Verkehrsnetze durch gewichtete Graphen modelliert, bei denen die Kantengewichte für die Kosten oder Entfernungen zwischen zwei Kreuzungen (Knoten) stehen, dann kann man mit Hilfe von Algorithmen zur Lösung des Kürzeste-Wege-Problems optimale Routen in der Verkehrsnavigation berechnen. • Minimal aufspannende Bäume. Gegeben ein gewichteter Graph G = (V, E, `). Finde einen Baum H = (V, F ) als Subgraphen von G, der `(H) minimiert. Bild Man beachte, dass hier von dem Baum H gefordert wird, dass er alle Knoten von G enthalten muss (daher der Begriff aufspannend“). Ein möglicher An” wendungshintergrund für diese Aufgabensteellung ist beispielsweise ein zusammenhängendes Computernetzwerk, das als gewichteter Graph G modelliert wird, der • Kürzeste Rundreisen. Gegeben ein gewichteter Graph G = (V, E, `). Finde einen Kreis H = (V, F ) als Subgraphen von G, der `(H) minimiert. Bild 42 Kapitel III. Relationale Strukturen Auch hier ist es natürlich wichtig, dass der Kreis H alle Knoten enthält. Ähnlich wie bei dem Kürzesten-Wege-Problem könnten die Knoten des Graphen hier für verschiedene Städte stehen, die Kantengewichte für die dazwischenliegenden Entfernungen, und gesucht ist eine sogenannte Tour des Handelsreisenden (engl. Travelling Salesman), der jede Stadt genau einmal besucht und dabei möglichst schnell wieder zu seinem Ausgangspunkt zurückkommen möchte. • Optimale Färbungen. Gegeben ein Graph G = (V, E). Finde eine k-Färbung von G, die k minimiert. Hier könnten beispielsweise die Knoten Radiosender repräsentieren, die so mit Frequenzen (Farben) ausgestattet werden sollen, dass benachbarte (also durch eine Kante verbundene) Sender nicht die gleiche Frequenz erhalten, und dabei insgesamt möglichst wenige verschiedene Frequenzen benutzt werden sollen. Auch wenn diese Probleme sich auf den ersten Blick vielleicht sehr ähneln, so unterscheiden sie sich in ihrem algorithmischen Schwierigkeitsgrad doch sehr. Man zum Beispiel zeigen, dass ein sehr einfaches Verfahren immer einen minimalen aufspannenden Baum findet: Beginne mit einer leeren Kantenmenge, gehe die Kanten, sortiert nach aufsteigendem Gewicht, durch und nimm jede Kante hinzu, die keinen Kreis schließt. Auch für das Kürzeste-Wege-Problem existieren effiziente Lösungsverfahren, während viele Argumente dafür sprechen, dass genau das für die Probleme der kürzesten Rundreisen und der optimalen Färbung unmöglich ist.2 Allerdings gibt es auch zwischen den beiden zuletzt genannten Aufgaben wieder einen deutlichen Unterschied – während es wiederum einen eleganten und schnellen Algorithmus gibt, der immer eine Rundreise findet, deren Länge höchstens um einen Faktor 1, 5 oberhalb der Länge der optimalen Tour liegt, liegt ein derartiges approximatives Verfahren für das Färbungsproblem außerhalb des Möglichen. Die Grenze des effizient Machbaren verläuft mitunter auch mitten durch die genannten Probleme. Wenn man beispielsweise den Beweis von Satz 7.4 noch einmal studiert, dann stellt man fest, dass man leicht herausfinden kann, ob ein Graph bipartit ist (also eine 2-Färbung hat) oder nicht: man generiert nämlich die Parti· tion V = A ∪ B wie in (7.1), und entweder dies induziert eine 2-Färbung oder es gibt keine. Demgegenüber ist aber bereits die Frage, ob ein Graph eine 3-Färbung besitzt, schon wieder sehr schwierig – könnte man sie im Allgmeinen beantworten, dann könnte man auch stets die optimale Anzahl Farben ermitteln. Die Untersuchung dieser algorithmischen Machbarkeitsgrenze gehört gleichermaßen in die Diskrete Mathematik wie in die Theoretische Informatik, aber ihre Darstellung würde den Rahmen dieses einführenden Buches sprengen und wir werden sie daher nicht weiter vertiefen. (Wir haben hier ja noch nicht einmal genau 2 Das ist genau die berühmte P versus NP Frage: es gibt genau dann schnelle Verfahren für diese Probleme, wenn P=NP ist. 9. Euler–Touren und Hamilton–Kreise 43 definiert, was wir unter einem schnellen Lösungsverfahren“ verstehen.) Wir wer” den aber im Folgenden en passant den Finger auf diejenigen Strukturresultate legen, die auch algorithmische Verwendbarkeit haben. 9 Euler–Touren und Hamilton–Kreise In diesem kurzen Abschnitt untersuchen wir zwei verschiedene Arten und Weisen, einen Graphen zu durchlaufen. Definition. Sei G = (V, E) ein Graph. Ein Kantenzug in G ist eine Folge (v0 , . . . , vk ) von Knoten vi ∈ V , so dass {vi−1 , vi } ∈ E für alle i ∈ [k]; und man sagt, dass der Kantenzug die Kante {vi−1 , vi } benutzt. (Man beachte: ein Kantenzug kann Knoten mehrfach durchlaufen und Kanten mehrfach benutzen.) Ein Kantenzug heißt geschlossen, wenn v0 = vk ist. Eine Euler–Tour von G ist ein geschlossener Kantenzug in G, der jede Kante aus E genau einmal benutzt. Die Frage, ob ein Graph G eine Euler–Tour besitzt ist populärwissenschaftlich unter der Formulierung Kann man G zeichnen, ohne den Stift abzusetzen “ (und: ” ohne Linien doppelt zu zeichnen und mit Anfangs- gleich Endpunkt) bekannt. Wegen der letzten Forderung hat das sogenannte Haus des Nikolaus“ keine Euler– ” Tour. Das Haus des Nikolaus mit Keller“ besitzt hingegen eine. ” Bild Der folgende Satz von Euler aus dem Jahr 1736 gilt als eine der ersten Arbeiten auf dem Gebiet der Graphentheorie. Satz 9.1. Sei G = (V, E) ein zusammenhängender Graph. Dann sind äquivalent: a) Es gibt eine Euler–Tour von G. b) Alle Knoten von G haben geraden Grad. c) Es gibt eine Partition von E in kantendisjunkte Kreise. Beweis. Übungsaufgabe! Wir ändern nun die Spielregeln. Während eine Euler–Tour einen geschlossenen Kantenzug beschreibt, der jede Kanten genau einmal besucht, muss ein Hamilton–Kreis jeden Knoten genau einmal durchlaufen. Definition. Sei G = (V, E) ein Graph. Ein Kreis der Länge |V | in G heißt Hamilton– Kreis. Im Gegensatz zu Euler–Touren bleiben Hamilton–Kreise natürlich bei Addition von Kanten erhalten, so dass man fragen könnte, ob sie ab einer gewissen Kantenanzahl erzwungen sind. Offensichtlich reichen dafür aber Informationen 44 Kapitel III. Relationale Strukturen über die Gesamtanzahl der Kanten nicht aus – da jeder Knoten an der gesuchten Struktur beteiligt sein soll, brauchen wir auch Aussagen über den Grad eines jeden Knotens. Das folgende Lemma mag auf den ersten Blick etwas technisch anmuten, enthält aber genau den Kerngedanken für den Beweis des darauffolgenden Satzes. Lemma 9.2. Seien x, y zwei Knoten in G = (V, E) mit deg(x) + deg(y) ≥ |V | und {x, y} 6∈ E. Dann gilt: G hat genau dann einen Hamilton Kreis, wenn G0 := (V, E ∪ {x, y}) einen Hamilton Kreis hat. Beweis. Wenn G einen Hamilton–Kreis hat, dann hat offensichtlich auch G0 einen. Für die umgekehrte Implikation sei nun C = (V, F ) ein Hamilton–Kreis in G0 und n := |V |. Wenn {x, y} 6∈ F , dann wäre C auch Subgraph von G, und damit hätte auch G einen Hamilton–Kreis, also wären wir fertig. Wir können also o.B.d.A. davon ausgehen, dass {x, y} ∈ F , und bezeichnen die Knoten von G0 mit x, v1 , v2 , . . . , vn−2 , y in der Reihenfolge, in der sie auf C liegen. Bild Die grundlegende Idee unseres Beweises ist die folgende: wenn {y, vi } ∈ E und {x, vi+1 } ∈ E, dann existiert in G ein Hamilton–Kreis C 0 = (V, F \ ({x, y} ∪ {vi , vi+1 }) ∪ {y, vi } ∪ {x, vi+1 } und wir wären wieder fertig. Wir betrachten also diejenigen Nachbarn von y, die in der Menge {v1 , . . . , vn−3 } liegen. Das sind deg(y) − 1 viele. Markiere für jeden solchen Nachbarn vi den Nachfolger vi+1 rot. Damit sind deg(y) − 1 Knoten in der Menge {v2 , . . . , vn−2 } rot markiert, und wir wären fertig, wenn x zu einem von ihnen verbunden wäre. Andernfalls bleiben für die Nachbarn von x, die in der Menge {v2 , . . . , vn−2 } liegen, nur n − 3 − (deg(y) − 1) = n − 2 − deg(y) Plätze frei. Da aber x noch deg(x) − 1 Nachbarn in genau dieser Menge unterbringen muss, folgt deg(x) − 1 ≤ n − 2 − deg(y), was gleichbedeutend mit deg(x) + deg(y) ≤ n − 1 = |V | − 1 ist und damit einen Widerspruch zur Voraussetzung darstellt. Aus dem Lemma folgt nun unmittelbar die gewünschte Aussage über Hamilton– Kreise in Graphen mit genügend hohem Minimalgrad. Satz 9.3. Sei G = (V, E) ein Graph mit |V | ≥ 3. a) Wenn für alle Paare x, y mit {x, y} 6∈ E gilt, dass deg(x) + deg(y) ≥ |V |, dann hat G einen Hamilton Kreis. b) Wenn für jeden Knoten x gilt, dass deg(x) ≥ |V |/2, dann hat G einen Hamilton– Kreis. 10. Matchings 45 Beweis. a) Wende Lemma 9.2 wiederholt auf jedes Paar von nicht benachbarten Knoten an und füge hier eine Kante ein. Am Ende ist der vollständige Graph erreicht, und der hat natürlich (dank |V | ≥ 3) einen Hamilton–Kreis. Wegen Lemma 9.2 muss also auch G einen Hamilton–Kreis haben. b) folgt aus a). Die Aussage b) in Satz 9.3 ist die älteste der hier erwähnten und gehr auf Dirac (1952) zurück, während Aussage a) von Ore (1960) bewiesen wurde. Chvátal (1972) zeigte außerdem den folgenden Satz, den wir hier ohne Beweis angeben: Satz 9.4. Sei G = (V, E) ein Graph und V = [n] mit n ≥ 3. Wir bezeichnen mit di den Grad von Knoten i für alle i ∈ [n] un nehmen an, dass d1 ≤ · · · ≤ dn . Dann gilt: Wenn für alle 1 ≤ i < n/2 gilt, dass di ≥ i + 1 oder dn−i ≥ n − i , dann hat G einen Hamilton–Kreis. Eine kurze Bemerkung zur Komplexität der hier beiden in diesem kurzen Abschnitt betrachteten Aufgabenstellungen. Satz 9.1 enthält eine einfache Charakterisiung von Graphen, die eine Euler-Tour enthalten: wir müssen lediglich alle im Graphen auftretenden Grade überprüfen. Und auch wenn wir nicht nur die Entscheidungsfrage beantworten wollen, sondern im Ja“–Fall die Tour eventuell noch ” konstruieren wollen, so ist das effizient machbar, in dem wir beispielsweise wie im Beweis von Satz 9.1 durch Ablaufen der Kanten zunächst eine Kreiszerlegung der Kantenmenge bestimmen und diese dann zu einer Euler–Tour verkleben. Anders verhält es sich mit Hamilton–Kreisen. Man kennt im Allgemeinen eigentlich überhaupt keine Charakterisierung von Graphen, die einen Hamilton– Kreis enthalten, und insbsondere recht keine, die sich schnell überprüfen ließe. Es verwundert daher auch nicht, dass das entsprechende Entscheidungsproblem NP-vollständig ist. 10 Matchings Definition. Sei G = (V, E) ein Graph. Eine Menge M ⊆ E heißt Matching, falls für alle e, e0 ∈ M mit e 6= e0 gilt, dass e ∩ e0 = ∅. Ein Knoten v heißt überdeckt von M , wenn es eine Kante e ∈ M mit v ∈ e gibt. Wenn {x, y} ∈ M , dann heißt x Matchingpartner von y (und umgekehrt). Ein Matching M heißt maximales Matching, wenn für alle e ∈ E\M gilt, dass M ∪ {e} kein Matching ist. M heißt größtes Matching, wenn für alle Matchings M 0 gilt: |M | ≥ |M 0 |. M heißt perfektes Matching, wenn alle Knoten in V von M überdeckt sind,, d.h. wenn 2|M | = |V | gilt. Die Matchingzahl ν(G) ist definiert als die Kardinalität (d.h. die Anzahl der Kanten) eines größten Matchings von G. Offensichtlich ist ein perfektes Matching auch ein größtes Matching, und ein größtes Matching auch maximal, aber nicht umgekehrt, wie die folgenden Beispiele zeigen. 46 Kapitel III. Relationale Strukturen Bild · Satz 10.1. Sei G = (A ∪ B, E) bipartit. Dann besitzt G genau dann ein Matching, das alle Knoten in A überdeckt, wenn ∀S ⊆ A : |S| ≤ |NG (S)|, (10.2) wobei NG (S) := {y ∈ B : ∃x ∈ S mit {x, y} ∈ E}, also die Menge der Nachbarn von Knoten in S ist. Beweis. Angenommen, G besitzt ein Matching M , das alle Knoten in A überdeckt. Sei S ⊆ A eine beliebige Teilmenge. Dann bildet die Menge T der Matchingpartner der Knoten in S eine Teilmenge von NG (S) und es gilt |S| = |T | ≤ |NG (S)|, wie in (10.2) behauptet. Die umgekehrte Implikation beiweisen wir durch Induktion über |A|. Der Induktionsanfang ist für |A| = 0 oder |A| = 1 klar. Für den Induktionsschritt sei nun |A| = k. Wir unterscheiden zwei Fälle: Fall a) : Es gibt eine Menge T mit ∅ = 6 T ⊆ A und |T | < |A|, so dass |T | = |NG (T )|. (10.3) · Wir betrachten dann den bipartiten Graphen G0 := G[T ∪ NG (T )]. Auch G0 erfüllt die Bedingung (10.2) (warum?) und es gilt |T | < |A| = k. Somit existiert nach Induktionsannahme ein Matching M 0 in G0 , das alle Knoten in T überdeckt. · Betrachte jetzt den bipartiten Graphen G00 := G[(A \ T ) ∪ (B \ NG (T ))]. Wir behaupten, dass auch der Graph G00 die Bedingung (10.2) erfüllt. Angenommen, das wäre nicht der Fall, dann gäbe es eine Menge S ⊆ A \ T mit |S| > |NG00 (S)|. (10.4) Aber dann wäre |S ∪ T | = |S| + |T | (10.3),(10.4) > |NG00 (S)| + |NG (T )| ≥ |NG (S ∪ T )|, und damit würde die Menge S ∪ T ⊆ A die Bedingung (10.2) im Graphen G verletzen. Wegen |A \ T | < |A| = k existiert somit nach Induktionsannahme ein Matching M 00 in G00 , das alle Knoten in A \ T überdeckt. Wir können nun beide Matchings zu einem Matching M := M 0 ∪ M 00 von G kombinieren, das alle Knoten in A überdeckt. Fall b) : Für alle Mengen T mit ∅ = 6 T ⊆ A und |T | < |A| gilt, dass |T | + 1 ≤ |NG (T )|. (10.5) 10. Matchings 47 (Man beachte, dass das tatsächlich die Kontraposition von Fall a) ist: alle Mengen T ⊆ A erfüllen wegen (10.2), dass |NG (T )| ≥ |T |. Wenn also Fall a) nicht eintritt, dann muss Fall b) eintreten.) Wir wählen eine beliebige Kante {x, y} ∈ E mit x ∈ A und y ∈ B und betrachten · den Graphen G0 := G[(A \ {x}) ∪ (B \ {y})]. Wegen der Bedingung (10.5) erfüllt G0 immer noch die Bedingung (10.2) (warum?), also existiert nach Induktionsannahme ein Matching M 0 in G0 , das alle Knoten in A \ {x} überdeckt. Wir können nun wieder ein neues Matching M := M 0 ∪ {{x, y}} von G konstruieren, das alle Knoten in A überdeckt. Folgerung. Sei G = (A ∪ B, E) bipartit. Dann gilt: G besitzt genau dann ein perfektes Matching, wenn |A| = |B| und für jede Menge S ⊆ A gilt: |N (S)| ≥ |S|. Beweis. Wenn G ein perfektes Matching besitzt, dann sind insbsondere alle Knoten in A überdeckt. Nach Satz 10.1 gilt dann |NG (S)| ≥ |S|. Da auch alle Knoten in B überdeckt sind, und die Kanten nur zwischen A und B verlaufen, muss |A| = |B| sein. Umgekehrt folgt aus der Bedingung |NG (S)| ≥ |S| nach Satz 10.1, dass es ein Matching M gibt, das alle Knoten in A überdeckt. Da G bipartit ist und |A| = |B| gilt, sind dann aber auch alle Knoten in B überdeckt, und damit ist M perfekt. Satz 10.1 und Korollar 10 sind zwar schöne Charakterisierungen, liefern aber keine effizienten Verfahren, um festzustellen, ob Graphen ein großes Matching besitzen. Hierfür ist das Konzept eines augmentierenden Pfades wichtig. Definition. Sei M ein Matching in G = (V, E). Ein Weg in G heißt M -alternierend, falls er abwechselnd Kanten aus M und E \ M benutzt. Ein M -alternierender Weg in G der Länge ≥ 1 heißt M -augmentierend, falls Anfangs- und Endknoten nicht von M überdeckt sind. Warum heißen M -augmentierende Wege augmentierend? Ganz einfach: weil man durch Vertauschen von Matching- und Nicht-Matching-Kanten entlang des Weges ein neues Matching erhält, das eine Kante mehr enthält – und damit das alte Matching augmentiert, d.h. erhöht. Beispiel. In G1 ist M := {{2, 3}, {4, 5}} ein Matching, (6, 3, 2, 5, 4) sowie (1, 3, 2, 4) sind M -alternierende, jedoch nicht M -augmentierende Wege und P := (6, 3, 2, 1) ist ein M -augmentierender Weg. Wenn wir M entlang P “augmentieren”, d.h. {6, 3} und {2, 1} zu M hinzufügen und {2, 3} entfernen, so erhalten wir ein neues Matching M 0 := {{4, 5}, {6, 3}, {2, 1}}. Es gibt keine M 0 -augmentierenden Wege. Bild 48 Kapitel III. Relationale Strukturen Das Augmentieren durch Austausch lässt sich am besten durch die symmetrische Differenz zweier Mengen X und Y formalisieren. Sie ist definiert als X∆Y := (X \ Y ) ∪ (Y \ X), also die Menge aller Elemente, die in genau einer der beiden Mengen enthalten ist. Lemma 10.2. Sei M ein Matching in G = (V, E) und P = (W, F ) ein M augmentierender Weg in G. Dann ist M 0 := M ∆F ein Matching in G mit |M 0 | = |M | + 1. Beweis. Wir setzen M1 := F ∩M und M2 := F \M = F \M1 mit |M2 | = |M1 |+1. Da M ein Matching und P = (W, F ) ein M -augmentierender Weg ist, gilt dass Kanten aus M , die nicht im Weg liegen, auch keinen seiner Knoten berühren, also ist M3 := M \ F = {e ∈ M : e ∩ W = ∅}, insbesondere ist daher · · M 0 := M ∆F = (M \ F ) ∪ (F \ M ) = M3 ∪ M2 wieder ein Matching und es gilt |M 0 | = |M3 | + |M2 | = |M3 | + |M1 | + 1 = |M | + 1, wie gefordert. Wir können also unser Matching sukzessive vergrößern, indem wir nach augmentierenden Wegen suchen und das jeweilig aktuelle Matching entlang des Weges augmentieren. Die entscheidende Frage ist nun: Angenommen, es gibt keinen augmentierenden Weg mehr, haben wir dann wirklich immer ein größtes Matching gefunden? Der folgende Satz garantiert genau dies. Satz 10.3. Sei G = (V, E) ein Graph und M ein beliebiges Matching in G. Dann gilt: Es gibt genau dann ein noch größeres Matching als M , wenn es einen M augmentierenden Weg in G gibt. Beweis. Wenn es einen M -augmentierenden Weg gibt, dann wissen wir nach Proposition 10.2, dass es auch ein größeres Matching gibt. Umgekehrt nehmen wir an, dass es ein Matching M ∗ mit |M ∗ | > |M | gibt. Betrachte dann den Subgraph H = (V, M ∆M ∗ ) von G. Da in jedem Knoten aus V höchstens eine Kante aus M und eine aus M ∗ anliegen kann, besteht H nur aus Kreisen und Wegen. In diesen Kreisen und Wegen müssen die Kanten abwechselnd aus M und M ∗ kommen, also müssen die Kreise gerade Länge haben und insbesondere gleich viele Kanten aus M und aus M ∗ enthalten. Bild Da aber |M ∗ | > |M | gilt, muss es mindestens einen Pfad in H geben, der mehr Kanten aus M ∗ als aus M enthält. Ein solcher Weg ist ein M -augmentierender Weg in G. Das zu einem Matching in gewisser Weise duale Konzept ist das einer Knotenüberdeckung, das wir hier zum Abschluss noch kurz studieren werden. 10. Matchings 49 Definition. Sei G = (V, E) ein Graph. Eine Knotenüberdeckung in G ist eine Menge W ⊆ V , für die gilt, dass jede Kante e ∈ E mindestens einen ihrer beiden Endpunkte in W liegen hat. Die Knotenüberdeckungszahl ist definiert als τ (G) := min{` ∈ N : es gibt eine Knotenüberdeckung der Größe ` in G }. Eine minimale Knotenüberdeckung ist also eine (möglichst kleine) Menge von Knoten, die alle Kanten überdecken soll. Ein größtes Matching ist eine Menge von Kanten, die möglichst viele Knoten überdecken soll. Die beiden folgenden Ungleichungen lassen sich schnell einsehen. Lemma 10.4. Für jeden Graphen G gilt: ν(G) ≤ τ (G) ≤ 2ν(G). Beweis. Die Ungleichung ν(G) ≤ τ (G) behauptet, dass jede Knotenüberdeckung mindestens soviele Knoten enthalten muss, wie es Kanten in einem größten Matching gibt. Das ist allerdings klar, denn alle diese Kanten müssen ja von der Knotenüberdeckung überdeckt werden, und da sie sich gegenseitig nicht berühren, kann das nur funktionieren, wenn man entsprechend viele Knoten bereitstellt. Um die Ungleichung τ (G) ≤ 2ν(G) einzusehen, betrachten wir ein festes größtes Matching M und die Menge W derjenigen Knoten von G, die in M enthalten sind. Offensichtlich ist |W | = 2ν(G) und wir behaupten, dass W eine Knotenüberdeckung ist. Das ist allerdings wieder klar, denn gäbe es eine von W noch nicht überdeckte Kante, dann könnte man sie zu M hinzufügen und hätte ein größeres Matching konstruiert. Also ist W eine Knotenüberdeckung der Größe 2ν(G) und somit folgt die gewünschte Ungleichung. Auch wenn diese Ungleichungen trivial sind, so beschreiben sie dennoch ein interessantes Phänomen: hier wird die Lösung einer Maximierungsaufgabe durch die Lösung einer Minimierungsaufgabe von oben beschränkt. Wenn man also beispielsweise in einem Graphen ein Matching der Größe m gefunden hat, dann kann man dadurch, dass man auf eine Knotenüberdeckung der Größe k und die Ungleichung ν(G) ≤ τ (G) verweist, klarstellen, dass es auf jeden Fall kein Matching mit mehr als k Kanten geben wird. Der folgende Satz ist in diesem Sinne eine Dualitätsaussage: er besagt, dass (in bipartiten Graphen) die jeweiligen Optimallösungen übereinstimmen und man den Nachweis der Optimalität lückenlos führen kann. · Satz 10.5. Für jeden bipartiten Graphen G = (A ∪ B, E) gilt: ν(G) = τ (G). Beweis. Dank der Vorarbeit in Lemma 10.4 genügt es, ν(G) ≥ τ (G) zu zeigen. Sei M ein größtes Matching von G. Unser Ziel ist es, eine Knotenüberdeckung W mit |M | ≥ |W | zu konstruieren. Sei U die Menge der Knoten in A, die nicht von M überdeckt sind. Setze S := {v ∈ A : es gibt einen M -alternierenden Weg von U nach v}, T := {w ∈ B : es gibt einen M -alternierenden Weg von U nach w}. 50 Kapitel III. Relationale Strukturen Bild Offensichtlich gilt aufgrund von Wegen der Länge 0, dass U ⊆ S ist. Außerdem wissen wir bereits, dass die M -alternierenden Wege in den Definitionen von S und T nicht M -augmentierend sein können (weil M ein größtes Matching ist und es daher nach Satz 10.3 gar keine M -augmentierenden Wege in G gibt). Daraus und aus der Tatsache, dass die Anfangsknoten dieser Wege in U liegen, also von M unüberdeckt sind und die M -alternierenden Wege daher in U mit einer Nicht-Matching-Kante beginnen, ergeben sich die drei folgenden Aussagen: die Knoten aus T sind von M überdeckt, (10.6) wenn {x, y} ∈ E und x ∈ S, dann muss y ∈ T sein, und (10.7) wenn {x, y} ∈ M und y ∈ T , dann muss x ∈ S sein. (10.8) Wir betrachten nun die Menge W := (A \ S) ∪ T und behaupten zunächst, dass W eine Knotenüberdeckung ist. Sei dazu {x, y} eine beliebige Kante aus E mit x ∈ A und y ∈ B. Wenn x ∈ A \ S, dann ist {x, y} nach Definition von W bereits von W überdeckt. Wenn x ∈ S, dann ist nach (10.7) y ∈ T und damit {x, y} wieder von W überdeckt. Nun wollen wir noch die Kardinalität von W abschätzen. Dazu beobachten wir einerseits, dass wegen U ⊆ S alle Knoten in A \ S von M überdeckt sind, und daher wegen (10.6) alle Knoten in W von M überdeckt sind. Andererseits kann wegen (10.8) keine Kante aus M zwei Knoten aus W enthalten, und deswegen muss es mindestens soviele Kanten in M wie Knoten in W geben, also folgt |M | ≥ |W |. 11 Färbungen planarer Graphen In diesem Abschnitt greifen wir das zu Beginn des Buches erwähnte Vier–Farben– Problem wieder auf. Die folgende Definition ist auf Grund ihrer umgangssprachlichen Formulierung eigentlich (für eine Definition) nicht präzise genug, soll aber aber unseren Bedürfnissen hier genügen. Definition (planarer Graph). Ein Graph G = (V, E) heißt planar, wenn man seine Knoten und Kanten so in die Ebene zeichnen kann“, dass sich Kanten nicht ” schneiden und nur in gemeinsamen Endknoten berühren“. Ist eine solche Zeich” nung gegeben, dann spricht man von einer Einbettung von G. Die durch sie entstehenden Zusammenhangskomponenten der Ebene bilden die Menge R der Gebiete und wir nennen G = (V, E, R) einen ebenen Graphen. Die Zahl der Knoten, die Zahl der Kanten und die Zahl der Gebiete in einem ebenen Graphen stehen in einem frappierend einfachen Verhältnis zueinander. 11. Färbungen planarer Graphen 51 Bild Abbildung 11.1: G1 ist ein ebener Graph mit den inneren“ Gebieten 1, 2, 3 und ” dem äußeren“ Gebiet 4. Der Graph G2 ist isomorph zu G1 und daher planar, ” auch wenn er hier nicht mit einer Einbettung in die Ebene gegeben ist. G3 ist nicht planar, wie wir noch sehen werden. Satz 11.1 (Polyederformel von Euler, 1750). Sei G = (V, E, R) ein ebener, zusammenhängender Graph. Dann gilt: |V | − |E| + |R| = 2. Beweis. durch vollständige Induktion über |E|. Induktionsanfang: |E| = 0. Dann muss |V | = 1 sein (sonst ist G nicht zusammenhängend) und damit |R| = 1 und die Formel |V | − |E| + |R| = 2 stimmt offensichtlich. Für den Induktionsschritt sei G+ = (V + , E + , R+ ) ein ebener, zusammenhängender Graph mit |E + | ≥ 1. Wir unterscheiden zwei Fälle. Fall 1: G+ habe keinen Kreis. Da G+ zusammenhängend ist, ist G+ ein Baum. Also gilt, dass |E + | = |V + | − 1 und |R+ | = 1, und somit folgt wie gewünscht |V + | − |E + | + |R+ | = |V + | − (|V + | − 1) + 1 = 2. Fall 2: G+ habe einen Kreis. Sei e eine Kante des Kreises. Wir löschen nun die Kante e (nicht aber die beiden zugehörigen Knoten) und erhalten dadurch einen neuen, ebenen, zusammenhängenden Graphen G = (V, E, R) mit |V | = |V + |, |E| = |E + | − 1, |R| = |R+ | − 1. (11.9) Wegen |E| < |E + | können wir aus der Induktionsannahme folgern, dass |V | − |E| + |R| = 2. Durch Einsetzen der Resultate aus (11.11) erhalten wir wieder die gewünschte Gleichung. Folgerung. Sei G = (V, E, R) ein ebener, zusammenhängender Graph mit |V | ≥ 4. Dann gilt: a) |E| ≤ 3|V | − 6. b) G hat mindestens einen Knoten vom Grad kleiner gleich 5. Beweis. a) Jedes Gebiet braucht mindestens drei berandende Kanten, jede Kante berandet höchstens zwei Gebiete. Daraus folgt, dass 3|R| ≤ 2|E|. Dies impliziert, dass 2 (11.1) |E| ≥ |R| = 2 − |V | + |E|, 3 52 Kapitel III. Relationale Strukturen also |V | − 2 ≥ 13 |E|, was zu zeigen war. b) Beweis durch Widerspruch: angenommen, alle Knoten v ∈ V würden deg(v) ≥ 6 erfüllen. Dann wäre 7.1a) 2|E| = X deg(v) ≥ 6|V |, v∈V also |E| ≥ 3|V | was aber im Widerspruch zur Aussage a) steht. Wie man leicht nachrechnet folgt aus der Abschätzung in a) unmittelbar, dass der Graph G3 := ([5], 52 ) in Abbildung 11.1 nicht planar ist. Nun wenden wir uns der Färbungsproblematik zu. Definition (Graphenfärbung). Sei k ∈ N. Ein Graph G = (V, E) heißt k-färbbar, wenn es eine sogenannten k-Färbung von G gibt, nämlich eine Abbildung f : V → [k] mit der Eigenschaft, dass benachbarte Knoten nicht die gleiche Farbe erhalten: ∀{x, y} ∈ E : f (x) 6= f (y)}. Die chromatische Zahl (oder Färbungszahl) von G ist definiert als χ(G) := min{k ∈ N : G ist k-färbbar }. Bemerkung. a) Der Graph in Abbildung 11.2 hat chromatische Zahl 3. Bild Abbildung 11.2: Eine 3-Färbung ist angegeben. Der Graph kann wegen der existierenden Dreiecke (bei denen jeder Knoten seine eigene“ Farbe braucht) nicht ” mit weniger als drei Farben gefärbt werden. b) Die 4-Farben-Vermutung ist äquivalent zu der Aussage: jeder planare Graph ist 4-färbbar. Das macht man sich am leichtesten dadurch klar, dass man in jedes Land einen Knoten, sozusagen als Hauptstadt, hinein malt, und dann die Hauptstädte benachbarter Länder durch eine Kante verbindet. Satz. Jeder planare Graph ist 5-färbbar. Beweis. Wir können ohne Beschränkung der Allgemeinheit (o.B.d.A.) annehmen, dass G zusammenhängend ist - andernfalls wenden wir die Behauptung auf die einzelnen Zusammenhangskomponente an. Der Beweis wird durch vollständige Induktion über |V | geführt. Der Induktionsanfang ist klar für alle Graphen mit k := |V | ≤ 5, da diese offensichtlich 5-färbbar sind. Sei also die Behauptung für alle planaren Graphen 12. Partielle Ordnungen 53 mit k Knoten bewiesen und sei G ein beliebiger planarer Graph mit k + 1 Knoten. Nach Korollar 11b) existiert ein Knoten v mit deg(v) ≤ 5. Entferne v und alle Kanten, die v enthalten und erhalte so den neuen Graphen G0 . Da G0 nur k Knoten hat liefert die Induktionsannahme, dass G0 eine 5-Färbung f besitzt. Falls in der Nachbarschaft von v durch f nicht alle Farben 1, 2, . . . , 5 vergeben werden, sind wir fertig, denn dann färben wir v mit einer nicht verwendeten Farbe. Also können wir uns auf den Fall beschränken, bei dem v fünf Nachbarn hat, die wir zu einer gegebenen Einbettung im Uhrzeigersinn mit v1 , . . . , v5 bezeichnen und die durch f jeweils mit den Farben 1, . . . , 5 gefärbt seien. Sei G13 die Menge aller Knoten in G0 , die von f Farbe 1 oder 3 erhalten haben und die mit v1 durch einen Pfad verbunden sind, der nur aus Knoten der Farbe 1 oder 3 besteht. Innerhalb dieser Menge könnten wir die Farben 1 und 3 gegeneinander austauschen und behielten dabei trotzdem eine legale 5-Färbung. Falls nur v1 und nicht auch v3 in G13 liegt, führen wir diesen Farbtausch durch – jetzt ist v1 mit Farbe 3 gefärbt, alle anderen Nachbarn von v wie bisher, und damit ist die Farbe 1 für den Knoten v frei geworden. Also betrachten wir abschließend den Fall, bei dem sowohl v1 wie auch v3 in G13 liegen. Hier schließt sich also ein Kreis C, der aus v sowie Knoten aus G13 besteht. Wenn wir jetzt in Analogie zu G13 die Menge G24 definieren, die aus allen Knoten in G0 , die von f Farbe 2 oder 4 erhalten haben und die mit v2 durch einen Pfad verbunden sind, der nur aus Knoten der Farbe 2 oder 4 besteht, dann sehen wir, dass wegen der Planarität und des Kreises C nicht zusätzlich zu v2 auch v4 in G24 liegen kann. Wir können also den Farbtausch innerhalb von G24 durchführen und somit wird die Farbe 2 für den Knoten v frei. 12 Partielle Ordnungen Wir haben bereits in Abschnitt 3 Relationen definiert und wichtige Eigenschaften von ihnen beschrieben (siehe Definitionen 3 und ??). Zur Erinnerung: sei M eine Menge und sei R ⊆ M × M eine binäre Relation. Wenn R irreflexiv und symmetrisch ist, dann ist R ein Graph. Wenn R reflexiv, symmetrisch und transitiv, dann ist R eine Äquivalenzrelation. Und wenn R reflexiv, antisymmetrisch und transitiv ist, dann nennen wir R eine partielle Ordnung. (Auf englisch spricht man von partially ordered sets, oder auch kurz posets). Beispiel. Sei M := N und (a, b) ∈ R genau dann, wenn a Teiler von b ist. Dann ist R eine partielle Ordnung. Für partielle Ordnungen hat sich die folgende Notation etabliert (neben den in Abschnitt 3 bereits erwähnten Symbolen (a, b) ∈ R oder aRb oder a ∼R b), nämlich a b, und wir schreiben dann R = (M, ). Beispiel. Sei X eine Menge.Für A, B ⊆ X definieren wir die Relation A B genau dann, wenn A ⊆ B. Dann ist (P(X), ) eine partielle Ordnung. 54 Kapitel III. Relationale Strukturen Definition. Sei R = (M, ) eine partielle Ordnung. a) Zwei Elemente a, b ∈ M heißen vergleichbar, wenn a b oder b a. b) Wenn a und b nicht vergleichbar sind, heißen sie unvergleichbar. c) R heißt vollständig oder linear, wenn alle a, b ∈ M vergleichbar sind. d) R0 = (M, 0 ) heißt lineare Erweiterung von R = (M, ), wenn R ⊆ R0 und R0 linear ist. e) Das Element a wird von b überdeckt, wenn a b und es kein c ∈ M mit c 6= a, b gibt, so dass a c und c b. f) Das Hasse-Diagramm von R ist ein Diagramm des Graphen M, {{a, b} : a wird von b überdeckt } , bei dem für jedes Paar a b der Knoten a unterhalb des Knoten b gezeichnet wird. g) Eine Kette in R ist eine Menge K ⊆ M mit der Eigenschaft, dass alle a, b ∈ K vergleichbar sind. Eine Antikette in R ist eine Menge L ⊆ M mit der Eigenschaft, dass alle a, b ∈ L mit a 6= b unvergleichbar sind. h) Ein Element a ∈ M heißt größtes Element, wenn es kein b ∈ M mit b 6= a und a b gibt. Ein Element a ∈ M heißt kleinstes Element, wenn es kein b ∈ M mit b 6= a und b a gibt. Beispiel. Wir greifen die Beispiele 12 und 12 wieder auf. a) Sei M = {2, 3, 4, 5, 6, 24, 25, 75} und a b genau dann, wenn a Teiler von b ist. Dann sieht das Hasse-Diagramm von (M, ) wie folgt aus: 24 4 75 6 25 2 3 5 b) Sei M = P({1, 2, 3}) und A B genau dann, wenn A ⊆ B. Dann sieht das Hasse-Diagramm von (P({1, 2, 3}), ) wie folgt aus: {1, 2, 3} {1, 2} {1, 3} {2, 3} {1} {2} {3} ∅ Satz. Es sei M eine endliche, nicht-leere Menge und R = (M, ) eine partielle Ordnung. Dann gilt: 12. Partielle Ordnungen 55 a) Die maximale Anzahl von Elementen in einer Antikette von R ist gleich der minimalen Anzahl von Ketten aus R, mit denen man M partitionieren kann. b) Die minimale Anzahl von Antiketten aus R, mit denen man M partitionieren kann, ist gleich der maximalen Anzahl von Elementen in einer Kette von R. Beweis. Aussage b) ist leichter zu beweisen, was angesichts der scheinbaren Symmetrie in den Aussagen vielleicht überrascht. Zu b). Sei ` die minimale Anzahl von Antiketten aus R, mit denen man M partitionieren kann, sei k die maximale Anzahl von Elementen in einer Kette von R, und sei K eine Kette mit k Elementen. Es ist klar, dass ` ≥ k ist, denn jede Antikette kann ja höchstens ein Element von K enthalten. Wir müssen also nur ` ≤ k zeigen, d.h. eine Partition von M in höchstens k Antiketten konstruieren. Setze dazu für i ∈ N Ai := {x ∈ M : die längste Kette mit x als größtem Element hat genau i Elemente}. Da die längste Kette in R genau k Elemente besitzt, muss Ai = ∅ für i > k · · sein, und somit folgt M = A1 ∪ . . . ∪ Ak . Es bleibt zu zeigen, dass die Mengen Ai für alle i ∈ [k] auch Antiketten sind. Angenommen, das wäre nicht der Fall, dann gäbe es ein i ∈ [k] und x, y ∈ Ai mit x y. Da x ∈ Ai existiert eine Kette x1 . . . xi−1 x, diese könnte jetzt verlängert werden zu einer Kette x1 . . . xi−1 x y, und somit könnte y nicht in Ai sein. Damit ist b) bewiesen. Zu a). Sei ` die maximale Anzahl von Elementen in einer Antikette von R, sei L eine Antikette mit ` Elementen, und sei k die minimale Anzahl von Ketten aus R, mit denen man M partitionieren kann. Es ist klar, dass ` ≤ k ist, denn jede Kette kann ja höchstens ein Element von L enthalten. Wir zeigen mit vollständiger Induktion über |M |, dass ` ≥ k ist. Für den Induktionsanfang |M | = 1 gilt ` ≥ k offensichtlich. Sei nun |M | ≥ 2. Wähle ein größtes Element a in R (a existiert, da M endlich ist), und sei R0 die partielle Ordnung, die man aus R erhält, wenn man a entfernt. Sei `0 ≤ ` die maximale Anzahl von Elementen in einer Antikette von R0 . Nach Induktionsannahme existiert in R0 eine Partition von M \ {a} in höchstens `0 Ketten K1 , . . . , K`0 . Unser Ziel ist es, daraus nun eine Partition von M in ` Ketten zu generieren. Eine Antikette in R0 mit `0 Elementen nennen wir eine gute Antikette. Jede gute Antikette muss aus jeder der Ki für i ∈ [`0 ] genau ein Element enthalten. Die entscheidende Definition ist diese: es sei ai das größte Element aus Ki , das zu einer guten Antikette gehört. (Da L eine gute Antikette ist, sind die ai wohldefiniert.) Wir zeigen zunächst, dass A := {a1 , . . . , a`0 } eine Antikette ist. Denn angenommen ai aj , dann betrachte man eine gute Antikette Lj , die aj enthält (eine solche muss es ja nach Definition von aj geben). Lj muss, wie jede gute Antikette, auch ein Element ã von Ki enthalten. Da Ki eine Kette ist, die ai enthält, sind ã und ai vergleichbar. Wenn ã ai , dann wäre wegen ai aj und der Transitivität auch ã aj , und damit wäre Lj keine Antikette mehr. Wenn aber ai ã und 56 Kapitel III. Relationale Strukturen ai 6= ã, dann wäre ã größer als ai und trotzdem in einer guten Antikette enthalten, im Widerspruch zur Definition von ai . Also ist A tatsächlich eine Antikette, und wir unterscheiden nun zwei Fälle, je nachdem ob auch A ∪ {a} noch eine Antikette ist. Fall 1: A ∪ {a} ist eine Antikette in R. Da |A ∪ {a}| ≥ `0 + 1 ist, gibt es also eine Antikette mit `0 + 1 Elementen in R, daher muss ` ≥ `0 + 1 sein. In diesem Fall reicht also die Partition von M in die `0 + 1 Ketten K1 , . . . , K`0 , {a} aus. Fall 2: A ∪ {a} ist keine Antikette in R. Dann gibt es ein ai mit i ∈ [`0 ], so dass ai und a vergleichbar sind, und da a als größtes Element in R gewählt war, gilt ai a. Somit ist K := {a} ∪ {x ∈ Ki : x ai } eine Kette. Wir erinnern uns daran, dass in R0 jede Antikette der Kardinalität `0 ein Element aus Ki enthalten muss, und dass ai das größte Element aus Ki war, welches in einer solchen Antikette enthalten ist. Somit muss in R jede Antikette mit `0 Elementen ein Element aus K enthalten. Daraus folgt wiederum, dass wenn wir nun mit R00 die partielle Ordnung bezeichnen, die man aus R erhält, wenn man die Elemente von K entfernt, dann kann R00 keine Antikette mit `0 Elementen enthalten. Also enthält die längste Antikette in R00 höchstens `0 − 1 Elemente, und nach Induktionsannahme existiert daher eine Partition von M \ K in höchstens `0 − 1 Ketten. Zusammen mit der Kette K liefert das eine Partition von M in höchstens `0 ≤ ` Ketten. Definition. Sei R = (M, ) eine partielle Ordnung und seien x, y ∈ M . a) Ein Element a ∈ M heißt obere Schranke für x und y, wenn x a und y a. Wenn zusätzlich gilt, dass für jede andere obere Schranke b gilt, dass a b, dann heißt a kleinste obere Schranke, und wir schreiben a = x ∨ y. b) Ein Element a ∈ M heißt untere Schranke für x und y, wenn a x und a y. Wenn zusätzlich gilt, dass für jede andere untere Schranke b gilt, dass b a, dann heißt a größte untere Schranke, und wir schreiben a = x ∧ y. c) R heißt Verband, wenn es zu je zwei Elementen x, y ∈ M eine kleinste untere und eine größte obere Schranke gibt. Die partielle Ordnung R = (P(X), ⊆), die wir schon in Beispiel 12 kennengelernt haben, ist ein Verband: für zwei Elemente A, B ∈ P(X) ist A ∨ B = A ∪ B und A ∧ B = A ∩ B. Man nennt diese partielle Ordnung auch Mengenverband. Für diese partielle Ordnung sind natürlich speziellere Aussagen als für allgemeine Ordnungen möglich. Satz (Sperner, 1928). Sei X eine Menge mit |X| = n und R = (P(X), ⊆), und sei A eine Antikette in R. Dann ist n . |A| ≤ b n2 c 12. Partielle Ordnungen 57 Es gilt darüberhinaus der etwas allgemeinere Satz Satz (LYM–Ungleichung, 1954). Sei X eine Menge mit |X| = n und R = (P(X), ⊆ ), und sei A eine Antikette in R. Dann ist X n −1 ≤1 |B| B∈A Offensichtlich folgt Satz 12 tatsächlich sofort aus Satz 12, denn −1 X n −1 n ≤ ≤ 1. |A| n |B| b2c B∈A to do: Beweis von LYM Übungsaufgaben 58 Kapitel III. Relationale Strukturen 12. Partielle Ordnungen 59 Literaturhinweise zu Kapitel ?? Weiteres Material zu Abschnitt ?? findet sich beispielsweise bei [MN] in Kapitel 4.1 und 4.2 und bei [S] in Kapitel 2.1 und 2.2. Zusätzliche Informationen zu Abschnitt ?? finden sich bei [A] in Kapitel 8.1 und 8.2 und bei [S] in Kapitel 2.4.4. Zu Abschnitt ?? siehe auch [S], Kapitel 2.4.1; und zu Abschnitt 12 bei [MN] in Kapiteln 2 und 7.2 sowie bei [S] in Kapitel 1.4. Zusätzliche Informationen zu Abschnitt ?? (Planare?) finden sich bei [MN] in Kapitel 6 und bei [S] in Kapitel 2.4.2 und 2.4.3. 60 Kapitel III. Relationale Strukturen Kapitel IV Konstruierte Regularität In diesem Kapitel wollen wir diskrete Objekte studieren, die sehr regelmäßig sind – und die absichtlich so kontruiert sind. Ihre Regelmäßigkeit hat dabei nicht nur ästethischen, sondern in einigen Fällen auch praktischen Nutzen. 13 Endliche projektive Ebenen Wenn man Punkte und Geraden im R2 betrachtet, dann fällt auf, dass zwei (nichtparallele) Geraden genau einen gemeinsamen Punkt haben, und dass durch zwei Punkte genau eine Gerade führt. Diese beiden Eigenschaften bilden den Ausgangspunkt für unsere folgenden Überlegungen. Definition (Endliche projektive Ebene). Eine endliche projektive Ebene besteht aus einer endlichen Menge X, der sogenannten Punktmenge, und einer Familie L von Teilmengen von X, den sogenannten Geraden. Das Paar (X, L) muss dabei die folgenden drei Eigenschaften (Axiome) erfüllen: A1) Für je zwei verschiedene Geraden L1 , L2 ∈ L existiert genau ein Punkt x(L1 , L2 ) ∈ X mit x(L1 , L2 ) ∈ L1 ∩ L2 . A2) Für je zwei verschiedene Punkte x1 , x2 ∈ X existiert genau eine Gerade L(x1 , x2 ) ∈ L mit {x1 , x2 } ⊂ L(x1 , x2 ). A3) Es gibt eine 4-elementige Menge F ⊂ X, so dass |L ∩ F | ≤ 2 für jede Gerade L ∈ L. Die Eigenschaften A1) und A2) sagen aus, dass eine endliche projektive Ebene eine sehr regelmäßige Struktur ist. Die Aussage A3) fordert in gewisserweise die Existenz eines Vierecks“; sie dient eigentlich nur dazu, besonders einfache, ” degenerierte Konstruktionen auszuschließen, wie die in Abbildung ??. Bild 62 Kapitel IV. Konstruierte Regularität Ein Beispiel einer endlichen projektiven Ebene ist die sogenannte FanoEbene. Sie ist gegeben durch X := [7], L := {{1, 2, 3}, {3, 4, 5}, {1, 5, 6}, {1, 4, 7}, {2, 5, 7}, {3, 6, 7}, {2, 4, 6}} , was man sich beispielsweise in der folgenden Abbildung veranschaulicht: 5 6 1 7 2 4 3 Eigenschaften Wir zeigen zunächst, dass die wenigen Axiome einer projektiven Ebene bereits weitere, starke Eigenschaften implizieren. Lemma 13.1. Es sei (X, L) eine endliche projektive Ebene. Dann gelten: a) Zu jedem Punkt x ∈ X gibt es eine Gerade L ∈ L mit x 6∈ L. b) Zu je zwei Geraden L1 , L2 ∈ L gibt es einen Punkt x ∈ X mit x 6∈ L ∪ L0 . Ferner existiert eine natürliche Zahl `, sodass c) alle Geraden genau ` + 1 Punkte enthalten, d) jeder Punkt in genau ` + 1 Geraden enthalten ist, und e) |X| = `2 + ` + 1 und |L| = `2 + ` + 1. Die Zahl ` nennt man auch die Ordnung von (X, L). Beweis. Um die Aussagen des Lemmas zu beweisen, konstruieren wir einen bipartiten Hilfsgraphen A = (X ∪ L, E), indem ein Paar (x, L) mit x ∈ X und L ∈ L genau dann eine Kante in E bilden, wenn x ∈ L. Dieser Hilfsgraph wird auch Inzidenzgraph von (X, L) genannt. Übersetzt lauten die Aussagen A1) bis A3) nun: A1) je zwei Knoten aus L haben genau einen gemeinsamen Nachbarn in X, A2) je zwei Knoten aus X haben genau einen gemeinsamen Nachbarn in L, A3) es gibt eine Menge F ⊂ X von vier Knoten, so dass alle Knoten in L maximal zwei Nachbarn in F haben. Zu a). Es sei F = {a, b, c, d} ⊂ X die gemäß A3) existierende Teilmenge von X. Betrachte drei von x verschiedene Punkte aus F , ohne Einschränkung seien 13. Endliche projektive Ebenen 63 dies a, b, c. Die Geraden L(a, b) und L(b, c) müssen verschieden sein, weil sonst eine Gerade mehr als zwei Nachbarn in F hätte, im Widerspruch zu A3). Nun kann der Punkt x aber nicht zu den beiden Geraden L(a, b) und L(b, c) benachbart sein, denn andernfalls hätten diese Geraden x und b als gemeinsame Nachbarn, im Widerspruch zu A1). Somit ist eine Gerade gefunden, zu der x nicht benachbart ist. Zu b). Es sei wieder F = {a, b, c, d} ⊂ X die gemäß A3) existierende Teilmenge. Da aufgrund von A3) die Geraden L1 und L2 jeweils nur höchstens zwei Nachbarn in F haben, existiert entweder ein Punkt x in F , der weder zu L1 noch zu L2 benachbart ist (womit wir fertig wären), oder wir können ohne Einschränkung annehmen, dass L1 zu a und b sowie L2 zu c und d benachbart sind. Mit anderen Worten: L(a, b) = L1 und L(c, d) = L2 . Betrachte nun die Geraden L(a, c) und L(b, d). Wiederum wegen A3) haben sie außer a, c bzw. b, d keine weiteren Nachbarn in F , sind somit paarweise verschieden und auch verschieden von L1 und L2 . Gemäß A1) existiert also ein Punkt x = x(L(a, c), L(b, d)). Wir behaupten, dass x weder zu L1 noch zu L2 benachbart ist. Zunächst ist klar, dass x nicht in F liegen kann, weil sonst L(a, c) oder L(b, d) ja noch einen dritten Nachbarn in F hätte. Wäre x zu L1 = L(a, b) benachbart, dann hätten L1 = L(a, b) und L(a, c) ja sowohl a wie auch x als gemeinsame Nachbarn, Widerspruch. Wäre x zu L2 = L(c, d) benachbart, dann hätten L2 = L(c, d) und L(b, d) ja sowohl d wie auch x als gemeinsame Nachbarn, ebenfalls Widerspruch. Zu c). Wir beweisen zunächst, dass zwei nicht benachbarte Knoten aus X und L im Hilfsgraphen A den gleichen Grad haben: x ∈ X und L ∈ L und (x, L) 6∈ E ⇒ |N (x)| = |N (L)|. (13.1) Beweis: Es sei s = |N (L)| und t = |N (x)| und N (L) = {x1 , . . . , xs } die Nachbarschaft von L. Zu jedem i ∈ [s] existiert nach A2) genau ein gemeinsamer Nachbar von xi und x, nennen wir ihn Li . Da x und L nicht benachbart sind, gilt xi 6= x und Li 6= L. Ferner sind die Li paarweise verschieden, denn wäre Li = Lj für i 6= j, dann hätten xi und xj die gemeinsamen Nachbarn L und Li = Lj , im Widerspruch zu A2). Da die Li insbesondere Nachbarn von x sind, folgt, dass s ≤ t. Das Argument lässt sich nun umdrehen und man erhält s = t und damit den Beweis von (13.1). Mit dieser Hilfsaussage beweisen wir nun, dass alle Geraden in L gleichen Grad haben, was äquivalent zu Ausssage c) ist. Es seien L1 , L2 ∈ L. Nach b) gibt es einen Punkt x ∈ X, der weder zu L1 noch zu L2 benachbart ist. Daraus folgt: (13.1) (13.1) |N (L1 )| = |N (x)| = |N (L2 )|. Zu d). Es sei x ∈ X beliebig. Nach a) existiert ein L ∈ L, das in A nicht zu x benachbart ist. Damit folgt (13.1) c) |N (x)| = |N (L)| = ` + 1. 64 Kapitel IV. Konstruierte Regularität Zu e). In den Aussagen c) und d) haben wir gezeigt, dass alle Knoten in A genau Grad ` + 1 haben. Somit folgt, dass |X|(` + 1) = |E| = |L|(` + 1), also |X| = |L|. Wir zählen nun noch geordnete Tripel der Form (x, L, y) mit x 6= y ∈ X, L ∈ L, und (x, L), (y, L) ∈ E. Einerseits gibt es davon genauso viele wie geordnete Paare (x, y) mit x 6= y ∈ X, also |X|(|X| − 1), da jedes solche Paar genau einen gemeinsamen Nachbarn L ∈ L hat. Andererseits können wir zu jedem L ∈ L ein geordnetes Paar aus N (L) wählen, um ein solches Tripel zu erzeugen. Wegen |N (L)| = ` + 1 gibt es dafür genau |L|(` + 1)` Möglichkeiten. Wir erhalten also |X|(|X| − 1) = |L|(` + 1)`. Mit Hilfe von |X| = |L| ergibt sich daraus |X| − 1 = `2 + `, was zu beweisen war. Dank dieser Erkenntnisse können wir jede endliche projektive Ebene gut in Form einer Matrix abspeichern. Definition. Sei (X, L) eine endliche projektive Ebene der Ordnung `. Wir setzen n := `2 + ` + 1 und benennen X = {x1 , . . . , xn } und L = {L1 , . . . , Ln }. Die n × n Inzidenzmatrix M = (mi,j ) ist definiert durch ( 1 xi ∈ Lj , mi,j := 0 xi 6∈ Lj . Offensichtlich gilt auf Grund der bereits zusammengetragenen Definitionen und Eigenschaften, dass jede Zeile und jede Spalte einer Inzidenzmatrix genau ` + 1 Einsen enthält. Weiterhin gilt: Lemma 13.2. Sei (X, L) eine endliche projektive Ebene der Ordnung ` und M die zugehörige Inzidenzmatrix. Dann gilt: 1 det(M ) = (` + 1)` 2 (` 2 +`) Beweis. Seien vi , vj die zu den Punkten xi 6= xj ∈ X zugehörigen Zeilenvektoren der Matrix M . Offensichtlich gilt, dass hvi , vi i = ` + 1. Da es außerdem genau eine Gerade L gibt, die xi und xj enthält, haben wir hvi , vj i = 1. Also enthält die Matrix M M T die Einträge `+1 auf der Diagonale und sonst überall den Eintrag 1. Die Eigenwerte dieser Matrix lauten ` (mit Multiplizität `2 + `, betrachte dazu die Eigenvektoren (0, . . . , 0, 1, −1, 0, . . . , 0)) und (` + 1)2 (mit Eigenvektor (1, . . . , 1)), und somit ergibt sich (` + 1)2 `(` was zu zeigen war. 2 +`) = det(M M T ) = det(M ) det(M T ) = (det(M ))2 , 13. Endliche projektive Ebenen 65 Existenz Wir wenden uns nun der Frage zu, ob endliche projektive Ebenen beliebiger Ordnung existieren. Mit der Fano-Ebene haben wir bereits ein Beispiel für eine Ebene der Ordnung 2 kennengelernt (und, wie man zeigen kann, das einzige). Bevor wir uns mit Ebenen höherer Ordnung beschäftigen, wiederholen wir zunächst einige Begriffe und Resultate aus der (linearen) Algebra. Satz (Endliche Körper). Es sei q eine natürliche Zahl. a) Die Menge Zq := {0, . . . , q − 1} zusammen mit der Addition modulo q und der Multiplikation modulo q bilden genau dann einen Körper, wenn q eine Primzahl ist. b) Es gibt genau dann einen Körper mit q Elementen, wenn q eine Primzahlpotenz ist, also q = pk mit p Primzahl und k ∈ N. Dieser Körper ist dann (bis auf Isomorphie) eindeutig und wird mit Fq bezeichnet. Man beachte: Wenn q = pk mit k > 1 ist, dann braucht man für die KörperKonstruktion von Fq eine etwas kompliziertere Körper-Konstruktion (als die von Zq mit Addition und Multiplikation modulo q). So ist F4 beispielsweise gegeben durch die Verknüpfungstabellen + 0 1 2 3 0 0 1 2 3 1 1 0 3 2 2 2 3 0 1 3 3 2 1 0 · 0 1 2 3 0 0 0 0 0 1 0 1 2 3 2 0 2 3 1 3 0 3 1 2. Zu einem beliebigen (endlichen oder unendlichen) Körper K können wir einen n-dimensionalen Vektorraum K n über K konstruieren, dessen Vektoren aus den n-Tupeln mit Komponenten aus K bestehen. Die Addition zweier Vektoren und die Multiplikation eines Körperelements mit einem Vektor ist hier wie üblich komponentenweise definiert. Wenn S eine Menge von Vektoren ist, dann bezeichnen wir mit lin(S) die Menge aller Linearkombinationen von Vektoren aus S. Wir können nun mit Hilfe von endlichen Körpern die Existenz von endlichen projektiven Ebenen nachweisen. Satz 13.3 (Existenz endlicher projektiver Ebene). Wenn q = pk eine Primzahlpotenz ist, dann gibt es eine endliche projektive Ebene der Ordnung q. Beweis. Sei K = Fq und betrachte den 3-dimensionalen Vektorraum K 3 . Die Menge X bestehe aus allen 1-dimensionalen Unterräumen, die Menge L aus allen 2-dimensionalen Unterräumen des K 3 , und ein x ∈ X sei in L ∈ L enthalten, wenn x Unterraum von L ist. Ein Beispiel: für Sei K = F2 . Betrachte die zwei Punkte x1 := lin((1, 0, 0)) und x2 := lin((0, 1, 0)). Dann ist L := lin((1, 0, 0), (0, 1, 0)) die einzige Gerade, die x1 und x2 enthält. 66 Kapitel IV. Konstruierte Regularität Wir überprüfen kurz, ob damit die Eigenschaften A1) bis A3) aus der Definition einer endlichen projektiven Ebene erfüllt sind. Dazu seien L1 und L2 zwei 2-dimensionale Unterräume des K 3 . Wegen dim(L1 ∩ L2 ) = dim(L1 ) + dim(L2 ) − dim(lin(L1 ∪ L2 )) = 2 + 2 − 3 = 1 muss L1 ∩ L2 aus einem einzigen Punkt bestehen und damit ist Eigenschaft A1) erfüllt. Desweiteren sind zwei 1-dimensionale Unterräume immer in genau einem 2dimensionalen Unterraum enthalten (Eigenschaft A2)). Die Eigenschaft A3) lässt sich schließlich durch die Menge F der vier verschiedenen 1-dimensionalen Unterräume einsehen, die durch die Vektoren (1, 0, 0), (0, 1, 0), (0, 0, 1) und (1, 1, 1) erzeugt werden. Um nun die Ordnung dieser projektiven Ebene zu bestimmen, überlegen wir uns, wieviele Punkte X enthält. Der Vektorraum K 3 enhält insgesamt q 3 − 1 von (0, 0, 0) verschiendene Vektoren Ein beliebiger 1-dimensionaler Unterraum von K 3 ist von der Form {αv : α ∈ K} mit einem Vektor v ∈ K 3 \ {(0, 0, 0)} und enthält daher genau q − 1 Vektoren 6= (0, 0, 0). Je zwei 1-dimensionale Unterräume überschneiden sich in genau dem Vektor (0, 0, 0). Es gibt daher (q 3 − 1)/(q − 1) = q 2 + q + 1 Unterräume der Dimension 1, und das impliziert, dass die Ebene Ordnung q hat. Die obige projektive Ebene wird üblicherweise mit P G(2, q) oder P G2 (q) bezeichnet. Gibt es projektive Ebenen der Ordnung q, wenn q keine Primzahlpotenz ist? Anders als bei endlichen Körpern ist das noch nicht vollständig geklärt. Man kann zwar zeigen, dass es keine projektiven Ebenen der Ordnung 6 oder 10 gibt, doch bereits für q ≥ 12 ist die Frage noch offen. Designs Die Regularität, die in den definierenden Eigenschaften a) und b) einer projektiven Ebene enthalten ist, lässt sich natürlich auch allgemeiner studieren. Wir geben hier nur einen minimalen Ausblick. Definition. Es seien t, v, k, λ ∈ N mit v ≥ k ≥ t ≥ 1 und λ ≥ 1. Ein t-Design mit Parametern v, k, λ besteht aus einer endlichen Menge V und einer Familie B von Teilmengen von V mit den folgenden Eigenschaften: a) |V | = v. b) Für jedes B ∈ B gilt, dass |B| = k. c) Jedes T ∈ Vt ist in genau λ der Mengen in B enthalten. Auf Grund von Lemma 13.1 ist eine projektive Ebene der Ordnung ` offensichtlich ein 2-Design mit Parametern v = `2 + ` + 1, k = ` + 1, λ = 1, denn jedes Paar von Punkten ist ja nach Definition in genau einer Gerade enthalten. Andererseits gilt (wiederum nach Lemma 13.1) auch, dass jeder Punkt in genau 14. Codierungstheorie 67 ` + 1 Geraden enthalten ist, d.h. es handelt sich hier auch um ein 1-Design mit Paramtern `2 + ` + 1, ` + 1, ` + 1. Die Tatsache, dass sich die Regularität von Punkt-Paaren auf Punkte vererbt, lässt sich allgemeiner beobachten: Lemma 13.4. Sei (V, B) ein t-Design mit Parametern v, k, λ. Dann gilt: a) |B| = λ vt / kt . b) Für jedes i ∈ [t] ist (V, B) auch ein i-Design mit Parametern v, k, λi := k−i λ v−i / t−i t−i . Beweisskizze. Teil a) ergibt sich durch doppeltes Abzählen der Paare (T, B) mit |T | = t, B ∈ B, T ⊂ B. Teil b) wird mit Induktion über i bewiesen. Für den Induktionsanfang setze λ0 = |B|. Auch hier lautet eine der wichtigsten (und noch nicht vollständig geklärten) Fragen: Für welche Parameter t, v, k, λ gibt es überhaupt ein entsprechendes Design? Für t = 4 kennt man nur endlich viele, für t = 5 unendlich viele. Das erste nicht-triviale Design mit t = 6 wurde erst 1982 konstruiert, und es galt als große Überraschung, als Teirlinck 1987 bewies, dass es zu jedem t ∈ N entsprechende, nicht-triviale Designs gibt. 14 Codierungstheorie Im vorangegangenen Abschnitt haben wir sehr regelmäßie Strukturen konstruiert und ihre Eigenschaften untersucht. Hier wollen wir jetzt zeigen, wie man diese Objekte nutzen kann, um Informationen effizient zu kodieren. Das Kernthema der Codierungstheorie befasst sich mit der folgenden Situation: Ein Sender verschickt Informationen, diese können durch unterwegs eventuell auftretende Störungen verändert werden, sollen aber dann trotzdem vom Empfänger richtig verstanden werden. Der Grundansatz besteht darin, dass Sender und Empfänger vorher im Rahmen eines Kodierungsschemas vereinbaren, dass versendete Informationen immer von einer bestimmten Form sein müssen. Falls das empfangene Wort nicht von der vereinbarten Form ist, weiß der Empfänger, dass eine Störung aufgetreten ist, und kann die Nachricht unter bestimmten Voraussetzungen auch wieder reparieren. Ein einfaches Beispiel ist der sogenannte parity code. Hierbei werden 0–1Wörter verschickt, und an jedes Wort wird ein zusätzliches Bit angefügt, so dass die Anzahl der Einsen insgesamt gerade ist. Unter der Annahme, dass höchstens ein Zeichen unterwegs verändert wurde, kann der Empfänger also feststellen, ob dies geschehen ist – auch wenn er natürlich keine Chance hat, herauszufinden, welches Zeichen das war und den Fehler daher nicht reparieren kann. Um Reparaturen zu ermöglichen, kann man beispielsweise den Wiederholungscode benutzen: hier verschickt der Sender einfach dreimal hintereinander das eigentlich gemeinte 0–1-Wort. Wiederum unter der Annahme, dass höchstens ein Zeichen unterwegs verändert wurde, kann der Empfänger den Fehler identifizieren und reparieren. 68 Kapitel IV. Konstruierte Regularität Definition. Sei A eine Menge der Kardinalität |A| = q ≥ 2 (das sogenannte Codierungsalphabet), und seien t, n ∈ N. Die Hammingdistanz zwischen a = (a1 , . . . , an ) ∈ An und b = (b1 , . . . , bn ) ∈ An ist definiert durch ∆(a, b) := |{i ∈ [n] : ai 6= bi }. Ein Code über dem Alphabet A ist eine Menge C ⊆ An , die Elemente von C heißen Codewörter. C heißt t-fehlerentdeckend, wenn für alle a 6= b ∈ C gilt, dass ∆(a, b) ≥ t + 1. C heißt t-fehlerkorrigierend, wenn für alle a 6= b ∈ C gilt, dass ∆(a, b) ≥ 2t + 1. Die Distanz von C ist definiert durch d(C) := min{∆(a, b) : a, b ∈ C}. Einen Code über dem Alphabet {0, 1} nennt man binär. Angenommen, das Wort a ∈ C werde gesendet, das Wort b ∈ An werde empfangen, und maximal t Zeichen sind unterwegs gestört worden, also ∆(a, b) ≤ t. • Wenn C nun t-fehlerentdeckend ist, dann ist entweder b = a oder b 6∈ C. Das heißt: wenn das empfangene Wort b in C liegt, dann ist es mit dem gesendeten Wort a identisch; und wenn b 6∈ C, dann weiß der Empfänger, dass ein Fehler aufgetreten ist. • Wenn C nun t-fehlerkorrigierend ist, dann gibt es außer a kein Wort a0 ∈ C mit ∆(b, a0 ) ≤ t, denn sonst würde aus ∆(a, b) ≤ t und ∆(b, a0 ) ≤ t ja folgen, dass ∆(a, a0 ) ≤ 2t (im Widerspruch dazu, dass C t-fehlerkorrigierend ist). Das heißt: der Empfänger kann das gesendete Wort a dadurch identifizieren, dass es das einzige Wort in C ist, das Abstand höchstens t zum empfangenen Wort b hat. • Wir können also ein zentrales Ziel der Kodierungstheorie wie folgt formulieren: zu gegebenem Alphabet A und Wortlänge n suchen wir einen Code C ⊆ An mit möglichst großem d(C) und möglichst großem |C|. Schranken Definition. Seien n, d, q ∈ N. Wir setzen C(n, d, q) := {C ⊆ {0, . . . , q − 1}n : d(C) ≥ d} und M (n, d, q) := max {|C| : C ∈ C(n, d, q)} . Die Menge C(n, d, q) beschreibt also die Menge aller Codes mit Wörtern der Länge n über einem q-elementigen Alphabet, die paarweise Abstand mindestens d haben müssen, und M (n, d, q) ist die maximale Anzahl von Codewörtern in einem solchen Code. Die folgende Schranke ergibt sich unmittelbar aus der Definition. Satz 14.1 (Hamming–Schranke). Seien n, t, q ∈ N und d = 2t + 1. Dann gilt M (n, d, q) ≤ Pt i=0 qn . n i i (q − 1) 14. Codierungstheorie 69 Beweis. Um die Notation zu vereinfachen, setzen wir A := {0, . . . , q − 1} und bezeichnen mit Bt (c) := {c0 ∈ An : ∆(c, c0 ) ≤ t} für ein beliebiges c ∈ An . die Hammingkugel um c mit Radius t. Um die Kardinalität von Bt (c) abzuschätzen 0 überlegen wir uns zuerst, wieviele Wörter c es gibt, die sich an genau i Stellen n von c unterscheiden: es gibt i Möglichkeiten, diese i Stellen auszusuchen, und dann für jede dieser Stellen q − 1 Möglichkeiten, ein anderes Zeichen (als das, das in c an dieser Stelle steht) auszuwählen. Wenn wir dann noch über i summieren erhalten wir t X n (q − 1)i . |Bt (c)| = i i=0 Sei nun C ein Code aus C(n, d, q). Da für alle a, b ∈ C gilt, dass ∆(a, b) ≥ d(C) ≥ d ist, also Bt (a) ∩ Bt (b) = ∅, folgt n n q = |A | ≥ | [ Bt (a)| = |C| · t X n i=0 a∈C i (q − 1)i , und daraus die Behauptung. Einen Code C ∈ C(n, 2t + 1, q), bei dem die obige Schranke mit Gleichheit n gilt, also |C| = Pt qn (q−1)i , nennt man t-perfekt. ( i=0 i ) Im obigen Beweis haben wir argumentiert, dass die Kugeln Bt (c) mit Radius t um die Codewörter c sich nicht überlappen dürfen, und dadurch eine obere Schranke für die Anzahl der Codewörter hergeleitet. Umgekehrt müssen aber in einem maximalen Code die Bälle Bd−1 (c) mit Radius d − 1 = 2t um die Codewörter c den Raum {0, . . . , q − 1}n vollständig überdecken, denn sonst könnten wir ein noch nicht überdecktes Wort zum Code hinzufügen, da es offensichtlich den notwenidgen Mindestabstand von d zu allen Codewörtern besitzt. Auf diese Weise lässt sich sofort die folgende untere Schranke für M (n, d, q) herleiten. Satz 14.2 (Gilbert-Varshamov–Schranke). Es seien n, d, q ∈ N. Dann gilt M (n, d, q) ≥ Pd−1 i=0 Beweis. klar. qn . n i i (q − 1) Lineare Codes Es sei q eine Primzahlpotenz. In diesem Abschnitt benutzen wir wieder die Menge {0, . . . , q−1} als unser Kodierungsalphabet, wollen dabei aber von der zusätzlichen algebraischen Struktur des Körpers Fq Gebrauch machen werden. Dies schlägt sich in der folgenden Definition nieder. 70 Kapitel IV. Konstruierte Regularität Definition. Sei q eine Primzahlpotenz, K = Fq und K n der entsprechende Vektorraum über K. Eine Menge C ⊆ K n heißt linearer Code über Fq , wenn C einen Untervektorraum von K n bildet, das heißt, wenn a) 0 ∈ C, b) ∀x, y ∈ C: x + y ∈ C, und c) ∀α ∈ K und ∀x ∈ C: αx ∈ C. Wenn k ∈ N die (Vektorraum-) Dimension von C ist, dann heißt C auch (n, k)-Code über Fq , und für x ∈ C heißt w(x) := |{i ∈ [n] : xi 6= 0}| das Gewicht von x. Dank der starken Struktureigenschaften eines linearen Codes ist unmittelbar klar, wieviele Codewörter er enthält. Außerden fallen hier zwei Parameter zusammen, nämlich die Distanz und das minimale (positive) Gewicht eines Codewortes. Lemma 14.3. Sei C ein (n, k)-Code über . Dann gelten: a) |C| = q k . b) d(C) = min ∆(a, b) = min w(c). a,b∈C,a6=b c∈C,c6=0 Beweis. a) Da C ein (n, k)-Code ist, hat der Unterraum C eine Basis mit k Basisvektoren. Jedes Element von C ist daher eineindeutig gegeben durch die Wahl der k Koeffizienten aus Fq . b) Einerseits gilt: 0∈C min a,b∈C,a6=b ∆(a, b) ≤ min ∆(0, c) = min w(c). c∈C,c6=0 c∈C,c6=0 Andererseits gilt für alle a, b ∈ K n , dass ∆(a, b) = w(a − b), und damit min a,b∈C,a6=b ∆(a, b) = min a,b∈C,a6=b w(a − b) a−b∈C ≥ min w(c). c∈C,c6=0 Die Dimension eines linearen Code macht also auch eine Angabe darüber, wieviele Codewörter er hat. Dementsprechend wird das Verhältnis k/n eines (n, k)Codes auch Informationsrate genannt. Oft ist es nützlich, zu einem linearen Code C auch den erweiterten Code C̄ und den dualen Code C ⊥ zu betrachten: Definition. Es sei C ein (n, k)-Code. a) Wir bezeichnen mit ( C̄ := (c1 , . . . , cn+1 ) : (c1 , . . . , cn ) ∈ C, n+1 X i=1 ) ci = 0 14. Codierungstheorie 71 den erweiterten Code von C. Die Komponente cn+1 heißt parity check symbol. b) Der zu C duale Code ist definiert durch C ⊥ := {a ∈ K n : ha, ci = 0 ∀c ∈ C}. Unmittelbar aus elementaren Ergebnissen der Linearen Algebra ergeben sich die folgenden Eigenschaften von C̄ und C ⊥ . Lemma 14.4. Wenn C ein (n, k)-Code ist, dann sind auch C̄ und C ⊥ lineare Codes. Es gilt, dass dim(C ⊥ ) = n − k und (C ⊥ )⊥ = C ist. Weiterhin wissen wir, dass es zwei Matrizen G ∈ K n×k und H ∈ K (n−k)×n gibt, sodass C = im(G) = ker(H) und daher rang(H) = dim(im(H)) = n − k ist. Die Matrizen G und H heißen Generator- und Kontrollmatrizen von C. Ohne Einschränkung kann man ferner annehmen, dass H (nach Skalierung und Permutationen) von der Form H = (In−k |H 0 ) ist, wobei In−k die (n − k) × (n − k) Identitätsmatrix ist. Beweis. Übung aus der Linearen Algebra. Ein Code C 6= K n ist also eindeutig durch eine Kontrollmatrix festgelegt. Wie sieht man der Kontrollmatrix die Distanz des Codes an? Lemma 14.5. Sei C ⊆ K n ein (n, k)-Code mit Kontrollmatrix H. Dann gilt: d(C) ≥ d ⇔ je d − 1 Spalten in H sind linear unabhängig. Beweis. Seien u1 , . . . , un ∈ K n−k die Spalten von H. Dann gilt 14.4 c = (c1 , . . . , cn ) ∈ C ⇔ Hc = 0 ⇔ c1 u1 + · · · + cn un = 0. Nehmen wir nun an, dass d(C) ≤ d − 1 ist. Dann existiert wegen Proposition 14.3 ein c ∈ C mit w(c) ≤ d − 1, und es seien ci1 , . . . , ci` mit ` ≤ d − 1 die Nichtnullkomponenten von c. Dann ist ci1 ui1 + · · · + ci` ui` = 0, also existieren ` ≤ d − 1 linear abhängige Spalten in H. Umgekehrt können wir analog argumentieren: wenn es cj1 , . . . , cjh ∈ K mit h ≤ d−1 und cj1 uj1 +· · ·+cjh ujh = 0 gibt, dann bilden wir aus diesen Komponenten einen Vektor c ∈ K n , in dem wir alle anderen Komponenten auf Null setzen. Somit erhalten wir einen Vektor c mit w(c) ≤ d − 1 und c1 u1 + · · · + cn un = 0, also c ∈ C, womit d(C) ≤ d − 1 gezeigt ist. Nach diesen Vorbereitungen wollen wir nun überlegen, wie wir mit Hilfe der linearen Struktur effizient Decodieren können. Sei C ein (n, k)-Code über K mit Kontrollmatrix H und Distanz d(C) = 2t+1. Wir betrachten die lineare Abbildung s : K n → K n−k mit s(a) = Ha. Man nennt s(a) das Syndrom von a, weil durch s(a) der Übertragungsfehler, der in dem empfangenen Wort a aufgetreten ist, eindeutig beschrieben wird, solange dieser Fehler nicht zu groß ist: 72 Kapitel IV. Konstruierte Regularität • Offensichtlich gilt für alle a, b ∈ K n : s(a) = s(b) ⇔ Ha = Hb ⇔ H(b − a) = 0 ⇔ b − a ∈ C. • Eine wichtige Eigenschaft der Abbildung s ist, dass sie, eingeschränkt auf {a ∈ K n : w(a) ≤ t}, injektiv ist. Beweis: Es seien a, b ∈ K n mit a 6= b und w(a) ≤ t und w(b) ≤ t. Wäre s(a) = s(b), dann müsste nach der vorangegangenen Überlegung 0 6= b − a ∈ C, und damit w(b − a) ≥ 2t + 1. Das steht aber im Widerspruch zu w(a) ≤ t und w(b) ≤ t. • Wir nehmen an, das Wort x ∈ C werde gesendet und das Wort y = x+e ∈ K n mit w(e) ≤ t werde empfangen. Der Empfänger berechnet dann s(y) = s(x + e) = s(x) + s(e) = s(e) und kann wegen der zuvor konstatierten Injektivität von s(e) auf e zurückschließen. Mit Hilfe von e kann er dann den Fehler korrigieren und das ursprünglich gesendete Wort x := y − e berechnen. Dieses Decodierungsverfahren ist einfach und kann immer angewendet werden – aber es ist nicht immer besonders schnell. Für spezielle Codes gibt es kompliziertere, aber schnellere Verfahren zur Decodierung. Beispielsweise werden Daten, die auf CDs gebrannt werden, mit solch speziellen Codes aufbereitet; Lesefehler, die durch kleine Kratzer oder Staub auf der Oberfläche der CD entstehen, können dadurch mühelos und schnell berichtigt werden. Zum Abschluss dieses Kapitels wollen wir nun noch einen Zusammenhang zwischen endlichen projektiven Ebenen und linearen Codes herstellen. Satz 14.6. Es sei ` ≡ 2( mod 4). Dann erzeugen die Zeilen der Inzidenzmatrix einer projektiven Ebene (X, L) der Ordnung ` einen binären Code C der Dimension 21 (`2 + ` + 2). Beweis. Es sei n := `2 + ` + 1 und M die Inzidenzmatrix von (X, L). Ihre Zeilenvektoren bezeichnen wir mit v 1 , . . . , v n ∈ {0, 1}n und setzen, wie gefordert, C := lin(v 1 , . . . , v n ). Im ersten Teil des Beweises zeigen wir, dass dim(C) ≤ 21 (`2 + ` + 2) und im zweiten Teil die umgekehrte Ungleichung. Teil 1: dim(C) ≤ 21 (`2 + ` + 2). Dazu betrachten wir den erweiterten Code C̄ und behaupten, dass das Skalarprodukt zweier (nicht notwendig verschiedener) Codewörter v, v 0 ∈ C̄ immer 0 ergibt. Um das einzusehen, betrachten wir zunächst zwei Zeilenvektoren v i und v j von M . Hier gilt h(v i ), v j i = 1, denn die Vektoren haben genau ` + 1 ≡ 1( mod 2) viele 1-Komponenten, und stimmen entweder in allen ` + 1 1-Komponenten (wenn i = j) oder in genau einer 1-Komponente (wenn i 6= j) überein. Es lässt sich leicht 14. Codierungstheorie 73 überprüfen, dass daraus für je zwei erweiterte Codewörter v, v 0 ∈ C̄ folgt, dass hv, v 0 i = 0. Aus der Behauptung folgt, dass C̄ ⊥ = C̄ und somit n + 1 = dim(C̄) + dim(C̄ ⊥ ) = 2 dim(C̄), also dim(C) ≤ dim(C̄) = 21 (n + 1) = 21 (`2 + ` + 2). Teil 2: dim(C) ≥ 21 (`2 + ` + 2). Setze k := dim(C) und betrachte die Kon(n−k)×n trollmatrix H ∈ F2 von C, von der wir wieder annehmen wollen, dass sie in der Form H = (In−k |H 0 ) gegeben sei. Definiere die Matrix N ∈ Fn×n durch 2 0 0 I In−k H 0 H n−k = , also N T = = HT N= 0 Ik 0 Ik H 0T Ik Ik Alle folgenden Operationen wollen wir über dem Körper Q (und nicht über F2 ) ausführen. Dann gilt einerseits, dass det(M N T ) = det(M ) det(N T ) = det(M ) Lemma 13.2 = 1 2 (` + 1)` 2 (` +`) . (14.2) T Andererseits betrachten wir die ersten n − k Spalten der Matrix M N . Wenn v ∈ Fn2 ein Zeilenvektor von M (und damit ein Codewort von C) ist, und w ∈ Fn2 ein Spaltenvektor von H T , also ein Zeilenvektor der Kontrollmatrix H, ist, dann gilt über F2 , dass hv, w, =i0. Über dem Körper Q muss dann das Ergebnis eine gerade natürliche Zahl sein. Wenn wir aus all diesen n − k Spalten den Faktor 2 aus der Matrix nach vorne ziehen, ist klar, dass det(M N T ) und damit det(M N ) ein Vielfaches von 2n−k sein muss. Da ` von der Form ` = 4p + 2 = 2(2p + 1) und ` + 1 ungerade ist, folgt aus (14.2), dass 12 (`2 + `) ≥ n − k. Somit muss 1 1 1 k ≥ n − (`2 + `) = (`2 + ` + 1) − (`2 + `) = (`2 + ` + 2), 2 2 2 was zu zeigen war. Man kann darüber hinaus noch zeigen, dass fuer den im obigen Satz konstruierten Code d(C) = ` + 1 gilt, und dass jedes Codewort mit Gewicht ` + 1 einer Gerade in der projektiven Ebene entspricht. Damit hat der Code eigentlich recht gute Eigenschaften, nämlich eine Informationsrate von dim(C) 1/2(`2 + ` + 2) 1 = ∼ , 2 n ` +`+1 2 und gleichzeitig eine Distanz von √ d(C) = ` + 1 ∼ n. Andererseits basiert seine Konstruktion auf einer projektiven Ebene der Ordnung ` ≡ 2( mod 4) und die einzige derartige bekannte Ebene ist die Fano-Ebene. Tatsächlich hat man beispielsweise für den Fall ` = 10 die abgeleiteten Code– Eigenschaften benutzt, um zu zeigen, dass es keine projektive Ebene der Ordnung 10 geben kann. Zum Abschluss nun noch ein Beispiel als Übungsaufgabe: betrachten Sie den Code, der von der Fano-Ebene erzeugt wird. Ist er perfekt? 74 Kapitel IV. Konstruierte Regularität Übungsaufgaben 1. Beweisen Sie Lemma 14.4 2. Sei (X, L) eine projektive Ebene der Ordnung ` mit ` ungerade. Betrachten Sie den Code C, den man erhält, wenn man basierend auf einer solchen Ebene die gleiche Konstruktion wie in Satz 14.6 durchführt. Was kann man über C aussagen? Literaturhinweise zu Kapitel 14 Weiteres Material findet sich beispielsweise bei [A] in Kapitel 13 und bei [S] in Kapitel 5.4. Kapitel V Ramseytheorie Im vorangegangenen Kapitel haben wir uns angestrengt, um Objekte mit einer besonders ausgeprägten Struktur zu konstruieren, oder wenigstens ihre Existenz nachzuweisen. Im Folgenden untersuchen wir ein Phänomen, das dem in gewisser Weise entgegen gesetzt zu sein scheint: wenn ein Objekt genügend groß ist, dann muss es wohl strukturierte Teilobjekte enthalten. Dieses Leitmotiv der Ramseytheorie lässt sich gut mit den Worten von Theodore Motzkin zusammenfassen: complete disorder is impossible. 15 Satz von Ramsey Ein Beispiel für die eben genannte Philosophie ist das sogenannte Schubfachprinzip, das sofort einsichtig ist. In der endlichen Version besagt es: Seien N und M zwei endliche Mengen mit Kardinalität n = |N | und m = |M |, und sei f : N → M n eine beliebige Funktion. Dann existiert eine Menge S ⊂ N mit |S| ≥ d m e und ein Element c0 ∈ M , so dass die Funktion f alle Elemente von S auf c0 abbildet.1 Die unendliche Variante des Schubfachprinzip lässt sich noch eleganter formulieren: Wenn die Elemente einer unendlichen Menge mit einer endlichen Anzahl von Farben gefärbt werden, dann existert eine unendliche einfarbige Teilmenge – also eine Teilmenge, deren Elemente alle die gleiche Farbe erhalten. Das Schubfachprinzip ist deswegen so einfach, weil hier die gleichen Objekte, nämlich die Elemente der Menge N , sowohl gefärbt wie auch zu Teilmengen zusammengefasst werden sollen. Die Situation wird ungleich interessanter, wenn wir zwar nachwievor nach Teilmengen von N suchen, aber nun 2−, 3−, oder r-Tupel färben. 1 Klar: wenn wir n Tauben in einem Taubeschlag mit m Löchern verteilen, dann müssen in n einem Loch mindestens d m e hocken – irgendwo müssen sie ja hin. Aus diesem Grund heißt das Schubfachprinzip auf Englisch auch pigeonhole principle. 76 Kapitel V. Ramseytheorie Eine kleine Anmerkung: Es hat sich eingebürgert, innerhalb der Ramseytheorie von Färbungen zu sprechen – damit ist aber nichts weiter als eine Partition der betreffenden Familie in eine (endliche oder unendliche) Anzahl von (Farb)Klassen gemeint. In keinem Fall sind damit Färbungen gemeint, die per se bestimmte Eigenschaften haben müssen, wie beispielsweise die Graphenfärbungen in Abschnitt 11, bei denen benachbarte Knoten unterschiedliche Farben brauchen. Als nächstes färben wir nun Paare von Knoten und stellen uns diese als die Kantenmenge eines (vollständigen) Graphen vor. Definition (Ramseyzahl). Sei k ∈ N. Die Ramseyzahl R(k) bezeichnet die kleinste natürliche Zahl n mit der Eigenschaft, dass jede Färbung der Kanten des vollständigen Graphen Kn mit zwei Farben einen einfarbigen Kk erzwingt. Um mit dieser Definition vertraut zu werden, betrachten wir zunächst einige einfache Beispiele. Es gilt, dass 5 < R(3), denn wie die folgende Abbildung zeigt, existiert eine 2-Kantenfärbung des K5 ohne einen einfarbigen K3 . Um sich andererseits davon zu überzeugen, dass R(3) ≤ 6, müssen wir zeigen, dass jede 2-Kantenfärbung des K6 einen einfarbigen K3 erzwingt. Sei also eine beliebige rot-blau Färbung der Kanten des K6 gegeben. Wir betrachten einen beliebigen Knoten x. Wegen des Schubfachprinzips muss x zu mindestens drei der fünf verbleibenden Knoten mittels Kanten der gleichen Farbe verbunden sein (denn 3 = d5/2e), sagen wir (oBdA) dies seien die Knoten u, v, w und die Kanten haben alle drei die Farbe rot. Jetzt sind wir aber fertig, denn – entweder ist mindestens eine der Kanten {u, v}, {v, w} oder {w, u} auch rot, dann schließt sich mit Hilfe der roten Kanten zu x ein roter K3 , – oder alle Kanten {u, v}, {v, w} oder {w, u} sind blau, dann haben wir einen blauen K3 gefunden. Insgesamt haben wir also gezeigt, dass 5 < R(3) ≤ 6, somit folgt R(3) = 6. Nach dieser Aufwärmübung stellt sich die Frage, warum eine solche kleinste natürliche Zahl n wie in der obigen Definition überhaupt existieren muss. Könnte es nicht sein, dass beispielsweise für k = 17 für jedes noch so große n ∈ N eine 2-Kantenfärbung des Kn existiert, die keinen einfarbigen K17 enthält? Der folgende Satz zeigt, dass das nicht sein kann, und gibt zugleich Schranken für R(k) an. 15. Satz von Ramsey 77 Satz 15.1. Für k ∈ N gilt: 2k/2 ≤ R(k) ≤ 22k−2 . Beweis. Die untere Schranke werden wir später in Abschnitt ?? mit Hilfe von probabilistischen Methoden beweisen. Zum Beweis der oberen Schranke führen wir Induktion über k. Für k = 1 gilt die Aussage offensichtlich. Sei also k ≥ 2 und eine beliebige rot-blau Färbung der Kanten des Kn auf n = 22k−2 Knoten gegeben. Wir müssen zeigen, dass sie einen einfarbigen Kk enthält. Setze V0 := [n] und wähle v0 ∈ V0 beliebig. Wir definieren eine Folge von Knoten v0 , v1 . . . und Teilmengen V0 , V1 . . . wie folgt. Wenn vi ∈ Vi gewählt, dann betrachte rote und blaue Nachbarn von vi innerhalb von Vi . Bezeichne die größere der beiden Mengen mit Vi+1 und wähle beliebiges vi+1 ∈ Vi+1 . Daraus folgt, dass |Vi+1 | ≥ |Vi |/2, und wegen n = 22k−2 folgt damit, dass wir somit eine Folge v0 , . . . , v2k−2 konstruieren können. Wenn mindestens die Hälfte der Knoten vi mehr rote als blaue Nachbarn in Vi hat, dann haben wir einen roten Kk gefunden, andernfalls einen blauen. Diese obere Schranke garantiert uns insbesondere, dass die Ramseyzahl R(k) wohldefiniert ist. Tatsächlich kennt man die exakten Werte nur von sehr wenigen Ramseyzahlen – man weiß beispielsweise, dass R(4) = 18, aber schon für k = 5 sind lediglich die Schranken 43 ≤ R(5) ≤ 49 bekannt. Man beachte, dass hier auch 43 ein Probieren mit dem Computer nicht viel hilft, weil man ja 2( 2 ) verschiedene 2-Kantenfärbungen des K43 durchgehen müsste. Für allgemeine k ist die derzeit beste bekannte obere Schranke von der 2k Größenordnung 2√k (und damit nur wenig geringer als die Schranke aus dem obigen Satz). Wir betrachten nun zwei Varianten des obigen Satzes. In der ersten werden nicht nur Paare mit zwei Farben, sondern allgemeiner r-Tupel mit c verschiedenen Farben gefärbt. Die zweite beschreibt eine unendliche Version. Satz 15.2 (Satz von Ramsey). Für beliebige natürliche Zahlen k, ` und r existiert eine kleinste natürliche Zahl R(k, `, r), so dass für jede Menge N mit |N | ≥ R(k, `, r) und jede Färbung N f: → [r] ` eine Menge K ∈ N k und eine Farbe r0 ∈ [r], so dass K f (L) = r0 ∀L ∈ . ` Mit anderen Worten: jede Färbung der `-elementigen Teilmengen aus der Menge N erzwingt eine Menge K ⊂ [n] der Größe k, deren `-Mengen alle die gleiche Farbe haben. 78 Kapitel V. Ramseytheorie Beweis. Wir beweisen den Satz durch Induktion über `. Für den Induktionsanfang ` = 1 folgt die Aussage aus dem zu Beginn des Kapitels erwähnten Schubfachprinzip, und für ` = 2 aus Satz 15.1. Nach Induktionsannahme gilt die Aussage für k, ` − 1 und r und wir setzen t := R(k, ` − 1, r). (15.1) Ferner wählen wir n ∈ N so groß, dass die Folge u`−2 ≥ u`−1 ≥ · · · ≥ ut , die durch u`−2 := n − (` − 2) und die Rekursion i+1 ui+1 := (ui − 1)r−(`−1) (15.2) noch ut ≥ 1 erfüllt. Wir behaupten, dass das so gewählte n die gewünschten Ramsey–Eigenschaften besitzt. Etwas genauer: Wenn N eine Menge der Kardi nalität mindestens n und f : N` → [r] eine beliebige Färbung ist, dann können K wir eine Menge K ∈ N k finden, so dass alle L ∈ ` von f auf die gleiche Farbe abgebildet werden. Mit dieser Aussage hätten wir dann die Existenz von R(k, `, r) nachgewiesen (und mehr müssen wir ja auch gar nicht zeigen). Unser Zwischenziel ist es, eine Folge S`−2 , St von Teilmengen Si ⊆ [n] und eine Folge a1 , . . . , at von Zahlen ai ∈ N mit ai+1 ∈ Si und Si+1 ⊆ Si \ {ai+1 } und der folgenden Eigenschaft zu konstruieren: Für beliebige i1 < · · · < i`−1 f ({ai1 , . . . , ai`−1 , as }) und = s, s0 ∈ [t] mit i`−1 + 1 ≤ s, s0 gilt: f ({ai1 , . . . , ai`−1 , as0 }). (15.3) Mit anderen Worten: Die durch f an die `-Menge vergebene Farbe ist unabhängig von der letzten Zahl. Um das zu erreichen wählen wir die ersten Elemente a1 , . . . , a`−2 beliebig aus der Menge [n] und setzen S`−2 := [n] − {a1 , . . . , a`−2 }. Angenommen i ≥ ` − 2 und die Folgen a1 , . . . , ai und Si ⊆ · · · ⊆ S`−2 seien konstruiert. Wir wählen dann ai+1 aus Si beliebig und nummerieren die Teilmengen durch {a1 , . . . , ai+1 } =: {T1 , . . . , T(i+1) }. `−1 `−1 i+1 Jetzt weisen wir jedem x ∈ Si \ {ai+1 } einen Vektor xf ∈ [r](`−1) zu, der aus den Farben aller `-Mengen, die x enthalten, besteht: xf := f (T1 ∪ {x}), . . . , f (T(i+1) ∪ {x}) . `−1 Bild 15. Satz von Ramsey 79 Wir nennen zwei Zahlen x, y aus Si \ {ai+1 } äquivalent, wenn xf = yf . Dadurch definieren wir eine Äquivalenzrelation und bezeichnen mit Si+1 eine größte der so entstehenden Äquivalenzklassen. Für zwei x, y ∈ Si+1 gilt nun, dass {a1 , . . . , ai+1 } xf = yf und damit f (T ∪ {x}) = f (T ∪ {y}) für alle T ∈ . `−1 i+1 Wie groß ist Si+1 ? Da es höchstens r(`−1) verschiedene Vektoren gibt, kann es auch nur höchstens soviele Äquivalenzklassen geben, also muss Si+1 als eine i+1 größte von ihnen mindestens (|Si | − 1)/r(`−1) Elemente enthalten. Nach Definition von n und der Rekursion in (15.2) folgt, dass wir die Folgen bis at ∈ [n] und St 6= ∅ fortsetzen können. Damit haben wir nun unser in (15.3) formuliertes Zwischenziel erreicht: Zu gegebenem i1 < · · · < i`−1 und i`−1 + 1 ≤ s, s0 wählen wir den Index i so, dass i + 1 = i`−1 und damit auch i + 1 ≤ s − 1, s0 − 1. Somit folgt {ai1 , . . . , ai`−1 } ⊆ {a1 , . . . , ai+1 } sowie as ∈ Ss−1 ⊆ Si+1 und as0 ∈ Ss0 −1 ⊆ Si+1 . Nach Konstruktion ist dann wegen (as )f = (as0 )f f ({ai1 , . . . , ai`−1 , as }) = f ({ai1 , . . . , ai`−1 , as0 }), wie in (15.3) gefordert. Jetzt definieren wir eine Färbung fˆ : {a1 ,...,at } `−1 → [r] durch fˆ({ai1 , . . . , ai`−1 }) := f ({ai1 , . . . , ai`−1 , as }) für ein beliebiges as mit i`−1 + 1 ≤ s ≤ t. Nach (15.3) spielt die Wahl von as dabei keine Rolle. (Falls i`−1 = t und deswegen kein Platz mehr für s sein sollte, wählen wir eine beliebige Farbe aus [r].) Nach Wahl von t in (15.1) existiert nun t} eine Menge K̂ ∈ {a1 ,...,a und eine Farbe r̂0 ∈ [r], so dass k fˆ(L̂) = r̂0 ∀L̂ ∈ K̂ . `−1 Wenn wir nun K := K̂ und r := r̂0 setzen, sind wir schon am Ziel unserer Träume: Für jede beliebige Menge L = {ai1 , . . . , ai`−1 , ai` } ∈ K` mit i1 < · · · < i`−1 < i` gilt jetzt f (L) = fˆ({ai1 , . . . , ai`−1 }) = r̂0 = r0 , was zu beweisen war. Hier noch, wie versprochen, die unendliche Variante des Satzes von Ramsey, wenn auch ohne Beweis. 80 Kapitel V. Ramseytheorie Satz 15.3. Für beliebige natürliche Zahlen r und c, eine unendliche Menge N und eine beliebige Färbung f : N` → [r] existiert eine unendliche Menge K und eine Farbe r0 ∈ [r], so dass K f (L) = r0 ∀L ∈ . ` 16 Konvexe Polygone In diesem Abschnitt wollen wir eine weitere Situation studieren, in der sich das Leitmotiv Complete disorder is imposssible schön manifestiert. Hier betrachten wir – statt Färbungen – eine beliebige Menge von Punkten in der Ebene. Wir sagen, dass sich k Punkte in allgemeiner Lage befinden, wenn keine drei von ihnen gemeinsam auf einer Gerade liegen. Sie bilden darüber hinaus ein konvexes Polygon, wenn sie die Eckpunkte eines k-Ecks sind und alle ihre Verbindungsstrecken ganz im Inneren des k-Ecks verlaufen. Wir werden nun zeigen, dass sich für jede vorgegebene natürliche Zahl k in einer genügend großen Punktmenge immer eine solche Struktur finden lässt. Bild Satz 16.1. Für jede natürliche Zahl k existiert eine kleinste natürliche Zahl ES(k), so dass jede Menge auf mindestens ES(k) Punkten in allgemeiner Lage in der Ebene k Punkte enthält, die ein konvexes Polygon bilden. Wir geben zwei Beweise für diesen Satz. Der erste Beweis beruht auf dem Satz von Ramsey und zeigt auf diese Weise, wie die unterschiedlichen Teile der Ramseytheorie miteinander verknüpft sind. Erster Beweis. Wir führen zunächst die folgende Notation ein. Sei N eine Menge von Punkten in allgemeiner Lage, und seien x, y, z ∈ N . Dann bezeichnen wir mit |xyz| die Anzahl der Punkte aus N , die innerhalb des Dreiecks mit den Eckpunkten x, y und z liegen. Es sei nun k ∈ N wie vorgegeben, wir setzen ` := 3 und r := 2, wenden den Satz von Ramsey (Satz 15.2) an und erhalten eine Zahl ES(k) := R(k, `, r). Wir betrachten eine beliebige Menge N von ES(k) Punkten in allgemeiner Lage und definieren wie folgt eine Färbung f der Punkte-Tripel mit zwei Farben. Wenn |xyz| ungerade ist, setzen wir f ({x, y, z}) := 1, andernfalls f ({x, y, z}) := 2. Die Wahl von ES(k) garantiert uns nun eine Menge K von k Punkten, so dass alle Teilmengen von K der Größe 3 durch f die gleiche Farbe erhalten. Wir würden nun gerne zeigen, dass K ein konvexes Polygon bildet und nehmen dazu das Gegenteil an. In diesem Fall muss es in K vier Punkte x, y, z, w geben, so 16. Konvexe Polygone 81 dass w im Inneren des Dreiecks x, y, z liegt (warum?). Da die Punkte von N in allgemeiner Lage waren, gilt jetzt: |xyz| = |xyw| + |yzw| + |xzw| + 1. Alle vier in der obigen Gleichung auftretenden Tripel haben von f die gleiche Farbe bekommen, und entsprechend sind die vier Größen |xyz|,. . . ,|xzw| alle gerade oder alle ungerade. Jeder der beiden Fälle führt, wegen der +1, zum Widerspruch. Durch die Verwendung des Satzes von Ramsey erhält man zwar einen eleganten Beweis, verliert aber die geometrische Sicht auf die Dinge. Dieses Manko wird in dem folgenden zweiten Beweis behoben, und er liefert auch eine obere Schranke für die Zahl der Punkte. Zweiter Beweis. We view finite sets {a0 , . . . , ak−1 } of vertices ai = (ai,x , ai,y ) ∈ R2 in the plane as enumerated monotonously with respect to the lexicographic order, i.e., ai,x < ai+1,x or ai,x = ai+1,x and ai,y < ai+1,y . The set {a0 , . . . , ak−1 } is convex if ai+2,y − ai+1,y ai+2,x − ai+1,x < ai+1,y − ai,y ai+1,x − ai,x for every i < k − 2, i.e., the slopes of the lines through a0 , a1 , through a1 , a2 , etc. decrease monotonously. The set is concave if these slopes increase monotonously. Clearly, if {a0 , . . . , ak−1 } is either convex or concave then this set forms a convex polygon. Let f (k, l) be the minimal number n such that every set {a0 , . . . , an−1 } of points in the plane, no three of which are collinear, contains a convex k-element subset or contains a concave l-element subset. Observe that f (3, m) = f (m, 3) = m for every m ≥ 3. We claim that f (k, l) ≤ f (k − 1, l) + f (k, l − 1) − 1, which would prove the theorem. Let N be a set of f (k −1, l)+f (k, l −1)−1 points, no three of which are collinear. Consider the first f (k − 1, l) points of N. Without loss of generality we may assume that this set contains a convex set {a0 , . . . , ak−2 } of size k − 1. Otherwise we are done. Now replace the largest point ak−2 by the next point of N, i.e., consider the set consisting of the first f (k − 1, l) + 1 points of N without the point ak−2 . Again, we can assume that the resulting set contains a convex set of size k − 1. We go on replacing the last points until we have constructed f (k, l − 1) last points. Without loss of generality, this set of last points contains a concave set {c0 , . . . , cl−2 } of size l − 1. Now consider the convex set {b0 , . . . , bk−3 , bk−2 } which has c0 as its last point, i.e., bk−2 = c0 . Then either the slope of the line through c0 , c1 is smaller than the slope of the line through bk−3 , c0 , then {b0 , . . . , bk−3 , c0 , c1 } form a convex set of size k and we are done. Or the converse is true, then {bk−2 , c0 , c1 , . . . , cl−2 } form a concave set of size l and we are also done. 82 Kapitel V. Ramseytheorie Es ist nicht schwer, mit Hilfe der Rekursion für die Funktion f (k, l) zu zeigen, dass ES(k) ≤ 22k ist (siehe Aufgabe 3). Andereseits gibt es direkte Konstruktionen, die beweisen, dass ES(k) ≥ 2k−2 + 1, und es wird vermutet, dass diese untere Schranke bestmöglich ist. 17 Arithmetische Progressionen Nach den einfarbigen Cliquen und den konvexen Polygonen in den beiden vorangegangenen Abschnitten wollen wir uns nun Objekten mit einer auffälligen arithmetischen Substruktur zuwenden. Hierbei werden wir die natürlichen Zahlen mit einer beliebigen, aber festen Anzahl von Farben färben, und dann nach einfarbi” gen Lösungen“ von bestimmten Gleichungen suchen. Satz 17.1 (Satz von Schur). Für jede natürliche Zahl r existiert eine natürliche Zahl n, so dass für jede Färbung f : [n] → [r] drei Zahlen x, y, z ∈ [n] existieren, für die x=y+z und f (x) = f (y) = f (z) gelten. Beweis. Es sei ` ∈ N vorgegeben, wir setzen k := 3 und ` := 2, wenden wieder den Satz von Ramsey (Satz 15.2) an und erhalten eine Zahl n := R(k, `, r). Sei nun eine beliebige Färbung f : [n] → [r] gegeben. Wir benutzen sie, um unsererseits ˆ eine Färbung fˆ : [n] 2 → [r] zu definieren, in dem wir f ({i, j}) := f (|j − i|) setzen. Die Wahl von n garantiert uns nun eine Farbe r0 ∈ [r] und eine Menge K = {a, b, c} ⊂ [n] , deren zweielementige Teilmengen unter fˆ alle die gleiche Farbe r0 bekommen. Ohne Einschränkung nehmen wir an, dass a < b < c gilt und definieren die natürlichen Zahlen y := b − a, z := c − b, x := c − a, die alle in [n] liegen. Somit gelten x = c − a = (b − a) + (c − b) = y + z, und r0 = fˆ({a, b}) = f (b − a) = f (y), = fˆ({b, c}) = f (c − b) = f (z), r0 = fˆ({a, c}) = f (c − a) = f (x), r0 was zu zeigen war. Ein wichtiges Thema der Ramseytheorie ist die Frage, ob eine Aussage wie die obige auch für andere Gleichungen als x = y + z gilt. Wir beschränken uns an dieser Stelle auf zwei Beispiele dazu. Bemerkung. a) Man kann zeigen, dass in der Tat eine analoge Aussage für die Gleichung 2x = y +z gilt, und wir werden dies in Kürze aus einem stärkeren Resultat folgern (siehe 17. Arithmetische Progressionen 83 Satz 17.2). b) Für die Gleichung 3x = y + z gilt hingegen keine analoge Aussage. Um das einzusehen kann man für jedes noch so große n beispielsweise die folgende Färbung f : [n] → [4] betrachten. Um f (m) zu definieren, ermitteln wir zunächst die eindeutigen Parameter i, p ∈ N0 und q ∈ [4] in der Darstellung m = 5i (5p + q) und setzen dann f (m) = q, Wir überlassen es den Lesenden zu zeigen, dass die Gleichung 3x = y + z unter dieser Färbung keine einfarbige Lösung hat. Wir wollen nun größere einfarbige Objekte mit einer besonderen arithmetischen Struktur suchen, nämlich arithmetische Progressionen. Wir sagen, dass eine Färbung f : [n] → [r] eine einfarbige arithmetische Progression der Länge k ∈ N enthält, wenn es eine Farbe r0 und eine Folge der Form (a, a + d, a + 2d, ..., a + (k − 1) · d) ⊂ [n] mit a, d ∈ N gibt, so dass f (a + id) = r0 für alle i ∈ [0, k − 1]. Satz 17.2 (Satz von van der Waerden, 1927). Für beliebige natürliche Zahlen k und r existiert eine kleinste natürliche Zahl W (k, r), so dass für jedes n ≥ W (k, r) jede Färbung f : [n] → [r] eine einfarbige arithmetische Progression der Länge k enthält. Wir folgen dem Beweis in [GRS] und führen dazu den Begriff der Äquivalenz zweier Vektoren ein: Seien x = (x1 , . . . , xm ), x0 = (x1 , . . . , x0m ) ∈ [0, k]m zwei Vektoren. Wir nennen sie k-äquivalent und schreiben x ∼k x0 , wenn für alle s ∈ [m] gilt: (xs 6= x0s ) ⇒ (∀t ≥ s xt 6= k 6= x0t ), das heißt, wenn x und x0 mindestens bis einschließlich zum letzten Auftreten der Zahl k übereinstimmen. Insbesondere bedeutet das im Fall m = 1: für zwei beliebige Zahlen 0 ≤ x, x0 ≤ k − 1 gilt x ∼k x0 . Mit Hilfe dieses Begriffs formulieren wir nun den folgenden Satz 17.3. Für alle k, m, r ∈ N gibt es eine kleinste Zahl n = W (k, m, r), so daß für jede Abbildung f : [n] → [r] gilt: es gibt a, d1 , . . . , dm ∈ N, so daß m ∀x ∈ [0, k] : 1≤a+ m X xi di ≤ n, (17.4) i=1 ∀x, x0 ∈ [0, k]m mit x ∼k x0 : f (a + m X xi di ) = f (a + i=1 m X x0i di ). (17.5) i=1 Offensichtlich folgt Satz 17.2 aus dem Spezialfall m = 1 des letzten Satzes. Beweis von Satz 17.3. Wir werden die folgenden beiden Aussagen zeigen: W (k, m + 1, r) ≤ W (k, m, r) · W (k, 1, rW (k,m,r) ) W (k + 1, 1, r) ≤ 2W (k, r, r). (17.6) (17.7) 84 Kapitel V. Ramseytheorie Um (17.6) zu zeigen, setzen wir M := W (k, m, r) und N := W (k, 1, rM ) und betrachten eine beliebige Abbildung f : [M N ] → [r]. Sei fN definiert durch fN : [N ] → [r]M , fN (x) := f (x − 1)M + 1 , . . . , f (x − 1)M + M . Dadurch gilt: fN (x) = fN (x0 ) ⇔ ∀j ∈ [M ] : f ((x − 1)M + j) = f ((x0 − 1)M + j). Nach Wahl von N gibt es a0 und d0 , so daß ∀x ∈ [0, k] : 1 ≤ a0 + xd0 ≤ N, (17.8) ∀x, x0 ∈ [0, k] mit x ∼k x0 : fN (a0 + xd0 ) = fN (a0 + x0 d0 ). was wir zurück in die Funktion f übersetzen als ∀i, i0 ∈ [0, k−1] : f ((a0 +id0 −1)M +j) = f ((a0 +i0 d0 −1)M +j) ∀j ∈ [M ]. (17.9) Sei fM definiert durch fM : [M ] → [r], fM (j) := f ((a0 − 1)M + j). Nach Wahl von M existieren a, d1 , . . . , dm ∈ N so dass ∀x ∈ [0, k]m : 1 ≤ a + m X xi di ≤ M, i=1 ∀x, x0 ∈ [0, k]m mit x ∼k x0 : fM (a + m X xi di ) = fM (a + i=1 m X x0i di ). i=1 Wir setzen â := a + (a0 − 1)M , betrachten die letzen beiden Aussagen wieder in die Sprache der Funktion f und erhalten ∀x ∈ [0, k]m : (a0 − 1)M + 1 ≤ â + m X xi di ≤ (a0 − 1)M + M = a0 M, (17.10) i=1 ∀x, x0 ∈ [0, k]m mit x ∼k x0 : f (â + m X i=1 xi di ) = f (â + m X x0i di ). (17.11) i=1 Nun setzen wir dm+1 := d0 M und behaupten, dass die so gewählten â, d1 , . . . , dm+1 das Geforderte leisten. Um (17.4) zu überprüfen stellen wir fest, dass für x ∈ [0, k]m+1 1 ≤ (a0 −1)M +1 (17.10) ≤ â+ m+1 X (17.10) xi di ≤ a0 M +xm+1 dm+1 ≤ (a0 +kd0 )M (17.8) ≤ N M. i=1 Um (17.5) zu überprüfen betrachten wir x, x0 ∈ [0, k]m+1 mit x ∼k x0 . Falls xm+1 = k oder x0m+1 = k, dann müsste x = x0 sein und wir müssen nichts mehr zeigen. Also können wir ohne Einschränkung annehmen, dass xm+1 , x0m+1 < k. 17. Arithmetische Progressionen 85 Weiterhin wissen wir bereits nach (17.11), dass f (â + m X xi di ) = f (â + i=1 m X x0i di ), i=1 und es genügt daher zu zeigen, dass f (â + m X xi di ) = f (â + i=1 m+1 X xi di ) (17.12) x0i di ). (17.13) i=1 und f (â + m X x0i di ) = f (â + m+1 X i=1 i=1 Nach (17.10) existiert ein j ∈ [M ], so dass â + m X xi di = (a0 − 1)M + j, i=1 und damit ist auch â + m+1 X xi di = (a0 − 1)M + j + xm+1 d0 M = (a0 + xm+1 d0 − 1)M + j. i=1 Nun können wir aber (17.9) mit i := 0 und i0 := xm+1 ∈ [0, k − 1] anwenden und erhalten f ((a0 − 1)M + j) = f ((a0 + xm+1 d0 − 1)M + j), was genau (17.12) entspricht. In analoger Manier zeigt man dann (17.13) für x0 anstelle von x, und damit ist (17.6) bewiesen. Um (17.7) zu zeigen, setzen wir N := W (k, r, r). Sei eine beliebige Abbildung f : [2N P]r → [r] gegeben. Nach Wahl vonPNr gibt es a, d1 , . . . , dr , so dass erstens a + k i=1 di ≤ N und zweitens f (a + i=1 xi di ) konstant auf jeder k-Äquivalenzklasse ist. Wir betrachten die folgenden Vektoren xµ ∈ [0, k]r für 0 ≤ µ ≤ r: x0 := (0, . . . , 0), x1 := (k, 0, . . . , 0), . . . , xr := (k, . . . , k). Nach dem gibt zwei Vektoren xµ , xν , µ < ν, so dass Pres nun Pr Schubfachprinzip ν µ f (a + i=1 (x )i di ) = f (a + i=1 (x )i di ) gilt. Da aber jeder Vektor x mit ν }| { z x = (k, . . . , k , j, . . . , j, 0, . . . , 0) mit j ∈ [0, k] entweder k-äquivalent zu xµ (wenn | {z } µ 86 Kapitel V. Ramseytheorie j < k) oder k-äquivalent zu xν (wenn j = k) ist, folgt, dass es eine Farbe r0 ∈ [r] gibt, so dass für alle j ∈ [0, k] gilt f (a + µ X i=0 kdi + ν X jdi ) = r0 . i=µ+1 Pµ Pν Mit a0 := a + i=1 kdi und d0 := i=µ+1 di sind dann aber die beiden Zahlen für W (k + 1, 1, r) gefunden, denn schließlich ist jetzt f (a0 + jd0 ) = r0 für alle j ∈ [0, k] und a0 + (k + 1)d0 ≤ 2N . Damit ist nun auch (17.7) bewiesen. Mit Hilfe von (17.6) und (17.7) kommen wir nun induktiv zu dem Schluß, daß die Behauptung für alle k, m, r ∈ N gilt: Die Behauptung ist trivial für den Fall k = m = 1, r beliebig. Wenn die Behauptung für k, m und alle r gilt, dann nach (17.6) auch für für k, m + 1 und alle r. Gilt die Behauptung für k und alle m, r, dann nach (17.7) auch für k + 1, m = 1 und alle r. Und dann wiederum nach (17.6) für k + 1, m + 1 und alle r. Mit Hilfe des Spezialfalls k = 3 im Satz von van der Waerden können wir nun auch die Bemerkung a) nach dem Beweis von Satz 17.1 beweisen: eine einfarbige arithmetische Progression a, a+d, a+2d liefert via x := a+d, y := a und z := a+2d sofort die Lösung der Gleichung 2x = y + z. Die besten derzeit bekannten Schranken für W (k, r) lauten k+9 2 r2 crk ≤ W (k, r) ≤ 22 rk . Alle Sätze, die wir bislang in den Abschnitten 15 und 17 kennengelernt haben, sind Partitionsresultate. Sie besagen, dass wir, egal wie die Kanten des vollständigen Graphen oder die natürlichen Zahlen in Farbklassen partitioniert sind, in einer der Klassen eine wohlgeordnete Struktur (Clique oder arithmetische Progression) auftauchen muss. Wir wissen aber nicht, in welcher. Es erscheint durchaus naheliegend, die gewünschte Struktur immer in derjenigen Farbklasse zu vermuten, die den höchsten Anteil an den zu färbenden Objekten besitzt. Im Falle der einfarbigen Cliquen ist das aber falsch, siehe Aufgabe 1. Im Falle der einfarbigen arithmetischen Progressionen ist es hingegen wahr: Satz 17.4 (Szemerédi, 1974). Für jede natürliche Zahl k und jede reelle Zahl ε > 0 existiert eine kleinste natürliche Zahl n(k, ε), so dass jede Teilmenge A ⊂ [n] mit |A| ≥ εn eine einfarbige arithmetische Progression der Länge k enthält. Tatsächlich gilt die Aussage hier bereits dann, wenn die Partitionsklasse (hier die Menge A) lediglich einen festen ε-Anteil der natürlichen Zahlen enthält. Offensichtlich impliziert dieser Satz den Satz von van der Waerden, denn mindestens eine der r Farbklassen muss ja einen Anteil von ε := 1/r bekommen. Er reicht aber nicht, um eine berühmte alte Vermutung zu beweisen, derzufolge bereits die 17. Arithmetische Progressionen 87 Menge der Primzahlen beliebig lange arithmetische Folgen enthält. Dies gelang Green und Tao im Jahr 2004, und mit ihrem Satz beenden wir dann auch dieses Kapitel. Satz 17.5 (Green und Tao, 2004). Für jede natürliche Zahl k enthält die Menge aller Primzahlen eine arithmetische progression der Länge k. Übungsaufgaben 1. a) Finden Sie für jedes n ∈ N eine 2-Färbung der Kanten des Kn , so dass die Farbklasse mit den meisten Kanten keinen einfarbigen K3 enthält. b) Finden Sie für jedes n ∈ N und jede reelle Zahl ε > 0 eine 2-Färbung der Kanten des Kn und eine Zahl k ∈ N, so dass eine Farbklasse mindestens (1 − ε) n2 Kanten aber trotzdem keinen einfarbigen Kk enthält. 2. Zeigen Sie, dass die Menge aller Primzahlen keine unendlich lange arithmetische Progression enthalten kann. 3. Zeigen Sie, dass ES(k) ≤ 22k . 88 Kapitel V. Ramseytheorie Kapitel VI Probabilistische Methoden In Kapitel IV haben wir uns explizit um die Konstruktion von regelmäßigen diskreten Strukturen gekümmert. Auch in Kapitel V war die – gerade noch vermiedene oder bereits erzwungene – Existenz von lokalen Regionen mit hohem Ordnungsgrad das Leitmotiv. Nehmen wir zum Beispiel die (noch zu beweisende!) untere Schranke aus dem Satz 15.1, also 2k/2 < R(k). Diese Ungleichung ist gleichbedeutend damit, nachzuweisen, dass es eine rot-blau–Färbung der Kanten des vollständigen Graphen auf 2k/2 Knoten gibt, die weder eine rote noch eine blaue Clique der Größe k enthält. Mit anderen Worten: die beiden Farben rot und blau müssen relativ gleichmäßig auf die Kantenmenge verteilt werden, so dass es nirgendwo zu massiven Häufungen kommt. Überraschenderweise besteht die einzige derzeit bekannte Methode um dieses Ziel zu erreichen, darin, die Kanten zufällig rot-blau zu färben - siehe Abschnitt 18. Dies ist bereits der Kerngedanke der sogenannten probabilistischen Methode: Um die Existenz eines diskreten Objekts mit einer gewünschten Eigenschaft nachzuweisen, führen wir ein geeignetes Zufallsexperiment durch. Anschließend zeigen wir, dass unser zufällig erzeugtes Objekt mit positiver Wahrscheinlichkeit die gewünschte Eigenschaft hat. Daraus folgt dann, dass es ein solches Objekt auch geben muss – denn andernfalls wäre die Wahrscheinlichkeit ja gleich 0 gewesen. Im folgenden Abschnitt führen wir zunächst in die elementaren Grundlagen der diskreten Wahrscheinlichkeitsrechnung ein, und erläutern diese unter anderem an der bereits erwähnten unteren Schranke für die Ramseyzahl. Anschließend studieren wir ein klassisches Problem aus der Graphentheorie und zeigen wiederum mit Hilfe der probabilistischen Methode, dass es Graphen ohne kurze Kreise“ gibt, ” die aber trotzdem eine beliebig hohe chromatische Zahl haben. Wir beschließen das Kapitel mit Anwendungen der probabilistischen Methode in der Geometrie. 90 18 Kapitel VI. Probabilistische Methoden Grundlagen und Ramseyzahlen Wir stellen im Folgenden zunächst die notwendigen Grundkonzepte vor. Definition (Wahrscheinlichkeitsraum und Erwartungswert). Ein diskreter Wahrscheinlichkeitsraum P ist eine endliche Menge Ω zusammen mit einer Funktion p : Ω → [0, 1] die ω∈Ω p(ω) = 1 erfüllt. Ein Ereignis ist eine Teilmenge A ⊆ Ω, die Wahrscheinlichkeit von A wird bezeichnet mit X P [A] := p(ω). ω∈Ω Eine Zufallsvariable ist eine Funktion X : Ω → R, ihr Erwartungswert ist definiert als X E [X] := X(ω)p(ω). ω∈Ω Für die Wahrscheinlichkeit des Ereignisses A := {ω : X(ω) = `} schreiben wir auch abkürzend X P [X = `] = p(ω). ω : X(ω)=` Hier sind einige elementare Aussagen über den Erwartungswert einer Zufallsvariable. Satz 18.1 (Linearität des Erwartungswerts und Markov’sche Ungleichung). Pk a) Seien X1 , . . . , XP k Zufallsvariablen und λ1 , . . . , λk ∈ R. Setze X := i=1 λi Xi . Dann gilt E [X] = i λi E [Xi ]. b) Sei X eine Zufallsvariable, die nur die Werte 0 und 1 annimmt. Dann ist X X E [X] = X(ω)p(ω) = p(ω) = P [X = 1]. ω∈Ω ω∈Ω:X(ω)=1 c) Sei X eine Zufallsvariable, die nur nicht-negative Werte annimmt, und sei t > 0. Dann ist E [X] . P [X ≥ t] ≤ t d) Insbesondere gilt P [X ≥ 1] ≤ E [X]. Als eine erste Aufwärmübung beweisen wir den folgenden einfachen Satz. · Satz. Jeder Graph G = (V, E) besitzt eine Bipartition V = A ∪ B, so dass mindestens die Hälfte der Kanten aus E zwischen A und B verläuft. Beweis. Wir führen das folgende Zufallsexperiment durch: jeden Knoten aus V weisen wir zufällig und unabhängig von den anderen Knoten mit Wahrscheinlichkeit 1/2 der Menge A und mit Wahrscheinlichkeit 1/2 der Menge B zu. 18. Grundlagen und Ramseyzahlen 91 Für eine Kante e = {x, y} setzen wir die Zufallsvariable Xe auf 1, wenn einer ihrer beiden Endknoten in A und der andere in B landet. Dann gilt, dass P [Xe = 1] = P [x ∈ A und y ∈ B] + P [x ∈ B und y ∈ A] = 1 1 1 + = 4 4 2 und damit P lässt sich die erwartete Anzahl von Kanten zwischen A und B, also X := e∈E Xe , im Erwartungswert durch X X E [X] = E [Xe ] = P [Xe = 1] = |E|/2 e∈E e∈E berechnen. Also muss es aber eine Aufteilung der Knoten in Mengen A und B geben, bei der X ≥ |E|/2 ist, denn wäre bei jeder Aufteilung X < |E|/2, dann könnte im Erwartungswert X = |E|/2 nicht erreicht werden. Nun wie versprochen zum Beweis der unteren Schranke für die Ramseyzahl aus Satz 15.1: Für jede natürliche Zahl k ≥ 3 gilt R(k) > 2k/2 . Beweis. Um die behauptete Ungleichung zu beweisen, müssen wir zeigen, dass es eine 2-Färbung der Kanten des vollständigen Graphen auf n = 2k/2 Knoten gibt, die keinen einfarbigen Kk enthält. Dazu machen wir das folgende Zufalls experiment: wir färben jede der n2 zufällig und unabhängig voneinander mit Wahrscheinlichkeit 1/2 rot und mit Wahrscheinlichkeit 1/2 blau. Unser Ziel ist es nun, zu zeigen, dass mit positiver Wahrscheinlichkeit diese zufällige Färbung die gewünschte Eigenschaft hat. Für eine Teilmenge S ⊆ [n] der Größe k setzen wir die Zufallsvariable XS auf 1, wenn alle Kanten in G[S] einfarbig sind, und andernfalls auf 0. Offensichtlich gilt für jedes solche S, dass P [XS = 1] = P [alle Kanten in G[S] rot] + P [alle Kanten in G[S] blau] k k 1 (2) = 2· = 21−(2) . 2 Betrachte nun die Zufallsvariable X := X XS , S∈([n] k ) also die Anzahl aller einfarbigen Kk . Wir schätzen ihren Erwartungswert wie folgt ab: X X n 1−(k2) P [X ≥ 1] ≤ E [X] = E [XS ] = P [XS = 1] = 2 k S S 2 < nk 1−k2 /2+k/2 2k /2 1−k2 /2+k/2 21+k/2 k≥3 2 = 2 = ≤ 1. k! k! k! 92 Kapitel VI. Probabilistische Methoden Damit gilt nun umgekehrt für das Gegenereignis P [X = 0] > 0, und das bedeutet, dass mit positiver Wahrscheinlichkeit kein einfarbiger Kk vorliegt. Somit muss also eine entsprechende Färbung existieren, und dies war zu zeigen. Bemerkung. Durch etwas genauere Rechnung folgt: R(k) ≥ 19 k √ e 2 k · 22 . Graphen ohne kurze Kreise Wir hatten bereits die triviale Ungleichung ω(G) ≤ χ(G) kennengelernt: Cliquen stellen eine einfache, lokale Struktur dar, die die chromatische Zahl eines Graphen in die Höhe treibt. In diesem Abschnitt befassen wir uns mit der Frage, ob es auch noch andere Gründe gibt, und ob es Graphen gibt, die lokal einfach strukturiert sind aber global eine (im Sinne der chromatischen Zahl) hohe Komplexität haben. In einem ersten Schritt werden wir dazu eine deterministische Konstruktion von Graphen angeben, die keine Dreiecke enthalten (also ω(G) = 2 erfüllen), aber beliebig hohe chromatische Zahl besitzen. Dazu vorweg ein kleines Lemma: Lemma 19.1. Sei G = (V, E) ein Graph mit χ(G) = k und f : V → [k] eine kFärbung von G. Dann gibt es für jede Farbe c ∈ [k] einen Knoten v ∈ V , so dass f (v) = c und in der Nachbarschaft von v die Färbung f jede Farbe aus [k] \ {c} benutzen muss. Beweis. Sei Vc die Teilmenge aller Knoten mit f (v) = c. Angenommen, die Behauptung wäre falsch. Dann gäbe es eine Farbe c ∈ [k], so dass f für jeden Knoten v ∈ Vc noch eine Farbe cv ∈ [k] \ {c} vorrätig hätte, die an keinen der Nachbarn von v vergeben ist. In diesem Fall würden wir alle Knoten v ∈ Vc statt mit c lieber mit cv färben. Die neue Färbung wäre wieder eine zulässige Färbung, weil zwei Knoten aus Vc nicht benachbart sind (sonst wäre f keine zulässige Färbung gewesen) und Konflikte zwischen Knoten aus Vc und ihren Nachbarn per Konstruktion vermieden wurden. Da die neue Färbung die Farbe c nicht mehr benutzt, hätten wir einen Widerspruch zur Voraussetzung χ(G) = k. Satz 19.2. Mycielski–Konstruktion Zu jeder natürlichen Zahl k ∈ N existiert ein Graph Gk mit ω(Gk ) = 2 und χ(Gk ) ≥ k. Beweis. Die Konstruktion von Gk (und der Nachweis ihrer Korrektheit) verläuft rekursiv über k. Für k ≤ 3 setzen wir Gk := C5 . Offensichtlich gilt ω(C5 ) = 2 und χ(C5 ) = 3. Sei nun Gk = (Vk , Ek ) konstruiert. Seine Knoten seien mit {v1 , . . . , vn } := Vk bezeichnet. Wir setzen Gk+1 := (Vk+1 , Ek+1 ), wobei die neue Knotenmenge aus Vk+1 := {v1 , . . . , vn , w1 , . . . , wn , z} bestehe und die neue Kantenmenge durch Ek+1 := Ek ∪ {{vi , wj } : i 6= j ∈ [n] und {vi , vj } ∈ Ek } ∪ {{wi , z} : i ∈ [n]} definiert sei. 19. Graphen ohne kurze Kreise 93 Wir überprüfen zunächst, dass Gk+1 kein Dreieck enthält. Da Gk dreiecksfrei ist und es in Gk+1 keine Kanten der Form {wi , wj } oder {vi , z} oder {vi , wi } mit i, j ∈ [n] gibt, könnte ein Dreieck in Gk+1 nur von der Form vi , vj , w` mit i 6= j 6= ` 6= i sein. Aber dann erfordern die Kanten {vi , w` } bzw. {vj , w` } die Existenz der Kanten {vi , v` } bzw. {vj , v` } in Gk , die dann mit der Kante {vi , vj } ein Dreieck in Gk schließen würde, im Widerspruch zur Dreiecksfreiheit von Gk . Nun zur chromatischen Zahl von Gk+1 . Wir nehmen im Widerspruch zur Behauptung an, dass es eine k-Färbung f von Gk+1 gäbe. Da Gk+1 nach Konstruktion Gk als Subgraphen enthält, ist nach Induktion klar, dass k ≤ χ(Gk ) ≤ χ(Gk+1 ). Mit Lemma 19.1 folgt dann, dass es für jede Farbe c ∈ [k] einen Knoten vi ∈ Vk gibt, bei dem die Farbe c erzwungen ist, weil in der Nachbarschaft NGk (vi ) bereits alle anderen Farben c0 ∈ [k] \ {c} durch f vergeben sind. Da nach Konstruktion NGk+1 (wi )∩Vk = NGk (vi ) muss daher f (vi ) = f (wi ) gelten. Da f alle k Farben aus [k] in der Menge Vk benutzt, tauchen diese somit auch in der Menge {w1 , . . . , wn } auf. Nun ist aber der Knoten z zu allen Knoten aus {w1 , . . . , wn }, und daraus folgt, dass z nicht mit einer Farbe aus [k] gefärbt werden kann, im Widerspruch zur Annahme, dass f eine k-Färbung von Gk+1 ist. Wir gehen nun noch einen Schritt weiter und zeigen die Existenz von Graphen, die erstens eine beliebig hohe chromatische Zahl haben, obwohl sie zweitens keine Kreise kurzer Länge haben. Mit anderen Worten: sie sehen lokal so einfach aus wie ein Baum, haben aber global eine hohe Komplexität. Satz. Zu jedem fest gewählten k, l ∈ N existiert ein Graph G∗ mit χ(G∗ ) ≥ k, der keine Kreise der Länge ≤ l enthält. Beweis. Im Folgenden nennen wir einen Kreis der Länge höchstens l einen “kurzen Kreis”. Wähle γ ∈ R so, dass 0 < γ < 1/l, und setze p := nγ−1 . Sei G ein zufälliger Graph mit Knotenmenge [n], bei dem jede der möglichen n2 Kanten mit Wahrscheinlichkeit p existiere. Sei X die Anzahl kurzer Kreise in G. Es gilt: E [X] ≤ l X ni p i = X i = 3l (nγ )i ≤ lnγl = o(n), i=3 und daraus folgt mit Hilfe der Markov Ungleichung (siehe Satz 18.1 c)), dass P [X ≥ n/2] ≤ E [X]/(n/2) = o(1). (19.1) G hat also eventuell kurze Kreise, aber nicht viele. Wie ist es um die chromatische Zahl bestellt? Setze x := d p3 ln ne. Es gilt P [α(G) ≥ x] ≤ x n (1 − p)(2) ≤ nx e−px(x−1)/2 = (ne−p(x−1)/2 )x = o(1), (19.2) x wegen p(x − 1)/2 > (ln n). 94 Kapitel VI. Probabilistische Methoden Sei n nun so groß, dass die Wahrscheinlichkeiten in (19.1) und (19.2) beide kleiner als 1/2 sind. Somit existiert ein Graph G mit weniger als n/2 kurzen Kreisen und α(G) < x. Entferne aus jedem kurzen Kreis in G einen Knoten und erhalte den neuen Graphen G∗ . Dieser hat noch mindestens n/2 Knoten, keine kurzen Kreise und seine chromatische Zahl erfüllt: χ(G∗ ) ≥ |G∗ | n/2 n np nγ ≥ ≥ = = ≥ k, ∗ α(G ) α(G) 2x 6 ln n 6 ln n für n groß genug. 20 Dreiecke Wir betrachten das Einheitsquadrat U in der Euklidischen Ebene. Gesucht sind Punktkonfigurationen, so dass jedes aufgespannte Dreieck einen möglichst großen Flächeninhalt hat. Satz. Es gibt n Punkte P1 , . . . , Pn in U , so dass der Flächeninhalt jedes Dreiecks Pi Pj Pk mindestens 1/(100n2 ) beträgt. Beweis. Wir wollen hier erst eine deterministische Konstruktion kennenlernen. Betrachte statt U zunächst das Gitter [0, n − 1]2 ⊆ Zn 2 für n prim und die n Punkte Pi = (i, i2 mod n) mit i = 0, 1, 2, . . . , n − 1. Man kann einsehen, dass keine drei Punkte Pi , Pj , Pk auf einer Geraden y = xm + b liegen (weil sonst die Parabel x2 − xm − b = 0 drei Nullstellen hätte), somit haben alle Dreiecke positiven Flächeninhalt. Da die Punkte alle auf Gitterpunkten liegen, müssen die Flächeninhalte von der Form k/2 mit k ∈ N+ sein (das folgt entweder als Korollar aus dem Satz von Pick oder ganz elementar durch Ergänzen des Dreiecks zu einem Rechteck), und haben damit mindestens Flächeninhalt 1/2. Nach Reskalierung um den Faktor n − 1 ergibt sich dadurch ein Mindestflächeninhalt von 1/(2(n − 1)2 ). Nun zu dem probabilisitischen Ansatz. Als Vorüberlegung werfen wir zunächst nacheinander drei Punkte P, Q, R in das Einheitsquadrat U , zufällig gleichverteilt. Angenommen, P sei bereits positioniert, werfe nun Q hinterher. Die Zufallsvariable x bezeichne den Abstand von Q zu P . Es gilt P [b ≤ x ≤ b + ∆b] ≤ π(b + ∆b)2 − πb2 = 2πb∆b + π(∆b)2 Für db = ∆b → 0 wollen wir das durch P [b ≤ x ≤ b + ∆b] ≤ 2πbdb abschätzen. Sei nun also auch Q positioniert, mit Abstand b zu P , und wir werfen R hinterher. Sei A die Zufallsvariable, die den Flächeninhalt des Dreiecks P QR bezeichnet und h der Abstand von R zur Gerade durch P und Q. Dann ist A = hb/2 und daher √ √ 4ε 2 . P [A ≤ ε|dist(P, Q) = b] ≤ 2h 2 ≤ b Somit ist Z √2 √ 4ε 2 P [A ≤ ε] ≤ 2πbdb = 16πε. b 0 20. Dreiecke 95 Wir werfen nun zufällig gleichverteilt 2n Punkte P1 , . . . , P2n nach U . Ein Dreieck Pi Pj Pk mit Fläch A ≤ 1/(100n2 ) =: ε wird als klein bezeichnet. Sei X die Anzahl kleiner Dreiecke, dann ist 2n (2n)3 16π < n. E [X] ≤ 16πε ≤ 3 6 100n2 Es gibt also 2n Punkte mit weniger als n kleinen Dreiecken. Entferne nun als jedem kleinen Dreieck einen Punkt, und wir sind fertig. Die zuletzt angegebene probabilistische Konstruktion ist zwar schlechter (um einen konstanten Faktor) als die zuerst angegebene determinsistische, lässt sich aber mit einigem Aufwand verbessern, so dass man die Existenz von Punktmengen mit minimalem Dreiecksflächeninhalt Ω(ln n/n2 ) zeigen kann. Das ist zur Zeit der Rekord, die beste bekannte obere Schranke ist O(1/n8/7 ). Wir bleiben bei Dreiecken, betrachten aber statt des Flächeninhalts die Winkel und wechseln aus dem R2 in den Rn . Ein Dreieck, dessen Innenwinkel alle kleiner als π/2 sind, bezeichnen wir als spitzwinklig. Unser Ziel ist es, möglichst viele Punkte im Rn unterzubringen, so dass alle aufgespannten Dreiecke spitzwinklig sind. n Satz 20.1. Zu jedem n ∈ N existiert eine Menge {a1 , . . . , am } mit m = b 12 √23 c und ai ∈ Rn für alle i ∈ [m], so dass alle Dreiecke, die durch diese Punkte aufgespannt werden, spitzwinklig sind. Beweis. Für die Konstruktion dieser Punkte beschränken wir uns (freiwillig!) auf Punkte, deren Komponenten nur aus 0 oder 1 bestehen. Das hat den Vorteil, dass die von ihnen aufgespannten Dreiecke keinen Winkel enthalten, der größer als π/2 ist – was sich wie folgt leicht verifizieren lässt: Wenn x, y, z ∈ {0, 1}n ist, dann ist der Winkel θ = ∠(xzy) gegeben durch cos θ = hx − z, y − zi . ||x − z|| · ||y − z|| Somit ist θ > π/2 genau dann, wenn hx − z, y − zi < 0, was wegen der 0/1Komponenten von x, y und z aber nicht geht, da x` − z` = −1 impliziert, dass y` − z` ≤ 0. Darüberhinaus folgt, dass θ = π/2 ⇔ hx − z, y − zi = 0 ⇔ ∀` ∈ [n] : x` = z` oder y` = z` ⇔ ∀` ∈ [n] : ¬(x` = y` = 1 ∧ z` = 0) und ¬(x` = y` = 0 ∧ z` = 1). (20.3) Damit ist unser Ziel klar: wir wollen Punkte a1 , . . . , am ∈ Rn konstruieren, bei denen für kein Tripel ai aj ak von Punkten die Bedingung (20.3) erfüllt ist. 96 Kapitel VI. Probabilistische Methoden Dazu erzeugen wir zunächt wie folgt eine Familie {a1 , . . . , a2m } mit ai ∈ {0, 1}n : jedes ai wird dadurch erzeugt, dass wir jede Komponente (ai )` mit Wahrscheinlichkeit 1/2 auf 0 und mit Wahrscheinlichkeit 1/2 auf 1 setzen, und das in 2m voneinander unabhängigen Durchläufen. Für ` ∈ [n] und {i, j, k} ∈ [2m] definieren wir zwei Ereignisse 3 Eijk (`) := (ai )` = (aj )` = 1∧(ak )` = 0 und Fijk (`) := (ai )` = (aj )` = 0∧(ak )` = 1. Offensichtlich gilt für ein fest gewähltes ` ∈ [n]: P [Eijk (`)] = P [Fijk (`)] = (1/2)3 = 1/8 und, da die Ereignisse disjunkt sind, P [Eijk (`) ∨ Fijk (`)] = 1/4. Daraus folgt, dass P [¬Eijk (`) ∧ ¬Fijk (`)] = 3/4. Da für ` 6= `0 die Ereignisse Eijk (`) und Eijk (`0 ) unabhängig voneinander sind, erhalten wir insgesamt, dass ^ i j k P a , a , a erfüllen (20.3) = P (¬Eijk (`) ∧ ¬Fijk (`)) = (3/4)n . `∈[n] Es sei nun X die Anzahl der Tripel {i, j, k} ∈ [2m] 3 , die (20.3) erfüllen. Dann gilt 2m 1 E [X] = 3 (3/4)n = m(2m−1)(2m−2)(3/4)n < m·4m2 (3/4)n ≤ m4( 4n /3n )(3/4)n = m. 4 3 Insbesondere gibt es also eine Familie {a1 , . . . , a2m }, bei der höchstens m Tripel ai , aj , ak die Bedingung (20.3) erfüllen. Für jedes solche Tripel löschen wir einen beliebigen der drei Punkte ai , aj , ak , reduzieren die Punkte anschließend (falls notwendig) noch bis wir genau m Punkte übrig behalten und erhalten auf diese Weise eine Punktfamilie m mit der gewünschten Eigenschaft. Kapitel VII Algebraische Methoden Die Philosophie hier ... grundidee 1: In einem VR mit Dim n gibt es höchstens n lin unabh Vektoren. 21 Zyklenraum 22 Intersecting families Dieses Kapitel diskutiert die folgende Frage: wieviele verschiedene Teilmengen einer Grundmenge kann es geben, wenn alle bestimmte Eigenschaften erfüllen müssen? Satz 22.1 (Ungleichung von Fisher). Sei n ∈ N und k ∈ [n] beliebig. Wenn A1 , . . . , Am paarweise verschiedene Teilmengen der Menge [n] sind, für die |Ai ∩ Aj | = k für alle 1 ≤ i 6= j ≤ m gilt, dann folgt m ≤ n. Beweis. Inzidenzvektoren plus grundidee 1 Jetzt von Inzidenzvektoren zu Polynomen. Lemma. Sei m ∈ N, M eine Menge, K ein Körper und M K der Vektorraum aller Funktionen f : M → K. Angenommen, es gebe Funktionen fi ∈ M k und Elemente vi ∈ M mit i ∈ [m], so dass a) fi (vi ) 6= 0 für alle i ∈ [m], b) fi (vj ) = 0 für alle 1 ≤ j < i ≤ m. Dann bildet {f1 , . . . , fm } eine Familie linear unabhängiger Vektoren in M K . Beweis. durch Widerspruch, 3 Zeilen Jetzt drei Verallgemeinerungen von Satz 22.1. 98 Kapitel VII. Algebraische Methoden Sei L ⊆ N0 eine endliche Menge und F eine Familie von Teilmengen der Menge [n]. Wir nennen F eine F-Schnittfamilie, wenn für alle A, B ∈ L mit A 6= B gilt, dass |A ∩ B| ∈ L ist. Satz 22.2. Sei L ⊆ N0 eine endliche Menge, A eine Menge mit |A| = n und F = {A1 , . . . , Am } eine L-Schnittfamilie mit Ai ⊆ A für alle i ∈ [m]. Dann gilt: |L| X n m≤ . i i=0 Wir benötigen noch die folgende Restklassen–Variante des letzten Satzes, für die wir die Notation r ∈ L (mod p) einführen, wenn es ein ` ∈ L gibt, so dass r = ` (mod p) gilt. Satz 22.3. Sei L ⊆ Z und p eine Primzahl, A eine Menge mit |A| = n und F = {A1 , . . . , Am } eine Familie mit Ai ⊆ A für alle i ∈ [m], so dass a) |Ai | 6∈ L (mod p) für alle i ∈ [m], b) |Ai ∩ Aj | ∈ L (mod p) für alle i, j mit 1 ≤ j < i ≤ m. Dann gilt: |L| X n . m≤ i i=0 Folgerung. Sei p eine Primzahl, A eine Menge mit |A| = 4p − 1 und F = {A1 , . . . , Am } eine Familie mit Ai ⊆ A und |Ai | = 2p − 1 für alle i ∈ [m], so dass |Ai ∩ Aj | = 6 p−1 für alle i, j ∈ [m], dann gilt: 4p − 1 m≤2· < 1, 75484p−1 . p−1 Anwendungen folgen in den folgenden Abschnitten. 23 Färbungen des Rn Bisher haben wir uns hauptsächlich mit Partitionen von endlichen Mengen beschäftigt. Unsere Methoden sind aber hinreichend stark, um auch darüberhinaus zu funktionieren. Wir betrachten hier den Raum Rn mit der euklidischen Metrik p d(x, y) := xT y für alle x, y ∈ Rn . Kann man Rn so in Mengen M1 , . . . , Mk partitionieren, dass zwei Punkte x, y ∈ Rn mit d(x, y) = 1 nie in der gleichen Klasse Mi liegen? Und, wenn ja, wie groß muss die Anzahl k der Klassen dafür sein? 23. Färbungen des Rn 99 Wir können diese Frage auch als Graphen–Färbungsproblem formulieren. Dazu definieren wir den sogenannten n-dimensionalen unit distance Graphen Un , dessen (unendliche) Knotenmenge aus der Menge Rn besteht und zwei Knoten x, y ∈ Rn genau dann eine Kante bilden, wenn d(x, y) = 1, und möchten nun seine chromatische Zahl χ(Un ) bestimmen. Der Fall n = 1 ist noch einfach, denn hier gilt offensichtlich χ(Un ) = 2 (siehe Übungsaufgabe ??). Bereits für die Ebene ist die genaue Antwort nicht bekannt, man weiß derzeit lediglich, dass 4 ≤ χ(U2 ) ≤ 7. Dies lässt sich wie folgt einsehen: Für die untere Schranke genügt es, den Graphen in Abbildung ?? zu betrachten, der offensichtlich ein Subgraph von U2 ist und chromatische Zahl 4 hat. Bild Um die obere Schranke zu beweisen, partitioniert man die Ebene in reguläre Sechsecke, die einen Duchmesser von 1 − ε haben, und färbt dann die Punkte wie in Abbildung ?? angegeben. Bild Das Ziel dieses Abschnitts ist es, untere und obere Schranken für χ(Un ) für allgemeine n anzugeben. Die beste derzeit bekannte obere Schranke ist χ(Un ) ≤ (3+ε)n und stammt von [?], wir beschränken uns hier auf den Beweis der folgenden Abschätzung: Satz 23.1. χ(Un ) ≤ 9n . Beweis. ... Satz 23.2. Es gibt ein n0 ∈ N, so dass für alle n ≥ n0 gilt: χ(Un ) ≥ 1, 1n . Beweis. Sei δ > 0 und Unδ der Graph mit Knotenmenge Rn bei dem zwei Knoten x, y ∈ Rn genau dann eine Kante bilden, wenn d(x, y) = δ ist. Mittels ι : Rn → Rn , das durch ι(x) := δx definiert ist, haben wir einen Isomorphismus von Un nach Unδ , und damit gilt χ(Un ) = χ(Unδ ), und das funktioniert auch dann noch, wenn δ = δ(n) eine Funktion von n ist. Wir 100 Kapitel VII. Algebraische Methoden Literaturverzeichnis [A] M. Aigner, Diskrete Mathematik, 6. Auflage, Vieweg, 2006. [GRS] R.L. Graham, B.L. Rothschild, J.H. Spencer, Ramsey Theory, 2nd edition, Wiley, 1989. [MN] J. Matousek und J. Nesetril, Diskrete Mathematik, 2. Auflage, Springer, 2007. [S] A. Steger, Diskrete Strukturen, Band 1. 1. Auflage, Springer, 2001.