Graphentheorie Zufallsgraphen Rainer Schrader Zentrum für Angewandte Informatik Köln 23. Januar 2008 1 / 45 2 / 45 Zufallsgraphen Zufallsgraphen • man könnte vermuten, dass ein Graph mit großer chromatischer Zahl einen „dichten“ Teilgraphen enthalten muss, der die Färbungszahl hochtreibt Gliederung • informelle Einführung • Zusammenhang mit den Ramsey-Zahlen • so könnte man folgende Vermutung aufstellen: • Erwartungswerte • Eigenschaften fast aller Graphen • Schwellenfunktionen • ist χ(G) groß, so enthält G einen großen vollständigen Graphen • diese Vermutung ist jedoch falsch • „dicht“ könnte auch heißen: G enthält kleine Kreise • falsch ist auch die folgende Vermutung: • ist χ(G) groß, so enthält G kleine Kreise 3 / 45 4 / 45 Zufallsgraphen Zufallsgraphen • man kann im Gegenteil zeigen: • sei V = {1, . . . , n} eine Knotenmenge • wir erzeugen zufällig einen Graphen mit Knotenmenge V : • es existieren Graphen • für jedes Paar i , j wird gewürfelt, ob (i , j ) eine Kante in E sein soll • mit beliebig hoher chromatischer Zahl • sei p ∈ [0, 1] und q = 1 − p • deren kleinster Kreis beliebig groß ist (große Taillenweite) • für alle (i , j ) sei p die Wahrscheinlichkeit, dass die Kante auftritt, und q die Wahrscheinlichkeit, dass sie nicht auftritt • diese Aussage konstruktiv zu beweisen, hat sich als schwierig erwiesen • wir wollen in diesem Kapitel die Methode vorstellen, mit der es Erdös 1959 gelungen ist, den Beweis zu führen. 5 / 45 6 / 45 Zufallsgraphen Zufallsgraphen • dieses Modell ist nicht das einzig denkbare • wir bleiben aber bei dem ersten Modell • es erlaubt u.a. nicht die Anzahl der generierten Kanten zu kontrollieren • alle Kanten werden gleich wahrscheinlich und unabhängig voneinander erzeugt • dies ist nachteilig bei der Analyse von Laufzeiten als Funktion von • die Wahrscheinlichkeit, dass wir einen bestimmten Graphen auf Knoten- und Kantenanzahl n Knoten und m Kanten auswürfeln, beträgt dann • ein alternativer Ansatz könnte darin bestehen, alle Graphen mit n p m · q (2)−m m Kanten gleichwahrscheinlich zu erzeugen • sei G(n, p) den Wahrscheinlichkeitsraum der Zufallsgraphen auf n Knoten und mit Kantenwahrscheinlichkeit p 7 / 45 8 / 45 Zufallsgraphen Zufallsgraphen zur Veranschaulichung: “ ” • sei P H ⊆ G die Wahrscheinlichkeit, dass ein Graph G einen anderen Graphen H mit ` Kanten auf den ersten k Knoten als Teilgraphen enthält • die Wahrscheinlichkeit, dass G einen zu H isomorphen Teilgraphen enthält ist schwieriger zu berechnen • dabei können sich die möglichen Kopien von H überlappen • die Ereignisse, dass sie als Untergraphen auftreten, sind daher nicht • dann ist unabhängig voneinander “ ” P H ⊆ G = p` • sicherlich bildet die Summe der Einzelwahrscheinlichkeiten eine obere Schranke • verlangen wir, dass der Graph induziert ist, so müssen wir die anderen Kanten ausschließen, d.h. “ ” k P H induzierter Teilgraph von G = p ` q (2)−` • dazu ein Beispiel: 9 / 45 10 / 45 Zufallsgraphen Zufallsgraphen Lemma 1 Die Wahrscheinlichkeit, dass G ∈ G(n, p) eine stabile Menge der Größe k mit k ≥ 2 enthält, ist ! “ ” k n P α(G) ≥ k ≤ q (2) . k Gliederung • informelle Einführung • Zusammenhang mit den Ramsey-Zahlen • Erwartungswerte • Eigenschaften fast aller Graphen • Schwellenfunktionen Beweis: • die Wahrscheinlichkeit, dass eine Teilmenge U ⊆ V mit |U | = k keine k Kanten enthält, ist q (2) ` ´ • da kn solcher Teilmengen existieren, folgt die Behauptung. • ebenso gilt: “ ” P ω(G) ≥ k ≤ ! n (k2) p . k 11 / 45 12 / 45 Zufallsgraphen Zufallsgraphen Beweis: Ramsey hat 1930 in einem Satz speziell die folgende Aussage bewiesen: • sei p = q = 1 2 Satz 2 • für k ≥ 4 ist k ! > 2k (Beweis per Induktion) Zu jedem k ≥ 1 existiert ein R(k ) ∈ N, so dass jeder Graph mit R(k ) Knoten entweder eine Clique der Größe k oder eine stabile Menge der Größe k enthält. • daraus und aus den obigen Aussagen über stabile Mengen und Cliquen folgt für n ≤ 2k /2 : • der Beweis dieses überraschenden Ergebnisses (genauer einer n k “ ” “ ” α(G) ≥ k = P ω(G) ≥ k ≤ allgemeineren Aussage) ist konstruktiv • allerdings ist das genaue Verhalten der Funktion R(k ) nicht bekannt = • außer für kleine k , gibt es lediglich Schranken, u.a. über Zufallsgraphen ! · “ 1 ”(k ) 2 2 1 n! · 2− 2 k (k −1) k !(n − k )! 1 < (n k /2k ) · 2− 2 k (k −1) 2 Satz 3 ≤ (2k Für k ≥ 4 ist R(k ) > 2k /2 . = 2−k /2 < /2 1 /2k ) · 2− 2 k (k −1) 1 2 13 / 45 14 / 45 Zufallsgraphen Zufallsgraphen • für n ≤ 2k /2 ist “ ” “ ” 1 P α(G) ≥ k = P ω(G) ≥ k < 2 Gliederung • informelle Einführung • Zusammenhang mit den Ramsey-Zahlen • damit ist die Wahrscheinlichkeit, dass eines der Ereignisse eintritt, echt kleiner als 1 • Erwartungswerte • Eigenschaften fast aller Graphen • Schwellenfunktionen • d.h. es existiert mindestens ein Graph auf n Knoten, der weder eine Clique noch eine stabile Menge der Größe jeweils k enthält. 15 / 45 16 / 45 Zufallsgraphen Zufallsgraphen Lemma 4 (Markov-Ungleichung) • jede Funktion, die einem Graphen einen nichtnegativen Wert zuordnet Sei x eine Zufallsvariable auf G(n, p) und t > 0. Dann gilt: (chromatische Zahl, maximale Cliquengröße, Stabilitätszahl usw.) wird auf G(n, p) zu einer Zufallsvariablen: “ ” P x ≥ t ≤ E (x )/t . x : G(n, p) → R+ . • der Erwartungswert Beweis: E (x ) = X Es ist: x (G)P (G) X E (x ) = G∈G(n,p) ·x (G)P (G) G∈G(n,p) ist das mit der Wahrscheinlichkeit des Auftretens gewichtete Mittel der Zufallsvariablen X ≥ x (G) · P (G) G∈G(n,p) • der Erwartungswert ist linear, d.h. E (ax + by ) = aE (x ) + bE (y ) x (G)≥t X ≥ • der Erwartungswert ermöglicht es, Aussagen über das Verhalten von x abzuleiten P (G) · t G∈G(n,p) x (G)≥t “ ” = P x ≥ t · t. 17 / 45 18 / 45 Zufallsgraphen Zufallsgraphen • dann ist E (xC ) die Wahrscheinlichkeit, dass C ⊆ G, also Zur Veranschaulichung berechnen wir die erwartete Anzahl von Kreisen der Länge k in einem Graphen. “ ” E (xC ) = P C ⊆ G = p k Satz 5 • jeder Kreis wird durch eine Folge u1 , . . . , uk dargestellt Die mittlere Anzahl von Kreisen der Länge k in einem Graphen G ∈ G(n, p) ist n! E (x ) = · pk . (n − k )! · 2k • davon gibt es n · (n − 1) · . . . · (n − k + 1) = n! (n−k )! viele • davon stellen jeweils 2k den gleichen Kreis dar: • (u1 , . . . , uk ), (u2 , . . . , uk , u1 ), . . . und die inversen Reihenfolgen ` Beweis: • die Zufallsvariable x ist die Summe der Zufallsvariablen xC • sei C ein festgewählter Kreis der Länge k auf der Knotenmenge V • somit folgt aus der Linearität: • sei xC die Zufallsvariable auf G(n, p) mit xC = ´ X X E (x ) = E ( xC ) = E (xC ) = 1, falls C ⊆ G 0, sonst C 19 / 45 C n! · pk . (n − k )! · 2k 20 / 45 Zufallsgraphen Zufallsgraphen • Im Folgenden wollen wir das Resultat von Erdös über Graphen mit • unser Modell bleibt gültig, wenn wir p nicht konstant wählen, sondern großer Taillenweite und großer chromatischer Zahl diskutieren z.B. als Funktion von n • wir zeigen zuerst, dass, wenn p etwas langsamer fällt als • wenn wir p klein wählen: 1 , n wir fast sicher keine großen stabilen Mengen finden werden. • intuitiv scheint klar, dass ein zufällig erzeugter Graph mit hoher Wahrscheinlichkeit keine kleine Kreis haben wird Lemma 6 • wählen wir p groß: Sei k > 0 und p ≥ • so werden nur selten große stabile Mengen erzeugt werden 6k ln n , n so gilt “ ” 1 lim P α ≥ · n/k = 0. n→∞ 2 • die Frage ist, ob wir einen Kompromiss für p finden, der beide Zahlen groß werden lässt Beweis: • folgt aus dem Lemma 1 und geeigneten Abschätzungen. 21 / 45 22 / 45 Zufallsgraphen Zufallsgraphen Satz 7 (Erdös) E (x ) = Zu jedem k ∈ N gibt es einen Graphen G mit Taillenweite g(G) > k und chromatischer Zahl χ(G) > k . k X i =3 k 1X i i n! · pi ≤ np (n − i )! · 2i 2 i =3 • da np = n ε ≥ 1, folgt (np)i ≤ (np)k , und somit: Beweis: • für das vorgegebene k wähle ε so, dass 0 < ε < E (x ) ≤ 1 k k 1X i i 1 n p ≤ (k − 2)n k p k , 2 2 i =3 • sei p = n ε−1 • aus der Markov-Ungleichung 4 folgt weiter: • sei x (G) die Zufallsvariable, die jedem G ∈ G(n, p) die Anzahl seiner “ n” n P x ≥ ≤ E (x )/( ) 2 2 ≤ (k − 2)n k −1 p k Kreise der Länge höchstens k zuordnet • nach Satz 5 gilt: E (x ) = k X i =3 = (k − 2)n k −1 n (ε−1)k k n! 1X i i · pi ≤ np (n − i )! · 2i 2 = (k − 2)n k ε−1 i =3 “ • da k ε − 1 < 0, folgt: limn→∞ P x ≥ 23 / 45 n 2 ” =0 24 / 45 Zufallsgraphen Zufallsgraphen “ n” lim P x ≥ = 0. n→∞ 2 Gliederung • damit “ und”nach Lemma “ 6 können wir” n so groß wählen, dass P x ≥ n 2 < 1 2 1 2 und P α ≥ · n/k < • informelle Einführung • Zusammenhang mit den Ramsey-Zahlen 1 2 • dann existiert eine Graph G ∈ G(n, p) mit α(G) < 21 n/k und mit weniger als n 2 • Erwartungswerte • Eigenschaften fast aller Graphen kurzen Kreisen • sei H der Graph, der aus G entsteht, wenn wir aus jedem kurzen • Schwellenfunktionen Kreis einen Knoten entfernen. • dann hat H immer noch mindestens n 2 Knoten, enthält aber keine kurzen Kreise mehr, d.h. g(H ) > k • weiter gilt nach Wahl von G: χ(H ) ≥ |H | n/2 ≥ > k. α(H ) α(G) 25 / 45 26 / 45 Zufallsgraphen Zufallsgraphen wir sagen, dass: • Im folgenden betrachten wir Eigenschaften von Graphen • fast alle Graphen haben die Eigenschaft E , falls r (E , p, n) → 1, • eine Eigenschaft ist eine Teilmenge aller Graphen, die unter Isomorphie abgeschlossen ist • fast kein Graph hat die Eigenschaft E , falls r (E , p, n) → 0 • d.h.: hat G die Eigenschaft, so auch jeder zu G isomorphe Graph • wir wollen folgende Fragestellung untersuchen: Zur Illustration zeigen wir: • gegeben eine Eigenschaft E • gegeben eine Auswahlfunktion p(n) • sei r (E , p, n) die Wahrscheinlichkeit, dass ein Graph die Eigenschaft hat • jeder gegebene Graph taucht in fast allen Graphen als isomorphe Kopie eines induzierten Teilgraphen auf • wie verhält sich r (E , p, n) für n → ∞ ? 27 / 45 28 / 45 Zufallsgraphen Zufallsgraphen Lemma 8 • die Wahrscheinlichkeit, dass keine dieser Teilmengen eine isomorphe Sei H ein Graph und 0 < p < 1. Dann enthalten fast alle Graphen einen induzierten Teilgraphen, der isomorph zu H ist. Kopie von H enthält, ist daher (1 − r )bn/k c • damit folgt: Beweis: “ ” P H ist nicht induzierter Teilgraph von G • sei k = |V (H )| ≤ (1 − r )bn/k c • sei U eine k -elementige Teilmenge der n Knoten eines −−−→ Zufallsgraphen G ∈ G(n, p) n→∞ 0. • sei r > 0 die Wahrscheinlichkeit, dass G(U ) isomorph zu H ist • wegen der Unabhängigkeit des Würfelns der Kanten, hängt diese Wahrscheinlichkeit nur von p ab, nicht aber von n • G enthält bn/k c disjunkte k -elementige Teilmengen • die Wahrscheinlichkeit, dass keine dieser Teilmengen eine isomorphe Kopie von H enthält, ist daher (1 − r )bn/k c 29 / 45 30 / 45 Zufallsgraphen Zufallsgraphen für i , j ∈ N sei Ti ,j die folgende Eigenschaft: Beweis: • der Graph enthält mindestens i + j Knoten • sei G ∈ G(n, p) • für je zwei disjunkten Teilmengen U1 und U2 mit |U1 | ≤ i und • seien U1 , U2 zwei Teilmengen von Knoten |U2 | ≤ j gilt: • sei r die Wahrscheinlichkeit, dass ein gegebener Knoten • es existiert ein Knoten v ∈ / (U1 ∪ U2 ) mit: v ∈ V r (U1 ∪ U2 ) zu allen Knoten aus U1 und zu keinem Knoten aus U2 benachbart ist • v ist zu allen Knoten aus U1 benachbart • v ist zu keinem Knoten aus U2 benachbart. • dann ist r = p |U1 | q |U2 | Lemma 9 Sei 0 < p < 1 und i , j ∈ N. Dann hat fast jeder Graph die Eigenschaft Ti ,j . • wegen der Unabhängigkeit ist für n ≥ i + j somit die Wahrscheinlichkeit, dass im Restgraphen kein solcher Knoten existiert (1 − p |U1 | q |U2 | )n−|U1 |−|U2 | ≤ (1 − p i q j )n−i −j 31 / 45 32 / 45 Zufallsgraphen Zufallsgraphen • wegen der Unabhängigkeit ist für n ≥ i + j somit die Korollar 10 Wahrscheinlichkeit, dass im Restgraphen kein solcher Knoten existiert Für 0 < p < 1 und k ∈ N ist fast jeder Graph k -zusammenhängend. (1 − p |U1 | q |U2 | )n−|U1 |−|U2 | ≤ (1 − p i q j )n−i −j Beweis: • nach Lemma 9 reicht es zu zeigen, dass jeder Graph mit Eigenschaft • es existieren höchstens `n´ i +j ≤ n i +j disjunkte Teilmengen U1 , U2 in V T2,k −1 k -zusammenhängend ist • dies folgt aber aus dem Satz von Menger, da je zwei nichtbenachbarte • die Wahrscheinlichkeit, dass darunter ein Paar ohne ein Knoten von keiner Teilmenge U2 der Kardinalität k − 1 getrennt werden können, denn sie haben immer noch einen gemeinsamen Nachbarn außerhalb von U2 . entsprechendes v ist, beträgt somit höchstens n i +j (1 − p i q j )n−i −j . • Wir haben sogar eine schärfere Aussage gezeigt: • fast alle Graphen haben maximale Distanz zwei. • Da 1 − p i q j < 1, geht dieser Wert für n → ∞ gegen 0. • Ebenso lässt sich zeigen, dass fast alle Graphen eine hohe chromatische Zahl in der Größenordnung von n/ log n haben. 33 / 45 34 / 45 Zufallsgraphen Zufallsgraphen • sei t (n) eine Funktion und T eine Eigenschaft von Graphen • t (n) heißt Schwellenfunktion für T , wenn gilt: Gliederung • informelle Einführung • Zusammenhang mit den Ramsey-Zahlen p(n)/t (n) → 0 =⇒ fast kein Graph hat die Eigenschaft T , p(n)/t (n) → ∞ =⇒ fast alle Graphen haben Eigenschaft T • Erwartungswerte • Eigenschaften fast aller Graphen • Schwellenfunktionen • wir beschränken uns im folgenden auf spezielle Eigenschaften T • T heißt monoton, wenn sie bei Hinzufügen von Kanten erhalten bleibt • wir wollen versuchen, für monotone Eigenschaften Schwellenfunktionen zu bestimmen 35 / 45 36 / 45 Zufallsgraphen Zufallsgraphen • wir werden dabei für eine Zufallsvariable x mit den bisher bekannten Lemma 11 (Tschebyschev-Ungleichung) Methoden das Ergebnis E (x ) → ∞ ableiten können Für jedes reelle t > 0 gilt: “˛ ” h i ˛ P ˛x − E (x )˛ ≥ t ≤ E (x − E (x ))2 /t 2 . • wir würden daraus gerne die Aussage P (x = 0) → 0 ableiten • obwohl dieser Schluss nahe liegt, ist er i.A. nicht richtig: • betrachte etwa P (x = 0) = 1/2 und P (x = n) = 1/2 • der gewünschte Schluss ist jedoch möglich, wenn wir sicherstellen, Beweis: dass die Werte sich nicht sehr weit vom Erwartungswert entfernen • aus der Markov-Ungleichung 4 folgt: • dazu betrachten wir zweite Momente, d.h. “˛ ” “` ” h` ˛ ´2 ´2 i P ˛x − E (x )˛ ≥ t = P x − E (x ) ≥ t 2 ≤ E x − E (x ) /t 2 . • die Erwartung von x 2 und h` ´2 i • die Varianz E x − E (x ) 37 / 45 38 / 45 Zufallsgraphen Zufallsgraphen Als Folgerung ergibt sich: Veranschaulichung des Konzeptes der Schwellenfunktion • wir leiten eine Schranke dafür her, dass jeder Knoten mindestens einen Lemma 12 2 Nachbarn hat 2 Gilt E (x )/E (x ) → 1, so folgt P (x = 0) → 0. • dies ist etwas schwächer als den Zusammenhang zu fordern Beweis: • dafür trennen wir das Verhalten schärfer als bei den • für Graphen mit x (G) = 0 gilt |x (G) − E (x )| = E (x ) Schwellenfunktionen gefordert • somit folgt aus Lemma 11: • dazu einige Vorüberlegungen ohne Beweis: “˛ ” ˛ P (x = 0) ≤ P ˛x − E (x )˛ ≥ E (x ) h` ´2 i ≤ E x − E (x ) /E (x )2 “ ” = E (x 2 ) − E (x )2 /E (x )2 • ist p = c ln n/n für eine beliebige Konstante c, so folgt np 2 (1/2 + p/3 + p 2 /4 + . . .) → 0, • für −1 ≤ x < 1 ist ln(1 − x ) = −x − x2 2 − x3 3 − ... , • ne −np = n 1−c → 0. 39 / 45 40 / 45 Zufallsgraphen Zufallsgraphen Lemma 13 Lemma 14 Sei p = c ln n/n für eine Konstante c > 1. Dann haben fast alle Graphen in G(n, p) keine isolierten Knoten. Sei p = c ln n/n für eine Konstante c < 1. Dann haben fast alle Graphen in G(n, p) isolierte Knoten. Beweis: Beweis: • sei xi die Indikatorfunktion, die anzeigt, ob der Knoten vi isoliert ist • für c < 1 folgt aus den obigen Überlegungen E (x ) → ∞. • sei x die Zufallsvariable der Anzahl der isolierten Knoten • wegen der Linearität des Erwartungswertes und der Eigenschaft • dann ist E (x ) = P i xi2 = xi der folgt P Indikatorfunktionen, P E (x 2 ) = ni=1 E (xi2 ) + 2 i <j E (xi xj ) = E (x ) + n(n − 1)E (xi xj ). E (xi ) = n(1 − p)(n−1) • mit den vorigen Bemerkungen folgt: • das Produkt xi xj ist wiederum eine Indikatorvariable, die genau dann (1 − p)n = e n ln(1−p) = e −np e −np 2 den Wert 1 annimmt, wenn beide Knoten isoliert sind. (1/2+p/3+...) • damit ist E (xi xj ) = (1 − p)2n−3 . • weiter folgt dann (1 − p)n ∼ e −np • da wie vorher (1 − p)n ∼ e −np , folgt E (xi xj ) ∼ e −2np . • da (1 − p)−1 ∼ 1, ergibt sich E (x ) ∼ ne −np • aus den vorigen Bemerkungen ergibt sich E (x ) ∼ n • somit ergibt sich E (x 2 ) ∼ E (x ) + E (x )2 und somit E (x 2 )/E (x )2 → 1. 1−c • da c > 1, folgt E (x ) → 0. • aus dem Lemma 12 folgt dann P (x = 0) → 0. 41 / 45 42 / 45 Zufallsgraphen Zufallsgraphen Korollar 15 Als Folgerungen ergeben sich aus diesem Satz: Die Funktion ln n/n ist eine Schwellenfunktion für das Verschwinden isolierter Knoten. Korollar 17 Für k ≥ 3 ist t (n) = 1/n eine Schwellenfunktion für das Auftreten eines Kreises der Länge k . • mit ähnlichen Methoden lässt sich das folgende allgemeine Resultat zeigen. • Insbesondere ist die Schwellenfunktion unabhängig von k . • dazu heiße ein Graph H ausgewogen, wenn der durchschnittliche • Damit treten ab der Kantenauswahlwahrscheinlichkeit 1/n bereits Knotengrad in einem Teilgraphen nie größer ist als der von H . Kreise jeder konstanten Länge auf. Satz 16 Korollar 18 Ist H ein ausgewogener Graph mit k Knoten und l Kanten, so ist t (n) = n −k /l eine Schwellenfunktion für das Auftreten von H als Teilgraph. Ist T ein Baum auf k Knoten, so ist t (n) = n −k /(k −1) eine Schwellenfunktion für das Auftreten von T als Teilgraph. 43 / 45 44 / 45 Zufallsgraphen Lässt man die Kantenwahrscheinlichkeit langsam anwachsen, so zeigt sich folgendes Verhalten: • unterhalb von 1/n 2 hat fast jeder Graph nur isolierte Knoten, • ab 1/n 2 tauchen erste Kanten auf, die noch isoliert bleiben, 3 • ab 1/n 2 hat fast jeder Graph Komponenten mit mehr als zwei Knoten, • bei n −(1+1/k ) haben die Graphen Bäume mit k + 1 Knoten, aber sind weiterhin kreisfrei. Für jedes k sind dies Schwellenfunktionen, die das Auftreten von Bäumen mit k + 1 Knoten von denen mit k + 2 Knoten trennen, • ab 1/n tauchen Kreise auf, • mit wachsendem p erhalten die Kreise Sehnen, d.h. die Graphen sind nicht mehr planar. Eine der Komponenten schwillt an, • bis bei ln n/n diese Komponente die anderen verschluckt und die Graphen zusammenhängend werden, • danach hat für alle k jeder Knoten mindestens k Nachbarn. 45 / 45