Rheinische Friedrich-Wilhelms-Universität Bonn Institut für Informatik I Markus Blätzinger Random Walks 16. Oktober 2006 Seminararbeit im SS 2006 Betreuer: Ansgar Grüne Zusammenfassung Diese Arbeit beschäftigt sich mit Random Walks und deren Beziehung zu Elektrischen Netzwerken, wie von Chandra et al. 1997 dargelegt [2]. Nach einigen Begriffsbestimmungen im ersten Abschnitt wird im zweiten Abschnitt auf die Commute und Cover Time auf zunächst recht allgemeinen Graphen eingegangen. Zusätzlich wird mit Hilfe von Random Walks eine Schranke für die Shortest Universal Traversal Sequence auf Graphen hergeleitet. Im dritten Abschnitt werden dann mit d-regulären Graphen und mit regelmäßigen Gittergraphen zwei spezielle Klassen von dichten Graphen betrachtet. Mit dichten Graphen sind solche Graphen gemeint, die eine Vielzahl von Kanten besitzen, also stark verbunden sind. Bei diesen Graphen können sehr gute obere Schranken für die Commute Time gezeigt werden. Inhaltsverzeichnis 1 Einführung 1.1 Random Walks . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Elektrische Netze . . . . . . . . . . . . . . . . . . . . . . . . . 2 2 3 2 Commute und Cover Time 2.1 Commute Time . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Cover Time . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 11 3 Random Walks auf dichten Graphen 14 3.1 Random Walks auf d-regulären Graphen . . . . . . . . . . . . 14 3.2 Random Walks in Gittergraphen . . . . . . . . . . . . . . . . 16 1 1 1.1 Einführung Random Walks Random Walks bilden eine wichtige Klasse von stochastischen Prozessen. Ein Beispiel für einen Random Walk ist die Fahrt durch eine Stadt, bei der an jeder Kreuzung ein Münzwurf, ein Würfelergebnis, oder ähnliches über die Richtung der Weiterfahrt entscheidet. Im folgenden wollen wir Random Walks auf Graphen betrachten. Genauer betrachten wir folgenden Prozess: Ausgehend von einem definierten Startknoten gehen wir zu einem Nachbarknoten über. Zu welchem Nachbarknoten wir dabei übergehen, entscheidet sich zufällig nach einer bestimmten Verteilung. Insbesonders können Knoten und Kanten mehrfach besucht werden. Erreichen wir einen vorab definierten Endknoten, so endet der Lauf. ? Abbildung 1: zufälliger Übergang zu einem Nachbarknoten. Interessiert man sich nun für die Anzahl der Schritte im Laufe eines solchen Random Walk, so hilft eine interessante Beziehung zu elektrischen Netzwerken. Es stellt sich ein enger Zusammenhang zwischen dem stochastischen Modell auf dem Graphen und der Betrachtung der Widerstände eines aus dem Graphen abgeleiteten elektrischen Netzes heraus. Diese Arbeit beschäftigt sich mit der Commute und Cover Time von Random Walks auf Graphen und deren Beziehung zu elektrischen Netzen, wie von Chandra et al. 1997 dargelegt [2]. Dabei versteht man unter der Commute Time die erwartete Anzahl von Schritten, die bei dem zufälligen Ablaufen des Graphen benötigt werden, um von einem Knoten u zu einem Knoten v überzugehen und zu u zurückzukehren. Unter der Cover Time versteht man die erwartete Anzahl von Schritten, um alle Knoten eines Graphen mindestens einmal zu besuchen. Dabei kann diese, ausgehend von verschiedenen Startknoten, unterschiedlich ausfallen. Wir wählen daher das Maximum dieser Werte als Wert der Cover Time. Es handelt sich bei diesen Betrachtungen stets um erwartete Werte, da wir es mit Zufallsprozessen zu tun haben. 2 1.2 Elektrische Netze Ein elektrisches Netz ist wie ein Graph aus Knoten und Kanten aufgebaut. Die Kanten entsprechen elektrischen Leitungen, welche mit Widerständen behaftet sind und für die das Ohmsche Gesetz gilt: 1 U R Dabei bezeichnet I den Strom in Ampere, R den Widerstand in Ohm und U die Spannung in Volt. I= Innerhalb des Netzes sind viele geschlossene Stromkreise möglich. Jeder geschlossene Stromkreis, bei dem kein Knoten und keine Kante mehrfach besucht werden, bildet eine Masche. Für die weiteren Überlegungen ist zunächst der erste Kirchhoffsche Satz - auch Knotenregel genannt - wichtig: In einem elektrischen Netz fließt in jedem Knoten die gleiche Ladungsmenge ab, die dem Knoten auch in der selben Zeiteinheit zufließt. Mit anderen Worten muss der Strom, der einem Knoten zufließt, von diesem Knoten wieder abfliessen. Ausgehende und eingehende Ströme werden am Vorzeichen unterschieden. I1 I0 I0 + I1 + I2 = 0 I2 Abbildung 2: Knotenregel von Kirchhoff. Weiter gilt der zweite Satz von Kirchhoff, die so genannte Maschenregel: Bei einem geschlossenen Umlauf in einer Masche des Netzes ist die Summe aller Spannungen Null. Für die Betrachtung von speziellen Graphen wird das Thomson-Prinzip benötigt. In einem beliebigen elektrischen Netzwerk sei I der Strom von u nach v, der durch die Sätze von Kirchhoff bestimmt ist. Leistung ist definiert als Arbeit pro Zeit, mit W = U It folgt für die elektrische Leistung: W = U I = I 2R t Betrachten wir nun ein elektrisches Netz wie folgt: V sei eine endliche Menge von Knoten, E die Menge der Kanten zwischen je zwei Knoten aus P = 3 V . Jeder Kante wird ein Widerstand r(e) zugeordnet. Sei nun ein Fluss in einem solchen Netz (V, E, r) mit den Knoten v ∈ V und den Widerständen r(e) an jeder Kante e ∈ E abstrakt definiert als eine Funktion c : V ×V → R mit c(u, v) = −c(v, u) und c(u, v) = 0 ∀{u, v} 3 E. Mit c(u) sei der Gesamtfluß aus dem Knoten u bezeichnet, also die Summe aller eingehenden und ausgehenden Flüsse. Der Fluss c habe nun genau eine Quelle u und eine Senke v. Für alle anderen Knoten sei die Summe der aus- und eingehenden Flüsse 0. Ferner gelte c(u) = I(u). Damit gilt der erste Satz von Kirchhoff, nicht aber zwangsläufig auch der zweite. Betrachtet man dann den Strom I, so ist die durch diesen Strom I bestimmte Leistung niemals größer als jede durch einen Fluss c von u nach v verursachte Leistung. Der Strom I ist also leistungsminimierender Fluss unter allen Flüssen mit einer Quelle und einer Senke, die dieselbe Quellstärke aufweisen. Einfach ausgedrückt wählt der durch die Sätze von Kirchhof bestimmte Strom den Weg des geringsten Widerstandes und damit wird die geringste Leistung frei. Abbildung 3 zeigt ein Beispiel, Doyle und Snell führen einen Beweis für die Aussage [3]. 0,5 A 1Ω 1A 1Ω u 1Ω 0,5 A 1Ω 1A 0,5 A 1A 1A P (i) = 4(1 · 0, 52 ) = 1 v 1A P (c) = 2(1 · 12 ) = 2 1Ω 0,5 A 1Ω u 1Ω v 1Ω 1A Abbildung 3: Bei gegebener Quelle und Senke und gegebener Stromstärke minimiert der nach den Sätzen von Kirchhoff bestimmte Fluss (oben) die freigegeben Leistung P . Eine weitere Eigenschaft elektrischer Netze wird durch das Monotoniegesetz von Rayleigh beschrieben: Wird der Widerstand einer Leitung erhöht, kann sich der Widerstand zwischen zwei Knoten des Netzes nur erhöhen. Wird der Widerstand an einer Stelle herabgesetzt, kann sich der Widerstand zwischen zwei Knoten des Netzes nur verringern. Ein Beweis findet sich ebenfalls bei Doyle und Snell [3]. 4 2 Commute und Cover Time Im folgenden betrachten wir Graphen G = (V, E) mit n = |V | Knoten und m = |E| Kanten. Diese Graphen werden ungerichtet und - wenn nicht anders angegeben - ungewichtet sein. Wir betrachten nur schlichte Graphen und immer auch nur solche, die aus genau einer Zusammenhangskomponente bestehen. Zu diesen Graphen werden elektrische Netze wie folgt abgeleitet: Zu jedem Knoten v ∈ V gibt es einen Knoten im elektrischen Netz. Zusätzlich gibt es für jede Kante (u, v) aus E eine entsprechende Verbindung im abgeleiteten Netz, mit dem Widerstand ru,v . Dieser Widerstand ru,v entspricht dem Gewicht der Kante zwischen u und v. Bei ungewichteten Graphen ist ru,v stets 1. Das abgeleitete elektrische Netz wird mit N (G) bezeichnet. Mit Ru,v sei der effektive Widerstand zwischen zwei Knoten in N (G) bezeichnet. Ru,v berechnet sich nach den Kirchhoffschen Sätzen und dem Ohmschen Gesetz. Abbildung 5 zeigt ein Beispiel. Der Unterschied zwischen Ru,v und ru,v wird in Abbildung 4 deutlich. In der Abbildung haben alle Widerstände den Wert 1Ω, für den effektiven Widerstand zwischen u und v 1 = 12 + 12 + 11 = 2 folgt: Ru,v 1Ω u 1Ω ru,v = 1Ω 1Ω 2Ω v ru,v = 1Ω u 2Ω 1Ω 1 Ru,v u v Ru,v = 12 Ω = 1/2 + 1/2 + 1 = 2 ⇒ Ru,v = 12 Ω v Abbildung 4: Effektiver Widerstand zwischen zwei Knoten. 2.1 Commute Time G = (V, E) sei ein ungewichteter Graph mit n Knoten und m Kanten. Hu,v bezeichnet die erwartete Anzahl von Schritten unter einer festgelegten Wahrscheinlichkeitsverteilung in einem Random Walk von einem Knoten u zu einem Knoten v in G. Also die Anzahl von Schritten, nach denen der erste Besuch des Knoten v erwartet wird. Hu,v heißt Hitting Time. 5 v s u t v 0 ru,v 0 s u 0 t 0 Abbildung 5: Übergang von G nach N (G). Definition 1 Die Commute Time Cu,v wird wie folgt definiert: Cu,v = Hu,v + Hv,u . Zunächst mag man sich fragen, weshalb zwischen Hu,v und Hv,u überhaupt unterschieden wird, intuitiv scheinen die beiden Werte vielleicht zunächst gleich zu sein. Es zeigt sich aber, dass Hu,v mitunter sehr verschieden von Hv,u sein kann. Als Beispiel betrachten wir einen ungewichteten Lollipop-Graphen L16 wie in Abbildung 6. Die ersten acht Knoten dieses Graphen bilden eine Clique, die restlichen acht bilden einen Pfad, der mit einem Knoten u der Clique verbunden ist. Die Übergangswahrscheinlichkeiten seien gleichverteilt. Betrachten wir nun diesen Knoten u und den äussersten Knoten v des Pfades, so gilt: Hu,v ∈ Θ(n3 ) und Hv,u ∈ Θ(n2 ). Die beiden Werte können also sehr weit auseinander liegen. Dieses Beispiel ist bei Worsch [5] näher ausgeführt, ein Beweis für diese beiden Schranken wird weiter unten geführt. Kommen wir zurück zu allgemeinen ungewichteten Graphen G, wie oben definiert. N (x) bezeichne die Menge der zum Knoten x ∈ V adjazenten Knoten in G. Sei nun d(x) der Grad des Knoten x. Dabei bezeichne φu,v die Spannung zwischen den zu u und v gehörenden Knoten in N (G), wobei ein Strom der Stärke d(x) an jedem Knoten eingespeist und zusätzlich an dem zu v gehörenden Knoten ein Strom der Stärke 2m abgegriffen wird. Jeder Widerstand in N (G) sei zunächst 1 Ω groß und die Übergangswahrscheinlichkeiten seien an jedem Knoten gleichverteilt. Mit diesen Festsetzungen gilt folgendes Lemma: 6 u v Abbildung 6: Lollipop Graph mit 16 Knoten. Lemma 2 Hu,v = φu,v . Beweis. Aus dem Ohmschen Gesetz folgt, dass der Strom, der den Knoten u in Richtung eines beliebigen Nachbarknotens w verlässt, gleich der Potentialdifferenz zwischen u und w geteilt durch den Widerstand zwischen u und w ist. Da alle Widerstände die Größe 1 Ω besitzen und an dem Knoten u ein Strom von d(u) Ampere anliegt, verlässt den Knoten nach dem ersten Kirchhoffschen Satz ein Strom von insgesamt d(u) Ampere. Für die Spannung φu,v folgt: X X d(u) = (φu,w ) = (φu,v − φw,v ) ∀u ∈ V − {v} w∈N (u) w∈N (u) Für die Hitting Time Hu,v gilt mit der Übergangswahrscheinlichkeit von u 1 : nach w, pu,w = d(u) Hu,v = X pu,w (1 + Hw,v ) ∀u ∈ V − {v} w∈N (u) = 1+ X 1 Hw,v d(u) w∈N (u) ⇒ d(u) = X P w∈N (u) Hw,v Hu,v − 1 (Hu,v − Hw,v ) = d(u)Hu,v − w∈N (u) X Hw,v w∈N (u) = d(u)Hu,v − d(u)(Hu,v − 1) = d(u)Hu,v − d(u)Hu,v + d(u) = d(u) X ⇒ d(u) = (Hu,v − Hw,v ) w∈N (u) 7 Identifiziert man in diesen beiden eindeutig lösbaren Gleichungssystemen φu,v mit Hu,v , so folgt die Behauptung. 2 Mit dieser Darstellung von Hu,v durch φu,v kann man das Verhalten von Hu,v und Hv,u im Lollipop Graphen herleiten. Für Hu,v : An jedem der n/2 Knoten der Clique wird ein Strom von n/2 Ampere injiziert. Dieser Gesamtstrom von Θ(n2 ) Ampere fließt durch u und die restlichen n/2 Knoten nach v und verursacht an allen n/2 Widerständen zwischen u und v einen Spannungsabfall von je Θ(n2 ) Volt. Daraus resultiert ein Spannungsabfall zwischen u und v von insgesamt Θ(n3 ) Volt, folglich gilt Hu,v ∈ Θ(n3 ). Für Hv,u gilt hingegen: An den Knoten außerhalb der Clique wird je ein Strom von 2 Ampere injiziert. Damit fließt zu u ein Strom der Stärke Θ(n). Die Spannungsabfälle summieren sich zu O(n2 ), damit folgt Hv,u ∈ Θ(n2 ). Theorem 3 Für zwei beliebige Knoten u und v in einem ungewichteten Graphen G gilt: Cu,v = 2m · Ru,v . Beweis. Per Definition gilt: Cu,v = Hu,v + Hv,u . Den Knoten u und v aus G entsprechen die Knoten u0 und v 0 in N (G). Der Wert von Hu,v ist gleich dem Wert der Spannung φu,v zwischen u0 und v 0 , wenn ein Strom der Stärke 2m Ampere an v 0 abgegriffen wird und d(x) Ampere an jedem Knoten x0 eingespeist werden. Umgekehrt kann Hv,u auch als Spannung φv,u zwischen v 0 und u0 angesehen werden, wenn wenn d(x) Ampere an jedem Knoten abgegriffen werden und 2m Ampere an u0 eingespeist werden. Überlagert man beide Ströme um eine Aussage über Cu,v = Hu,v + Hv,u zu erhalten, so folgt ein Strom von u0 nach v 0 der Stärke 2m. Alle anderen Ströme heben sich auf. Abbildung 7 zeigt ein Beispiel. Damit ist der effektive Widerstand φ +φ Ru,v zwischen u0 und v 0 nach dem Ohmschen Gesetz gleich u,v2m v,u . Es folgt: Cu,v = Hu,v + Hv,u = φu,v + φv,u = 2mRu,v 2 An dieser Stelle soll ein Beispiel die bisherigen Definitionen und Sätze verdeutlichen. Wir betrachten einen ungewichteten Graphen mit vier Knoten u,v,s und t wie in Abbildung 8. Die Übergangswahrscheinlichkeiten seien wieder gleichverteilt, die Hitting Time Hs,t zwischen s und t soll berechnet werden. Hs,t = X 1/d(s)(1 + Hw,t) = 1(1 + Hu,t ) = 1 + Hu,t w∈N (s) Hu,t = X (1/d(u))(1 + Hw,t ) w∈{s,v,t} 8 2A 2A 2A 3A 1A 2A φu,v = 12V v0 2A u0 3A −φv,u = −5, 5V v0 2A 10A 1A u0 2A 10A 2A 3A 1A φv,u = 5.5V v 2A φu,v + φv,u = Cu,v = 17, 5V 0 u0 u0 10A v0 10A 10A Abbildung 7: Beispiel zum Beweis von Theorem 3. Alle Spannungen sind in Bezug auf u0 angegeben.. = X w∈{s,v,t} 1 1 1 1 (1 + Hw,t) = (1 + Hs,t ) + (1 + Hv,t ) + (1 + Ht,t ) 3 3 3 3 Hs,t = Hv,t wegen Symmetrie 1 1 1 (1 + Hs,t) + (1 + Hs,t) + ⇒ Hu,t = 3 3 3 2 1 (3 + 2Hs,t ) = 1 + Hs,t = 3 3 2 2 ⇒ Hs,t = 1 + 1 + Hs,t = 2 + Hs,t ⇒ Hs,t = 6 3 3 Einfacher zu berechnen ist die Spannung φs,t zwischen s und t. Mit den Widerständen rs,u = ru,t = 1 und den Strömen wie in Lemma 2 definiert folgt: φs,t = 1V + 5V = 6V . Identifiziert man wie in Lemma 2 Hs,t mit φs,t , so bestätigt sich die oben berechnete Hitting Time. Wir wollen nun auch die Commute Time Cs,t zwischen s und t in dem Graphen aus Abbildung 8 betrachten. Nach Theorem 3 folgt Cs,t = 2mRs,t mit Rs,t = 2Ω ergibt sich Cs,t zu 12. Dies wird durch die Symmetrie des Graphen auch klar, denn mit Hs,t = Ht,s folgt Cs,t = Hs,t + Ht,s = 2Hs,t = 9 1A v 1A 1A 3A v’ 1Ω 1Ω s u s’ 1A u’ 1Ω 5A 1A t 6A t’ Abbildung 8: Beispiel zur Hitting Time. 12. Dieses Ergebnis für ungewichtete Graphen kann auf Situationen ausgeweitet werden, bei denen die Kanten gewichtet sind und auch die Übergangswahrscheinlichkeiten nicht mehr gleichverteilt sind. Dazu wird nur N (G) anders definiert: Zu jedem Knotenpaar (u, v) aus G verbinden wir einen positiven Widerstand ru,v = rv,u . Diese Widerstände bestimmen, wie gleich gezeigt wird, die Übergangswahrscheinlichkeiten. Für nicht durch Kanten verbundene Knotenpaare wird der Widerstand als unendlich definiert. Jede gerichtete Kante in N (G) erhält zusätzlich Kosten fu,v zugeordnet. Nun wird ein Random Walk auf G wie folgt betrachtet: Gehe am Knoten u mit der Wahrscheinlichkeit 1 ru,v 1 w∈V ru,w P zum Knoten v über. Diese Wahrscheinlichkeit wird wieder mit pu,v bezeichnet. Die Kosten des Random Walk sind definiert als Summe über die Kosten fu,v der besuchten Kanten. Wie im einfachen Fall bezeichne Ru,v den f effektiven Widerstand zu den Knoten u und v. Hu,v bezeichne die erwarteten Kosten eines Random Walk von u nach v unter der Kostenfunktion f . f f f Cu,v = Hu,v + Hv,u bezeichne die Commute Time unter f . P fx,y . Für je zwei Kanten u und v ergibt Theorem 4 Sei F = (x,y)∈V ×V rx,y f sich die Commute Time zu Cu,v = F Ru,v . P fx,y Ampere eingespeist. Der Beweis. In jeden Knoten werden fx = y∈V rx,y Beweis ist dann identisch zum einfachen Fall, mit F = 2m in Theorem 3. 2 10 Bei den folgenden Betrachtungen beschränken wir uns - wenn nicht anders angegeben - wieder auf ungewichtete Graphen. Auch werden die Übergangswahrscheinlichkeiten an jedem Knoten gleichverteilt sein. Damit werden auch meist nur elektrische Netze mit Einheitswiderständen zwischen adjazenten Knoten zur Diskussion benötigt. 2.2 Cover Time Für die nähere Betrachtung der Cover Time benötigen wir zunächst einige Vereinbarungen. N 0 (G) sei ein gewichteter, vollständiger Graph, der zu jedem Knoten u des Graphen G einen Knoten u0 besitzt und zu allen Knotenpaaren (u, v) in G eine Kante (u0 , v 0 ) mit Gewicht Ru,v besitzt. Cu bezeichne die erwartete Länge eines Random Walk in G, wobei im Knoten u gestartet wird und jeder Knoten in G mindestens einmal besucht wird. Definition 5 Die Cover Time CG zu einem Graphen G wird wie folgt definiert: CG = maxu Cu . Sei mit R = maxu,v∈V Ru,v der maximale Widerstand zwischen zwei beliebigen Knoten aus G bezeichnet. Dann lässt sich eine untere und eine obere Schranke für die Cover Time finden. Lemma 6 Für die Cover Time gilt die untere Schranke CG ≥ mR. C Beweis. Mit Definition 1 auf Seite 6 gilt max(Hu,v , Hv,u ) ≥ u,v 2 . Weiter existieren immer Knoten u und v derart, dass Ru,v = R. Für die Cover C Time folgt CG ≥ maxu (Hu,v , Hv,u ) ≥ u,v 2 . Mit Theorem 3 auf Seite 8 und der Beziehung R = Ru,v folgt die Behauptung. 2 Zum Nachweis einer oberen Schranke betrachten wir nun einen minimalen Spannbaum auf N 0 (G) mit Gewicht R∗ . Das Gewicht eines Graphen ist die Summe aller Kantengewichte. Zusätzlich benutzen wir ein Ergebnis von Matthews [4], auf welches hier nicht weiter eingegangen wird. Lemma 7 Für die Cover Time gilt die obere Schranke CG ≤ 2m·min(R(1+ ln(n)), R∗ ) Beweis. Die erste obere Schranke folgt aus Beobachtung von Matthews Pneiner 1 [4]. Sei H = maxu,v (Hu,v ) und sei hn = i=1 i , so folgt CG ≤ Hhn . hn heißt die n-te harmonische Zahl. Es gilt hn ≤ 1 + ln(n). Mit H < maxu,v (Cu,v ) = 2mR ergibt sich: CG ≤ Hhn ≤ H(1 + ln(n)) ≤ 2mR(1 + ln(n)) 11 Für den Nachweis der zweiten oberen Schranke sei zunächst für einen Spannbaum T zu G der Wert W (T ) definiert als: X X W (T ) = Cu,v = 2mRu,v u,v∈V (T ) u,v∈V (T ) Aleliunas et al. [1] zeigten Cu ≤ W (T ) für alle SpannbäumeP von G. Daraus folgt für einen minimalen Spannbaum insbesonders Cu ≤ 2m u,v∈V (T ) Ru,v = 2mR∗ und damit auch die Schranke für CG . 2 Theorem 8 mR ≤ CG ≤ 2m · min(R(1 + ln(n)), R∗) Beweis. Die Behauptung folgt aus Lemma 6 und Lemma 7. 2 Eine gröbere obere P Schranke kann mit folgenden Vereinbarungen gefunden werden: σG = u,v∈V Ru,v mit u, v ∈ V bezeichne die Summe der effektiven Widerstände im elektrischen Netz zum Graphen G. T bezeichne die Menge aller Spannbäume von G, Ti einen solchen Spannbaum. Mit der Definition von Rspan als Minimum über alle σTi folgt mit der Beziehung R∗ ≤ Rspan : Corollary 9 CG ≤ 2m · Rspan Ein bekanntes Problem ist das Auffinden von Universal Traversal Sequences auf einer Familie von beschrifteten Graphen. Ein beschrifteter Graph hat an an jedem Knoten für jede ausgehende Kante ein Label, beispielsweise mögen die ausgehenden Kanten für jeden Knoten durchnummeriert sein. Abbildung 9 zeigt eine solche Beschriftung. 1 3 2 3 3 2 1 1 1 2 2 1 2 3 2 1 1 3 3 2 Abbildung 9: Beschrifteter Knoten und Graph. Eine Universal Traversal Sequence ist nun eine Abfolge von Labels, so dass nach dem Ablaufen dieser Abfolge in jedem Graphen alle Knoten besucht wurden. Die Länge einer kürzesten Universal Traversal Sequence sei 12 mit U (G) bezeichnet, wobei G eine Familie beschrifteter Graphen ist. Jeder Graph G ∈ G sei ungewichtet, und habe n Knoten. Ferner sei G d-regulär, also habe jeder Knoten den Grad d. Eine Definition d-regulärer Graphen findet sich auch auf Seite 14. Theorem 10 Unter obigen Voraussetzungen gilt: U (G) ≤ (4 + o(1))mR(G)ln(n |G|) R(G) bezeichne dabei den maximalen Widerstand zweier beliebiger Knoten in irgendeinem Graphen G ∈ G. Beweis. Betrachtet wird ein Random Walk der Länge kt, der in k Epochen, jeweils mit Länge t, unterteilt wird. Betrachtet wird dieser Random Walk zunächst auf einem der Graphen G, wobei v ein Knoten dieses Graphen ist. Sei nun Ai das Ereignis, dass der Random Walk den Knoten v in der i-ten Epoche nicht besucht. Aus Theorem 3 auf Seite 8 folgt, dass die Hitting Time Hu,v kleiner 2mRu,v ist. Schlimmstenfalls wird der Besuch des Knoten v daher nach 2mRu,v Schritten erwartet. Der Erwartungswert ist daher E(X) = 2mRu,v . Jede Epoche habe nun eine Länge von t = b4mR(G)c + 1. Damit ist die Wahrscheinlichkeit, dass v nach t Schritten noch unbesucht ist, P (Ai ) ≤ P (X > 2E(X)). Mit der Ungleichung von Markov gilt für eine Zufallsvariable h und eine Konstante c: P (X > c) ≤ E(X) c . Damit folgt P (Ai ) < 1/2. Sei nun p(a, b) die Wahrscheinlichkeit dafür, dass der Random Walk der Länge t von a aus in b endet und den Knoten v dabei nicht besucht. Betrachtet werden nun zwei aufeinander folgende Epochen. Die erste ende bei b, entsprechend beginne die zweite bei b. Für dieses feste b 6= v sind nun die Ereignisse, v zu verfehlen, voneinander unabhängig. Starte nun die Epoche k − 1 auf a 6= v so folgt für die Wahrscheinlichkeit, v in den beiden letzten Epochen zu verfehlen: P (Ak−1 ∧ Ak | Epoche k-1 startet an a) X X X = p(a, b)p(b, c) = p(a, b) p(b, c) ≤ (1/2)(1/2) = (1/4) b,c6=v b6=v c6=v Fährt man fort, so unterschreitet die Wahrscheinlichkeit dafür, dass v nach k Epochen noch nicht besucht wurde, 2−k . Wird nun k = dlog2 (n |G|)e gewählt, so folgt 2−k ≤ (n |G|)−1 . Summieren wir nun diese Wahrscheinlichkeit, v immer zu verfehlen, über alle Wahlen von v und alle |G| Graphen G ∈ G, so ist diese Summe kleiner 1. Es gibt daher mindestens eine Universal Traversal Sequence mit Länge U (G) ≤ (4 + O(1))mR(G)ln(n |G|). 2 13 3 Random Walks auf dichten Graphen In diesem Abschnitt werden dichte Graphen betrachtet. Unter dichten Graphen sollen dabei solche Graphen verstanden werden, die sehr viele Kanten besitzen und deren Knoten damit stark verbunden sind. Für solche Graphen lassen sich mitunter sehr viel bessere Schranken für den Gesamtwiderstand und damit auch für die Commute oder Cover Time finden. 3.1 Random Walks auf d-regulären Graphen Ein ungerichteter, schlichter Graph G = (V, E) mit n = |V | Knoten und m = |E| Kanten, bei dem jeder Knoten u genau d Nachbarn und damit auch den Grad d hat, heisst d-regulär. In diesem Abschnitt sollen solche d-regulären Graphen betrachtet werden, da es eine bemerkenswerte obere Schranke für die Cover Time bei d ≥ b n2 c zu beobachten gibt. Wir betrachten nur ungewichtete d-reguläre Graphen. Zunächst betrachten wir wieder den effektiven Widerstand Rs,t in N (G) zu zwei Knoten s und t in G. Lemma 11 In einem Graph G seien p Pfade mit der maximalen Länge l auf disjunkten Kantenmengen von einem Knoten s zu einem Knoten t vorhanden. Dann gilt Rs,t ≤ pl Beweis. Sei H ein von G wie folgt abgeleitetes Netzwerk: Alle Kanten, die nicht auf einem der p Pfade liegen, werden verworfen. Durch Vervielfachung von Knoten, führen die Pfade auf disjunkten Knotenmengen von s nach t. Dabei ist es nicht notwendig, Kanten zu vervielfachen, da die Pfade bereits in G auf disjunkten Kantenmengen verliefen. Alle Kanten in H erhalten den Widerstandswert 1Ω. Die Widerstände der Kanten, die auf Pfaden der Länge l0 ≤ l liegen werden auf ll0 Ohm erhöht. Abbildung 10 zeigt ein Beispiel. Es folgt für das Netzwerk H : Rs,t = pl . Mit Rayleighs Prinzip gilt damit erst recht in N (G): Rs,t ≤ pl 2 Mit diesem Hilfssatz ist es nun möglich, eine gute obere Schranke für die Cover Time bei d ≥ b n2 c herzuleiten. Theorem 12 Für jeden d-regulären Graphen G mit n Knoten und d ≥ b n2 c gilt CG ∈ O(n log(n)) Beweis. Seien s und t zwei beliebige Knoten aus G. Sei k = 1, falls {s, t} ∈ E und sei sonst k = 0. Sei k0 die Anzahl der Knoten, die gleichzeitig adjazent zu s und zu t sind. Damit gibt es mindestens j = d − k − k0 Knoten, die adjazent zu s liegen, aber nicht zu t. Genauso gibt es auch j = d − k − k0 Knoten, die adjazent zu t liegen, aber nicht zu s. Seien diese Knoten 14 G t s H 1.5 Ohm 1.5 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 1 Ohm 3/4 Ohm Abbildung 10: Beispiel zum Beweis von Lemma 11. mit s1 , ..., sj bzw. t1 , ...., tj bezeichnet. Aus der Menge der Knoten si seien nun k00 adjazent zu einem Knoten ki . Mit d ≥ b n2 c sind zwei Knoten in G stets entweder adjazent, oder aber haben einen gemeinsamen Nachbarn. Damit gilt: si und ti haben - falls sie nicht adjazent sind - zumindest einen gemeinsamen Nachbarn mi für k00 < i ≤ j. Damit gibt es d Pfade mit einer Länge von maximal 4 von s nach t wie folgt: k Pfade der Länge 1, k0 der Länge 2, k00 der Länge 3 und d − k − k0 − k00 der Länge 4. Die d Pfade verlaufen auf disjunkten Kantenmengen. Aus Lemma 11 ergibt sich Rs,t ≤ 4d ∈ O(1/n). Mit Theorem 8 auf Seite 12 folgt schließlich für die obere Schranke der Cover Time von G: CG ∈ O(mR(1 + ln(n))) und mit m ∈ O(n2 ) folgt CG ∈ O(nlog(n)). 2 Es zeigt sich also bei der Betrachtung der Cover Time auf d-regulären Graphen ein deutlicher Unterschied zwischen den Fällen d < b n2 c und d ≥ b n2 c. Mit Theorem 12 fällt die Cover Time an der Schwelle d = b n2 c auf O(nlog(n)) ab. Für d < b n2 c liegt sie in manchen Fällen aber in Ω(n2 ). Betrachten wir dazu einen Graphen G, der aus 2 Cliquen der Größe n/2 besteht, wobei je eine Kante aus jeder Clique entfernt und durch eine 15 Verbindungskante der zwei Cliquen ersetzt wurde. Abbildung 11 zeigt ein Beispiel eines solchen Graphen. Für diesen Graphen ergibt sich nach Rayleighs Prinzip R ≥ 1/2Ω, da nach dem Zusammenführen aller Knoten je einer Clique ein Netz mit zwei parallelen Widerständen einer Größe von je 1 Ohm übrigbleibt. Mit Theorem 8 auf Seite 12 folgt CG ∈ Ω(n2 ). Wird jetzt d auf b n2 c erhöht, so fällt nach Theorem 12 die Cover Time unter die Schranke O(nlog(n)). Auch intuitiv mag dies klar erscheinen: Es ist nicht möglich, weitere Kanten hinzuzufügen, ohne eine Vielzahl von Verbindungen zwischen den beiden Cliquen herzustellen. Mit diesen Verbindungen fällt aber auch der Widerstand zwischen den beiden Cliquen ab. Abbildung 11: Zwei verbundene Cliquen. 3.2 Random Walks in Gittergraphen In diesem letzten Abschnitt soll nun mit Gittergraphen eine noch speziellere Klasse von Graphen betrachtet werden. Gittergraphen sind ungerichtete, ungewichtete Graphen, deren Knoten man sich als ganzzahlige Punkte in einem d-dimensionalen Gitter vorstellen kann. Dabei ist jeder Knoten in jede Richtung mit seinen nächsten Nachbarn verbunden. Zusätzlich werden Knoten am Rand des Gitters mit dem ersten Knoten ihrer Reihe am anderen Rand verbunden. Eine formale Definition findet sich beispielsweise in [2]. Wir bezeichnen mit d die Dimension des Gitters und mit k die Anzahl der Knoten entlang einer Reihe. Den Graphen bezeichnen wir dann als (k, d)Gittergraph. Abbildung 12 zeigt einen (3, 3)-Gittergraphen. Im Folgenden sollen die Widerstände auf solchen Graphen untersucht werden. Zunächst gilt folgende Dreiecksungleichung: Lemma 13 Für drei beliebige Knoten u,v,w in einem Graphen G gilt: Ru,w ≤ Ru,v + Rv,w . 16 Abbildung 12: Ein dreidimensionaler Gittergraph. Wir definieren mit P (c) die Leistung, die durch den Fluss c an den Widerständen in einem Netzwerk abfällt. Der Fluss aus einem Knoten u des Netzwerkes wird mit c(u) bezeichnet, für diesen P Fluss gilt mit V als Menge aller Knoten des Netzes und u ∈ V : c(u) = v∈N (u) c(u, v), wobei c(u, v) den von u nach v gerichteten Fluss auf der Kante {u, v} bezeichnet. Bezeichne r(e) den Widerstand P an e ∈2 E mit E als Menge aller Kanten des Netzes, so ist folglich P (c) = e r(e)c (e). Vergleiche dazu Abschnitt 1.2. Man kann nun Quellen und Senken in solch einem Netzwerk betrachten, dabei sind Quellen diejenigen Knoten für die c(u) > 0 gilt und Senken diejenigen für die c(u) < 0 ist. Betrachtet man nun mehrere Flüsse auf einem solchen Netz, so folgt: Lemma 14 Für zwei beliebige Flüsse c1 und c2 in einem elektrischen Netz gilt: P (c1 + c2 ) ≤ 2(P (c1 ) + P (c2 )). Beweis. P (c1 + c2 ) = X r(e)(c1 (e) + c2 (e))2 = X r(e)(c1 (e)2 + c2 (e)2 + 2c1 (e)c2 (e)) = X r(e)c1 (e)2 + e e r(e)c2 (e)2 + 2 e e = X P (c1 ) + P (c2 ) + 2 X e 17 X e r(e)c1 (e)c2 (e) r(e)c1 (e)c2 (e) 2 X r(e)c1 (e)c2 (e) ≤ P (c1 ) + P (c2 ) e ⇒ P (c1 + c2 ) ≤ 2(P (c1 ) + P (c2 )) 2 Mit diesen Vorbereitungen ergeben sich folgende Schranken für den maximalen Widerstand RG in einem Gittergraphen G: Theorem 15 Sei G ein (k, d)-Gittergraph. Dann gilt: Θ(log(n)) für d = 2 RG = Θ( 1d ) für d ≥ 3 Dabei ist n = kd die Zahl der Knoten von G. Beweis. Zunächst sei der Abstand eines KnotenPu = (k1 , k2 , ..., kd ), ki ∈ {0, . . . , k − 1} vom Ursprung definiert als l(u) = ki und als Länge von u bezeichnet. Im Fall d = 2 hat jeder Knoten genau vier Nachbarn, es gibt maximal l + 1 Knoten der Länge l und damit O(l) Kanten zwischen den Knoten der Länge l und der Länge l + 1. Im Fall d > 2 hat jeder Knoten 2d Nachbarn, es gibt d l+d−1 Kanten zwischen Knoten der Länge l und d−1 solchen der Länge l + 1. Wir wollen die obere und die untere Grenze des Widerstandes RG nun dadurch feststellen, dass wir einen Fluss konstruieren, der vom Ursprung u0 zu einem beliebigen Knoten u im Gittergraphen fließt. Zur Vereinfachung wird in diesem Beweis nicht mehr streng zwischen dem Graphen und dem aus dem Graphen abgeleiteten Netz unterschieden. Für die obere Grenze ist es wichtig, dass die Leistung des konstruierten Flusses O(log(n)) im Fall d = 2 und O(1/d) im Fall d > 2 nicht übersteigt. Die Behauptung folgt dann, wie wir später sehen werden, aus dem Prinzip von Thomson. Für die untere Schranke wird das Monotoniegesetz von Rayleigh verwendet. Der konstruierte Strom wird aus drei einfachen Strömen zusammengesetzt, die sich überlagern. Der Übersicht halber wird zunächst noch ein weiterer Strom c0 in einem (k + 1, d) Netz wie folgt definiert (vgl. Abbildung 13 auf Seite 19): Für Knoten v = (k1 , k2 , ..., ki , ..., kd ) und u = (k1 , k2 , ..., ki − 1, ..., kd ) mit ki ≥ 1, l = l(v) ≤ k sei der Strom c0 (u, v) durch die Kante (u, v) definiert ki . Der Fluss in allen vom Ursprung entfernteren Kanten sei 0. als l+d−1 l( d−1 ) Damit gilt für einen Knoten u = (k1 , ..., kd ) mit l(u) = l < k, dass die SummePaller Flüsse von u zu seinen Nachbarknoten vi mit l(vi ) = l + 1 ki +1 l+d 1 genau i (l+1)( l+d ) = (l+1)( l+d ) = (l+d−1) beträgt. Analog gilt für die d−1 d−1 d−1 18 Summe der Flüsse zu u von allen Nachbarknoten vi mit l(vi ) = l − 1: P ki 1 i l(l+d−1) = (l+d−1) . d−1 d−1 Der Fluss c0 hat damit drei wesentliche Eigenschaften: Der Knoten u0 = (0, ..., 0) ist die einzige Quelle mit c0 (u0 ) = 1, wobei c0 (u0 ) die Summe der Flüsse über alle Kanten an u0 ist. −1 . Die Knoten ui mit Länge k sind Senken mit c0 (ui ) = k+d−1 ( d−1 ) P (c0 ) ∈ O(log(n)) für d = 2 und P (c0 ) ∈ O( 1d ) für d ≥ 3. 4 1/5 5 6 7 8 4 3/20 5 6 7 4 1/10 5 6 4 1/20 5 1/20 3 1/4 1/12 2 1/3 1/10 3 1/6 1/6 1 1/2 1/6 2 1/6 1/2 0 3/20 3 1/12 1/3 1 1/4 2 1/5 3 4 Abbildung 13: Der Fluss c0 hier mit k = 4 und d = 2. Um die letzte Eigenschaft einzusehen, betrachte man zuerst den Fall d = 2. Es gibt dann O(l) Kanten zwischen Knoten der Länge l und solchen der Länge l + 1, denn jeder Knoten hat maximal zwei Nachbarn, die weiter vom Ursprung entfernt sind als der Knoten selbst. Durch jede dieser Kanten O( l12 ) Leistung frei wird. Insgesamt wird fließt ein Fluss von O( 1l ), Pwomit 1 damit eine Leistung vonP l O( l2 ) frei, über eine Abschätzung der endlichen n 1 harmonischen Reihe i=1 i ≈ ln(n) folgt P (C0 ) ∈ O(log(n)). Im Fall n ≥ 3 ergibt sich P (C0 ) ∈ O( 1d ). Um jetzt die durch das Theorem konstatierte obere Grenze nachzuwei19 sen, werden aus c0 drei Flüsse c1 , c2 , c3 , die im Fall d = 2 die Stärke O(log(n)) und im Fall d ≥ 3 allesamt die Leistung O( 1d ) haben, konstruiert. Die Summe dieser drei Flüsse soll eine einzelne Quelle u0 und eine einzelne Senke u ergeben. Der aus der Quelle abfließende Fluss betrage genau 1. Man beachte, dass die Flüsse c1 , c2 und c3 in einem (k, d) Gitter definiert sind, während c0 in einem (k + 1, d) Gitter definiert ist. Wir beginnen mit der Definition von c1 : c1 ((k1 , . . . , kd ), (k1 , k2 , . . . , (ki + 1 mod k, . . . , kd ))) = c0 ((k1 , . . . , kd ), (k1 , k2 , . . . , (ki + 1), . . . , kd )) Damit folgt für die Leistung von c1 : P (c1 ) = P (c0 ). Der Strom c1 hat, wie auch c0 genau k+d−1 eine Quelle u0 mit c1 (u0 ) = 1 − d/ d−1 . Abbildung 14 zeigt ein Beispiel. 1/20 3 1/4 4 3/20 1/12 1/5 2 1/3 1/6 4 1/10 5 1/6 2 1/6 3/20 3 1/12 1/2 0 6 1/10 3 1/6 1 1/2 5 1/3 1 4 1/20 1/4 2 3 1/5 Abbildung 14: Der Fluss c1 mit k = 4 und d = 2. Der Fluss c2 wird aus c1 wie folgt definiert: c2 (v, w) = c1 (w + u, v + u). Hierbei ist ’+’ als komponentenweise Addition mod k zu verstehen, der Knoten u ist ein beliebiger Knoten des Gittergraphen. c2 ist also im Grunde die Umkehr des Flusses c1 , wobei der Ursprung nach −u verlegt wurde. Damit gilt auch: P (c2 ) = P (c1 ). Abbildung 15 auf Seite 21 mit u0 = (−2, −2) zeigt ein Beispiel. Für die Definition von c3 wird folgende Vereinbarung getroffen: Der Pfad P = (u0 , . . . , ur = u) zwischen zwei Knoten u0 und u sei so definiert, dass erstens jeder Knoten ui auf dem Pfad die Länge i besitzt. Zweitens sei, wenn 20 1/6 3/20 3 1/12 1/6 4 1/20 1/3 1/4 2 5 1/2 1/5 3 1/10 1/3 6 1/6 1/2 4 1/5 5 1/6 1/20 1 2 1/10 3 1/4 4 3/20 1/12 0 1 2 3 Abbildung 15: Der Fluss c2 zu c1 . (ui , ui+1 ) eine Kante entlang der Dimension d0 ist, (ui+1 , ui+2 ) eine Kante der Dimension ≥ d0 . Mit diesen zwei Bedingungen ist P eindeutig definiert. Der Fluss c3 wird nun wie folgt definiert: Für jeden Knoten v der Länge k fließt ein Strom der Stärke 1/ k+d−1 entlang des Pfades P + v = (u0 + d−1 v, . . . , ur + v) und zusätzlich ein Strom der Stärke d/ k+d−1 entlang des d−1 Pfades P , wobei P wie oben definiert sei. Es gilt r < kd und es gibt maximal k+d−1 Knoten der Länge k. Damit folgt für die Leistung von c3 : d−1 2 k+d−1 P (c3 ) ≤ kd/ d−1 + kd3 / k+d−1 . Damit gilt: P (c3 ) ∈ O(1/d) für k, d ≥ 3 d−1 und P (c3 ) ∈ O(1) für d = 2. Abbildung 16 auf Seite 22 zeigt den Fluss c3 . Bildet man die Summe c = c1 + c2 + c3 , so hat c genau eine Quelle u0 und eine Senke u, ferner existiert ein Fluss von u0 nach u der Stärke 1. Mit Lemma 14 folgt eine Leistung von O(log(n) bzw. O(1/d) und damit die obere Schranke. Die untere Schranke für den Widerstand folgt durch das Zusammenlegen von Knoten nach dem Prinzip von Rayleigh. So ist für d = 2 der Widerstand zwischen dem Ursprung und dem Knoten u an der Stelle (k/2, k/2) mindestens k/2 groß. Dazu werden alle Knoten gleicher Länge zusammengefasst. 21 1/5 3 1/5 4 1/5 1/5 5 6 1/5 1/5 2 3 1/5 1/5 1/5 4 2/5 5 3 2/5 4 1/5 2 3 1/5 1/5 1 2 2/5 0 2/5 1 Abbildung 16: Der Fluss c3 als Verbindung von c1 und c2 . Da k2 = n gilt, liegt der Widerstand zwischen dem Ursprung und dem Knoten u in Ω(log(n)). Für den höherdimensionalen Fall ergibt sich eine untere Schranke von 1/(2d). 2 Mit Theorem 8 auf Seite 12 folgt: Corollary 16 Für die Cover Time auf d-dimensionalen Gittergraphen gilt: CG ∈ O(nlog2 (n)) für d = 2 und CG ∈ O(nlog(n)) für d ≥ 3. Anzumerken ist, dass in großen Gittergraphen das Entfernen einiger weniger Kanten keinen großen Einfluss auf den Gesamtwiderstand hat. Genauer ist das Entfernen von einigen Kanten gerade dann unkritisch, wenn die Kanten einen entsprechend großen Abstand von dem betrachteten Widerstandspfad haben. Literatur [1] R. Aleliunas, R. M. Karp, R. J. Lipton, L. Lovasz, and C. W. Rackoff. Random walks, universal traversal sequences, and the complexity of maze problems. In 20th Ann. IEEE Symp. Found. Comput. Sci., 1979. 22 [2] A. K. Chandra, P. Raghavan, W. L. Ruzzo, R. Smolensky, and P. Tiwari. The electrical resistance of a graph captures its commute and cover times. In Computational Complexity, 1997. [3] P. G. Doyle and J. L. Snell. Random Walks and Electrical Networks. The Mathematical Association of America, 1984. [4] P. Matthews. Covering problems for brownian motion on spheres. The Annals of Probability, 1988. [5] T. Worsch. Randomisierte algorithmen, 2006. 23