Random Walks

Werbung
Rheinische Friedrich-Wilhelms-Universität Bonn
Institut für Informatik I
Markus Blätzinger
Random Walks
16. Oktober 2006
Seminararbeit im SS 2006
Betreuer: Ansgar Grüne
Zusammenfassung
Diese Arbeit beschäftigt sich mit Random Walks und deren Beziehung zu Elektrischen Netzwerken, wie von Chandra et al. 1997 dargelegt [2]. Nach einigen Begriffsbestimmungen im ersten Abschnitt wird
im zweiten Abschnitt auf die Commute und Cover Time auf zunächst
recht allgemeinen Graphen eingegangen. Zusätzlich wird mit Hilfe von
Random Walks eine Schranke für die Shortest Universal Traversal Sequence auf Graphen hergeleitet. Im dritten Abschnitt werden dann mit
d-regulären Graphen und mit regelmäßigen Gittergraphen zwei spezielle Klassen von dichten Graphen betrachtet. Mit dichten Graphen
sind solche Graphen gemeint, die eine Vielzahl von Kanten besitzen,
also stark verbunden sind. Bei diesen Graphen können sehr gute obere
Schranken für die Commute Time gezeigt werden.
Inhaltsverzeichnis
1 Einführung
1.1 Random Walks . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Elektrische Netze . . . . . . . . . . . . . . . . . . . . . . . . .
2
2
3
2 Commute und Cover Time
2.1 Commute Time . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Cover Time . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5
11
3 Random Walks auf dichten Graphen
14
3.1 Random Walks auf d-regulären Graphen . . . . . . . . . . . . 14
3.2 Random Walks in Gittergraphen . . . . . . . . . . . . . . . . 16
1
1
1.1
Einführung
Random Walks
Random Walks bilden eine wichtige Klasse von stochastischen Prozessen.
Ein Beispiel für einen Random Walk ist die Fahrt durch eine Stadt, bei der
an jeder Kreuzung ein Münzwurf, ein Würfelergebnis, oder ähnliches über
die Richtung der Weiterfahrt entscheidet. Im folgenden wollen wir Random
Walks auf Graphen betrachten. Genauer betrachten wir folgenden Prozess:
Ausgehend von einem definierten Startknoten gehen wir zu einem Nachbarknoten über. Zu welchem Nachbarknoten wir dabei übergehen, entscheidet
sich zufällig nach einer bestimmten Verteilung. Insbesonders können Knoten
und Kanten mehrfach besucht werden. Erreichen wir einen vorab definierten
Endknoten, so endet der Lauf.
?
Abbildung 1: zufälliger Übergang zu einem Nachbarknoten.
Interessiert man sich nun für die Anzahl der Schritte im Laufe eines
solchen Random Walk, so hilft eine interessante Beziehung zu elektrischen
Netzwerken. Es stellt sich ein enger Zusammenhang zwischen dem stochastischen Modell auf dem Graphen und der Betrachtung der Widerstände eines
aus dem Graphen abgeleiteten elektrischen Netzes heraus.
Diese Arbeit beschäftigt sich mit der Commute und Cover Time von
Random Walks auf Graphen und deren Beziehung zu elektrischen Netzen,
wie von Chandra et al. 1997 dargelegt [2]. Dabei versteht man unter der
Commute Time die erwartete Anzahl von Schritten, die bei dem zufälligen
Ablaufen des Graphen benötigt werden, um von einem Knoten u zu einem Knoten v überzugehen und zu u zurückzukehren. Unter der Cover Time versteht man die erwartete Anzahl von Schritten, um alle Knoten eines
Graphen mindestens einmal zu besuchen. Dabei kann diese, ausgehend von
verschiedenen Startknoten, unterschiedlich ausfallen. Wir wählen daher das
Maximum dieser Werte als Wert der Cover Time. Es handelt sich bei diesen
Betrachtungen stets um erwartete Werte, da wir es mit Zufallsprozessen zu
tun haben.
2
1.2
Elektrische Netze
Ein elektrisches Netz ist wie ein Graph aus Knoten und Kanten aufgebaut.
Die Kanten entsprechen elektrischen Leitungen, welche mit Widerständen
behaftet sind und für die das Ohmsche Gesetz gilt:
1
U
R
Dabei bezeichnet I den Strom in Ampere, R den Widerstand in Ohm und
U die Spannung in Volt.
I=
Innerhalb des Netzes sind viele geschlossene Stromkreise möglich. Jeder
geschlossene Stromkreis, bei dem kein Knoten und keine Kante mehrfach
besucht werden, bildet eine Masche.
Für die weiteren Überlegungen ist zunächst der erste Kirchhoffsche Satz
- auch Knotenregel genannt - wichtig: In einem elektrischen Netz fließt in
jedem Knoten die gleiche Ladungsmenge ab, die dem Knoten auch in der
selben Zeiteinheit zufließt. Mit anderen Worten muss der Strom, der einem
Knoten zufließt, von diesem Knoten wieder abfliessen. Ausgehende und eingehende Ströme werden am Vorzeichen unterschieden.
I1
I0
I0 + I1 + I2 = 0
I2
Abbildung 2: Knotenregel von Kirchhoff.
Weiter gilt der zweite Satz von Kirchhoff, die so genannte Maschenregel:
Bei einem geschlossenen Umlauf in einer Masche des Netzes ist die Summe
aller Spannungen Null.
Für die Betrachtung von speziellen Graphen wird das Thomson-Prinzip
benötigt. In einem beliebigen elektrischen Netzwerk sei I der Strom von u
nach v, der durch die Sätze von Kirchhoff bestimmt ist. Leistung ist definiert
als Arbeit pro Zeit, mit W = U It folgt für die elektrische Leistung:
W
= U I = I 2R
t
Betrachten wir nun ein elektrisches Netz wie folgt: V sei eine endliche
Menge von Knoten, E die Menge der Kanten zwischen je zwei Knoten aus
P =
3
V . Jeder Kante wird ein Widerstand r(e) zugeordnet. Sei nun ein Fluss in
einem solchen Netz (V, E, r) mit den Knoten v ∈ V und den Widerständen
r(e) an jeder Kante e ∈ E abstrakt definiert als eine Funktion c : V ×V → R
mit c(u, v) = −c(v, u) und c(u, v) = 0 ∀{u, v} 3 E. Mit c(u) sei der Gesamtfluß aus dem Knoten u bezeichnet, also die Summe aller eingehenden
und ausgehenden Flüsse. Der Fluss c habe nun genau eine Quelle u und eine
Senke v. Für alle anderen Knoten sei die Summe der aus- und eingehenden
Flüsse 0. Ferner gelte c(u) = I(u). Damit gilt der erste Satz von Kirchhoff,
nicht aber zwangsläufig auch der zweite. Betrachtet man dann den Strom
I, so ist die durch diesen Strom I bestimmte Leistung niemals größer als
jede durch einen Fluss c von u nach v verursachte Leistung. Der Strom I ist
also leistungsminimierender Fluss unter allen Flüssen mit einer Quelle und
einer Senke, die dieselbe Quellstärke aufweisen. Einfach ausgedrückt wählt
der durch die Sätze von Kirchhof bestimmte Strom den Weg des geringsten
Widerstandes und damit wird die geringste Leistung frei. Abbildung 3 zeigt
ein Beispiel, Doyle und Snell führen einen Beweis für die Aussage [3].
0,5 A
1Ω
1A
1Ω
u
1Ω
0,5 A
1Ω
1A
0,5 A
1A
1A
P (i) = 4(1 · 0, 52 ) = 1
v
1A
P (c) = 2(1 · 12 ) = 2
1Ω
0,5 A
1Ω
u
1Ω
v
1Ω
1A
Abbildung 3: Bei gegebener Quelle und Senke und gegebener Stromstärke
minimiert der nach den Sätzen von Kirchhoff bestimmte Fluss (oben) die
freigegeben Leistung P .
Eine weitere Eigenschaft elektrischer Netze wird durch das Monotoniegesetz von Rayleigh beschrieben: Wird der Widerstand einer Leitung erhöht,
kann sich der Widerstand zwischen zwei Knoten des Netzes nur erhöhen.
Wird der Widerstand an einer Stelle herabgesetzt, kann sich der Widerstand zwischen zwei Knoten des Netzes nur verringern. Ein Beweis findet
sich ebenfalls bei Doyle und Snell [3].
4
2
Commute und Cover Time
Im folgenden betrachten wir Graphen G = (V, E) mit n = |V | Knoten und
m = |E| Kanten. Diese Graphen werden ungerichtet und - wenn nicht anders angegeben - ungewichtet sein. Wir betrachten nur schlichte Graphen
und immer auch nur solche, die aus genau einer Zusammenhangskomponente bestehen.
Zu diesen Graphen werden elektrische Netze wie folgt abgeleitet: Zu jedem Knoten v ∈ V gibt es einen Knoten im elektrischen Netz. Zusätzlich
gibt es für jede Kante (u, v) aus E eine entsprechende Verbindung im abgeleiteten Netz, mit dem Widerstand ru,v . Dieser Widerstand ru,v entspricht
dem Gewicht der Kante zwischen u und v. Bei ungewichteten Graphen ist
ru,v stets 1. Das abgeleitete elektrische Netz wird mit N (G) bezeichnet. Mit
Ru,v sei der effektive Widerstand zwischen zwei Knoten in N (G) bezeichnet. Ru,v berechnet sich nach den Kirchhoffschen Sätzen und dem Ohmschen Gesetz. Abbildung 5 zeigt ein Beispiel. Der Unterschied zwischen Ru,v
und ru,v wird in Abbildung 4 deutlich. In der Abbildung haben alle Widerstände den Wert 1Ω, für den effektiven Widerstand zwischen u und v
1
= 12 + 12 + 11 = 2
folgt: Ru,v
1Ω
u
1Ω
ru,v = 1Ω
1Ω
2Ω
v
ru,v = 1Ω
u
2Ω
1Ω
1
Ru,v
u
v
Ru,v = 12 Ω
= 1/2 + 1/2 + 1 = 2 ⇒ Ru,v = 12 Ω
v
Abbildung 4: Effektiver Widerstand zwischen zwei Knoten.
2.1
Commute Time
G = (V, E) sei ein ungewichteter Graph mit n Knoten und m Kanten.
Hu,v bezeichnet die erwartete Anzahl von Schritten unter einer festgelegten
Wahrscheinlichkeitsverteilung in einem Random Walk von einem Knoten u
zu einem Knoten v in G. Also die Anzahl von Schritten, nach denen der
erste Besuch des Knoten v erwartet wird. Hu,v heißt Hitting Time.
5
v
s
u
t
v
0
ru,v
0
s
u
0
t
0
Abbildung 5: Übergang von G nach N (G).
Definition 1 Die Commute Time Cu,v wird wie folgt definiert: Cu,v =
Hu,v + Hv,u .
Zunächst mag man sich fragen, weshalb zwischen Hu,v und Hv,u überhaupt unterschieden wird, intuitiv scheinen die beiden Werte vielleicht zunächst gleich zu sein. Es zeigt sich aber, dass Hu,v mitunter sehr verschieden von Hv,u sein kann. Als Beispiel betrachten wir einen ungewichteten
Lollipop-Graphen L16 wie in Abbildung 6. Die ersten acht Knoten dieses
Graphen bilden eine Clique, die restlichen acht bilden einen Pfad, der mit einem Knoten u der Clique verbunden ist. Die Übergangswahrscheinlichkeiten
seien gleichverteilt. Betrachten wir nun diesen Knoten u und den äussersten
Knoten v des Pfades, so gilt: Hu,v ∈ Θ(n3 ) und Hv,u ∈ Θ(n2 ). Die beiden Werte können also sehr weit auseinander liegen. Dieses Beispiel ist bei
Worsch [5] näher ausgeführt, ein Beweis für diese beiden Schranken wird
weiter unten geführt.
Kommen wir zurück zu allgemeinen ungewichteten Graphen G, wie oben
definiert. N (x) bezeichne die Menge der zum Knoten x ∈ V adjazenten Knoten in G. Sei nun d(x) der Grad des Knoten x. Dabei bezeichne φu,v die Spannung zwischen den zu u und v gehörenden Knoten in N (G), wobei ein Strom
der Stärke d(x) an jedem Knoten eingespeist und zusätzlich an dem zu v
gehörenden Knoten ein Strom der Stärke 2m abgegriffen wird. Jeder Widerstand in N (G) sei zunächst 1 Ω groß und die Übergangswahrscheinlichkeiten
seien an jedem Knoten gleichverteilt. Mit diesen Festsetzungen gilt folgendes
Lemma:
6
u
v
Abbildung 6: Lollipop Graph mit 16 Knoten.
Lemma 2 Hu,v = φu,v .
Beweis. Aus dem Ohmschen Gesetz folgt, dass der Strom, der den Knoten
u in Richtung eines beliebigen Nachbarknotens w verlässt, gleich der Potentialdifferenz zwischen u und w geteilt durch den Widerstand zwischen u
und w ist. Da alle Widerstände die Größe 1 Ω besitzen und an dem Knoten u ein Strom von d(u) Ampere anliegt, verlässt den Knoten nach dem
ersten Kirchhoffschen Satz ein Strom von insgesamt d(u) Ampere. Für die
Spannung φu,v folgt:
X
X
d(u) =
(φu,w ) =
(φu,v − φw,v ) ∀u ∈ V − {v}
w∈N (u)
w∈N (u)
Für die Hitting Time Hu,v gilt mit der Übergangswahrscheinlichkeit von u
1
:
nach w, pu,w = d(u)
Hu,v =
X
pu,w (1 + Hw,v ) ∀u ∈ V − {v}
w∈N (u)
= 1+
X
1
Hw,v
d(u)
w∈N (u)
⇒ d(u) =
X
P
w∈N (u) Hw,v
Hu,v − 1
(Hu,v − Hw,v ) = d(u)Hu,v −
w∈N (u)
X
Hw,v
w∈N (u)
= d(u)Hu,v − d(u)(Hu,v − 1)
= d(u)Hu,v − d(u)Hu,v + d(u) = d(u)
X
⇒ d(u) =
(Hu,v − Hw,v )
w∈N (u)
7
Identifiziert man in diesen beiden eindeutig lösbaren Gleichungssystemen
φu,v mit Hu,v , so folgt die Behauptung.
2
Mit dieser Darstellung von Hu,v durch φu,v kann man das Verhalten von
Hu,v und Hv,u im Lollipop Graphen herleiten. Für Hu,v : An jedem der n/2
Knoten der Clique wird ein Strom von n/2 Ampere injiziert. Dieser Gesamtstrom von Θ(n2 ) Ampere fließt durch u und die restlichen n/2 Knoten
nach v und verursacht an allen n/2 Widerständen zwischen u und v einen
Spannungsabfall von je Θ(n2 ) Volt. Daraus resultiert ein Spannungsabfall
zwischen u und v von insgesamt Θ(n3 ) Volt, folglich gilt Hu,v ∈ Θ(n3 ). Für
Hv,u gilt hingegen: An den Knoten außerhalb der Clique wird je ein Strom
von 2 Ampere injiziert. Damit fließt zu u ein Strom der Stärke Θ(n). Die
Spannungsabfälle summieren sich zu O(n2 ), damit folgt Hv,u ∈ Θ(n2 ).
Theorem 3 Für zwei beliebige Knoten u und v in einem ungewichteten
Graphen G gilt: Cu,v = 2m · Ru,v .
Beweis. Per Definition gilt: Cu,v = Hu,v + Hv,u . Den Knoten u und v aus
G entsprechen die Knoten u0 und v 0 in N (G). Der Wert von Hu,v ist gleich
dem Wert der Spannung φu,v zwischen u0 und v 0 , wenn ein Strom der Stärke
2m Ampere an v 0 abgegriffen wird und d(x) Ampere an jedem Knoten x0
eingespeist werden. Umgekehrt kann Hv,u auch als Spannung φv,u zwischen
v 0 und u0 angesehen werden, wenn wenn d(x) Ampere an jedem Knoten
abgegriffen werden und 2m Ampere an u0 eingespeist werden. Überlagert
man beide Ströme um eine Aussage über Cu,v = Hu,v + Hv,u zu erhalten, so
folgt ein Strom von u0 nach v 0 der Stärke 2m. Alle anderen Ströme heben
sich auf. Abbildung 7 zeigt ein Beispiel. Damit ist der effektive Widerstand
φ +φ
Ru,v zwischen u0 und v 0 nach dem Ohmschen Gesetz gleich u,v2m v,u . Es
folgt:
Cu,v = Hu,v + Hv,u = φu,v + φv,u = 2mRu,v
2
An dieser Stelle soll ein Beispiel die bisherigen Definitionen und Sätze
verdeutlichen. Wir betrachten einen ungewichteten Graphen mit vier Knoten
u,v,s und t wie in Abbildung 8. Die Übergangswahrscheinlichkeiten seien
wieder gleichverteilt, die Hitting Time Hs,t zwischen s und t soll berechnet
werden.
Hs,t =
X
1/d(s)(1 + Hw,t) = 1(1 + Hu,t ) = 1 + Hu,t
w∈N (s)
Hu,t =
X
(1/d(u))(1 + Hw,t )
w∈{s,v,t}
8
2A
2A
2A
3A
1A
2A
φu,v = 12V
v0
2A
u0
3A
−φv,u = −5, 5V
v0
2A
10A
1A
u0
2A
10A
2A
3A
1A
φv,u = 5.5V
v
2A
φu,v + φv,u
= Cu,v = 17, 5V
0
u0
u0
10A
v0
10A
10A
Abbildung 7: Beispiel zum Beweis von Theorem 3. Alle Spannungen sind in
Bezug auf u0 angegeben..
=
X
w∈{s,v,t}
1
1
1
1
(1 + Hw,t) = (1 + Hs,t ) + (1 + Hv,t ) + (1 + Ht,t )
3
3
3
3
Hs,t = Hv,t wegen Symmetrie
1
1
1
(1 + Hs,t) + (1 + Hs,t) +
⇒ Hu,t =
3
3
3
2
1
(3 + 2Hs,t ) = 1 + Hs,t
=
3
3
2
2
⇒ Hs,t = 1 + 1 + Hs,t = 2 + Hs,t ⇒ Hs,t = 6
3
3
Einfacher zu berechnen ist die Spannung φs,t zwischen s und t. Mit den
Widerständen rs,u = ru,t = 1 und den Strömen wie in Lemma 2 definiert
folgt: φs,t = 1V + 5V = 6V . Identifiziert man wie in Lemma 2 Hs,t mit φs,t ,
so bestätigt sich die oben berechnete Hitting Time.
Wir wollen nun auch die Commute Time Cs,t zwischen s und t in dem
Graphen aus Abbildung 8 betrachten. Nach Theorem 3 folgt Cs,t = 2mRs,t
mit Rs,t = 2Ω ergibt sich Cs,t zu 12. Dies wird durch die Symmetrie des
Graphen auch klar, denn mit Hs,t = Ht,s folgt Cs,t = Hs,t + Ht,s = 2Hs,t =
9
1A
v
1A
1A
3A
v’
1Ω
1Ω
s
u
s’
1A
u’
1Ω
5A
1A
t
6A
t’
Abbildung 8: Beispiel zur Hitting Time.
12.
Dieses Ergebnis für ungewichtete Graphen kann auf Situationen ausgeweitet werden, bei denen die Kanten gewichtet sind und auch die Übergangswahrscheinlichkeiten nicht mehr gleichverteilt sind. Dazu wird nur N (G)
anders definiert: Zu jedem Knotenpaar (u, v) aus G verbinden wir einen positiven Widerstand ru,v = rv,u . Diese Widerstände bestimmen, wie gleich
gezeigt wird, die Übergangswahrscheinlichkeiten. Für nicht durch Kanten
verbundene Knotenpaare wird der Widerstand als unendlich definiert. Jede
gerichtete Kante in N (G) erhält zusätzlich Kosten fu,v zugeordnet.
Nun wird ein Random Walk auf G wie folgt betrachtet: Gehe am Knoten
u mit der Wahrscheinlichkeit
1
ru,v
1
w∈V ru,w
P
zum Knoten v über. Diese Wahrscheinlichkeit wird wieder mit pu,v bezeichnet.
Die Kosten des Random Walk sind definiert als Summe über die Kosten fu,v der besuchten Kanten. Wie im einfachen Fall bezeichne Ru,v den
f
effektiven Widerstand zu den Knoten u und v. Hu,v
bezeichne die erwarteten Kosten eines Random Walk von u nach v unter der Kostenfunktion f .
f
f
f
Cu,v
= Hu,v
+ Hv,u
bezeichne die Commute Time unter f .
P
fx,y
. Für je zwei Kanten u und v ergibt
Theorem 4 Sei F = (x,y)∈V ×V rx,y
f
sich die Commute Time zu Cu,v
= F Ru,v .
P
fx,y
Ampere eingespeist. Der
Beweis. In jeden Knoten werden fx = y∈V rx,y
Beweis ist dann identisch zum einfachen Fall, mit F = 2m in Theorem 3. 2
10
Bei den folgenden Betrachtungen beschränken wir uns - wenn nicht
anders angegeben - wieder auf ungewichtete Graphen. Auch werden die
Übergangswahrscheinlichkeiten an jedem Knoten gleichverteilt sein. Damit
werden auch meist nur elektrische Netze mit Einheitswiderständen zwischen
adjazenten Knoten zur Diskussion benötigt.
2.2
Cover Time
Für die nähere Betrachtung der Cover Time benötigen wir zunächst einige Vereinbarungen. N 0 (G) sei ein gewichteter, vollständiger Graph, der zu
jedem Knoten u des Graphen G einen Knoten u0 besitzt und zu allen Knotenpaaren (u, v) in G eine Kante (u0 , v 0 ) mit Gewicht Ru,v besitzt. Cu bezeichne
die erwartete Länge eines Random Walk in G, wobei im Knoten u gestartet
wird und jeder Knoten in G mindestens einmal besucht wird.
Definition 5 Die Cover Time CG zu einem Graphen G wird wie folgt
definiert: CG = maxu Cu .
Sei mit R = maxu,v∈V Ru,v der maximale Widerstand zwischen zwei
beliebigen Knoten aus G bezeichnet. Dann lässt sich eine untere und eine
obere Schranke für die Cover Time finden.
Lemma 6 Für die Cover Time gilt die untere Schranke CG ≥ mR.
C
Beweis. Mit Definition 1 auf Seite 6 gilt max(Hu,v , Hv,u ) ≥ u,v
2 . Weiter
existieren immer Knoten u und v derart, dass Ru,v = R. Für die Cover
C
Time folgt CG ≥ maxu (Hu,v , Hv,u ) ≥ u,v
2 . Mit Theorem 3 auf Seite 8 und
der Beziehung R = Ru,v folgt die Behauptung.
2
Zum Nachweis einer oberen Schranke betrachten wir nun einen minimalen Spannbaum auf N 0 (G) mit Gewicht R∗ . Das Gewicht eines Graphen ist
die Summe aller Kantengewichte. Zusätzlich benutzen wir ein Ergebnis von
Matthews [4], auf welches hier nicht weiter eingegangen wird.
Lemma 7 Für die Cover Time gilt die obere Schranke CG ≤ 2m·min(R(1+
ln(n)), R∗ )
Beweis. Die erste obere Schranke folgt aus
Beobachtung von Matthews
Pneiner
1
[4]. Sei H = maxu,v (Hu,v ) und sei hn = i=1 i , so folgt CG ≤ Hhn . hn heißt
die n-te harmonische Zahl. Es gilt hn ≤ 1 + ln(n). Mit H < maxu,v (Cu,v ) =
2mR ergibt sich:
CG ≤ Hhn
≤ H(1 + ln(n))
≤ 2mR(1 + ln(n))
11
Für den Nachweis der zweiten oberen Schranke sei zunächst für einen Spannbaum T zu G der Wert W (T ) definiert als:
X
X
W (T ) =
Cu,v =
2mRu,v
u,v∈V (T )
u,v∈V (T )
Aleliunas et al. [1] zeigten Cu ≤ W (T ) für alle SpannbäumeP
von G. Daraus
folgt für einen minimalen Spannbaum insbesonders Cu ≤ 2m u,v∈V (T ) Ru,v =
2mR∗ und damit auch die Schranke für CG .
2
Theorem 8 mR ≤ CG ≤ 2m · min(R(1 + ln(n)), R∗)
Beweis. Die Behauptung folgt aus Lemma 6 und Lemma 7.
2
Eine gröbere obere
P Schranke kann mit folgenden Vereinbarungen gefunden werden: σG =
u,v∈V Ru,v mit u, v ∈ V bezeichne die Summe der
effektiven Widerstände im elektrischen Netz zum Graphen G. T bezeichne
die Menge aller Spannbäume von G, Ti einen solchen Spannbaum. Mit der
Definition von Rspan als Minimum über alle σTi folgt mit der Beziehung
R∗ ≤ Rspan :
Corollary 9 CG ≤ 2m · Rspan
Ein bekanntes Problem ist das Auffinden von Universal Traversal Sequences auf einer Familie von beschrifteten Graphen. Ein beschrifteter Graph
hat an an jedem Knoten für jede ausgehende Kante ein Label, beispielsweise mögen die ausgehenden Kanten für jeden Knoten durchnummeriert sein.
Abbildung 9 zeigt eine solche Beschriftung.
1
3
2
3
3
2
1
1
1
2
2
1
2
3
2
1
1
3
3
2
Abbildung 9: Beschrifteter Knoten und Graph.
Eine Universal Traversal Sequence ist nun eine Abfolge von Labels, so
dass nach dem Ablaufen dieser Abfolge in jedem Graphen alle Knoten besucht wurden. Die Länge einer kürzesten Universal Traversal Sequence sei
12
mit U (G) bezeichnet, wobei G eine Familie beschrifteter Graphen ist. Jeder
Graph G ∈ G sei ungewichtet, und habe n Knoten. Ferner sei G d-regulär,
also habe jeder Knoten den Grad d. Eine Definition d-regulärer Graphen
findet sich auch auf Seite 14.
Theorem 10 Unter obigen Voraussetzungen gilt:
U (G) ≤ (4 + o(1))mR(G)ln(n |G|)
R(G) bezeichne dabei den maximalen Widerstand zweier beliebiger Knoten
in irgendeinem Graphen G ∈ G.
Beweis. Betrachtet wird ein Random Walk der Länge kt, der in k Epochen,
jeweils mit Länge t, unterteilt wird. Betrachtet wird dieser Random Walk
zunächst auf einem der Graphen G, wobei v ein Knoten dieses Graphen ist.
Sei nun Ai das Ereignis, dass der Random Walk den Knoten v in der i-ten
Epoche nicht besucht.
Aus Theorem 3 auf Seite 8 folgt, dass die Hitting Time Hu,v kleiner 2mRu,v
ist. Schlimmstenfalls wird der Besuch des Knoten v daher nach 2mRu,v
Schritten erwartet. Der Erwartungswert ist daher E(X) = 2mRu,v . Jede
Epoche habe nun eine Länge von t = b4mR(G)c + 1. Damit ist die Wahrscheinlichkeit, dass v nach t Schritten noch unbesucht ist, P (Ai ) ≤ P (X >
2E(X)). Mit der Ungleichung von Markov gilt für eine Zufallsvariable h und
eine Konstante c: P (X > c) ≤ E(X)
c . Damit folgt P (Ai ) < 1/2.
Sei nun p(a, b) die Wahrscheinlichkeit dafür, dass der Random Walk der
Länge t von a aus in b endet und den Knoten v dabei nicht besucht. Betrachtet werden nun zwei aufeinander folgende Epochen. Die erste ende bei
b, entsprechend beginne die zweite bei b. Für dieses feste b 6= v sind nun die
Ereignisse, v zu verfehlen, voneinander unabhängig. Starte nun die Epoche
k − 1 auf a 6= v so folgt für die Wahrscheinlichkeit, v in den beiden letzten
Epochen zu verfehlen:
P (Ak−1 ∧ Ak | Epoche k-1 startet an a)
X
X
X
=
p(a, b)p(b, c) =
p(a, b)
p(b, c) ≤ (1/2)(1/2) = (1/4)
b,c6=v
b6=v
c6=v
Fährt man fort, so unterschreitet die Wahrscheinlichkeit dafür, dass v nach
k Epochen noch nicht besucht wurde, 2−k . Wird nun k = dlog2 (n |G|)e
gewählt, so folgt 2−k ≤ (n |G|)−1 . Summieren wir nun diese Wahrscheinlichkeit, v immer zu verfehlen, über alle Wahlen von v und alle |G| Graphen
G ∈ G, so ist diese Summe kleiner 1. Es gibt daher mindestens eine Universal
Traversal Sequence mit Länge U (G) ≤ (4 + O(1))mR(G)ln(n |G|).
2
13
3
Random Walks auf dichten Graphen
In diesem Abschnitt werden dichte Graphen betrachtet. Unter dichten Graphen sollen dabei solche Graphen verstanden werden, die sehr viele Kanten
besitzen und deren Knoten damit stark verbunden sind. Für solche Graphen
lassen sich mitunter sehr viel bessere Schranken für den Gesamtwiderstand
und damit auch für die Commute oder Cover Time finden.
3.1
Random Walks auf d-regulären Graphen
Ein ungerichteter, schlichter Graph G = (V, E) mit n = |V | Knoten und
m = |E| Kanten, bei dem jeder Knoten u genau d Nachbarn und damit
auch den Grad d hat, heisst d-regulär. In diesem Abschnitt sollen solche
d-regulären Graphen betrachtet werden, da es eine bemerkenswerte obere
Schranke für die Cover Time bei d ≥ b n2 c zu beobachten gibt. Wir betrachten nur ungewichtete d-reguläre Graphen.
Zunächst betrachten wir wieder den effektiven Widerstand Rs,t in N (G)
zu zwei Knoten s und t in G.
Lemma 11 In einem Graph G seien p Pfade mit der maximalen Länge
l auf disjunkten Kantenmengen von einem Knoten s zu einem Knoten t
vorhanden. Dann gilt Rs,t ≤ pl
Beweis. Sei H ein von G wie folgt abgeleitetes Netzwerk: Alle Kanten, die
nicht auf einem der p Pfade liegen, werden verworfen. Durch Vervielfachung
von Knoten, führen die Pfade auf disjunkten Knotenmengen von s nach t.
Dabei ist es nicht notwendig, Kanten zu vervielfachen, da die Pfade bereits
in G auf disjunkten Kantenmengen verliefen. Alle Kanten in H erhalten den
Widerstandswert 1Ω. Die Widerstände der Kanten, die auf Pfaden der Länge
l0 ≤ l liegen werden auf ll0 Ohm erhöht. Abbildung 10 zeigt ein Beispiel.
Es folgt für das Netzwerk H : Rs,t = pl . Mit Rayleighs Prinzip gilt damit
erst recht in N (G): Rs,t ≤ pl
2
Mit diesem Hilfssatz ist es nun möglich, eine gute obere Schranke für die
Cover Time bei d ≥ b n2 c herzuleiten.
Theorem 12 Für jeden d-regulären Graphen G mit n Knoten und d ≥ b n2 c
gilt CG ∈ O(n log(n))
Beweis. Seien s und t zwei beliebige Knoten aus G. Sei k = 1, falls {s, t} ∈ E
und sei sonst k = 0. Sei k0 die Anzahl der Knoten, die gleichzeitig adjazent
zu s und zu t sind. Damit gibt es mindestens j = d − k − k0 Knoten, die
adjazent zu s liegen, aber nicht zu t. Genauso gibt es auch j = d − k −
k0 Knoten, die adjazent zu t liegen, aber nicht zu s. Seien diese Knoten
14
G
t
s
H 1.5 Ohm
1.5 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
1 Ohm
3/4 Ohm
Abbildung 10: Beispiel zum Beweis von Lemma 11.
mit s1 , ..., sj bzw. t1 , ...., tj bezeichnet. Aus der Menge der Knoten si seien
nun k00 adjazent zu einem Knoten ki . Mit d ≥ b n2 c sind zwei Knoten in
G stets entweder adjazent, oder aber haben einen gemeinsamen Nachbarn.
Damit gilt: si und ti haben - falls sie nicht adjazent sind - zumindest einen
gemeinsamen Nachbarn mi für k00 < i ≤ j. Damit gibt es d Pfade mit
einer Länge von maximal 4 von s nach t wie folgt: k Pfade der Länge 1,
k0 der Länge 2, k00 der Länge 3 und d − k − k0 − k00 der Länge 4. Die d
Pfade verlaufen auf disjunkten Kantenmengen. Aus Lemma 11 ergibt sich
Rs,t ≤ 4d ∈ O(1/n). Mit Theorem 8 auf Seite 12 folgt schließlich für die
obere Schranke der Cover Time von G: CG ∈ O(mR(1 + ln(n))) und mit
m ∈ O(n2 ) folgt CG ∈ O(nlog(n)).
2
Es zeigt sich also bei der Betrachtung der Cover Time auf d-regulären
Graphen ein deutlicher Unterschied zwischen den Fällen d < b n2 c und d ≥
b n2 c. Mit Theorem 12 fällt die Cover Time an der Schwelle d = b n2 c auf
O(nlog(n)) ab. Für d < b n2 c liegt sie in manchen Fällen aber in Ω(n2 ).
Betrachten wir dazu einen Graphen G, der aus 2 Cliquen der Größe
n/2 besteht, wobei je eine Kante aus jeder Clique entfernt und durch eine
15
Verbindungskante der zwei Cliquen ersetzt wurde. Abbildung 11 zeigt ein
Beispiel eines solchen Graphen. Für diesen Graphen ergibt sich nach Rayleighs Prinzip R ≥ 1/2Ω, da nach dem Zusammenführen aller Knoten je
einer Clique ein Netz mit zwei parallelen Widerständen einer Größe von je
1 Ohm übrigbleibt. Mit Theorem 8 auf Seite 12 folgt CG ∈ Ω(n2 ).
Wird jetzt d auf b n2 c erhöht, so fällt nach Theorem 12 die Cover Time
unter die Schranke O(nlog(n)). Auch intuitiv mag dies klar erscheinen: Es ist
nicht möglich, weitere Kanten hinzuzufügen, ohne eine Vielzahl von Verbindungen zwischen den beiden Cliquen herzustellen. Mit diesen Verbindungen
fällt aber auch der Widerstand zwischen den beiden Cliquen ab.
Abbildung 11: Zwei verbundene Cliquen.
3.2
Random Walks in Gittergraphen
In diesem letzten Abschnitt soll nun mit Gittergraphen eine noch speziellere
Klasse von Graphen betrachtet werden. Gittergraphen sind ungerichtete,
ungewichtete Graphen, deren Knoten man sich als ganzzahlige Punkte in
einem d-dimensionalen Gitter vorstellen kann. Dabei ist jeder Knoten in
jede Richtung mit seinen nächsten Nachbarn verbunden. Zusätzlich werden
Knoten am Rand des Gitters mit dem ersten Knoten ihrer Reihe am anderen
Rand verbunden. Eine formale Definition findet sich beispielsweise in [2].
Wir bezeichnen mit d die Dimension des Gitters und mit k die Anzahl der
Knoten entlang einer Reihe. Den Graphen bezeichnen wir dann als (k, d)Gittergraph. Abbildung 12 zeigt einen (3, 3)-Gittergraphen.
Im Folgenden sollen die Widerstände auf solchen Graphen untersucht
werden. Zunächst gilt folgende Dreiecksungleichung:
Lemma 13 Für drei beliebige Knoten u,v,w in einem Graphen G gilt:
Ru,w ≤ Ru,v + Rv,w .
16
Abbildung 12: Ein dreidimensionaler Gittergraph.
Wir definieren mit P (c) die Leistung, die durch den Fluss c an den Widerständen in einem Netzwerk abfällt. Der Fluss aus einem Knoten u des
Netzwerkes wird mit c(u) bezeichnet, für diesen
P Fluss gilt mit V als Menge
aller Knoten des Netzes und u ∈ V : c(u) = v∈N (u) c(u, v), wobei c(u, v)
den von u nach v gerichteten Fluss auf der Kante {u, v} bezeichnet. Bezeichne r(e) den Widerstand
P an e ∈2 E mit E als Menge aller Kanten des Netzes,
so ist folglich P (c) = e r(e)c (e). Vergleiche dazu Abschnitt 1.2.
Man kann nun Quellen und Senken in solch einem Netzwerk betrachten,
dabei sind Quellen diejenigen Knoten für die c(u) > 0 gilt und Senken
diejenigen für die c(u) < 0 ist. Betrachtet man nun mehrere Flüsse auf
einem solchen Netz, so folgt:
Lemma 14 Für zwei beliebige Flüsse c1 und c2 in einem elektrischen Netz
gilt: P (c1 + c2 ) ≤ 2(P (c1 ) + P (c2 )).
Beweis.
P (c1 + c2 )
=
X
r(e)(c1 (e) + c2 (e))2
=
X
r(e)(c1 (e)2 + c2 (e)2 + 2c1 (e)c2 (e))
=
X
r(e)c1 (e)2 +
e
e
r(e)c2 (e)2 + 2
e
e
=
X
P (c1 ) + P (c2 ) + 2
X
e
17
X
e
r(e)c1 (e)c2 (e)
r(e)c1 (e)c2 (e)
2
X
r(e)c1 (e)c2 (e)
≤
P (c1 ) + P (c2 )
e
⇒ P (c1 + c2 ) ≤ 2(P (c1 ) + P (c2 ))
2
Mit diesen Vorbereitungen ergeben sich folgende Schranken für den maximalen Widerstand RG in einem Gittergraphen G:
Theorem 15 Sei G ein (k, d)-Gittergraph. Dann gilt:
Θ(log(n)) für d = 2
RG =
Θ( 1d ) für d ≥ 3
Dabei ist n = kd die Zahl der Knoten von G.
Beweis. Zunächst sei der Abstand eines KnotenPu = (k1 , k2 , ..., kd ), ki ∈
{0, . . . , k − 1} vom Ursprung definiert als l(u) =
ki und als Länge von u
bezeichnet. Im Fall d = 2 hat jeder Knoten genau vier Nachbarn, es gibt
maximal l + 1 Knoten der Länge l und damit O(l) Kanten zwischen den
Knoten der Länge l und der Länge
l + 1. Im Fall d > 2 hat jeder Knoten
2d Nachbarn, es gibt d l+d−1
Kanten
zwischen Knoten der Länge l und
d−1
solchen der Länge l + 1.
Wir wollen die obere und die untere Grenze des Widerstandes RG nun
dadurch feststellen, dass wir einen Fluss konstruieren, der vom Ursprung u0
zu einem beliebigen Knoten u im Gittergraphen fließt. Zur Vereinfachung
wird in diesem Beweis nicht mehr streng zwischen dem Graphen und dem
aus dem Graphen abgeleiteten Netz unterschieden. Für die obere Grenze
ist es wichtig, dass die Leistung des konstruierten Flusses O(log(n)) im Fall
d = 2 und O(1/d) im Fall d > 2 nicht übersteigt. Die Behauptung folgt
dann, wie wir später sehen werden, aus dem Prinzip von Thomson. Für die
untere Schranke wird das Monotoniegesetz von Rayleigh verwendet.
Der konstruierte Strom wird aus drei einfachen Strömen zusammengesetzt, die sich überlagern.
Der Übersicht halber wird zunächst noch ein weiterer Strom c0 in einem (k + 1, d) Netz wie folgt definiert (vgl. Abbildung 13 auf Seite 19):
Für Knoten v = (k1 , k2 , ..., ki , ..., kd ) und u = (k1 , k2 , ..., ki − 1, ..., kd ) mit
ki ≥ 1, l = l(v) ≤ k sei der Strom c0 (u, v) durch die Kante (u, v) definiert
ki
. Der Fluss in allen vom Ursprung entfernteren Kanten sei 0.
als l+d−1
l( d−1 )
Damit gilt für einen Knoten u = (k1 , ..., kd ) mit l(u) = l < k, dass die
SummePaller Flüsse von u zu seinen Nachbarknoten vi mit l(vi ) = l + 1
ki +1
l+d
1
genau
i (l+1)( l+d ) = (l+1)( l+d ) = (l+d−1) beträgt. Analog gilt für die
d−1
d−1
d−1
18
Summe der Flüsse zu u von allen Nachbarknoten vi mit l(vi ) = l − 1:
P
ki
1
i l(l+d−1) = (l+d−1) .
d−1
d−1
Der Fluss c0 hat damit drei wesentliche Eigenschaften:
Der Knoten u0 = (0, ..., 0) ist die einzige Quelle mit c0 (u0 ) = 1, wobei c0 (u0 )
die Summe der Flüsse über alle Kanten an u0 ist.
−1
.
Die Knoten ui mit Länge k sind Senken mit c0 (ui ) = k+d−1
( d−1 )
P (c0 ) ∈ O(log(n)) für d = 2 und P (c0 ) ∈ O( 1d ) für d ≥ 3.
4
1/5
5
6
7
8
4
3/20
5
6
7
4
1/10
5
6
4
1/20
5
1/20
3
1/4
1/12
2
1/3
1/10
3
1/6
1/6
1
1/2
1/6
2
1/6
1/2
0
3/20
3
1/12
1/3
1
1/4
2
1/5
3
4
Abbildung 13: Der Fluss c0 hier mit k = 4 und d = 2.
Um die letzte Eigenschaft einzusehen, betrachte man zuerst den Fall
d = 2. Es gibt dann O(l) Kanten zwischen Knoten der Länge l und solchen
der Länge l + 1, denn jeder Knoten hat maximal zwei Nachbarn, die weiter
vom Ursprung entfernt sind als der Knoten selbst. Durch jede dieser Kanten
O( l12 ) Leistung frei wird. Insgesamt wird
fließt ein Fluss von O( 1l ),
Pwomit
1
damit eine Leistung vonP l O( l2 ) frei, über eine Abschätzung der endlichen
n
1
harmonischen Reihe i=1 i ≈ ln(n) folgt P (C0 ) ∈ O(log(n)). Im Fall
n ≥ 3 ergibt sich P (C0 ) ∈ O( 1d ).
Um jetzt die durch das Theorem konstatierte obere Grenze nachzuwei19
sen, werden aus c0 drei Flüsse c1 , c2 , c3 , die im Fall d = 2 die Stärke O(log(n))
und im Fall d ≥ 3 allesamt die Leistung O( 1d ) haben, konstruiert. Die Summe dieser drei Flüsse soll eine einzelne Quelle u0 und eine einzelne Senke u
ergeben. Der aus der Quelle abfließende Fluss betrage genau 1. Man beachte,
dass die Flüsse c1 , c2 und c3 in einem (k, d) Gitter definiert sind, während
c0 in einem (k + 1, d) Gitter definiert ist.
Wir beginnen mit der Definition von c1 : c1 ((k1 , . . . , kd ), (k1 , k2 , . . . , (ki +
1 mod k, . . . , kd ))) = c0 ((k1 , . . . , kd ), (k1 , k2 , . . . , (ki + 1), . . . , kd )) Damit folgt
für die Leistung von c1 : P (c1 ) = P (c0 ). Der
Strom c1 hat, wie auch c0 genau
k+d−1
eine Quelle u0 mit c1 (u0 ) = 1 − d/ d−1 . Abbildung 14 zeigt ein Beispiel.
1/20
3
1/4
4
3/20
1/12
1/5
2
1/3
1/6
4
1/10
5
1/6
2
1/6
3/20
3
1/12
1/2
0
6
1/10
3
1/6
1
1/2
5
1/3
1
4
1/20
1/4
2
3
1/5
Abbildung 14: Der Fluss c1 mit k = 4 und d = 2.
Der Fluss c2 wird aus c1 wie folgt definiert: c2 (v, w) = c1 (w + u, v + u).
Hierbei ist ’+’ als komponentenweise Addition mod k zu verstehen, der Knoten u ist ein beliebiger Knoten des Gittergraphen. c2 ist also im Grunde die
Umkehr des Flusses c1 , wobei der Ursprung nach −u verlegt wurde. Damit
gilt auch: P (c2 ) = P (c1 ). Abbildung 15 auf Seite 21 mit u0 = (−2, −2) zeigt
ein Beispiel.
Für die Definition von c3 wird folgende Vereinbarung getroffen: Der Pfad
P = (u0 , . . . , ur = u) zwischen zwei Knoten u0 und u sei so definiert, dass
erstens jeder Knoten ui auf dem Pfad die Länge i besitzt. Zweitens sei, wenn
20
1/6
3/20
3
1/12
1/6
4
1/20
1/3
1/4
2
5
1/2
1/5
3
1/10
1/3
6
1/6
1/2
4
1/5
5
1/6
1/20
1
2
1/10
3
1/4
4
3/20
1/12
0
1
2
3
Abbildung 15: Der Fluss c2 zu c1 .
(ui , ui+1 ) eine Kante entlang der Dimension d0 ist, (ui+1 , ui+2 ) eine Kante
der Dimension ≥ d0 . Mit diesen zwei Bedingungen ist P eindeutig definiert.
Der Fluss c3 wird nun wie folgt definiert:
Für jeden Knoten v der Länge
k fließt ein Strom der Stärke 1/ k+d−1
entlang
des Pfades P + v = (u0 +
d−1
v, . . . , ur + v) und zusätzlich ein Strom der Stärke d/ k+d−1
entlang des
d−1
Pfades P , wobei
P wie oben definiert sei. Es gilt r < kd und es gibt maximal k+d−1
Knoten der Länge k. Damit folgt für die Leistung von c3 :
d−1
2
k+d−1
P (c3 ) ≤ kd/ d−1 + kd3 / k+d−1
. Damit gilt: P (c3 ) ∈ O(1/d) für k, d ≥ 3
d−1
und P (c3 ) ∈ O(1) für d = 2. Abbildung 16 auf Seite 22 zeigt den Fluss c3 .
Bildet man die Summe c = c1 + c2 + c3 , so hat c genau eine Quelle u0
und eine Senke u, ferner existiert ein Fluss von u0 nach u der Stärke 1.
Mit Lemma 14 folgt eine Leistung von O(log(n) bzw. O(1/d) und damit die
obere Schranke.
Die untere Schranke für den Widerstand folgt durch das Zusammenlegen
von Knoten nach dem Prinzip von Rayleigh. So ist für d = 2 der Widerstand
zwischen dem Ursprung und dem Knoten u an der Stelle (k/2, k/2) mindestens k/2 groß. Dazu werden alle Knoten gleicher Länge zusammengefasst.
21
1/5
3
1/5
4
1/5
1/5
5
6
1/5
1/5
2
3
1/5
1/5
1/5
4
2/5
5
3
2/5
4
1/5
2
3
1/5
1/5
1
2
2/5
0
2/5
1
Abbildung 16: Der Fluss c3 als Verbindung von c1 und c2 .
Da k2 = n gilt, liegt der Widerstand zwischen dem Ursprung und dem Knoten u in Ω(log(n)). Für den höherdimensionalen Fall ergibt sich eine untere
Schranke von 1/(2d).
2
Mit Theorem 8 auf Seite 12 folgt:
Corollary 16 Für die Cover Time auf d-dimensionalen Gittergraphen gilt:
CG ∈ O(nlog2 (n)) für d = 2 und CG ∈ O(nlog(n)) für d ≥ 3.
Anzumerken ist, dass in großen Gittergraphen das Entfernen einiger weniger Kanten keinen großen Einfluss auf den Gesamtwiderstand hat. Genauer ist das Entfernen von einigen Kanten gerade dann unkritisch, wenn die
Kanten einen entsprechend großen Abstand von dem betrachteten Widerstandspfad haben.
Literatur
[1] R. Aleliunas, R. M. Karp, R. J. Lipton, L. Lovasz, and C. W. Rackoff.
Random walks, universal traversal sequences, and the complexity of maze
problems. In 20th Ann. IEEE Symp. Found. Comput. Sci., 1979.
22
[2] A. K. Chandra, P. Raghavan, W. L. Ruzzo, R. Smolensky, and P. Tiwari.
The electrical resistance of a graph captures its commute and cover times.
In Computational Complexity, 1997.
[3] P. G. Doyle and J. L. Snell. Random Walks and Electrical Networks.
The Mathematical Association of America, 1984.
[4] P. Matthews. Covering problems for brownian motion on spheres. The
Annals of Probability, 1988.
[5] T. Worsch. Randomisierte algorithmen, 2006.
23
Herunterladen