Algorithmische Methoden zur Netzwerkanalyse Juniorprof. Dr. Henning Meyerhenke Institut für Theoretische Informatik 1 Institutund für Theoretische KIT –Henning Universität desMeyerhenke, Landes Baden-Württemberg nationales Forschungszentrum in der Helmholtz-Gemeinschaft Algorithmische Methoden zur Netzwerkanalyse Informatik www.kit.edu Vorlesung 14 Programm des Tages: Generierung von Graphen Übungsaufgaben 11 und 12 Netzwerke mit hyperbolischer Geometrie 2 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Wiederholung BA-Modell CL-Modell R-MAT-Modell Graph500 3 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Inhalt Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie 4 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Einführung Geometrische Netzwerke in der euklidischen Ebene: Durchschnittlicher Knotengrad abhängig vom Radius um Knoten Gradverteilung entspricht Binomialverteilung Geometrische Netzwerke in der hyperbolischen Ebene: Gradverteilung entspricht Potenzgesetz, Exponent abhängig von der Raumkrümmung Natürliche Hierarchie spiegelt sich wider Literaturverweis D. Krioukov, F. Papadopoulos, M. Kitsak, A. Vahdat, M. Boguna: Hyperbolic Geometry of Complex Networks. Phys. Rev. E 82, 036106 (2010). http://arxiv.org/pdf/1006.5169v2.pdf 5 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Bsp. hyperbolischer Geometrie L2 L1 [Krioukov et al.] 2 L3 A B a b L1 c C P1 P2 P3 P3 P2 P1 L3 L2 (a) (b) (c) FIG. 1: (Color online) Poincaré disk model. In (a), L1,2,3 and P1,2,3 are examples of hyperbolic lines. Lines L1,2,3 intersect to form triangle ABC. The sum of its angles a + b + c < ⇡. As opposed to Euclidean geometry, there are infinitely many lines (examples are P1,2,3 ) that are parallel to line L1 and go through a point C that does not belong to L1 . In (b), a {7, 3}-tessellation of the hyperbolic plane by equilateral triangles, and the dual {3, 7}-tessellation by regular heptagons are shown. All triangles and heptagons are of the same hyperbolic size but the size of their Euclidean representations exponentially decreases as a function of the distance from the center, while their number exponentially increases. In (c), the exponentially increasing number of men illustrates the exponential expansion of hyperbolic space. The Poincaré tool [1] is used to construct a {7, 7}-tessellation of the hyperbolic plane, rendering a fragment of The Vitruvian Man by Leonardo da Vinci. as usual—by a non-analyticity of the partition function.bei clidean (flat), spherical (positively curved), and hyperHyperbolische Geraden werden euklid. Darstellung gekrümmt This phase transition separates two regimes in the enbolic (negatively curved). Hyperbolic spaces of constant semble, cold and hot. Complex networks belong to the curvature are difficult to envisage because they Der hyperbolische Raum expandiert auf exponentielle Weisecannot be cold regime, while in the hot regime, the standard configisometrically embedded into any Euclidean space. The 6 uration model [18] and classical random graphs [19] turn out to be two limiting cases with degenerate geometric Henning Meyerhenke, Institut für Theoretische Informatik structures, Section IX. Sections VII and VIII analyze the Algorithmische Methoden zur Netzwerkanalyse degree distribution and clustering as functions of temper- reason is, informally, that the former are “larger” and have more “space” than the latter. Modelle für (Zufalls)Graphen Because of the fundamental difficulties in representNetzwerke mit hyperbolischer Geometrie ing spaces of constant negative curvature as subsets of Grundlagen 3 Drei Typen isotroper Räume: TABLE I: Characteristic properties of Euclidean, spherical, and hyperbolic geometries. Parallel lines is the number of lines that are parallel to a line andpthat go through a point not belonging to this line, and ⇣ = |K|. Property Curvature K Parallel lines Triangles are Euclidean 0 1 normal Shape of triangles Sum of 4 angles ⇡ Circle length 2⇡r Disk area 2⇡r2 /2 7 Spherical >0 0 thick Hyperbolic <0 1 thin >⇡ <⇡ 2⇡ sin ⇣r 2⇡ sinh ⇣r 2⇡(1 cos ⇣r) 2⇡(cosh ⇣r 1) That is, Meyerhenke, the distance two points is approximately Modelle für (Zufalls)Graphen Henning Institutbetween für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse mit hyperbolischer Geometrie the sum of their radial coordinates, minus some Netzwerke ✓- Poincaré-Modell t 2 = x 2 + y 2 + 1, konstante Krümmung −1 Hyperbolischer Raum repräsentiert durch Hyperboloiden Perspektivische Projektion auf (x , y )-Einheitskreis von (t = −1, x = 0, y = 0) aus gesehen Rand des Einheitskreises nicht Teil der hyperb. Ebene (Punkte unendlicher Distanz) Hyperbolische Geodäten sind euklidisch Kreisdurchmesser und Kreisbögen 8 http://en.wikipedia.org/wiki/File:HyperboloidProjection.png Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Poincaré und andere Modelle Euklidische Winkel zwischen hyperbolischen Geraden entsprechen den hyperbolischen Winkeln Bei Distanzen und Fläche ist das nicht der Fall Verallgemeinerung auf größere d möglich Modelle allgemein: Hyperbolische Räume konstanter Krümmung sind schwierig zu visualisieren Grund (informell): Hyperbolische Räume sind “größer” und haben mehr “Platz” Daher gibt es mehrere äquivalente Modelle hyperbolischer Räume Jedes Modell fokussiert auf andere Aspekte der hyperb. Geometrie Kein Modell hat gleichzeitig alle Eigenschaften 9 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Polarkoordinaten (euklidisch) Distanz r vom Nullpunkt Winkel θ Siehe Tafel! Umrechnung polar - kartesisch: x = r cos θ, y = r sin θ p Umrechnung kartesisch - polar: r = x 2 + y 2 , arctan yx + π für x < 0 y für x > 0 arctan x π θ= 2 für x = 0 und y > 0 π −2 für x = 0 und y < 0 unbestimmt für x = y = 0 10 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Eigenschaften des hyperbolischen Modells Von nun an: Abstände haben ihren wahren hyperbolischen Wert 2D-hyperb. Raum H2ζ mit konstanter Krümmung K = −ζ 2 < 0, ζ > 0 Eigenschaften: Kreislänge bei Radius r : L(r ) = 2π sinh ζr (1) A(r ) = 2π (cosh ζr − 1) (2) Kreisfläche bei Radius r : ⇒ Kreislänge und -fläche wachsen mit r gemäß eζr Hyperbolische Distanz x zweier Punkte (r , θ ) und (r 0 , θ 0 ): cosh ζx = cosh ζr cosh ζr 0 − sinh ζr sinh ζr 0 cos ∆θ , dabei ist ∆θ = π − |π − |θ 11 − θ 0 || (3) der Winkel zwischen den Punkten Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Ähnlichkeit zu Bäumen b-ärer Baum (siehe Tafel): Analogie zur Kreislänge: Zahl der Knoten mit Abstand genau r von der Wurzel Analogie zur Kreisfläche: Zahl der Knoten mit Abstand höchstens r von der Wurzel # Knoten mit genau Abstand r : (b + 1)br −1 # Knoten mit höchstens Abstand r : [(b + 1)br − 2]/(b − 1) Beides wächst gemäß br (und somit exponentiell) in r Also: Für ζ = ln b wächst alles gemäß e ζr Informell: b-äre Bäume sind diskrete hyperbolische Räume H2ln b 12 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Hierarchische Struktur von Daten Dendrogramm zur Visualisierung Abbildung: Quelle: Wikipedia 13 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Hierarchische Struktur in Netzwerken Euklidischer Kreis R2 repräsentiere Sammlung von Attributen für einen Knoten im Netzwerk Hierarchie durch überlappende Kreisscheiben (größere Überlappung = größere Ähnlichkeit = hyperbolisch näher) 14 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Hierarchische Struktur, R2 und H3 Seien zwei Kreise in R2 mit Radius r und r 0 gegeben Sei das Verhältnis gegeben durch: 1/C ≤ r /r 0 ≤ C Sei die euklidische Distanz zwischen den Kreismittelpunkten ≤ Cr Dann gilt: Die hyperbolische Distanz zwischen den beiden Knoten im H3 ist ≤ C 0 C 0 hängt nur von C ab, nicht von r , r 0 oder der Lage der Kreismittelpunkte Umgekehrt gilt das auch! Also: Distanzen von Knoten hinsichtlich ihrer (metrischen) Knotenattribute können auf Distanzen im hyperbolischen Raum abgebildet werden! 15 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Generierung eines Netzwerks Krümmungsparameter ζ = 1 Wirf N 1 Punkte zufällig in Kreisscheibe mit Radius R 1 R korrespondiert mit der Tiefe der Baumstruktur Gleichverteilung für θ, daher Dichte ρ(θ ) = 1/(2π ) Dichte für r : ρ (r ) = sinh r ≈ e r −R ∼ e r cosh R − 1 (4) Kante zwischen Knoten mit hyp. Abstand x gdw. x ≤ R Beschleunigung der Kantenabfrage durch geometrische Datenstrukturen (angepasst an hyperbolische Geometrie!) 16 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Durchschnittlicher Knotengrad Proposition Der durchschnittliche Knotengrad k (r ) für einen Knoten mit Abstand r vom Nullpunkt kann für große R folgendermaßen approximiert werden: 4 4 −r /2 (5) e − ( − 1 )e −r k (r ) = N π π 4 ≈ Ne−r /2 (für große r ) (6) π Der durchschnittliche Knotengrad k im Netzwerk ist dann: k≈ 17 8 Ne −R/2 π Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse (7) Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Knotengradverteilung Proposition Dünn besetzte Netzwerke haben die Gradverteilung: pk = 2 k 2 !2 Γ(k − 2, k /2) ∼ k −3 k! (8) Also haben wir eine Power-Law-Gradverteilung mit Exponent 3. Erstaunliches Ergebnis: Ergibt sich ohne unser explizites Zutun aus der Geometrie! 18 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie Diskussion Vorteile: Hierarchische Struktur Power-Law-Gradverteilung Zahl der Dreiecke meist im passablen Bereich Generierung kann parallel erfolgen (Achtung: Parallele Datenstrukturen!) Nachteile: Hyperbolische Geometrie wenig intuitiv 19 Henning Meyerhenke, Institut für Theoretische Informatik Algorithmische Methoden zur Netzwerkanalyse Modelle für (Zufalls)Graphen Netzwerke mit hyperbolischer Geometrie