Breitensuche Warteschlangen und die Grundidee der Breitensuche Im Folgenden wollen wir Graphen systematisch von einem Startknoten aus durchmustern, das heißt, alle Knoten sollen besucht und alle Kanten berührt werden, wobei nach dem Startknoten s erst alle Nachbarn von s, dann alle Nachbarn der Nachbarn usw. besucht werden sollen. Dazu sei G = (V, E) ein ungerichteter Graph gegeben durch seine Adjazenzlistendarstellung und s ∈ V ein fest gewählter Startknoten. Wir werden den Knoten ‘Farben’ geben welche deren ihren aktuellen Zustand symbolisieren: • weiß: Knoten wurde noch nicht gesehen; zu Beginn sind alle Knoten weiß • grau: Knoten wurde schon gesehen, wir müssen aber noch überprüfen, ob er noch weiße Nachbarn hat • schwarz: Knoten ist erledigt, Knoten selbst und alle seine Nachbarn wurden gesehen. Die noch zu untersuchenden grauen Knoten werden in einer Warteschlange Q verwaltet. Als Datenstruktur ist eine Warteschlange dadurch charakterisiert, dass Objekte in einer linearen Ordnung gehalten werden, neue Objekte kann man nur am Ende einfügen und zugreifen bzw. entfernen kann man nur den Kopf der Schlange, also das Objekt, was am längsten in der Schlange war. Eine solche Struktur realisiert das sogenannte FIFO-Prinzip : First–In–First–Out. Ohne die Details der Implementierung einer Warteschlange zu spezifizieren, werden wir ihre Funktionalität im Pseudocode verwenden, insbesondere die Funktion enqueue v in Q zum Einfügen des Knoten v in die Warteschlange Q und die Funktion dequeue Q um den vordersten Knoten aus der Warteschlange zu entfernen. Ein Knoten, dessen Farbe von weiß nach grau wechselt, wird ans Ende der Schlange eingefügt. Die Schlange wird vom Kopf her abgearbeitet. Ist die Schlange leer, sind alle von s erreichbaren Knoten erledigt. Mit BFS kann der Abstand d[u] = dG (s, u) eines erreichbaren Knotens u von s berechnet werden (Beweis später). Intuitiv sollte dies aber klar sein, denn der Algorithmus besucht zunächst alle Knoten im Abstand i von s, danach erst alle im Abstand i + 1. Gleichzeitig wird ein Baum von kürzesten Wegen von s zu allen erreichbaren Knoten aufgebaut. Dieser ist dadurch beschrieben, dass man für jeden Knoten u einen Zeiger π[u] auf den Vorgängerknoten auf einem kürzesten Weg von s nach u aufrechterhält. Ist dieser noch nicht bekannt oder existiert gar nicht, so ist der Zeiger auf NIL gesetzt. Pseudocode und ein Beispiel Im folgenden Programm dienen die ersten 8 Zeilen der Initialisierung. Breitensuche BFS(G,s): for all u ∈ V(G) \{ s} Farbe[u] = weiss d[u] = ∞ π[u] = NIL Farbe[s] = grau d[s] = 0 π[s] = NIL enqueue s in Q 1 while Q not empty u = dequeue Q for all v ∈ Adj[u] if Farbe[v] = weiss then Farbe[v] = grau d[v] = d[u]+1 π[v] = u enqueue v in Q Farbe[u] = schwarz Beispiel: Im Beispiel werden die Adjazenzlisten als lexikographisch sortiert angenommen. s a b c 0 e f d s a 0 g Zustand nach Initialisierung; Nur s ist grau ( gestrichelt) Q=[s] h i b c 1 e Zustand, nachdem s aus Schlange entfernt wurde. Jetzt Q=[a,d] g Schon gefundene Baumkanten sind dick! Schwarze Knoten auch. 1 d s a 0 i h f b 1 c 2 3 Der BFS−Baum mit den berechneten Abständen 1 2 e 3 g 2 3 h f 3 i Die Laufzeit des BFS–Algorithmus ist offensichtlich O(|V | + |E|). Man beachte, dass der konstruierte Baum kürzester Wege von der Reihenfolge der Knoten in den Adjazenzlisten abhängt, der Abstand der Knoten selbst natürlich nicht. Genauer, verschiedene Adjazenzlistendarstellungen ein und desselben Graphen können nichtisomorphe Breitensuchbäume produzieren. Ist der Graph G ungerichtet und zusammenhängend, so liefert BFS einen aufspannenden Baum. Hat G mehrere Zusammenhangskomponenten, so kann man leicht einen aufspannenden Wald erzeugen. Man startet die BFS–Suche erneut bei einem beliebigen noch weißen Knoten. 2 Was kann man damit noch anfangen? Auch der Test, ob ein ungerichteter Graph bipartit (also 2färbbar) ist, wird jetzt sehr einfach. Wir konstruieren einen aufspannenden Wald, färben dessen Knoten mit zwei Farben und testen abschließend, ob die Graphkanten, die nicht im Wald sind, korrekt 2–gefärbt sind. Breitensuche und der Abstand vom Startknoten Wir wollen jetzt zeigen, dass man mit BFS korrekt die graphentheoretischen Abstände in G vom Startknoten s berechnet, also für alle Knoten v gilt: d[v] = dG (s, v). Vorbetrachtung: Wir werden mit dem Induktionsbeweis zeigen, dass die folgenden drei Eigenschaften der Warteschlange zu jedem Zeitpunkt gültig sind. • Falls v später als u in die Warteschlange aufgenommen wird, so gilt für die berechneten Werte d[u] ≤ d[v]. • Zu jedem Zeitpunkt während des Algorithmus gilt für jeden Knoten v, dass d[v] ≥ dG (s, v). • Zu jedem Zeitpunkt gilt für die Warteschlange, dass der Abstand zwischen Kopfknoten und letzten Knoten in der Queue ≤ 1 ist. Beweis der BFS–Korrektheit: Wir führen eine Induktion über den graphentheoretischen Abstand dG (s, v) durch. Induktionsanfang: Falls dG (s, v) = 0 so ist v = s und laut Initialisierung d[s] = 0. Induktionsannahme: Aussage richtig für alle Knoten u mit dG (s, u) < dG (s, v) Induktionsschritt: Sei Knoten z Vorgänger von v auf einem tatsächlich kürzestem Weg von s nach v. Nach Annahme ist d[z] = d( s, z) und dG (s, v) = dG (s, z) + 1 = d[z] + 1 Entsprechend der Vorbetrachtung ist also d[v] ≥ dG (s, v) > d[z]. Also wird z vor v aus der Schlange entfernt. Wir betrachten den Zeitpunkt, bei dem z Kopf ist. Fall 1: v ist in diesem Moment schon in Q. Dann ist d[v] ≤ d[z] + 1 = dG (s, z) + 1 = dG (s, v) und wegen der Vorbetrachtung haben wir d[v] = dG (s, v). Fall 2: v wird erst jetzt wegen der Kante zwischen z und v in Q aufgenommen und zwar mit dem Wert d[v] = d[z] + 1 = dG (s, v), was zu zeigen war. Bemerkung: Der eigentliche, tiefere Grund, weshalb dieser Beweis funktioniert, ist die banale Feststellung, dass ein kürzester Weg (hier von s zu v) als Teilwege wieder kürzeste Wege enthält (hier von s nach z). Dies werden wir bei anderen Kürzeste–Wege–Problemen wiederfinden. 3