Methoden des Algorithmenentwurfs Kapitel 1: Einführung Christian Scheideler SS 2009 08.04.2015 Kapitel 1 1 Organisatorisches Leitung: Prof. Dr. Christian Scheideler • Sprechstunde: Do, 16-17 Uhr • Email: [email protected] Modulinformation: • Modul II.2.1 Modelle und Algorithmen (MuA) • V2+Ü1 • 3 ECTS Credits Zeit und Ort: • Mi 16-18 Uhr, F0.530 Webseite: • http://www.cs.upb.de/fachgebiete/fg-ti/lehre0/ss2009/methoden.html 08.04.2015 Kapitel 1 2 Organisatorisches Übungen: • Übungsleitung: NN • Mi 14-16 Uhr, F0.530, 14-tägig ab 29. April • Übungszettel: Ausgabe: 14-tägig auf dieser Seite zum Übungstermin Abgabe: eine Woche danach in der Vorlesung Rückgabe: eine Woche danach in der Übung Schein: Einen Schein erhält, wer die Klausur am Ende des Semesters besteht. Bei Vorrechnen einer Aufgabe verbessert sich die Note um 0,3 Punkte. 08.04.2015 Kapitel 1 3 Organisatorisches Inhalt: • Teil 1: Approximationsalgorithmen – 1.1 Einführung [1w] – 1.2 Approximation mit absoluter Güte [2w] – 1.3 Approximation mit relativer Güte [2w] – 1.4 Approximationsschemata [2w] – 1.5 Lineare Optimierung und Approximationsalgorithmen [2w] 08.04.2015 Kapitel 1 4 Organisatorisches • Teil 2: Online-Algorithmen – 2.1 Deterministische Online-Algorithmen (Scheduling, Paging, selbstorganisierende Datenstrukturen) [3w] – 2.2 Randomisierte Online-Algorithmen (Scheduling, Paging, selbstorganisierende Datenstrukturen, Lastbalancierung) [2-3w] 08.04.2015 Kapitel 1 5 Literatur • Approximationsalgorithmen: – Rolf Wanka. Approximationsalgorithmen: Eine Einführung Vieweg & Teubner Verlag, 2006. – Klaus Jansen und Marian Margraf. Approximative Algorithmen und Nichtapproximierbarkeit. De Gruyter Verlag, 2008. • Online-Algorithmen: – Susanne Albers. Online- und Approximationsalgorithmen. Universität Freiburg, SS 2004. Verfügbar über WWW. – Christian Scheideler. Universal Routing Strategies for Interconnection Networks. Springer Verlag, LNCS 1390, 2007. 08.04.2015 Kapitel 1 6 Kapitel 1.1: Einführung Inhalt: • Einführung in P vs. NP • Approximationsalgorithmen • Beispiele – Lastbalancierung – Zentrumswahl – Rucksackproblem 08.04.2015 Kapitel 1 7 P vs. NP • Algorithmus: berechnet in endlicher Zeit aus einer Eingabe eine Ausgabe. Algorithmus Eingabe Ausgabe • zentrales Problem: möglichst effizienter Algorithmus (Zeit und Speicher) 08.04.2015 Kapitel 1 8 P vs. NP • Ein Algorithmus ist „schnell“, falls seine Laufzeit polynomiell in der Eingabegröße ist. • Eingabegröße: Anzahl der Elemente der Eingabe (z.B. Sortierproblem, Graph) oder Anzahl Bits / Wörter, aus denen Eingabe besteht (Multiplikation großer Zahlen) • Polynomiell: Laufzeit ist O(nk) für eine Konstante k bei Eingabegröße n. 08.04.2015 Kapitel 1 9 P vs. NP Laufzeitvergleiche: n 20 60 100 300 1000 5n 100 300 500 1500 5000 n log n 86 354 665 2469 9966 n2 400 3 600 10 000 90 000 1 000 000 n3 8000 216 000 1 000 000 27 000 000 1 000 000 000 2n 1 048 576 19 Stellen 31 Stellen 91 Stellen 302 Stellen n! 19 Stellen 82 Stellen 161 Stellen 623 Stellen unvorstellbar nn 27 Stellen 107 Stellen 201 Stellen 744 Stellen Unvorstellbar 08.04.2015 Kapitel 1 10 P vs. NP P: Klasse aller Entscheidungsprobleme (Anworten sind aus {Ja, Nein}), die in polynomieller Zeit entschieden werden können. Beispiele: Sortiertheit einer Folge, Auswertung eines Schaltkreises, Wortproblem für kontextfreie Sprachen, Lineare Optimierung,… 08.04.2015 Kapitel 1 11 P vs. NP NP: Klasse aller Entscheidungsprobleme (Anworten sind aus {Ja, Nein}), für die es für Eingaben mit Antwort Ja ein Zertifikat gibt, so dass die Antwort in polynomieller Zeit (in der Eingabegröße) verifiziert werden kann. Beispiele: Erfüllbarkeit einer Booleschen Formel, 3-Färbung von Graphen, Rucksackproblem,… 08.04.2015 Kapitel 1 12 P vs. NP 1.1 Beispiele für Probleme in NP: • Clique = {(G,k) | G=(V,E) ist ein Graph, der einen vollständigen Teilgraphen aus mindestens k Knoten besitzt} • IS = {(G,k) | G=(V,E) ist ein Graph, in dem es eine Knotenmenge U aus k Knoten gibt, so dass keine zwei Knoten in U durch eine Kante in G verbunden sind} • Hamilton = {G | G=(V,E) ist ein Graph, der einen Hamilton-Kreis besitzt} (Ein Hamilton-Kreis ist ein Kreis in G, in dem jeder Knoten genau einmal besucht wird.) 08.04.2015 Kapitel 1 13 P vs. NP Offensichtlich ist P eine Teilmenge von NP. Die 1-Million-Dollar-Frage: Ist P=NP oder nicht? • Antwort auf diese Frage scheint sehr schwer zu sein. • Bisher nur Ergebnisse des Typs: “Das kann nicht in polynomieller Zeit gelöst werden, es sei denn, P=NP.” • Klasse der NP-harten Probleme: sind nicht in P, es sei denn, P=NP. 08.04.2015 Kapitel 1 14 P vs. NP Zu Entscheidungsproblemen gibt es häufig entsprechende Optimierungsprobleme. Beispiele: • Optimierungsvariante zu Clique: finde vollständigen Teilgraphen maximaler Größe. • Optimierungsvariante zu IS: finde Knotenmenge maximaler Größe, in der kein Knotenpaar verbunden ist. Einsicht: Ist das Entscheidungsproblem nicht in P, dann ist auch die Optimierungsvariante nicht in polynomieller Zeit lösbar (und umgekehrt). 08.04.2015 Kapitel 1 15 P vs. NP 1.2 Definition: Ein kombinatorisches Optimierungsproblem P ist charakterisiert durch vier Komponenten: – D: Menge der Eingaben – S(I) für ein ID: Menge der zur Eingabe I zulässigen Lösungen – Die Bewertungsfunktion f:S(I) IN – ziel{min, max} 08.04.2015 Kapitel 1 16 P vs. NP • Gesucht: eine zu ID zulässige Lösung sopt S(I), so dass f(sopt) = ziel{ f(s) | s S(I)} • f(s) ist der Wert der zulässigen Lösung s. • Wir schreiben OPT(I) = f(sopt). Für viele komb. Optimierungsprobleme ist es schwer, OPT(I) exakt zu bestimmen. 08.04.2015 Kapitel 1 17 P vs. NP 1.3 Beispiel: (a) Das Traveling Salesperson Problem (TSP) ist charakterisiert durch: – D={(Kn,c) | Kn ist der vollständige Graph auf n Knoten, c:E IN sind die Kantengewichte} – S((Kn,c)) = { C | C=(vi1,vi2,...,vin,vi1) ist ein Hamilton-Kreis} – f(C) = c(vin, vi1) + Sj=1n-1 c(vij, vij+1) – min 08.04.2015 Kapitel 1 18 P vs. NP 1.3 Beispiel: (b) Das Rucksackproblem ist charakterisiert durch: – D={ (W,vol,p,B) | W={1,...,n}, vol:W IN, B IN, p:W IN und für alle w W gilt vol(w) ≤ B} W ist das Warenangebot, vol die Zuordnung von Volumina zu den Waren, p die Zuordnung von Werten und B die Kapazität des Rucksacks – S((W,vol,p,B)) = {A W | SwA vol(w) ≤ B} – f(A) = SwA pw – max 08.04.2015 Kapitel 1 19 Übersicht • • • • • P vs. NP Approximationsalgorithmen Lastbalancierung Zentrumswahl Rucksackproblem 08.04.2015 Kapitel 1 20 Approximationsalgorithmen Die NP-Härte eines Entscheidungsproblems legt nahe, dass die Optimierungsvariante keinen effizienten Algorithmus besitzt. Man muss sich also mit Näherungslösungen zufrieden geben. 1.4 Definition: Sei P ein kombinatorisches Optimierungsproblem. Ein t(n)-Zeit-Approximationsalgorithmus A berechnet zu Eingabe ID in Zeit t(|I|) eine Ausgabe sIA S(I). Wir schreiben A(I) = f(sIA). 08.04.2015 Kapitel 1 21 Approximationsalgorithmen • Wir wollen natürlich nach t(n)-Zeit-Approximationsalgorithmen suchen, für die – t(n) polynomiell in n ist und – f(sIA) möglichst nah an OPT(I) ist. Ziele: • Bestimme untere und obere Schranken für Approximationsgüte des Algorithmus • Bestimme untere Schranken für die erreichbare Approximationsgüte des Problems • Bestimme Heuristiken, die in der Praxis gut funktionieren ( Benchmarks) 08.04.2015 Kapitel 1 22 Übersicht • • • • • P vs. NP Approximationsalgorithmen Lastbalancierung Zentrumswahl Rucksackproblem 08.04.2015 Kapitel 1 23 Lastbalancierung Eingabe: m identische Maschinen, n Jobs. Job i hat Laufzeit ti. Einschränkungen: • Ein einmal ausgeführter Job muss bis zum Ende auf derselben Maschine ausgeführt werden. • Jede Maschine kann höchstens einen Job gleichzeitig bearbeiten. 1.5 Definition: Sei J(i) die Teilmenge der Jobs, die Maschine i zugewiesen werden. Dann ist Li = jJ(i) tj die Last der Maschine i. 1.6 Definition: Der Makespan L ist die maximale Last einer Maschine, d.h. L = maxi Li Lastbalancierung: finde Zuweisung, die Makespan minimiert 08.04.2015 Kapitel 1 24 Lastbalancierung: List Scheduling List-Scheduling Algorithmus: • Betrachte n Jobs in einer festen Reihenfolge • Weise Job j der Maschine mit z.Zt. geringster Last zu List-Scheduling(m, n, (t1,…,tn)): for i:=1 to m do Li := 0; J(i):=; for j:=1 to n do i:=argmink Lk // wähle Maschine mit kleinster Last J(i):=J(i) {j} // weise dieser Job i zu Li:=Li + tj return (J(1),…,J(m)) Laufzeit: O(n log m) mit Priority Queue 08.04.2015 Kapitel 1 25 Lastbalancierung: List Scheduling 1.7 Satz (Graham): List Scheduling ist 2-approximativ (d.h. für alle Eingaben I ist List-Scheduling(I) 2OPT(I) ). vergleiche Güte des Algorithmus mit optimalem Makespan L* 1.8 Lemma: L* ≥ maxj tj Beweis: Eine Maschine muss den zeitintensivsten Job bearbeiten. 1.9 Lemma: L* ≥ (1/m) j tj Beweis: • Die Gesamtlast ist j tj • Eine der m Maschinen muss mindestens 1/m der Gesamtlast bekommen. 08.04.2015 Kapitel 1 26 Lastbalancierung: List Scheduling 1.10 Satz: List Scheduling ist 2-approximativ. Beweis: • Betrache Maschine i mit höchster Last Li. • Sei j der letzte Job in Maschine i. • Da Job j Maschine i zugeordnet wurde, hatte i vorher die kleinste Last. Es gilt also Li – tj ≤ Lk für alle k. vor j nach j j Li - tj 08.04.2015 Li Kapitel 1 27 Lastbalancierung: List Scheduling Beweis (Forsetzung): • Es gilt: Li-tj ≤ Lk für alle k{1,…,m} • Daraus folgt: Li – tj ≤ (1/m) 1km Lk = (1/m) 1kn tk ≤ L* (Lemma 1.9) • Also gilt wegen Lemma 1.8: Li = (Li-tj) + tj ≤ 2L* 08.04.2015 Kapitel 1 28 Lastbalancierung: List Scheduling Ist die Analyse scharf? Ja! Beispiel: m Maschinen, m(m-1) Jobs der Länge 1, ein Job der Länge m m=10 Makespan = 19 08.04.2015 Kapitel 1 29 Lastbalancierung: List Scheduling Ist die Analyse scharf? Ja! Beispiel: m Maschinen, m(m-1) Jobs der Länge 1, ein Job der Länge m m=10 Optimaler Makespan = 10 08.04.2015 Kapitel 1 30 Lastbalancierung: LPT Regel Longest Processing Time (LPT): Sortiere die n Jobs in absteigender Reihenfolge und führe dann den List Scheduling Algorithmus aus. LPT-List-Scheduling(m, n, (t1,…,tn)): sortiere Jobs, so dass t1≥t2≥…≥tn for i:=1 to m do Li := 0; J(i):=; for j:=1 to n do i:=argmink Lk J(i):=J(i) {j} Li:=Li + tj return (J(1),…,J(m)) 08.04.2015 Kapitel 1 31 Lastbalancierung: LPT Regel Beobachtung: Wenn es höchstens m Jobs gibt, dann ist List Scheduling optimal. Beweis: Weise jedem Job eigene Maschine zu. 1.11 Lemma: Falls es mehr als m Jobs gibt, dann ist L*≥2tm+1. Beweis: • Betrachte die ersten m+1 Jobs t1,…,tm+1 • Da die ti’s absteigend sortiert sind, benötigt jeder dieser Jobs mindestens tm+1 Zeit. • Bei m+1 Jobs muss eine Maschine mindestens zwei Jobs erhalten. 08.04.2015 Kapitel 1 32 Lastbalancierung: LPT Regel 1.12 Satz: Die LPT Regel liefert eine 3/2-Approximation. Beweis: Falls die Maschine i mit größter Last nur einen Job hat, ist LPT offensichtlich optimal. Sonst gilt für den letzten Job j auf Maschine i, dass j m+1 und damit nach Lemma 1.11: Li = (Li – tj) + tj L* + (1/2)L* (3/2)L* Ist 3/2 scharf? Nein! 08.04.2015 Kapitel 1 33 Lastbalancierung: LPT Regel 1.13 Satz: (Graham): Die LPT Regel ist eine 4/3Approximation. Beweis: aufwändig Satz 1.13 ist im Wesentlichen scharf. Beispiel: m Maschinen, n=2m+1 Jobs: jeweils 2 Jobs der Länge m+1,m+2,…,2m und ein Job der Länge m Vergleich zu OPT: Übung. 08.04.2015 Kapitel 1 34 Übersicht • • • • • P vs. NP Approximationsalgorithmen Lastbalancierung Zentrumswahl Rucksackproblem 08.04.2015 Kapitel 1 35 Zentrumswahl-Problem Eingabe: Menge von n Orten s1,…,sn und eine Zahl kIN. Zentrumswahl-Problem: Wähle k Zentren C, so dass die maximale Distanz eines Ortes zum nächsten Zentrum minimal ist. k=4 : Zentrum 08.04.2015 Kapitel 1 36 Zentrumswahl-Problem Eingabe: Menge von n Orten s1,…,sn und eine Zahl kIN. Zentrumswahl-Problem: Wähle k Zentren C, so dass die maximale Distanz eines Ortes zum nächsten Zentrum minimal ist. Notation: • dist(x,y) = Distanz zwischen x und y • dist(si, C) = mincC dist(si,c) = Distanz von si zum nächsten Zentrum • r(C) = maxi dist(si, C) = kleinster Überdeckungsradius Wir nehmen an, dist ist eine Metrik, d.h. • dist(x,x) = 0 (Identität) • dist(x,y) = dist(y,x) (Symmetrie) • dist(x,y) dist(x,z) + dist(z,y) (Dreiecksungleichung) 08.04.2015 Kapitel 1 37 Zentrumswahl-Problem Beispiel: jeder Ort ist ein Punkt im 2-dimensionalen Euklidischen Raum, dist(x,y) = Euklidische Distanz k=4 : Zentrum 08.04.2015 Kapitel 1 38 Zentrumswahl: Greedy Algorithmus Greedy Algorithmus: Setze das erste Zentrum an der bestmöglichen Stelle für ein einzelnes Zentrum, füge dann Zentren hinzu, um den Überdeckungsradius möglichst stark zu verkleinern. Kann beliebig schlecht werden!! Beispiel: k=2 erstes Zentrum 08.04.2015 Kapitel 1 39 Zentrumswahl: Greedy Algorithmus Greedy Algorithmus: wähle wiederholt als nächstes Zentrum den Ort si mit maximaler Distanz zu allen bisherigen Zentren Greedy-Center-Selection(k, n, (s1,s2,…,sn)): C:=; wiederhole k-mal wähle Ort si mit maximalem dist(si,C) C:=C {si} return C Bemerkung: erstes Zentrum ist beliebiger Ort si 08.04.2015 Kapitel 1 40 Zentrumswahl: Greedy Algorithmus Bemerkung: Zentren in C sind mindestens r(C) entfernt voneinander Beweis: r(C) sinkt monoton, jeweils minimale paarweise Entfernung 1.14 Satz: Sei C* die optimale Wahl der Zentren. Dann ist r(C) ≤ 2r(C*). Beweis (durch Widerspruch): • Angenommen, r(C*) < r(C)/2. • Betrachte die Kreise mit Radius r(C)/2 um jedes ci C. • Es muss genau ein cC* im Kreis von jedem ci geben (siehe Bemerkung und Annahme); wir nennen dieses Zentrum c*i • Betrachte einen beliebigen Ort s und sei c*i sein nächstes Zentrum in C*. Es gilt: dist(s,C) dist(s,ci) dist(s,c*i) + dist(c*i,ci) 2r(C*) • Also ist r(C) 2r(C*), ein Widerspruch zur Annahme 08.04.2015 Kapitel 1 41 Zentrumswahl Wir wissen: Der Greedy Algorithmus ergibt eine 2-Approximation. Gibt es auch Polynomialzeitalgorithmen mit Approximationsgüte 3/2? Oder 4/3? 1.15 Satz: Sofern nicht P=NP ist, gibt es keinen Polynomialzeitalgorithmus mit Approximationsgüte < 2 für die Zentrumswahl (für k>2). 08.04.2015 Kapitel 1 42 Übersicht • • • • • P vs. NP Approximationsalgorithmen Lastbalancierung Zentrumswahl Rucksackproblem 08.04.2015 Kapitel 1 43 Rucksack-Problem Rucksack-Problem: • Gegeben sind n Objekte und ein Rucksack • Objekt i hat Wert pi>0 und wiegt voli>0 • Der Rucksack kann max. Gesamtgewicht B tragen. Ziel: fülle Rucksack mit Objekten mit max. Gesamtwert Beispiel: B=11 {3,4} hat Wert 40 08.04.2015 Objekt Wert Gewicht 1 1 1 2 6 2 3 18 5 4 22 6 5 28 7 Kapitel 1 44 RP: Greedy Verfahren Greedy Strategie: • Berechne Profitdichten d1=p1/vol1,.., dn=pn/voln • Sortiere Objekte nach Profitdichten • Angefangen von dem Objekt mit höchster Profitdichte, füge Objekte zu Rucksack hinzu, bis kein Platz mehr da Problem: Greedy Strategie kann weit vom Optimum entfernt liegen 08.04.2015 Kapitel 1 45 RP: Greedy Verfahren Beispiel: zwei Objekte mit p1=1 und p2=B-1 und vol1=1 und vol2=B, Rucksackkapazität ist B Greedy-Methode: berechnet d1=1 und d2 = 1-1/B und wird nur Objekt 1 in Rucksack packen, da Objekt 2 nicht mehr passt Optimale Lösung: packe Objekt 2 in Rucksack (viel besser da Wert B-1 statt 1) 08.04.2015 Kapitel 1 46 RP: Greedy Verfahren Verbesserte Greedy-Methode: • Seien die Objekte 1 bis n absteigend nach Profitdichte sortiert • Bestimme maximale Objektmenge {1,…,i} wie bisher mit ji volj B • Gib entweder {1,…,i} oder {i+1} aus, je nachdem, welche Menge den maximalen Wert hat 08.04.2015 Kapitel 1 47 RP: Greedy Verfahren 1.16 Satz: Die Lösung der verbesserten GreedyMethode ist höchstens einen Faktor 2 von der optimalen Lösung entfernt. Beweis: • Wenn beliebige Bruchteile der Objekte gewählt werden könnten, wäre die optimale Lösung {1,…,i+1}, wobei von Objekt i+1 nur der Bruchteil genommen wird, der noch in den Rucksack passt. • Für den optimalen Wert OPT gilt demnach: OPT ji+1 volj. • Also ist max{ji volj, voli+1} OPT/2 08.04.2015 Kapitel 1 48 Fragen? 08.04.2015 Kapitel 1 49