2. Grundlagen ¾ Beschreibung von Algorithmen durch Pseudocode. ¾ Korrektheit von Algorithmen durch Invarianten. ¾ Laufzeitverhalten beschreiben durch O-Notation. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 1 Beispiel Minimum-Suche Eingabe bei Minimum - Suche : Folge von n Zahlen (a1,a2 ,K ,an ). Ausgabe bei Minimum - Suche : Index i , so dass ai ≤ a j für alle Indizes 1 ≤ j ≤ n. Minimumalg orithmus : Verfahre n, das zu jeder Folge (a1,a2,K ,an ) Index eines kleinsten Elements berechnet. Eingabe : (31,41,59, 26,51,48) Ausgabe : 4 SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 2 Min-Search in Pseudocode Min - Search( A) 1 min ← 1 2 for j ← 2 to length[A] 3 do if A[ j ] < A[min ] 4 then min ← j 5 return min SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 3 Pseudocode (1) ¾ Schleifen (for, while, repeat) ¾ Bedingtes Verzweigen (if – then – else) ¾ (Unter-)Programmaufruf/Übergabe (return) ¾ Zuweisung durch ← ¾ Kommentar durch > ¾ Daten als Objekte mit einzelnen Feldern oder Eigenschaften (z.B. length(A):= Länge des Arrays A) ¾ Blockstruktur durch Einrückung SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 4 Invarianten Definition 2.1 Eine (Schleifen-) Invariante ist eine Eigenschaft eines Algorithmus, die vor und nach jedem Durchlaufen einer Schleife erhalten bleibt. ¾ Invarianten dienen dazu, die Korrektheit von Algorithmen zu beweisen. ¾ Sie werden in der Vorlesung immer wieder auftauchen und spielen eine große Rolle. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 5 Invarianten und Korrektheit Invariante und Korrektheit von Algorithmen wird bewiesen, indem gezeigt wird, dass ¾ Die Invarianten vor dem ersten Schleifendurchlauf erfüllt ist (Initialisierung). ¾ Die Eigenschaft bei jedem Schleifendurchlauf erhalten bleibt (Erhaltung). ¾ Die Invariante nach Beendigung der Schleife etwas über die Ausgabe des Algorithmus aussagt, Algorithmus korrekt ist (Terminierung). SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 6 Min-Search Min - Search( A) 1 min ← 1 2 for j ← 2 to length[A] 3 do if A[ j ] < A[min ] 4 then min ← j 5 return min SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 7 Invariante bei Min-Search Invariante: Vor Schleifendurchlauf mit Index i ist A[min] kleinstes Element in A[1..i-1]. Initialisierung: Der kleinste Index für die Schleife ist i=2. Davor ist A[min]=A[1]. Erhaltung: if-Abfrage mit then in Zeilen 3 und 4 ersetzt korrekt Minimum, wenn zusätzlich A[i] betrachtet wird. Terminierung: Vor Durchlauf mit i=n+1 ist A[min] das Minimum der Zahlen in A[1..n]. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 8 Laufzeitanalyse und Rechenmodell Für eine präzise mathematische Laufzeitanalyse benötigen wir ein Rechenmodell, das definiert ¾ ¾ ¾ ¾ Welche Operationen zulässig sind. Welche Datentypen es gibt. Wie Daten gespeichert werden. Wie viel Zeit Operationen auf bestimmten Daten benötigen. Formal ist ein solches Rechenmodell gegeben durch die Random Accsess Maschine (RAM). RAMs sind Idealisierung von 1- Prozessorrechner mit einfachem aber unbegrenzt großem Speicher. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 9 Basisoperationen – Kosten Definition 2.2: Als Basisoperationen bezeichnen wir ¾ Arithmetische Operationen – Addition, Multiplikation, Division, Ab-, Aufrunden. ¾ Datenverwaltung – Laden, Speichern, Kopieren. ¾ Kontrolloperationen – Verzweigungen, Programmaufrufe, Wertübergaben. Kosten: Zur Vereinfachung nehmen wir an, dass jede dieser Operationen bei allen Operanden gleich viel Zeit benötigt. In weiterführenden Veranstaltungen werden Sie andere und häufig realistischere Kostenmodelle kennen lernen. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 10 Eingabegröße - Laufzeit Definition 2.3: Die Laufzeit T(I) eines Algorithmus A bei Eingabe I ist definiert als die Anzahl von Basisoperationen, die Algorithmus A zur Berechnung der Lösung bei Eingabe I benötigt. Definition 2.4: Die (worst-case) Laufzeit eines Algorithmus A ist eine Funktion T : N → R + , wobei T ( n ) : = max{T ( I ) : I hat Eingabegrö ße ≤ n}. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 11 Eingabegröße – Laufzeit (2) ¾ Laufzeit angegeben als Funktion der Größe der Eingabe. ¾ Eingabegröße abhängig vom Problem definiert. ¾ Eingabegröße Minimumssuche = Größe des Arrays. ¾ Laufzeit bei Minimumsuche: A Array, für das Minimum bestimmt werden soll. T(A ):= Anzahl der Operationen, die zur Bestimmung des Minimums in A benötigt werden. Satz 2.5: Algorithmus Min-Search hat Laufzeit T(n) ≤ an+b für Konstanten a,b. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 12 Minimum-Suche Min - Search(A) cost 1 min ← 1 2 for j ← 2 to length[A] 3 do if A[ j ] < A[min ] 4 then min ← j 5 return min c1 c2 c3 c4 c5 times 1 n n −1 t 1 Hierbei ist t die Anzahl der Mimimumswe chsel. Es gilt t ≤ n − 1. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 13 O-Notation + N R → Definition 2.6. : Sei g : eine Funktion. Dann bezeichnen wir mit O (g ( n )) die folgende Menge von Funktionen ⎧ Es existieren Konstanten c , n0 ,⎫ ⎪ ⎪ = ≥ O (g ( n )) : ⎨f ( n ) : so dass für alle n n0 gilt ⎬ ⎪ ⎪ ≤ ≤ 0 f ( n ) cg ( n ) . ⎭ ⎩ ¾ O(g(n)) formalisiert: Die Funktion f(n) wächst asymptotisch nicht schneller als g(n). ¾ Statt f(n)∈ O(g(n)) in der Regel f(n)= O(g(n)) SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 14 Ω-Notation Definition 2.7: Sei g : N → R + eine Funktion. Dann bezeichnen wir mit Ω(g ( n )) die folgende Menge von Funktionen Es existieren Konstanten c , n0 ,⎫ ⎧ ⎪ ⎪ Ω(g ( n )) : = ⎨f ( n ) : so dass für alle n ≥ n0 gilt ⎬ ⎪ ⎪ 0 ≤ cg ( n ) ≤ f ( n ). ⎭ ⎩ ¾ Ω(g(n)) formalisiert: Die Funktion f(n) wächst asymptotisch mindestens so schnell wie g(n). ¾ Statt f(n)∈ Ω(g(n)) in der Regel f(n)= Ω(g(n)) SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 15 Θ-Notation Definition 2.8: Sei g : N → R + eine Funktion. Dann bezeichnen wir mit Θ(g ( n )) die folgende Menge von Funktionen Es existieren Konstanten c1 , c 2 , n0 , ⎫ ⎧ ⎪ ⎪ Θ(g ( n )) : = ⎨f ( n ) : so dass für alle n ≥ n0 gilt ⎬ ⎪ ⎪ ≤ ≤ ≤ 0 c g ( n ) f ( n ) c g ( n ) . ⎭ 1 2 ⎩ ¾ Θ(g(n)) formalisiert: Die Funktion f(n) wächst asymptotisch genau so schnell g(n). ¾ Statt f(n)∈ Θ(g(n)) in der Regel f(n)= Θ(g(n)) SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 16 Illustration von Θ(g(n)) c2g ( n ) f(n) c1g ( n ) SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 17 Regeln für Kalküle - Transitivität O-, Ω- und Θ-Kalkül sind transitiv, d.h.: ¾ Aus f(n)= O(g(n)) und g(n)= O(h(n)) folgt f(n)= O(h(n)). ¾ Aus f(n)= Ω(g(n)) und g(n)= Ω(h(n)) folgt f(n)= Ω(h(n)). ¾ Aus f(n)= Θ(g(n)) und g(n)= Θ(h(n)) folgt f(n)= Θ(h(n)). SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 18 Regeln für Kalküle - Reflexivität ¾ O-, Ω- und Θ-Kalkül sind reflexiv, d.h.: f(n) = O(f(n)) f(n) = Ω(f(n)) f(n) = Θ(f(n)) ¾ Θ-Kalkül ist symmetrisch, d.h. f(n) = Θ(g(n)) genau dann, wenn g(n) = Θ(f(n)). SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 19 Regeln für Kalküle Satz 2.10: Sei f : N → R + mit f (n ) ≥ 1 für alle n. Weiter sei k , l ≥ 0 mit k ≥ l . Dann gilt ( k ( l ) 1. f (n ) = O f (n ) . 2. f (n ) = Ω f (n ) . l k ) Satz 2.11: Seien ε , k > 0 beliebig. Dann gilt SS 2005 1. log(n ) = O (n ε ). 2. n = Ω log(n) . k ε ( k ) Datenstrukturen und Algorithmen 2.Grundlagen 20 Anwendung auf Laufzeiten Min-Search Satz 2.11: Minimum-Search besitzt Laufzeit Θ(n). Zum Beweis ist zu zeigen: 1. Es gibt ein c 2 , so dass die Laufzeit von Min - Search bei allen Eingaben der Größe n immer höchstens c 2 n ist. 2. Es gibt ein c1, so dass für alle n eine Eingabe I n der Größe n existiert bei der Min - Search mindestens Laufzeit c1n besitzt. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 21 Anwendung auf Laufzeiten (2) ¾ O-Notation erlaubt uns, Konstanten zu ignorieren. ¾ Wollen uns auf asymptotische Laufzeit konzentrieren. ¾ Werden in Zukunft Laufzeiten immer mit Hilfe von O-, Ω-,Θ-Notation angeben. SS 2005 Datenstrukturen und Algorithmen 2.Grundlagen 22