DHP-FAQ DHP-FAQ Wie auch bei den DVP-FAQs sind hier wieder alle, mir relevant erscheinenden, Fragen aus den Protokollen zusammengefasst. Wieder gilt, dass die Antworten zum grossen Teil direkt aus der angegebenen Literatur übernommen wurden und daher nicht auf meine geistige Leistung zurück gehen. Trotzdem kann es natürlich gut sein, dass ein Haufen Fehler drin sind. Viel Spass damit. Florian Deißenböck, 03.04.2003 Datenbanken Compilerbau Software Engineering Objektorientierung Rechnerarchitektur Betriebssysteme Rechnernetze Rechnernetze II Effiziente Algorithmen und Datenstrukturen Automaten, Formale Sprachen, Berechenbarkeit Logik http://www.deissenboeck.de/faqs DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 2 Inhaltsverzeichnis 5.5 6 Betriebssysteme 6.1 Allgemeines . . . . . . 6.2 Prozesse und Threads 6.3 Deadlocks . . . . . . . 6.4 Speichermanagement . 6.5 I/O . . . . . . . . . . . 6.6 Betriebssystem-Design 6.7 Beispiele . . . . . . . . Inhaltsverzeichnis I Praktische Informatik 5 1 Datenbanksysteme 1.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . 1.2 Datenbankentwurf . . . . . . . . . . . . . . . . . . . 1.3 Das relationale Modell . . . . . . . . . . . . . . . . . 1.4 SQL . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Datenintegrität . . . . . . . . . . . . . . . . . . . . . 1.6 Entwurfstheorie (Normalformen) . . . . . . . . . . . 1.7 Transaktionen . . . . . . . . . . . . . . . . . . . . . . 1.8 Objektrelationale und objektorientierte Datenbanken 1.9 Data Warehousing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 10 12 13 13 15 16 17 2 Compilerbau 2.1 Allgemeines . . . . . . . . . . . . . . . . 2.2 Lexikalische Analyse . . . . . . . . . . . 2.3 Syntaktische Analyse . . . . . . . . . . . 2.4 Semantische Analyse . . . . . . . . . . . 2.5 Codegenerierung und Optimierung . . . 2.6 Übersetzung objektorientierter Sprachen 2.7 Top-Down Parser in Java . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 19 20 21 23 23 25 26 . . . . . . . . . . . . . . Elicitation) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 30 31 31 32 33 33 35 36 . . . . . . . . . . . . . . . . . . . . . 3 Software Engineering 3.1 Allgemeines . . . . . . . . . . . . . . . . . . . 3.2 UML . . . . . . . . . . . . . . . . . . . . . . . 3.3 Ermittlung der Anforderungen (Requirements 3.4 Analyse . . . . . . . . . . . . . . . . . . . . . 3.5 Grobentwurf (System Design) . . . . . . . . . 3.6 Feinentwurf (Object Design) . . . . . . . . . . 3.7 Testen . . . . . . . . . . . . . . . . . . . . . . 3.8 Projektmanagement . . . . . . . . . . . . . . 3.9 Vorgehensmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Objektorientierung 41 4.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2 Entwurfsmuster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 Literaturverzeichnis 43 II 45 Technische Informatik 5 Rechnerarchitektur 5.1 Allgemeines . . . . . . . . . . . . 5.2 Zentralprozessoren . . . . . . . . 5.3 Hauptspeicher und Verkehrswege 5.4 Ein-/Ausgabewerk . . . . . . . . . . . . . . . . DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs SPEC-Werte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 52 57 59 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 63 63 69 71 74 74 76 7 Rechnernetze 7.1 Allgemeines . . . . . . . . 7.2 ISO–OSI–Referenzmodell 7.3 Schichtübergreifend. . . . 7.4 Schicht 1 . . . . . . . . . . 7.5 Schicht 2a . . . . . . . . . 7.6 Schicht 2b . . . . . . . . . 7.7 Schicht 3 . . . . . . . . . . 7.8 Schicht 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 79 80 82 83 83 86 88 91 . . . . . . . 8 Rechnernetze II 95 8.1 Allgemeines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 8.2 Hochleistungsnetze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 8.3 Dienstgüte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 Literaturverzeichnis III 101 Theoretische Informatik 103 9 Effiziente Algorithmen und Datenstrukturen 9.1 Allgemeines . . . . . . . . . . . . . . . . . . . 9.2 Mathematische Grundlagen . . . . . . . . . . 9.3 Datenstrukturen . . . . . . . . . . . . . . . . 9.4 Selektieren und Sortieren . . . . . . . . . . . 9.5 Minimale Spannbäume . . . . . . . . . . . . . 9.6 Kürzeste Pfade . . . . . . . . . . . . . . . . . 9.7 Matchings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 105 107 108 120 126 127 129 10 Automaten, Formale Sprachen 10.1 Allgemeines . . . . . . . . . . 10.2 Chomsky 3 . . . . . . . . . . 10.3 Chomsky 2 . . . . . . . . . . 10.4 Chomsky 1 . . . . . . . . . . 10.5 Berechenbarkeit . . . . . . . . und . . . . . . . . . . . . . . . Berechenbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 131 132 136 141 142 11 Logik 11.1 Allgemeines . . 11.2 Aussagenlogik . 11.3 Prädikatenlogik 11.4 Beweisideen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 149 149 160 168 Literaturverzeichnis 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 Teil I Praktische Informatik DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 5 Kapitel 1. Datenbanksysteme Physische Datenunabhängigkeit: Die Modifikation der physischen Speicherstruktur lässt die logische Schicht unverändert. Logische Datenunabhängigkeit: Kleinere Änderungen des Datenbankschemas (z. B. Umbenennung von Attributen) können durch Sichten verborgen werden. Kapitel 1 1.1.7 Unterscheiden Sie relationale Datenbanken von objektorientierten Datenbanken. Die Unterschiede entsprechen ziemlich genau den Erweiterungen des objektrelationalen Modells die in 1.8 beschrieben sind. Datenbanksysteme 1.1.8 Erklären Sie den Unterschied zwischen Entity und Klasse. Entitäten haben keine Methoden, entsprechen also eher Pascal Records. Ausserdem sind alle Attribute einer Entität atomar. 1.1 Allgemeines 1.1.1 Was ist der Unterschied zwischen dem relationalem und anderen Modellen? 1.1.9 Die Objekte müssen flach geklopft werden, so dass die Objekteigenschaften sich als atomare Attribute speichern lassen. Dazu sind i. A. mehrere Relationen nötig. Methoden können nicht abgebildet werden. Im Gegensatz zu dem satzorientierten hierarchischen und dem ebenfalls satzorientierten Netzwerkmodell ist das relationale Modell mengenorientiert. 1.1.10 1.1.2 Wie kann man Objekte mit einer relationalen Datenbank realisieren? Vergleichen Sie B-Bäume mit Hashing im Kontext von Datenbanken? Wo gibt es denn in der Mathematik Schlüssel? Bei Funktionen. Beides wird bei Datenbanken eingesetzt. B-Bäume werden zur Speicherung der eigentlichen Daten benutzt, da Sie gut mit Daten, die auf Hintergrundspeichern liegen, umgehen können. Hashing wird bei Indizes gesetzt, da es annähernd O(1) Zugriff erlaubt. 1.1.11 Was ist ein Datenbankschema? Das Datenbankschema legt die Struktur der abgespeicherten Daten fest. 1.1.3 Erklären sie die Begriffe Datenbankschema/Ausprägung und intensional/extensional . Das Datenbankschema legt die Struktur der abgespeicherten Daten fest. Eine Ausprägung ist ein momentan gültiger Zustand der Datenbasis. Man spricht auch von der intensionalen (Schema) und der extensionalen (Ausprägung) Ebene einer Datenbank. Der Unterschied entspricht dem von Klasse und Objekt in der Objektorientierung. 1.1.4 Was ist eine Datenbank? Eine Datenbasis ist eine Menge von Daten. Angereichert um weitere Daten, die das DBMS zur Erfüllung seiner Aufgabe benötigt, bilden sie eine Datenbank. Ein DBMS einschliesslich einer oder mehrerer Datenbanken nennt man Datenbanksystem. 1.1.12 Was ist ein Datenmodell? Ein Datenmodell ist ein Satz von abgestimmten Konzepten zur Beschreibung der Repräsentation von Informationen durch Daten. 1.2 Datenbankentwurf 1.2.1 Was gibt es für Modellierungsmöglichkeiten für Datenbanken? ER-Modell semantisches Modell 1.1.5 funktionales Modell Wie sieht eine relationale Datenbank aus? objektorientierte Entwurfsmodelle Eine relationale Datenbank speichert die Daten in Tabellen. 1.1.6 1.2.2 Welche Schichten gibt es bei einer Datenbank? Beschreiben Sie das ER-Modell. Die grundlegenden Modellierungsstrukturen des Modells sind Mann kann drei Schichten unterscheiden. 1. Physische Schicht: Hier wird festgelegt, wie die Daten gespeichert werden. Entities: Entitäten sind wohl unterscheidbare physisch oder gedanklich existierende Dinge der zu modellierenden Welt. Im ER-Modell wird eigentlich mit Entitymengen gearbeitet. 2. Logische Schicht: Auf der logischen Schicht wird in einem Datenbankschema festgelegt, welche Daten gespeichert werden. Relationships: Beziehungen zwischen Entitäten. Diese Beziehung können Funktionalitäten habe, z. B. 1:N . Sie können ausserdem durch die (min, max)-Notation noch genauer beschrieben werden. 3. Sichten: Durch Sichten werden Teilmengen der gespeicherten Daten bereitgestellt. Attribute: Attribute dienen dazu Entitäten zu charakterisieren. Rollen: Rollen spezifizieren die Rolle einer Entität in einer Beziehung, dies ist z. B. bei rekursiven Beziehung nötig. Das Schichtenmodell dient der Datenunabhängigkeit, es kann zwei Stufen der Datenunabhängigkeit gewährleisten: DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 7 8 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 1.2. Datenbankentwurf Erweitert wird das ER-Modell durch: Kapitel 1. Datenbanksysteme 1.2.7 Modellieren Sie eine 3-fach Beziehung. schwache Entitäten: Schwache (existenzabhängige) Entitäten sind in ihrer Existenz von einer übergeordneten Entität abhängig. Oft sind sie nur in Kombination mit dem Schlüssel der übergeordneten Entität eindeutig identifizierbar. Vorlesungen M Generalisierung: Generalisierung bzw. Spezialisierung kann durch is-a-Beziehung modelliert werden. Studenten N prüfen Aggregation: Aggregation kann durch part-of -Beziehungen modelliert werden. 1 1.2.3 1.2.4 Professoren Was ist eine Entität? Entitäten sind wohl unterscheidbare physisch oder gedanklich existierende Dinge der zu modellierenden Welt. Durch diese Modellierung hat die Relation die Eigenschaften einer partiellen Funktion Wie kann man ein ER-Modell in das relationale Modell überführen? D. h. jedem Paar (Student, Vorlesung) ist genau ein Prüfer zugeordnet. Ein Student kann sich also nicht in einer Vorlesung von zwei Professoren prüfen lassen. prüfen : Studenten × Vorlesungen → Professoren Alles was mit dem ER-Modell modelliert wurde, muss (so weit möglich) in Relationen überführt werden. 1.2.8 Entitäten: straight-forward! Beziehungen: Zuerst werden alle Beziehungen in Relationen umgesetzt, dies wird später noch verfeinert. Die Relation erhält alle Schlüssel-Attribute der beteiligten Entitäten sowie alle Attribute der Beziehung. Möglicherweise müssen Attributnamen umbenannt werde um Duplikate auszuschliessen oder die Übersichtlichkeit zu erhöhen. Die Wahl der Schlüssel hängt von der Funktionalität der Beziehung ab N :M : Die Menge aller Fremdschlüssel bildet den Schlüssel. 1:N : Als Schlüssel wird der Schlüssel der N Entität gewählt. 1:1: Hier kann man es sich aussuchen. ternäre Beziehungen: Hier müssen die Schlüssel aller nicht-1-Entitäten aufgenommen werden. Die Fremdschlüssel kommen gar nicht vor. Sie existieren implizit durch Angabe der Relationships. 1.3 Das relationale Modell 1.3.1 Was ist ein Schlüssel? Eine minimale Teilmenge von Attributen, deren Werte die zugeordnete Entity eindeutig identifizieren. 1.3.2 Generalisierung: Das relationale Modell unterstützt Generalisierung nicht, deshalb gibt es nur suboptimale Lösungen. Mann muss die Information auf die Ober- bzw. Untertypen aufteilen. Dadurch ist aber keine Vererbung realisiert, um an die ganze Information zu gelangen, muss man joinen. Verfeinerung. Das wichtigste ist, dass nur Relationen mit gleichen Schlüsseln zusammengefasst werden dürfen. 1:N : Diese Beziehungen können zusammengefasst werden, wobei die N -Entität um einen Fremdschlüssel erweitert werden muss. 1:1: Hier kann man sich aussuchen in welche Richtung man zusammenfassen möchte. Das ist natürlich von den Entitäten abhängig, so sollte man z. B. so zusammenfassen, dass möglichst wenige N U LL-Einträge entstehen. Was ist ein Primärschlüssel? Kandidatenschlüssel sind minimale Schlüssel. Gibt es mehrere Kandidatenschlüssel, so wählt man einen als Primärschlüssel 1.3.3 Was ist ein Fremdschlüssel? Attribute einer Relation die dazu dienen Tupel einer anderen Relation zu identifizieren, heissen Fremdschlüssel. N :M : Diese Beziehungen bleiben als eigenständige Relation erhalten. 1.2.5 Wo kommen im ER-Modell die Fremdschlüssel vor? 1.3.4 Wie werden Beziehung im relationalen Modell dargestellt? Beziehungen werden wie alles anderen im relationalen Modell durch Relationen (Tabellen) dargestellt. 1.3.5 Geben Sie ein Beispiel für eine Operation auf einer Relation. Selektion (σ) Gibt es Vererbung im ER-Modell? Projektion (Π) Es gibt Generalisierung, die durch is-a-Beziehung realisiert wird. Vereinigung (∪) Differenz (−) 1.2.6 Was ist der Unterschied zwischen einem UML-Klassendiagramm und einem ER-Diagramm? Kreuzprodukt (×) Entitäten haben keine Methoden Umbenennung (ρ) Attribute von Entitäten können nur atomar sein diverse Joins (1) Vererbung wird bei ER durch is-a-Beziehung realisiert Schnitt (∩) Aggregation wird bei ER durch part-of -Beziehung realisiert Division(÷) DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 9 10 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 1.3. Das relationale Modell 1.3.6 1.3.7 Kapitel 1. Datenbanksysteme Wie überführt man ternäre Relationships ins relationale Modell? 1.4 SQL Die Relation erhält alle Schlüssel-Attribute der an der Beziehung beteiligten Entities und alle Attribute der Beziehung. Schlüssel der Relation ist die Vereinigung aller Schlüssel von Entitäten, die eine N oder M Funktionalität haben. 1.4.1 Wie würden Sie Vererbung mit Hilfe von SQL Natürlicher Join: Es wird das Kreuzprodukt gebildet und aus diesem nur diejenigen Tupel interpretiert für die gleichnamige Attribute gleiche Werte haben. Durch eine folgende Projektion wird jedes Ergebnis nur einmal aufgenommen. Seien R und S zwei Relationen. Wenn R die Attribute A1 , . . . , Am , B1 , . . . , Bk und S die Attribute B1 , . . . , Bk , C1 , . . . , Cn hat, dann ist der Join wie folgt definiert: Die folgenden Beispiele zeigen die Definition der Tabellen und Sichten mit SQL. R 1 S = ΠA1 ,...Am ,R.B1 ,...,R.Bk ,C1 ,...,Ck (σR.B1 =S.B1 ∧...∧R.Bk =S.Bk (R × S)) Der Join-Operator ist assoziativ und kommutativ. Allgemeiner Join: Beim natürlichen Join werden nur Tupel mit gleichnamigen und gleichwertige Attributen aufgenommen. Beim allgemeinen Join (oder Theta-Join) kann ein beliebiges Prädikat angegeben werden. Somit ist der allgemeine Join nichts anderes als ein Kreuzprodukt gefolgt von einer Selektion: Rechter äusserer Join: Die Tupel der rechten Argumentrelation bleiben in jedem Fall erhalten. Semi-Join (n): Der Semi-Join von L und R ist definiert als R n S = ΠL (L 1 R) create table Professoren ( PersNr . . . Name . . . Rang . . . Raum . . . ); create table Assistenten ( PersNr . . . Name . . . Boss . . . ); create view Angestellte as ( select PersNr, Name from Professoren ) union ( select PersNr, Name from Assistenten ); create view Assistenten as select ∗ from Angestellte a, AssiDaten d where a.PersNr = d.PersNr; wobei R die Menge der Attribute von R ist. Das Ergebnis enthält also alle Tupel aus R in unveränderter Form die einen potentielle Joinpartner in S haben. Semi-Join (o): analog definiert. Es gilt: 1.4.2 Geben Sie Beispiele für SQL-Anfrage. select s.∗ from Studenten s where s.GebDatum < ( select max(p.GebDatum) from Professoren p ); Erklären Sie Operatoren im Kontext der relationalen Algebra. Im relationalen Modell werden alle Information in Relationen gespeichert. Relationen sind erst mal nur Mengen von Tupeln, deswegen können auf ihnen sämtliche Mengenoperationen durchgeführt werden. Diese Operationen bekommen im Kontext der Datenbankandwendung eine bestimmte Semantik. 1.4.3 Bei welchen Operatoren muss man Duplikate eliminieren? Wie sieht die allgemeine Syntax einer SQL-Anfrage aus? select A1 , . . . , An from R1 , . . . , Rk where P ; Bei Projektion (Π) und Vereinigung (∪). 1.4.4 Was ist eine Relation? 11 Wie kann man Anfragen optimieren? Anfrage können optimiert werden indem die entstehende Zwischenergebnisse möglichst klein gehalten werden. D. h. man versucht das unvermeidliche Kreuzprodukt möglichst spät zu machen und es dadurch möglichst klein zu halten. Eine Relation ist eine Teilmenge des Kreuzprodukts mehrerer Mengen. Im relationalen Modell werden Relationen meist als Tabellen dargestellt. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs create table Angestellte ( PersNr . . . Name . . . ); create view Professoren as select ∗ from Angestellte a, ProfDaten d where a.PersNr = d.PersNr; Äusserer Join: Die Tupel beider Argumentrelationen bleiben in jedem Fall erhalten. 1.3.10 Obertypen als Sichten create table AssiDaten ( PersNr . . . Boss . . . ); Linker äusserer Join: Die Tupel der linken Argumentrelation bleiben in jedem Fall erhalten. 1.3.9 Untertypen als Sichten create table ProfDaten ( PersNr . . . Rang . . . Raum . . . ); R 1θ S = σθ (R × S) 1.3.8 nachbauen? Untertypen als Sicht: Hierbei werden die Untertypen ausschliesslich als Sichten angelegt. Die Anfragen müssen über recht komplizierte Joins aufgelöst werden. Obertypen als Sicht: Die Obertypen werden als Sichten angelegt, die ihre Ergebnisse durch Vereinigung von Anfragen an die Untertypen, berechnen. Welche verschiedenen Join-Arten gibt es? RoS =SnR Generalisierung kann in SQL durch Sichten imitiert werden. Zum Beispiel möchte man die Spezialisierung von Angestellte auf Professoren und Assistenten darstellen. Dabei bestehen zwei Möglichkeiten: 12 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 1.5. Datenintegrität 1.5 Datenintegrität 1.5.1 Was sind Integritätsbedingungen? Kapitel 1. Datenbanksysteme Normalformen dienen dazu die Güte eines Relationenschemas zu bewerten. Es gibt folgende Normalformen: 1NF : Eine Relation ist in erster Normalform wenn alle Attribute atomare Wertebereiche haben. Man unterscheidet zwischen statischen und dynamischen Integritätsbedingungen. Statische Bedingungen müssen von jedem Zustand der Datenbank erfüllt sein. Dynamische Bedingungen müssen an Zustandsübergänge sichergestellt werden. Integritätsbedingung sind: 2NF : Eine Relation ist in zweiter Normalform wenn alle Nicht-Schlüssel-Attribute voll funktional abhängig von allen Kandidatenschlüssel sind. 3NF : Die dritte Normalform ist verletzt wenn eine Nicht-Schlüssel-Attribut von einem anderen Nicht-Schlüssel-Attribut abhängig ist. Eine Relation R ist in dritter Normalform, wenn für jede für R geltende funktionale Abhängigkeit der Form α → B mit α ⊆ R und B ∈ R mindestens eine der drei Bedingungen gilt: Schlüsseldefinitionen, keine zwei Tupel mit gleichem Schlüssel dürfen existieren. Kardinalitäten werden bei dem Übergang ins relationale Modell fest eingebaut. Referentielle Integrität (keine Dangling References) B ∈ α, d. h. die funktionale Abhängigkeit ist trivial Das Attribut B ist in einem Kandidatenschlüssel von R enthalten – also B ist prim. α ist Superschlüssel von R. 1.6 Entwurfstheorie (Normalformen) 1.6.1 Geben Sie ein Beispiel für eine Relation, die in 2NF aber nicht in 3NF ist. BCNF : Eine Relation R ist in Boyce-Codd Normalform wenn für jede für R geltende funktionale Abhängigkeit α → β eine der folgenden Bedingung gilt: Ein Verlag speichert alle seine Bücher in der abgebildeten Relation. Diese Relation ist in 2NF da alle nicht Schlüssel-Attribute voll funktional abhängig vom Schlüssel ArtNr sind. Sie ist aber nicht in 3NF da die Nicht-Schlüssel-Attribute Titel und Autor abhängig vom Nicht-Schlüssel-Attribut ISBN sind. ArtNr Titel Autor Was ist 4NF : Eine Relation R mit einer zugeordneten Menge D von funktionalen und mehrwertigen Abhängigkeiten ist in vierter Normalform, wenn für jede mehrwertige Abhängigkeit α →→ β ∈ D + eine der folgenden Bedingungen gilt. ISBN Achtung! In der wirklichen Welt ist diese Relation allerdings schon in 3NF. Es gibt nicht für alle Bücher eine ISBN, deshalb existiert die funktionale Abhängigkeit {ISBN} → {Titel, Autor} nicht. 1.6.2 β ⊆ α, d. h. die funktionale Abhängigkeit ist trivial. α ist Superschlüssel von R. Die mehrwertige Abhängigkeit ist trivial. α ist Superschlüssel von R. 1.6.6 Der folgende Algorithmus zerlegt ein Relationenschema R mit funktionalen Abhängigkeiten F so in Relationenschemata R1 , . . . , Rn , dass folgende Kriterien erfüllt sind. funktionale Abhängigkeit? Zwei Attributteilmengen α und β von R sind funktional abhängig wenn gilt: Für alle Paare von Tupeln r, t ∈ R mit r.α = t.α gilt auch r.β = t.β. Wenn also eine funktionale Abhängigkeit α → β besteht, müssen für alle Tupel, die in allen Attributen von α gleich sind, auch alle Attribute in β gleich sein. 1.6.3 R1 , . . . , Rn ist eine verlustlose Zerlegung von R. Die Zerlegung ist abhängigkeitsbewahrend. Alle Ri sind in dritter Normalform. Was ist ’volle funktionale Abhängigkeit? Algorithmus: Die Definition der vollen funktionale Abhängigkeit benötigt man um Schlüssel von Superschlüsseln abzugrenzen. β ist voll funktional abhängig von α wenn gilt: 1. Bestimme die kanonische Überdeckung Fc zu F . Das geht so: a) b) c) d) 1. α → β, d. h. β ist funktional abhängig von α und 2. α kann nicht mehr verkleinert werden, d. h. ∀A ∈ α : α − {A} 6→ β Kreiere eine Relationenschema Ra := α ∪ β Ordne Ra die funktionalen Abhängigkeiten. Fα := {a0 → β 0 ∈ Fc | α0 ∪ β 0 ⊆ Ra } zu. 3. Falls eines der in Schritt 2 erzeugten Schemata Ra einen Kandidatenschlüssel von R bzgl Fc enthält, sind wir fertig. Ansonsten wähle einen Kandidatenschlüssel κ ⊆ R aus und definiere folgendes zusätzliche Schema: • α → β. Wann ist eine funktionale Abhängigkeit trivial? Rκ := κ Fκ := ∅ Triviale funktionale Abhängigkeiten sind Abhängigkeiten die automatische erfüllt sind. Nur Abhängigkeiten der Form α→β mit β⊆α 4. Eliminiere diejenigen Schemata Ra , die in einem anderen Relationenschema Ra0 enthalten sind, d. h. sind trivial. 1.6.5 Ra ⊆ R a0 Was sind Normalformen? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Linksreduktion der funktionalen Abhängigkeiten Rechtsreduktion der funktionalen Abhängigkeiten Entfernung funktionaler Abhängigkeiten der Form α → ∅ Zusammenfassung funktionaler Abhängigkeit mit gleichen linken Seiten 2. Für jede funktionale Abhängigkeit α → β ∈ Fc : Man kann also kein Attribut aus α entfernen ohne die funktionale Abhängigkeit zu zerstören. Wenn β voll funktional abhängig ist von α schreibt man 1.6.4 Erläutern Sie den Algorithmus zur Zerlegung in 3NF und führen Sie ihn an einem Beispiel vor. 1.6.7 13 14 Warum bringt man Relationen in Normalformen? http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 1.7. Transaktionen Kapitel 1. Datenbanksysteme Bei schlechten Relationenschemata kann es zu folgenden Anomalien kommen Updateanomalie Wenn Informationen redundant gespeichert werden, müssen sie bei einer Änderung an alle Stellen geändert werden. Wenn dies nicht geschieht, treten Problem auf. Selbst wenn dies sichergestellt wird, kostet es Speicherplatz und Performance. Einfügeanomalie Wenn in einem Entwurf Informationen zweier Entitytypen vermischt werden, so ergeben sich Problem wenn man nur eine der Entitäten anlegen will. Die anderen Werte müssen dann mit NULL-Werten aufgefüllt werden. Durability: Die Wirkung einer erfolgreich abgeschlossenen Transaktion muss dauerhaft in der Datenbasis festgeschrieben werden. Die bereits ausgeführten Teile einer abgebrochenen Transaktion müssen vollständig rückgängig gemacht werden. 1.7.4 Probleme beim Einbenutzerbetrieb: Das DBMS kann abstürzen. Die Recovery muss dafür sorgen, den ursprünglichen Zustand wieder herzustellen. Löschanomalie Wen Information bzgl. eines der beiden vermischten Entitytypen gelöscht werden kommt es zum Verlust von Informationen bzgl. des anderen Typen. Am Ende einer Transaktion zeigt sich, dass Konsistenzbedingungen verletzt werden. Bisher durchgeführt Operationen müssen Rückgängig gemacht werden. Alle diese Anomalien sind darauf zurückzuführen, dass nicht zusammenpassende Information in einer Relation gespeichert werden. Normalisierung soll das verhindern. 1.6.8 1.6.9 Probleme beim unkontrollierten Mehrbenutzerbetrieb: Ist die Zerteilung (3NF) verlustlos und abhängigkeitsbewahrend? Lost update: Durch ungeschickte Verzahnung mehrere Transaktionen können Änderungen verloren gehen. Die Mehrbenutzersynchronisation muss das ausschliessen. Ja. Die Relation R wurde in die Relationen R1 , . . . , Rn zerlegt. Mann kann aber alle Information die in der Ausprägung R enthalten war aus den Ausprägungen R1 , . . . Rn rekonstruieren und für R geltenden funktionalen Abhängigkeiten sind auf R1 , . . . , Rn übertragbar. Dirty read : Durch ungeschickte Verzahnung mehrere Transaktionen liest eine Transaktion Daten, die noch nicht freigegeben wurden. Die Mehrbenutzersynchronisation muss das ausschliessen. Was sind die Phantomproblem: Eine Transaktion liest während ihres Ablaufs bestimmte Daten zweimal. Zwischen dem ersten und zweiten Zugriff fügt eine andere Transaktion ein neues Datum ein, das mit berücksichtigt werden muss. Dadurch unterscheiden sich der erste und der zweite Zugriff, da beim zweiten Zugriff das neu eingefügte Phantom mit gelesen wurde. Die Mehrbenutzersynchronisation muss das ausschliessen. Armstrong-Axiome? Die Armstrong-Axiome sind: Reflexivität: Falls β eine Teilmenge von α ist, dann gilt immer α → β. Insbesondere gilt also immer α → α. Probleme beim kontrollierten Mehrbenutzerbetrieb: Verklemmungen: Mehrere Transaktionen können in einen Deadlock geraten. Verstärkung: Falls α → β gilt, dann gilt auch α ∪ γ → β ∪ γ. Transitivität: Falls α → β und β → γ gilt, dann gilt auch α → γ. Mit den Armstrong-Axiomen kann die Hülle F + einer Menge F von funktionalen Abhängigkeiten bestimmt werden. 1.7 Transaktionen 1.7.1 Was ist eine Transaktion? 1.7.5 1.7.3 Was ist Serialisierbarkeit? Beim Konzept der Serialisierbarkeit werden die Vorzüge der seriellen Ausführung (Isolation) mit den Vorteilen des Mehrbenutzerbetriebs (bessere Auslastung) kombiniert. Eine serialisierbare Ausführung mehrer Transaktionen entspricht einer kontrollierten Verzahnung und zwar so, dass das Ergebnis dem des echten seriellen Ausführens entspricht. 1.7.6 Aus der Sicht des Datenbankbenutzers ist eine Transaktion eine Arbeitseinheit, die eine bestimmte Funktion erfüllt. Aus der Sicht des DBMS ist eine Transaktion eine Folge von Lese-und Schreiboperationen abgeschlossen durch ein abort oder commit. 1.7.2 Welche Probleme gibt es bei der Ausführung von Transaktion und welche Lösungen gibt es? Was ist das Serialisierbarkeitstheorem? Das Serialisierbarkeitstheorem besagt, dass eine Historie H genau dann serialisierbar ist, wenn ihr Serialsierbarkeitsgraph SG(H) azyklisch ist. Eine Serialisierung entspricht einer topologischen Sortierung des Serialsierbarkeitsgraphen. Es gibt keine topologische Sortierung, falls dieser Zyklen enthält. Welche Eigenschaften müssen Transaktionen erfüllen? siehe 1.7.3 1.8 Objektrelationale und objektorientierte Datenbanken Was bedeutet das Akronym ACID? 1.8.1 Was ist eine objektrelationale Datenbank? Das objektrelationale Modell erweitert das relationale Modell wie folgt: Das Akronym steht für die vier wichtigsten Forderungen an Transaktionen Atomicity: Eine Transaktion muss atomar, also ununterbrechbar sein. Entweder werden keine oder alle Änderungen in der Datenbasis festgeschrieben (alles-oder-nichts-Prinzip). Mengenwertige Attribute: Attribute müssen nicht mehr Atomar sein, man erlaubt Mengen als Attribute. Consistency: Eine Transaktion muss bei Beendigung einen konsistenten Zustand hinterlassen, anderenfalls wird sie komplett zurückgenommen. Während der Ausführung der Transaktion können teilweise Konsistenzbedingungen verletzt werden. Typendeklaration: Das objektrelationale Modell erlaubt das erstellen eigener Datentypen. Referenzen: Attribute können direkt Referenzen auf Objekte haben. Dadurch ist man nicht mehr auf Fremdschlüssel angewiesen. Ausserdem können N :M -Beziehungen durch eine Menge von Referenzen aufgelöst werden. Isolation: Nebenläufige Transaktionen dürfen sich nicht gegenseitig beeinflussen. Für eine Transaktion muss es so aussehen, als sei sie die einzige auszuführende Transaktion. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 15 Objektidentität: Voraussetzung für Referenzen ist die eindeutige Identifizierbarkeit von Objekten. 16 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 1.9. Data Warehousing Pfadausdrücke: Wenn Referenzen erlaubt sind, muss die Anfragesprache auch Pfadausdrücke unterstützen. Vererbung Methode: Klassen (bzw. Objekten) können Methoden zugeordnet werden. 1.8.2 Was versteht man unter Objektidentität? Im Gegensatz zu relationalen Modell braucht man beim objektorientierten Modell keine Schlüssel zu verwenden um ein Objekt anzusprechen. Jedes Objekt hat eine systemweit eindeutig Identität, die automatisch generiert wird und sich während der Objektlebenszeit nicht ändert. 1.9 Data Warehousing 1.9.1 Was ist Data Warehousing? Eine Data Warehouse ist eine Datenbank die historische Unternehmensdaten hält, es ist eine OLAPAnwendung (Online Analytical Processing). Der Datenbestand des Data Warehouses wird periodisch mit Informationen aus den operationalen Datenbanken des Unternehmens aufgefrischt. Das Data Warehouse dient der Analyse langfristiger Entwicklungen und daher zur Entscheidungsunterstützung. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 17 Kapitel 2. Compilerbau In der Optimierungsphase. Man unterscheidet zwischen der Optimierung von Zwischencode und der Optimierung von Zielcode. 2.1.4 Was sind Attribute? Attribute beschreiben Eigenschaften von Syntaxknoten. Kapitel 2 2.1.5 Compilerbau Wie funktioniert die Informationsübergabe zwischen Scanner und Parser? Über Tokens. 2.1.6 Was ist ein Token? Ein Token ist eine Folge von Zeichen die bedeutungsmässig zusammengehören. 2.1 Allgemeines 2.1.1 Geben Sie einen Überblick über die Struktur eines Compilers. 2.1.7 Welche Fehler kann das Laufzeitsystem erkennen? Indexüberschreitungen bei Arrays Quellprogramm Cast-Exceptions (OO) Lexikalische Analyse Null-Pointer-Exceptions Token Frontend Syntaxanalyse 2.1.8 Welche Fehler werden nicht gefunden? Syntaxbaum Logische Fehler. Semantische Analyse Zwischencode 2.1.9 Optimierung Beim Bootstrapping wird ein Compiler für eine neue Programmiersprache Schritt für Schritt entworfen. Zuerst wird in Maschinensprache ein Compiler entworfen, der nur eine Teilmenge der Sprache beschert, mit diesem wird dann ein Compiler geschrieben, der schon etwas mehr kann, usw. Zwischencode Backend Codeerzeugung Code lexikalische Analyse: Das Quellprogramm wird mit einem Scanner in eine Folge von Tokens zerlegt. Syntaxanalyse: Aus diesen Token erzeugt der Parser einen Syntaxbaum entsprechende der Syntax der Programmiersprache. semantische Analyse: In der semantischen Analyse wird der Syntaxbaum hinsichtlich semantischer Korrektheit (z. B. Typinformationen) geprüft. Optimierung: In der Optimierungsphase wird der erzeugte Zwischencode optimiert. 2.2 Lexikalische Analyse 2.2.1 Was ist screenen? Entfernung von Leerzeichen, Zeilenumbrüche, Tabstopps, . . . 2.2.2 2.2.3 Welche Fehler werden an welchen Stellen erkannt? 2.2.4 Syntaxfehler : Der Parser erkennt Syntaxfehler. Wie unterscheidet man Literale von Bezeichnern? Durch Sonderzeichen wie Anführungsstriche. semantische Fehler : Semantische Fehler, z. B. Typfehler oder ungültige Methodenparameter werden bei der semantischen Analyse erkannt. 2.2.5 Dürfen Schlüsselwörter auch Bezeichner sein? Es gibt Sprachen, wo dies erlaubt ist, z. B. PL/1. In welchen Phasen finden Optimierungen statt? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was verwendet man zur lexikalischen Analyse? Einen endlichen Automaten. lexikalische Fehler : Lexikalische Fehler, z. B. ungültige Zeichen oder ungültige Bezeichner werden vom Lexer erkannt. 2.1.3 Kann man auch Leerzeichen in den Identifaktoren haben? Ja, z. B. bei Fortran. Codeerzeugung: Aus dem optimierten Zwischencode wird in Maschinencode erzeugt. Der Zielcode kann nochmal optimiert werden. 2.1.2 Was ist Bootstrapping? 19 20 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 2.3. Syntaktische Analyse 2.3 Syntaktische Analyse 2.3.1 Entwerfen Sie einen Top-Down-Parser für folgende Grammatik: Kapitel 2. Compilerbau 2.3.6 → E Um die Linksrekursivität von A zu beseitigen, geht man wie folgt vor: 1. Man teilt alle A-Produktionen in zwei Gruppen auf. rekursiven, in die andere, die nicht-links-rekursiven: E+T | T → T ∗F | F → (E) | id T F Wie kann man Linksrekursionen beseitigen? A A wobei E das Startsymbol ist. 1. Elimination der Links-Rekursivität. Diese Grammatik ist links-rekursiv, dass kann zu Endlosschleifen im Top-Down-Parser führen, daher muss die Links-Rekursivität beseitigt werden: E E0 T T0 F A → β 1 A0 | β2 A0 | . . . | β n A0 wobei A0 eine neue Variable ist. Für A0 werden folgende Produktionen eingefügt. A → α 1 A0 | α2 A0 | . . . | α m A0 | → FT0 → ∗F T 0 | → (E) | id Wichtig ist die -Alternative. Frage 2.3.1 zeigt ein einfaches Beispiel. Diese Vorgehensweise beseitigt nur direkte Links-Rekursionen. Was für Sprachen verwendet man und wieso? 2.3.7 2.3.8 2.3.4 2.3.9 2.3.10 2.3.11 Geben Sie eine Grammatik für arithmetische Ausrücke mit Klammerung, Addition und Multiplikation an. expr expr expr op op folgende semantische Aktionen: NameList.type := Type.type; VarDecl.list := NameList.list; 2.3.12 Was ist eine LALR-Grammatik? 21 → → → → → expr op expr ( expr ) num + ∗ Welche Fehlerbehandlungsstrategien gibt es? panic mode: Nachdem der Parser einen Fehler gefunden hat, überspringt er folgende Tokens bis zu einem ausgezeichneten Synchronisationstoken, z. B. das Semikolon. Eine LALR-Grammatik kann mit einem LALR-Parser erkannt werden. LALR steht für lookahead LR. LALR stellt einen Kompromiss in Sachen Mächtigkeit und Aufwand zwischen SLR und kanonischer LR da. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was bedeutet mehrdeutig und welche Probleme sind damit verbunden? Eine Grammatik ist mehrdeutig wenn es für ein Wort mehrere, verschieden Ableitungsbäume gibt. Programmiersprachen sollten nicht mehrdeutig sein, da mehrere Ableitungsbäume meistens auch verschiedenen Bedeutungen entsprechen. VarDecl↑list = ’var’ NameList↓type↑list ’:’ Type↑type ’;’ 2.3.5 Erzeugt eine kontextsensitive Grammatik auch einen Baum? Nein. Typ 1 Grammatiken erzeugen Ableitungsgraphen. Was ist eine attributierte Grammatik? Attributierte Grammatiken sind formale Beschreibungen von Übersetzungsprozessen und werden zur Spezifikation und zur Generierung von Übersetzern verwendet. Sie beschreiben, wie die Knoten des erzeugten Syntaxbaums mit Attributen ’dekoriert’ werden, die schliesslich das Übersetzungsergebnis darstellen. Zum Beispiel definiert die Produktion Ist LR(k) mächtiger als LR(1)? Nein. Die Sprachklassen LR(1), LR(2), . . . sind alle gleich mächtig. Es sind die Sprachen, die von einem deterministischen Kellerautomaten über Endzustände erkannt werden. LR(0)-Sprachen werden von einem deterministischen Kellerautomaten über den leeren Keller erkannt. Was ist der Unterschied zwischen LL(k) und LR(k) und was ist mächtiger? Ein LR-Parser erkennt, dass für die Ableitung eines Wortes die Produktion A → β angewandt wurde, nachdem er alles gesehen hat, was aus den Symbolen von β abgeleitet wurde – denn zu jedem Symbol aus β liegt der Ableitungsbaum bereits vor (auf dem Stack) – sowie die nächsten k Zeichen der Eingabe. Ein LL-Parser muss die Entscheidung treffen nachdem er nur die ersten k Zeichen des aus β abgeleiteten Wortes gesehen hat. Daher können LR-Grammatiken mehr Sprachen als LL-Grammatiken beschreiben, es gilt L(LL) ⊂ L(LR). Welche Fehler erkennt der Parser? Syntaxfehler. Man verwendet deterministisch kontextfreie Sprachen, da deren Mächtigkeit annähernd ausreichend ist und das Wortproblem in linearer Zeit gelöst werden kann. 2.3.3 Aα1 | Aα2 | . . . | Aαm β 1 | β2 | . . . | β n 2. Dann ersetzt man die ursprüngliche A-Produktionen durch → T E0 → +T E 0 | 2. Recursive Decent Parser in Java. Abschnitt 2.7 zeigt eine Java-Implementierung des Parsers. Für jedes Nicht-Terminal existiert eine Methode. E 0 und T 0 heissen in der Java-Version E1 und E2. Statt Bezeichner erkennt der Parser Ziffern. 2.3.2 → → In die eine Gruppe kommen die links- phrase level : Der Parser ’behebt’ Fehler in dem er Fehlerhafte Token durch gültige ersetzt, also z. B. eine Komma durch ein Semikolon ersetzt. 22 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 2.4. Semantische Analyse Kapitel 2. Compilerbau error productions: Falls die Fehler gut bekannt sind, können eigene Produktion für Fehler definiert werden. 2.3.13 Während der semantischen Analyse kann bereits Vorarbeit für die Codegenerierung geleistet worden sein, so können bereits Adressen für die Variablen errechnet worden sein. Ausserdem besteht die Möglichkeit, den Code nicht direkt auszugeben, sondern in Codeattributen des Syntaxbaumes zu speichern. Der Wurzelknoten enthält dann den ganzen Code. Kann jeder Parser nach der Recursive-Decent-Methode implementiert werden? Nein. Die Recursive-Decent-Methode funktioniert nur bei LL-Grammatiken, diese müssen ausserdem frei von Linksrekursionen sein, sonst kann es zu Endlosschleifen kommen. 2.4 Semantische Analyse 2.4.1 Was passiert bei der semantischen Analyse? 2.5.2 Welche Optimierungsmöglichkeit gibt es bei der Codegenerierung Konstantenfaltung: Konstantenausdrücke können zur Compilezeit berechnet werden. Das ist vor allem wichtig für Verbesserungen, die der Programmierer nicht beeinflussen kann. Beispiel Zugriff auf das Arrayelement a[3]: memory[base + offset(a) + 3 · elemSize] Copy Propagation: Bei Zuweisungen der Form x := y kann in der Folge jedes Vorkommen von x durch y ersetzt werden, solange der Wert von x sich nicht ändert. Überprüfung des Syntaxbaums auf Fehler. Zusätzlich zur kontextfreien Grammatik unterliegen Programmiersprachen noch weiteren, kontextsensitiven Regeln, wie z. B. Bezeichner müssen vor der ersten Verwendung deklariert werden Zuweisungen müssen typkorrekt sein Beim Methodenaufruf müssen Anzahl und Typ der Parameter stimmen 3+5·z x := y z := 3 · n := x Hier kann die Variable x weg optimiert werden: Diese Bedingungen müssen während der semantische Analyse überprüft werden, da der (auf kontextfreie Sprachen beschränkte) Parser dies nicht erledigen kann. Vorbereitung der Codeerzeugung. In der semantischen Analyse kann die Codeerzeugung vorbereitet werden, indem z. B. Adressen für Variablen (lokal) vergeben werden. y := z := 3·n 3+5·z Entfernung von totem Code: Zum Beispiel Zuweisungen an Variablen, die nicht mehr benutzt werden oder Code der in einem Ast eines If-Then-Statements liegt, das nicht erreicht werden kann. Was ist eine Symboltabelle? Auflösung von Schleifeninvarianten: Zuweisungen innerhalb einer Schleife, die nicht vom Schleifenzähler abhängen können aus der Schleife herausgezogen werden. Die Symboltabelle hält für jeden Bezeichner seine Deklarationsinformation. Beim ersten Vorkommen eines Bezeichner wird ein Symboltabelleneintrag angelegt auf den bei späteren Typüberprüfungen zugegriffen werden kann. Symboltabellen werden häufig mit Hashing implementiert. 2.4.3 memory[base + constant] algebraische Vereinfachungen: Teure Operationen durch billige ersetzen, z. B. Division und Multiplikation durch Bit-Shifts. Die semantische Analyse erfüllt zwei Aufgaben: 2.4.2 ⇒ Befehlsanordnung: Befehle sollten nach Möglichkeit so angeordnet sein, dass sie das Pipelining moderner Prozessoren unterstützen. Registervergabe: Variablen sollte so auf Register und Hauptspeicher verteilt sein, dass möglichst selten auf den Hauptspeicher zugegriffen wird. Welche Arten von Attributen gibt es? Es gibt erzeugte Attribute (synthesized): Attribute werden als erzeugt bezeichnet, wenn der Wert eines Attributs an einem Parsebaum Knoten von Attributen der Kinder dieses Knotens abhängt. Erzeugte Attribute können bei einem einzigen Bottom-Up Durchlauf berechnet werden. 2.5.3 Was ist ’Peephole’-Optimierung? Bei der ’Peephole’-Optimierung wird immer nur ein kurzes Stück Code angeschaut und dort verschiedene Optimierungen durchgeführt. Diese kurze Stück ist das ’Peephole’. Typische Anwendungsfelder für ’Peephole’-Optimierung sind: vererbte Attribute (inherited): Der Wert von vererbten Attributen wird aus Attributen des Vaterknotens oder von Geschwisterknoten berechnet. Entfernung redundanter Anweisungen Kontrollfluss-Optimierung 2.4.4 algebraische Vereinfachungen Geben Sie Beispiele für Attribute. Typinformation 2.5.4 Code Wie funktioniert die Registervergabe nach Aho-Johnson? Der Registervergabealgorithmus nach Aho-Johnson arbeitet nach dem Prinzip des dynamischen Programmierens. Deklarationsinformation Adressen bzw. Stackinformation 2.5.5 2.5 Codegenerierung und Optimierung 2.5.1 Welche Rolle spielen Attribute bei der Codegenerierung? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was sind die Ausgangs- und Zieldatenstrukturen? Sowohl Ein- wie Ausgabe der Optimierung ist eine Zwischensprache. Meist verwendet die Zwischensprache einen Drei-Adress-Code der in Tupel gespeichert wird. Diese Zwischensprache ähnelt einer Assemblersprache. 23 24 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 2.6. Übersetzung objektorientierter Sprachen 2.6 Übersetzung objektorientierter Sprachen 2.6.1 Welchen Unterschiede gibt es zwischen Compilern für objektorientierte Sprachen und Compilern für prozeduralen Sprachen? Kapitel 2. Compilerbau 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 Entsprechend der Phasen: lexikalische Analyse: keine Unterschiede. Syntaxanalyse: keine Unterschiede. semantische Analyse: Die Typanalyse wird komplizierter, da die Klassenstruktur (Vererbung) berücksichtigt werden muss. Der Compiler muss überprüfen ob Vererbung, Interface-Implementierung, usw. korrekt programmiert ist. Optimierung: siehe 2.6.2. Codeerzeugung: Bei objektorientierten Programmiersprachen kommt es aufgrund der Polymorphie viel öfter zu Fällen, in denen nicht während der Compilezeit gebunden werden kann (dynamische Bindung). 2.6.2 Was für spezielle Methode zur Optimierung gibt es bei OO-Compilern? Man versucht die Bindungen so gut es geht zur Compile-Zeit zu erledigen, dadurch erspart man sich aufwendiges Methoden suchen. Im einfachsten Falle bindet man nur dynamisch, im kompliziertesten macht man eine komplette Datenflussanalyse und versucht damit die Zahl der dynamischen Bindungen klein zu halten. Dies ist aber zu aufwendig. 2.6.3 Erklären Sie an einem Beispiel nochmal genau den Unterschied zwischen dynamischer und statischer Bindung. Wann bindet Java statisch und wann dynamisch? Das Beispiel macht nochmal alles klar. Es gibt eine Klassenhierarchie mit zwei Klassen, Oberklasse ist Shape, Unterklasse ist Circle. Ausserdem gibt es noch eine Klasse Test mit zwei Methoden die je nach Parameter (Shape oder Circle) einen unterschiedlichen String zurückgeben. 2.7 class Shape { private String name; public String toString(){ return "Shape"; } } class Circle extends Shape { public String toString(){ return "Circle"; } } class Test { public String print(Shape shape) { return "Test: Shape"; } public String print(Circle circle) { return "Test: Circle"; } In Zeile 29–31 wird eine Variable werden drei Variablen deklariert. shape1 und shape2 haben den Typ Shape. circle hat den Typ Circle. Die Variabel shape1 und circle sind jeweils Objekten zugeordnet, die ihrem statischen Typ entsprechen. Der Variablen shape2 ist ein Kreis zugeordnet, somit eine Instanz einer Unterklasse. Wenn man dieses Programm nun laufen lässt erhält man folgende Ausgabe: Dynamische Bindung Shape Circle Circle Statische Bindung Test: Shape Test: Circle Test: Shape Erst mal zu den Ausgabe die die dynamische Bindung betreffen. Die ersten beiden Ausgabe } sind klar, hier wird einfach die toString()Methode der Klassen Shape bzw. Circle aufpublic class DynBind { gerufen. Die dritte Ausgabe ist nun interespublic static void main(String argv[]) { sant. Obwohl die Variable vom statischen Typ Shape ist, wurde offensichtlich die Methode Test test = new Test(); der Klasse Circle aufgerufen. Die Methodenbindung hängt also von der aktuellen Instanz Shape shape1 = new Shape(); Circle circle = new Circle(); ab. Natürlich könnte in diesem einfach Fall Shape shape2 = circle; bereits Compiler die Zusammenhänge erkennen und die Methode statisch binden. Es gibt System.out.println("Dynamische Bindung"); aber viel komplexere Situationen in denen das System.out.println(shape1); tatsächlich nur zur Laufzeit möglich ist oder System.out.println(circle); der Compiler müsste eine sehr aufwendige DaSystem.out.println(shape2); tenflussanalyse machen (und selbst dann geht System.out.println("Statische Bindung"); es nicht immer). Java bindet also die Methoden dynamisch an System.out.println(test.print(shape1)); die Objekte. Der zweite Teil der Ausgabe zeigt, System.out.println(test.print(circle)); dass dies bei den Methodenparametern nicht so System.out.println(test.print(shape2)); } ist. Unabhängig von der Instanz, der die Va} riable zugeordnet ist, wird immer die statische Typdefinition verwendet. Top-Down Parser in Java Dieser Parser arbeitet nicht auf Tokens, die vom Scanner kommen, sondern direkt auf Zeichen. Da in der beschreibenden Grammatik ausserdem -Produktion sind, kommt der Parser nicht mit unbekannten Zeichen zurecht. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 25 26 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 2.7. Top-Down Parser in Java public class TopDownParser { static void nextToken() { lookahead++; } static boolean match(char token) { static char[] input; static int lookahead; static void ntE() throws ParseException { printLA(); System.out.println("E -> T E2"); ntT(); ntE2(); } static void ntE2() throws ParseException { printLA(); System.out.print("E2 ->"); if (match(’+’)) { System.out.println(" + T E2"); ntT(); ntE2(); } else { System.out.println(" e"); } if (lookahead >= input.length) return false; if (token==input[lookahead]) { nextToken(); return true; } else { return false; } } static boolean matchDigit() { if (lookahead >= input.length) return false; if (Character.isDigit(input[lookahead])) { nextToken(); return true; } else { return false; } } static void ntT() throws ParseException { printLA(); System.out.println("T -> F T2"); ntF(); ntT2(); } static void ntT2() throws ParseException { printLA(); System.out.print("T2 ->"); if (match(’*’)) { System.out.println(" * F T2"); ntF(); ntT2(); } else { System.out.println(" e"); } } static void ntF() throws ParseException { printLA(); System.out.print("F ->"); if (match(’(’)) { System.out.println(" ( E )"); ntE(); match(’)’); } else if (matchDigit()) { System.out.println(" digit"); } else throw new ParseException(lookahead); } static void printLA() { System.out.print(lookahead); if (lookahead < input.length) System.out.print ("["+input[lookahead]+"] | "); else System.out.print ("[e] | "); } public static void main(String argv[]) { input = argv[0].toCharArray(); lookahead=0; try { ntE(); System.out.println("k"); } catch (ParseException ex) { System.out.println ("\nParseException at position: " + ex.pos); } } static class ParseException extends Exception { public int pos; public ParseException(int pos){ super("ParseException at position: " + pos); this.pos=pos; } } } } DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 27 Kapitel 3. Software Engineering Zum Beispiel mit UML oder ER-Diagrammen. 3.1.10 In welche Phasen organisiert man ein Softwareprojekt? Softwareentwicklung besteht normalerweise aus diesen fünf Aktivitäten: Kapitel 3 Ermittlung der Anforderungen (Requirements Elicitation). Kunde und Entwickler definieren die Aufgabe des Systems. Das Ergebnis kann eine Beschreibung des Systems in Form von Use Case und Akteuren sein. Es werden funktionale so wie nicht-funktionale Anforderung herausgearbeitet. Software Engineering Analyse (Analysis). Das Ziel der Analyse ist es ein Modell aufzustellen das das System komplett beschreibt und alle Anforderung gerecht wird. Bei diesem Schritt befindet man sich noch komplett in der Problemdomäne. Es gibt natürlich Ausnahmen wie Pseudo-Requirements. Wenn der Kunde fordert, dass in Java implementiert wird, ist das eine Anforderung an die Lösungsdomäne. Grobentwurf (System Design). Die Architektur des Systems wird festgelegt, d. h. Designziele werden definiert und das System in kleinere Subsysteme aufgeteilt. Ausserdem wird die Zuordnung von Software auf Hardware festgelegt. 3.1 Allgemeines 3.1.1 Was sind Komponenten und wie sind sie definiert? 3.1.2 Eine Komponente ist ein physischer und austauschbarer Teil eines Systems der durch eine Schnittstelle spezifiziert ist. Beispiele sind Klassenbibliotheken, Frameworks und Binärprogramme. Feinentwurf (Object Design). Aufgabe dieser Phase ist es die Kluft zwischen dem Grobentwurf und der Implementierung zu schliessen. Ausserdem werden hier Entscheidung bzgl. dem Einsatz von Fertigprodukten getroffen. Das Ergebnis ist ein detailliertes Objekt Modell mit präzisen Beschreibungen für alle Elemente. Was ist in einer Schnittstelle definiert? Implementation. Jetzt wird das Objekt Modell in Code umgesetzt. Unit-Tests sollten hier stattfinden. Test. Integration- und System Tests. Eine Schnittstelle ist ein Übergang zwischen zwei Funktionseinheit mit vereinbarten Regeln für die Übergabe von Daten oder Signalen. 3.1.3 Operation und Wartung 3.1.11 Was wäre den in Java ein Modul und was eine Komponente? Bezüglich der genauen Definition von Subsystem, Paket, Komponente und Modul herrscht alles andere als Einigkeit. UML definiert sie so: Es gibt keine vernünftige Trennung von Modul und Komponente. 3.1.4 3.1.5 Was sind CASE-Tools? Subsystem: Ein Subsystem ist ein Teil eines Gesamtsystems, das nach aussen durch eine Schnittstelle definiert ist und die Struktur und die Zusammenarbeit seiner Einzelteile versteckt. CASE steht für Computer Aided Software Engineering. CASE-Tools sind Programm die den Entwickler bei den verschieden Phasen des Engineerings unterstützen. Darüber hinaus unterstützen CASE-Tools auch Bereiche wie Projektkommunikation, Dokumentation,. . . . Paket: Ein Paket ist eine lose Ansammlung von Modellelementen, das nicht durch eine Schnittstelle definiert sein muss und sein Inneres nicht kapseln muss. UML definiert keine Module, aber das dürfte wohl am ehesten den Komponenten entsprechen. Conquering Complex And Changing System . Wie ist der Aufwand dabei verteilt? Man rechnet Ungefähr 10% für Analyse, 20% für Entwurf, 20% für Implementierung und 50% für Testen und Wartung. 3.1.7 Komponente: Ein Komponente ist eine ausführbare und austauschbare Softwareeinheit mit definierter Schnittstelle und eigener Identität. Um welche Aspekte geht es beim Software-Engineering? Der Titel des Bruegge Buch sagt es: 3.1.6 Nochmal Subsystem, Paket, Komponente? Sie haben ein OO-Modell bis runter zu den Objekten, wie geht es dann weiter? 3.2 UML 3.2.1 Wie definiert man Semantik mit der UML? Mit der OCL können Constraints beschrieben werden. 3.2.2 Jetzt folgt die Implementierungsphase mit anschliessendem Testen. Wenn man eine Software-Architektur mit UML beschreibt, welche Verbindungsrelationen sind da brauchbar? So ziemlich alle Arten von Assoziationen inklusive Aggregation und Kompositionen. 3.1.8 Was ist ein Modul? Module sind physische Container in denen man Klassen und Objekte des logischen Designs definiert. 3.1.9 3.2.3 Die UML ist eine Sprache und Notation zur Spezifikation, Konstruktion, Visualisierung und Dokumentation von Modellen für Softwaresysteme. Wie kann man Daten modellieren? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was ist UML? 29 30 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 3.3. Ermittlung der Anforderungen (Requirements Elicitation) 3.2.4 Welche Diagrammarten gibt es in der UML? Use Case Diagramme Kapitel 3. Software Engineering 3.5 Grobentwurf (System Design) 3.5.1 Was ist eine Software-Architektur? Klassendiagramme Eine Software-Architektur ist die Aufteilung eines Softwaresystems in seine Subsysteme, deren Schnittstellen, die Prozesse und Abhängigkeiten zwischen ihnen, sowie den benötigten Ressourcen. Es ist sozusagen ein Blick aus der Vogelperspektive auf das ganze System. Sequenzdiagramme Aktivitätsdiagramme Kollaborationsdiagramme 3.5.2 Zustandsdiagramme Eine Software-Architektur lässt sich z. B. mit dem 4+1 View Model von Kruchten beschreiben. Diese Modell teilt die Beschreibung in 5 Sichten auf: Verteilungsdiagramme 3.2.5 Vergleiche Sie UML-Klassendiagramme und ER-Diagramme. Logical View : Das Objekt-Modell der Architektur (Grobentwurf). Development View : Diese Sicht bezieht sich auf die tatsächliche Zerlegung des Systems in einzelne Softwaremodule, d. h. die konkrete(n) Zielmaschine(n) werden in diese Betrachtung mit aufgenommen. Entitäten haben keine Methoden Attribute von Entitäten können nur atomar sein Vererbung wird bei ER durch is-a-Beziehung realisiert Process View : Zeigt Nebenläufigkeits- und Synchronisationsaspekte des Systems. Aggregation wird bei ER durch part-of -Beziehung realisiert 3.2.6 Physical View : Beschreibt die Zuordnung von Software auf die Hardware. Deployment View wäre vielleicht ein treffenderer Name. Gibt es bei Klassendiagrammen auch so etwas wie schwache Entitäten? Scenarios: Die Scenarios beziehen sich auf alle Sichten und beschreiben typische Anwendungsfälle des Systems. Schwache Entitäten werden in UML durch Komposition dargestellt. Komposition ist eine strenge Form der Aggregation. Dargestellt wird sie durch eine Linie mit einer ausgefüllten Raute am Ende. 3.5.3 3.3 Ermittlung der Anforderungen (Requirements Elicitation) 3.3.1 Was sind Use Cases? Wie kann man Systeme unterteilen? In Subsysteme. 3.5.4 Ein Use Case (Anwendungsfall) beschreibt eine Menge von Aktivitäten eines Systems aus der Sicht seiner Akteure, die für die Akteure zu einem wahrnehmbaren Ergebnis führen. Ein Anwendungsfall wird stets durch einen Akteur initiiert. Ein Anwendungsfall ist eine komplette, unteilbare Beschreibung. 3.3.2 Wie kann man eine Software-Architektur beschreiben? Was sind nicht-funktionale Anforderungen an die Software? Was ist eine ACL? Eine Access Control List ist mit einem Objekt verknüpft und enthält 2-Tupel (actor, operation) und ordnet damit jedem Benutzer Zugriffsrechte zu. Bei jedem Zugriff wird überprüft, ob der Benutzer für die Operation die entsprechenden Rechte hat. Anschaulich entspricht dies der Gästeliste für eine Party. 3.5.5 Nicht-funktionale Anforderungen beschreiben für den Benutzer wahrnehmbare Aspekte des Systems, die nicht direkt mit dem funktionalen Verhalten des Systems zusammenhängen. Beispiele sind: Was sind Capabilities? Eine Capability verbindet einen Akteur mit einem 2-Tupel (class, operation). Die Zugriffsinformation wird hier bei den Akteuren gespeichert. Anschaulich entspricht dies einer Party mit Einladungen. Performance 3.5.6 Reaktionszeit Welche Phasen hat das System Design? Teilaufgaben des System Designs sind: 3.4 Analyse Festlegung der Designziele 3.4.1 Wie identifiziere ich Use Cases mit Objekten? Zerlegung in Subsysteme Zuordnung von Software auf Hardwarekomponenten Eine Möglichkeit Objekte zu identifizieren ist Natural Language Analysis. Man analysiert die natürlich sprachliche Beschreibung der Use Cases. Dabei kann man nach der Heuristik von Abbott vorgehen. Sie schlägt z. B. folgende Identifikationsregel vor Datenmanagement Zugriffskontrollmechanismen Kontrollfluss. Welche Folgen von Operationen werden durchlaufen? Ist das System Event-Abhängig? Eigenname → Objekt Boundary Conditions. Start- und Stopp des System, Fehlerbehandlung. Substantiv → Klasse Verb → Operation Auxialverb ... 3.5.7 sein → Vererbung DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Neben der Trennung von Komponenten gibt es auch Trennung der Schichten, wozu? Reduzierung der Komplexität und Austauschbarkeit. 31 32 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 3.6. Feinentwurf (Object Design) 3.6 Feinentwurf (Object Design) 3.6.1 Erklären Sie Specification und Implementation Inheritance. Kapitel 3. Software Engineering System Testing. Mit Unit und Integration Testing sucht man Fehler in einzelnen Komponenten und im Zusammenspiel der Komponenten. Nach der Integration testet man mit dem System Testing, ob das System den funktionalen und nicht-funktionalen Anforderungen entspricht. Functional Testing. Das Functional Testing dient der Überprüfung der funktionalen Anforderungen, die im RAD beschrieben sind. Man hält sich an die beschriebenen Use Cases und geht ähnlich wie beim Equivalence oder Boundary Testing vor. Performance Testing. Performance Testing testet das System auf nicht-funktionale Anforderungen, beschrieben in SDD und RAD. Man unterscheidet zwischen: Stress Testing. Testet ob das System mit auf viele gleichzeitige Anfragen korrekt reagiert. Volume Testing. Testest ob das System mit grossen Datenmengen zurecht kommt. Security Testing. Testet die Sicherheit des Systems. Eingesetzt werden Tiger Teams die Versuchen in das System einzubrechen. Timing Testing. Test ob die Reaktionszeitanforderungen eingehalten werden. Recovery Testing. Testet ob sich das System wie gewünscht von Fehlern erholt. Pilot Testing. Beim Pilot oder Field Testing testen eine ausgewählte Gruppe von Benutzer das System ohne dass ihnen bestimmte Testscenarios vorgegeben werden. Man unterscheidet: Alpha Testing. Pilot Test in der Umgebung der Entwicklung. Beta Testing. Pilot Test in der tatsächlichen Zielumgebung. Acceptance Testing. Der Kunde testet ob das System den Anforderungen entspricht. Man unterscheidet: Benchmark Testing. Der Kunde wählt eine Testmenge mit der System getestet wird. Dies kann entweder durch echte Benutzer oder spezielle Test Teams erfolgen. Competitor Testing. Das System wird mit Konkurrenzsystem oder bei Reengineering Projekten mit dem alten System verglichen. Shadow Testing. Das alte und das neue System laufen parallel und die Resultate werden verglichen. Installation Testing. Das System wird in der Zielumgebung installiert und nochmal getestet. Dabei werden viele Test des Functional und Performance Testings wiederholt. Bestimmte Funktionalität die von anderen System des Kunden abhängig ist, kann erst jetzt wirklich getestet werden. Wenn Vererbung nur eingesetzt wird um Code mehrfach zu verwenden, so spricht man von Implementation Inheritance. Wenn Vererbung eingesetzt wird, um durch die Klassen-Subklassen-Hierarchie logisch zu gliedern, spricht man von Specification Inheritance. Implementation Inheritance sollte möglichst vermieden werden, sie kann in vielen Fällen besser durch Delegation ersetzt werden. 3.7 Testen 3.7.1 Was ist ein Regressionstest? Bei jeder Änderung werden alle vorhergehenden Tests wiederholt. 3.7.2 Welche Testverfahren gibt es? Testverfahren lassen sich wie folgt kategorisieren: Unit Testing. Beim Unit Testing werden einzelne Komponenten des Systems getrennt getestet, man unterscheidet zwischen Blackbox Testing. Beim Blackbox Testen testet man Komponenten nur bzgl. ihrer Ein-/Ausgaben. Die Implementierung der Komponenten wird nicht betrachtet. Vorgehensweisen sind: Equivalence Testing. Alle möglichen Eingabe werden in Klassen aufgeteilt. Aus jeder Klasse wird ein Repräsentant ausgewählt mit dem getestet wird. Man geht nun davon aus, dass sich die Komponenten für alle Mitglieder einer Klasse gleich verhält. Für jede Äquivalenzklasse sollten zwei Werte ausgewählt werden, eine typische Eingabe und eine ungültige damit das Fehlerverhalten der Komponente getestet werden kann. Boundary Testing. Boundary Testing is ein Spezialfall von Equivalence Testing. Hier wählt man die Repräsentanten immer so, dass sie an der Grenze zwischen zwei Äquivalenzklassen liegen. Die Idee dabei ist, dass Programmierer Spezialfälle oft stiefmütterlich behandeln. Whitebox Testing. Beim Whitebox Testen schaut man sozusagen in die Komponenten hinein und überprüft deren Implementierung. Eine Möglichkeit ist: Path Testing. Das Path Testing erfordert genaue Kenntnis des Codes der Komponente. Zuerst muss man einen Flussgraphen für die Komponente erstellen, dieser Graph beinhaltet Codeblöcke und Entscheidungen. Dieser kann z. B. als UML Aktivitätsdiagramm dargestellt werden. Jetzt wählt man die Testeingabe so, dass jede Transition des Diagramms mindestens einmal schalten muss. Dies ist aber natürlich immer noch kein Beweis für die Korrektheit, deckt aber normalerweise die meisten Fehler auf. Bei objektorientierten Sprachen wird PathTesting durch Polymorphie und die kürze der Methoden erschwert. State-based Testing. State-based Testing ist eine zustandsorientierte Testmethode speziell für objektorientierte Systeme. 3.7.3 Ca. 40%–50%. 3.7.4 3.7.5 Was ist ein Review? Unter einem Review versteht man die Man unterscheidet: Big-bang Testing. Alle Komponenten wurden zuvor getestet und werden jetzt auf einen Schlag zusammen gesetzt. Der Vorteil ist, dass man keine zusätzlichen Testumgebungen braucht, der Nachteil das die Fehlersuche sehr aufwendig ist. Bottom-Up Testing. Bei einem schichtenorientierten System werden zuerst nur die Komponenten der untersten Schicht zusammengesetzt und getestet, dann die der nächst höheren usw. Auch hier braucht man keine Testumgebungen. Top-Down Testing. Beim Top-Down Testen geht man genau anders herum vor. Der Nachteil ist, dass man Testumgebungen braucht, die die unteren Schichten simulieren. Der Vorteil ist, dass man mit dem Test des User Interfaces anfängt. Sandwich Testing. Beim Sandwich Testing geht man gleichzeitig von oben und unten vor. 33 Was versteht man unter Black-Box-Testen? siehe 3.7.2. Integration Testing. Nachdem die Komponenten einzeln getestet wurden, muss das Zusammenspiel der Komponenten getestet werden. Dabei gibt es wieder verschiedene Ansätze: DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie viel Aufwand entfällt für das Testen? händische Analyse des System ohne dieses laufen zu lassen. Walkthrough. Der Entwickler stellt die API, den Code und die Dokumentation dem Review Team vor. Das Team analysiert die Abbildung von der Analyse und des Object Design auf Code bzgl. der Use Cases aus der Analyse Phase und macht entsprechende Vorschläge. Inspection. Bei der Inspection stellt der Entwickler die API dem Review Team vor, er darf aber weder Modelle, Code, Dokumentation, o. ä. vorstellen. Das Review Team prüft dann Code, Dokumentation und auch Kommentare im Code. Diese alles geschieht ohne den Entwickler, der nur bei Unklarheiten herangezogen wird. Code Reviews sind sehr effektiv, so dass in Experiment bis 60%–85% der Fehler gefunden wurden. Sie sind aber auch sehr aufwendig. 34 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 3.8. Projektmanagement 3.7.6 Kapitel 3. Software Engineering Wie geht man bei Verifikation vor? Zum Beispiel gilt für ein Projekt mittlerer Komplexität mit geschätzten 30000 Zeilen Code. Verifikation ist der Beweis der Korrektheit eines Programms. Diese ist nur in bestimmten, kleine Fällen möglich. 3.7.7 PE ≈ TDEV = ≈ Wann testet man? N= Was ist ein Integrationstest? 14 M 135 ≈ 10 14 Man könnte das System also in 14 Monaten mit 10 Programmierern entwickeln. siehe 3.7.2. 3.8 Projektmanagement 3.8.1 Wie kann man ein Projekt aufteilen? 3.9 Vorgehensmodelle 3.9.1 Was ist das V-Modell? Das V-Modell ist eine Erweiterung des Wasserfallmodells. Es enthält direkte Verbindungen zwischen Entwicklungs- und Verifikationsphasen. Man kann ein Projekt in Aktivitäten aufteilen, die wiederum in Tasks aufgeteilt werden. Jeder Task produziert eine Reihe von Work Products und benötigt eine bestimmte Menge an Ressourcen. 3.8.2 2.5 · 1350.35 Für die Anzahl der Entwickler ergibt sich. In allen Phasen, aber hauptsächlich während der Implementierung. 3.7.9 135 MM Damit Testet man in der Analyse Phase? Ja. Man kann Prototypen entwickeln und diese Testen. 3.7.8 3.0 · 301.12 = Was versteht man unter Aufwandsschätzung? Man möchte am Beginn des Projektes den Aufwand den Projektes schätzen. Z. B. in Zeilen von Code oder Anzahl der benötigten Entwickler. 3.8.3 Wie ist der Einfluss der Projektdauer auf die Kosten? Bis zu einem gewissen Punkt (z. B. Deadline) ist der Einfluss der Dauer auf die Kosten proportional. 3.8.4 Beschreiben Sie das Cocomo-Modell. In Abschätzung mit dem Cocomo-Modell läuft in etwa wie folgt ab. 1. Komplexität mit Hilfe des Function-Point-Modells bestimmen. Als Ergebnis erhält die man geschätzte Anzahl Codezeilen in KLOC. 2. Einteilung des Systems in eine drei Klassen Organic (einfach), semi-detached (mittel) und embedded (komplex). 3. Entsprechend der Komplexitätsklasse wird nun aufgrund der Anzahl der Codezeilen der Personalaufwand (Personal Effort) in MM (Man-Month) berechnet. einfach: mittel: komplex: PE = 2.4 · KLOC1.05 PE = 3.0 · KLOC1.12 PE = 3.6 · KLOC1.20 4. Anhand dieses Wertes kann nun die Entwicklungszeit in Monaten bestimmt werden: einfach: mittel: komplex: TDEV = 2.5 · PE0.38 TDEV = 2.5 · PE0.35 TDEV = 2.5 · PE0.32 5. Um die Anzahl der Entwickler N zu bestimmen: N= DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs PE TDEV 35 36 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 3.9. Vorgehensmodelle 3.9.2 Was ist das Spiralmodell? Kapitel 3. Software Engineering 3.9.3 Auch die Weiterentwicklung des Wasserfallmodells durch das flexiblere Spiralmodell bietet benannte und standardisierte Entwicklungsschritte. Diese werden jedoch in einem zyklischen Prozess mehrfach durchlaufen. Das Spiralmodell trägt der Schwierigkeit Rechnung, Anforderungen vorweg zu ermitteln und berücksichtigt den Lernprozess bei der Entwicklung. Ziel ist aber nach wie vor ein fertiges Produkt. Versionen gibt es nur während der Entwicklung. Das wichtigste am Spiralmodell ist, dass es risk-driven ist. Festlegen der Ziele, Lösungsvorschläge, Nebenbedingungen und Einschränkungen Risikoanalye Gibt es bessere Vorgehensmodelle? Es gibt die zyklische Modelle die immer neue Generationen der Software entwickeln, ein Beispiel ist RUP: Beim Rational Unified Process besteht die Entwicklung aus mehreren Zyklen, am Ende eines jeden Zyklus wird dem Kunden ein Produkt geliefert. Jeder dieser Zyklen besteht aus vier Phasen, wobei jede Phase wiederum in 9 Workflows zerlegt ist. Dadurch wird die Entwicklung sozusagen in zwei Dimension aufgeteilt. Die Phasen: Inception. Hier werden Use Case entdeckt und beschrieben, Risiken und Ressourcenverbrauch abgeschätzt. Erarbeitung und Beurteilung von Lösungsvorschlägen, Erkennen und Beseitigen von Risiken Elaboration. Die Ideen werden konkretisiert, ein Architekturprototyp aufgestellt und getestet. Dies ist die wichtigste Phase. Construction. In diese Phase finden die Entwicklungsprozesse statt. Risikoanalye Transition. In diese Phase fällt die Installation. Risikoanalye 3.9.4 Vorgehensmodelle dienen zur Benennung und Ordnung von produktbezogenen Tätigkeiten bei der Softwareentwicklung. Beispiele sind: w urf e alys ent rd Entwickulungs- Validierung plan der Analyse Validierung Integrations- und Verfikation plan des Entwurfs Acceptance Test Planung der nächsten Phase V-Modell Spiralmodell ob fo Wasserfallmodell Feinentwurf RUP Gr er An An un gen ProtoPrototyp 1 typ 2 Prototyp 3 Prototyp 4 Anforderungsplan Was ist ein Vorgehensmodell und welche kennen Sie? Dvorak-Modell Code 3.9.5 Integration & System Test Welche Kritik gibt es am Wasserfallmodell? Im ürsprünglichen Wasserfallmodell werden die Phasen streng sequentiell durchlaufen. Dies entspricht nicht der Realität bei einem Softwareprojekt. Das wird schon daran klar, dass der Wissenserwerb nicht linear abläuft. Eine einzelne Information, auch sehr spät im Entwicklungsprozess, kann alles über den Haufen werfen . Das Wasserfallmodell ist dokumentgesteuert. Entwicklung und Validierung des Produkts der nächsten Stufe Anforderungsermittlung Jede Runde beinhaltet folgende Aktivitäten. Analyse Phase 1 Ziele und Bedingungen festlegen Grobentwurf Lösungen vorschlagen Phase 2 Feinentwurf Risiken erkennen Implementierung Risiken beheben Phase 3 Test Produkt für nächste Runde entwickeln. . . Einsatz und Wartung und testen Phase 4 nächste Phase planen DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 3.9.6 37 38 Vergleichen Sie das Wasserfallmodell mit dem Spiralmodell. http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 3.9. Vorgehensmodelle Jede Runde des Spiralmodells entspricht einer Phase des Wasserfallmodells. Es ermöglicht es flexibler auf Änderungen zu reagieren. Der wichtigste Unterschied zwischen den Modell ist, dass das Spiralmodell risikogesteuert ist. 3.9.7 Steckt in jedem Spiralmodell ein V-Modell? Ja. 3.9.8 Zeichen Sie ein V-Modell auf. Client Acceptance Test Anforderungsermittlung System Test Analyse Integration Test Grobentwurf Unit Test Feinentwurf Implementation 3.9.9 Erklären Sie das Dvorak-Modell. Das Dvorak-Modell erhöht die Flexibilität in dem es in der Entwicklungsphase beliebige Zwischenschritte zulässt. Client Acceptance Test ... ... ... System Test ... Integration Test Anforderungsermittlung Analyse DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Grobentwurf Feinentwurf Implementation Unit Test 39 Kapitel 4. Objektorientierung 4.2 Entwurfsmuster 4.2.1 Was sind Entwurfsmuster? Softwareentwickler haben bei der Analyse grosser Softwaresysteme festgestellt, dass es für ähnliche Problemstellungen gleiche Konfigurationen von Entwurfskomponenten gefunden wurden, d. h. Klassen oder Objekte die eine bestimmte Dienstleistung erbringen. Solche Lösungen lassen sich als Muster beschreiben und benennen und bilden damit die Grundlage für Sammlungen zugehöriger Musterbeschreibungen. Kapitel 4 4.2.2 Objektorientierung 4.1 Allgemeines 4.1.1 Erklären Sie die Merkmale und Konzepte der Objektorientierung. Erklären Sie das Decorator-Pattern. Das Decorator-Pattern erlaubt es die Funktionalität von Objekten zur Laufzeit zu erweitern. Es bietet oft eine flexible Alternative zur Vererbung. 4.2.3 Erklären Sie das Observer-Pattern. Mit dem Observer-Pattern kann eine 1:N Beziehung zwischen Objekten realisiert werden, so dass die N Objekte (Observer) geupdatet werden, wenn das eine Objekt (Subject) seinen Zustand ändert. Dies wird z. B. bei MVC eingesetzt. Bei Java Swing heissen die Observer Listener. OO Sprachen Kapselung von Daten Instantiierung von Klassen Vererbung Polymorphie 4.2.4 Eine Adapterklasse kann man eine andere Klasse Schnittstelle hat. OO Systemmodellierung 4.2.5 Analyse und Design mit OO Beschreibungstechniken Visualisierung einer Abstraktion des Systems Statische und dynamische Sichten 4.1.2 vorschalten, wenn diese nicht die gewünschte Erklären Sie das Facade Pattern. Mit dem Facade Pattern kann man den Zugriff aus ein ganzes Subsystem vereinfachen. Dem Subsystem wird eine Facade-Klasse hinzugefügt, die die ganze Kommunikation mit anderen Subsystemen abwickelt. 4.2.6 Was ist Polymorphie? Erklären Sie das Bridge Pattern. Mit dem Bridge-Pattern kann die Implementierung und die Abstraktion einer Klasse in zwei unterschiedliche Klassenhierarchien aufgeteilt werden. Dadurch können die beiden unabhängig voneinander geändert werden. Polymorphie ist die Eigenschaft einer Variable für Objekte verschiedener Klassen stehen zu können. 4.1.3 Erklären Sie das Adapter Pattern. Was gibt es für Arten von Polymorphie? 4.2.7 Ad-hoc Polymorphie. Überladen von Operatoren. Strukturelle Polymorphie. Ein Variable kann für Objekte verschiedener Klassen stehen, wenn sie eine gemeinsame Oberklasse haben. Erklären Sie das Strategy Pattern. Mit dem Strategy Pattern lassen sich einzelne Algorithmen einer Klasse getrennt austauschen. So kann man z. B. in eine Klasse die Graphen darstellt verschiedene Layoutalgorithmen einhängen. Parametrische Polymorphie. Wird zum Beispiel bei parametrischen Klassen verwendet. 4.2.8 4.1.4 Was sind Vorteile der Polymorphie? Mit dem Visitor-Pattern können Operationen auf Klassen selbst wieder in Klassen gepackt werden. Dadurch können Operationen für Klassen definiert werden ohne das die Klassen selbst geändert werden müssen. Das ist speziell bei generierten Klassen interessant. Das Visitor-Pattern wird häufig bei der semantischen Analysephase im Compilerbau eingesetzt. Vereinfacht die Programmierung. 4.1.5 Was sind Nachteile der Polymorphie? Polymorphie muss oft durch dynamisches Binden gelöst werden, das geht auf die Performance. Oft wird schlechtere Lesbarkeit des Codes als Nachteil angegeben. Das ist Blödsinn. Wenn man statt Polymorphie haufenweise verschachtelte Instance-Of-Abfragen verwendet, wird der Code sicher nicht besser lesbar. 4.1.6 Erklären Sie das Visitor Pattern. 4.2.9 Erklären Sie das Command Pattern. Das Command Pattern ist ein objektorientierter Ersatz für Call-Back-Methode. Es erlaubt einzelne Operationen dynamisch in Objekte einzuhängen. Das Actionkonzept von Java Swing ist eine Anwendung des Command Patterns. Was gibt es für Notationen? Booch-Notation und UML. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 41 42 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 Literaturverzeichnis [Aho et al., 1986] Aho, Alfred V. et al. Compilers: Principles, Techniques and Tools. AddisonWesley, 1986 [Duden Informatik, 1993] Duden Informatik. 2. Aufl. Dudenverlag, 1993 [Bauer & Höllerer, 1998] Bauer, Bernhard; Höllerer Riitta. Übersetzung objektorientierter Programmiersprachen. Springer-Verlag, 1998 [Bruegge & Dutoit, 2000] Buegge, Bernd; Dutoit, Allen H. Object-Oriented Software Engineering: Conquering Complex and Changing Systems. Prentice Hall, 2000 [Gamma et al., 1994] Gamma, Erich et al. Desgin Patterns: Elements of Reusable Object-Oriented Software. Addison-Wesley, 1994 [Oestereich, 2001] Oestereich, Bernd Die UML-Kurzreferenz für die Praxis. Oldenbourg, 2001 [Kemper & Eickler, 1999] Kemper, Alfons; Eickler, André Datenbanksystem: Eine Einführung. Oldenbourg, 1999 [Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl. Hanser, 1999 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 43 Teil II Technische Informatik DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 45 Kapitel 5. Rechnerarchitektur Befehle (Programme) Hauptspeicher Allgemeines 5.1.1 Erläutern Sie das von-Neumann-Konzept. Leitwerk BZ IR SR AC Adressen Rechnerarchitektur 5.1 Daten Programm Daten Kapitel 5 Rechenwerk Daten E/A-Werk Beim von-Neumann-Konzept gelten folgende Prinzipien: 5.1.2 1. Der Computer besteht aus Welche von-Neumann-Einheiten kommunizieren heutzutage miteinander und wie? Der Prozessor ist über den Prozessor-Speicher-Bus mit dem Hauptspeicher verbunden. Auch mit den Peripheriegeräten kommuniziert er über Busse. Die Abbildung zeigt eine typische Bushierarchie. Speicher Rechenwerk Leitwerk Ein-/Ausgabegeräten. Prozessor Heute: Aufspaltung des Speichers in Speicherhierarchie Leitwerk und Rechenwerk formen Zentraleinheit gelegentliche mehrere Rechenwerke im Zentralprozessor Ein-/Ausgabegeräte über Gerätesteuerungen indirekt angeschlossen Verbindungsnetz ist kritischer Teil Secondary Cache Hauptspeicher für langsame Geräte, z.B. Bänder Peripheriebus Prozessor-Speicher-Bus Bussteuerung 2. Die Struktur des Rechners ist unabhängig vom bearbeiteten Problem. Heute: gilt immer noch. Busbrücke für schnelle Geräte, z.B. LAN E/ASchnittstelle Systembus 3. Programm und Daten stehen im selben Speicher und können beide durch die Maschine verändert werden. Heute: Manchmal liegt das Programm in einem Festspeicher, z. B. bei Taschenrechnern, aber in Normalfall wie von-Neumann, aber getrennt in unveränderliche Teile (pure segments) und veränderliche Teile (impure segments). Die Möglichkeiten der Veränderung des Programms wurde durch Sprünge und Adressmodifikation abgelöst. Das ist sicherer und erlaubt Programme als pure segments. 5.1.3 5. Das Programm besteht aus einer Folge von Befehlen, die sequentielle Aufträge beschreiben und in der Aufzeichnungsreihenfolge auszuführen sind. Die Befehle enthalten i. A. nicht die Werte, mit denen gerechnet werden soll, sondern die Adresse der Zellen, wo die Werte liegen. Heute: Heutige Prozessoren bemühen sich mit allen möglichen Tricks (Pipelining, look-aheadMechanismen, mehrere Rechenwerke) die Sequentialität zu umgehen. Trotzdem muss das Ergebnis dem der sequentiellen Verarbeitung entsprechen. Gleichzeitige Bearbeitung in mehreren weitgehend unabhängigen Werken: Zentralprozessoren, Rechenwerke, Kanäle, Peripheriegeräte,. . . Automatisch verwaltete Speicherhierarchie. Steuerung nicht durch ein Programm sondern eine Hierarchie von Steuervorgängen. Programmunterbrechung durch interne und externe Signale. 5.1.4 Was für Klassifikationssyteme kennen Sie? 1. Klassifikationssystem von Flynn, klassifiziert nach: 6. Von der Folge kann durch Sprungbefehle abgewichen werden. Die Ausführung eines Sprungs kann von errechneten Werten abhängig gemacht werden. Heute: praktisch unverändert. SI vs MI : ein oder mehrere (durch die Rechnerhardware) gleichzeitige Progamminterpretationen SD vs MD: ein oder mehrere (durch die Rechnerhardware) gleichzeitige Operationen auf Daten 7. Die Maschine benutzt Binärcodes, Zahlen werden dual dargestellt. Heute: praktisch unverändert. Dadurch ergeben sich Kombinationen wie SISD (Standard), SIMD (Vektor-/Feldrechner), MIMD (Multiprozessoren) Abbildung zeigt original von-Neumann-Modell: 47 Wie erweitern heutige Architekturen das von-Neumann-Konzept? Adressmodifikation: die Programmadresse wird zuerst in eine Prozessadresse und dann in eine Maschinenadresse umgesetzt. 4. Der Speicher ist Zellen gleicher Grösse geteilt, die durch fortlaufende Nummern bezeichnet sind. Heute: Gilt noch immer, aber die untypisierten, unstrukturierten Zellen sind Hauptangriffspunkt von von-Neumann-Kritikern. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs E/ASteuerung 48 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.1. Allgemeines Kapitel 5. Rechnerarchitektur 2. Erlangen Classification System (ECS): Rechner werden durch Tripel von Paaren beschrieben (k ∗ k 0 , d∗ d0 , w∗ w0 ). Kollateralität der Programminterpretation: Spielkonsolen PCs und Laptops Servers Mainframes Supercomputer k Zahl der Leitwerke bzw. Prozessoren k 0 Zahl der (hardwareunterstützt) im Pipelining zusammen wirkenden Programminterpretationen Kollateralität der Befehlsausführungen je Programminterpretation: 5.1.7 d Zahl der gleichen Rechenwerke je CPU d0 Zahl der verschiedenen Rechenwerke je CPU MIPS (Million Instructions per Second ) und FLOPS (Million Floating Point Operations per Second ) sind Durchsatzkenngrössen. SPEC-Werte sind die Ergebnisse der standardisierten SPEC-Benchmarks. MIPS- und FLOPS-Werte werden häufig falsch interpretiert. Vergleiche zwischen Rechnern aufgrund dieser Werte sind irreführend, wenn diese unterschiedliche Befehlssätze oder Hardwareunterstützung für Gleitpunktoperationen haben. Eine RISC-System hat meist einen höheren MIPS-Wert als ein CISCWert, das sagt aber noch überhaupt nichts aus, da die Mächtigkeit der Befehle sehr unterschiedlich ist. Ein weiteres Problem ist, dass die Werte insofern keine verlässlichen Aussagen machen, da sich moderne Prozessoren sich in wirklichen Einsatz die meiste Zeit mit Pipelinekonflikten und dem Warten auf den Speicher beschäftigen und nicht mit Gleitpunktberechnungen. Kollateralität in Ausführung eines Befehls w Operandenwortlänge w0 Zahl der Pipelinestufen Beispiele: Intel 8085 Multirechner aus 128 Intel 80386 Cray.1 Vektorrechner 5.1.5 (1∗ 1, 1∗ 1, 8∗ 1) (128∗ 1, 1∗ 1, 32∗ 1) (1∗ 1, 1∗ 12, 64∗ 14) SPEC-Werte haben einen eine deutlich höhere Aussagekraft, da durch Standardisierung und Mittelung das erste Problem beseitigt ist. Rechensysteme lassen sich damit tatsächlich vergleichen. Aber nur bzgl. ihrer SPEC-Werte. Der SPEC-Benchmark ist synthetisch und es ist nicht gesagt, dass die erzielten Werten etwas über die Leistungsfähigkeit eines Systems bei seiner realen Aufgabe aussagen. Was ist SPEC? Die Standard Performance Evaluation Corporation (SPEC) unterhält als Dachorganisation diverse Unterabteilungen, die sich mit Grafik (GPC) oder High Performance Computing (HPC) beschäftigen und nicht zuletzt gibt es die Open System Group OSG, die für Komponenten und Systeme im Workstationund Multiuser-Serverbetrieb zuständig ist. Diese OSG hat diverse Benchmarks entwickelt beziehungsweise zusammengestellt, zum Beispiel für Web-Server (SPEC WEB99), Mail-Server (SPEC MAIL2001), Java Virtual Maschines (SPEC JVM98), Java Business (SPEC JBB2000) – aber am bekanntesten ist ihre CPU-Benchmark-Suite SPEC CPU2000. 5.1.8 Zeit. Die Verweilzeit ist die Zeit, die ein Auftrag insgesamt im System verbringt. Die Verweilzeit setzt sich zusammen aus Wartezeit und Bedienzeit. Die Verweilzeit wird auch als Verzögerung, Antwortzeit oder Latenz bezeichnet. Die Zeiten sind meist stochastische Grössen, im Allgemeinen interessiert aber nur der Erwartungswert. Beispiele sind: Befehlsausführungszeit (CPI), Speicherzugriffszeit, Laufzeit eines Programmes, Verzögerung einer Nachricht in einem Netz. Durchsatz. Der Durchsatz ist definiert als die Anzahl der pro Zeiteinheiten bedienten Aufträge. Der maximale Durchsatz heisst Grenzdurchsatz. In den meisten Fällen sind die Antwortzeiten für System, die in der Nähe des Grenzdurchsatzes operieren, sehr hoch. Deshalb interessiert meist der maximal erzielbare Durchsatz, so dass eine obere Schranke für die Verweilzeit nicht überschritten wird. Das nennt man Usable Capacity. Die Verlustrate ist die Anzahl von Aufträgen, die pro Zeiteinheit verloren geht. Beispiele sind: MIPS und FLOPS eines Prozessors, Bit/s auf einem Bus oder Netz, ausgeführte Jobs pro Stunde, Zellverlustrate bei ATM. Auslastung. Unter der Auslastung eines System versteht man das Verhältnis von tatsächlich erreichtem Durchsatz zum Grenzdurchsatz, dies wird manchmal auch als Effizienz bezeichnet. Bei einem zusammengesetzten System, stellt das System mit der höchsten Auslastung den Bottleneck dar. Die Suite besteht aus zwei Teilen, dem Gleitkommabereich (SPECfp), der eine Fülle wissenschaftlicher Software umfasst und überwiegend in Fortran kodiert ist, und dem Integer-dominierten Bereich (SPECint), kodiert in C/C++. SPECint enthält auch viele typische Desktop-Aufgaben, etwa Komprimierung (gzip und bzip2), Kompilation mit gcc, auch ein Schachspiel (crafty) oder Sprachanalyse (parser). SPECint spiegelt damit wesentlich mehr die normale Desktop-Anforderung wider und eignet sich daher eher für ein Speed rating von Desktop-Prozessoren. Das gleiche gilt für Server, für die Gleitkommaleistung eher nebensächlich ist. Auch hier zählt vor allem der SPECint-Wert. Zwei verschiedene Messverfahren erlaubt die SPEC in ihren restriktiven Runrules. Bei Base muss jede der beiden Einzelsuites mit einem Compiler und einem gemeinsamen Satz von höchstens vier Optimierungsflags verwendet werden, bei Peak darf man für jedes einzelne der insgesamt 26 Programme unterschiedliche Compiler mit beliebigen Flags mischen. Diese Zusammenfassung stammt aus der c’t 21/01. Zur Bewertung der obigen Kenngrössen bietet es sich an das System als einfaches Warteschlangensystem zu modellieren. Deshalb gilt auch der Satz von Little: U = λ · Tr wobei U die mittlere Anzahl der Aufträge im System, λ die Ankunftsrate und Tr die mittlere Verweilzeit bezeichnet. Für jeden der einzelnen Test, 12 bei SPECint und 14 bei SPECfp, wird der sog. SPEC-Ratio berechnet. Der SPEC-Ratio ist der Kehrwert der Laufzeit geteilt durch den Kehrwert einer Referenzlaufzeit. Aus den SPEC-Ratio-Werte wird dann mit dem geometrischen Mittel ein Mittelwert bestimmt, der SPECMark. Zur Bestimmung dieser Kenngrössen gibt es verschiedene Verfahren, die sich in drei Gruppen gliedern lassen. Analytische Modelle und Verfahren. In analytischen Modellen wird das zu bewertenden System in Form von Gleichung beschrieben. Verwendet werden einfache Formeln, Warteschlangenmodelle, Petri-Netze. Speziell bei den Warteschlangenmodellen stehen mächtige Methoden zur Bewertung zu Verfügung. Generell gilt aber, dass der Entwurf von analytischen Modellen mit zunehmender Komplexität der Systeme immer schwieriger bis praktisch unmöglich wird. Kennen Sie noch andere Rechner ausser Workstations? Taschenrechner PDAs DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was kann man bei Rechnern bewerten und was für Methoden gibt es dafür? Die bei Rechnern zu bewertenden Kenngrössen lassen sich in drei Bereich aufteilen. Aber nicht nur in der multikulturellen Zusammensetzung des Benchmark-Komitees, sondern auch in vielen anderen Punkten unterscheidet sich der CPU2000-Benchmark der SPEC von normalen Benchmarks. Insbesondere liegt die Suite als Source (C, C++, Fortran) vor, sodass man weiß, was der Benchmark so treibt und es der Tester durch die Wahl der Compiler und Optimierungsflags in der Hand hat, ob der Benchmark mehr altbacken arbeiten oder das Potenzial der modernen Prozessoren mit all ihren neuen Funktionseinheiten voll ausschöpfen soll. 5.1.6 Welche Bedeutung haben Angaben wie SPEC-Werte, MIPS oder MFLOPS? 49 50 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.1. Allgemeines Kapitel 5. Rechnerarchitektur Simulation. Bei der Simulation werden Struktur und Verhalten des Systems in einem geeigneten Abstraktionsgrad mit in einem ausführbaren Rechnermodell nachgebildet. Man unterscheidet zwischen stochastischer und deterministischer Simulation. Bei der stochastischen Simulation werden die Modelle mit zufälligen Daten gefüttert. Bei der deterministischen Simulation verwendet man Daten die aus Experimenten mit realen System gewonnen wurden. Messung. Eine weitere Methode ist, Messungen an existierenden System durchzuführen. Man unterscheidet zwischen Monitoring und Benchmarking. Monitoring dient dazu interessante Ereignisse, Operationen und Zustände von Systemen aufzuzeichnen. Ziel ist es das Verhalten des Systems zu verstehen und Engpässe zu identifizieren. Ausserdem können Werte gewonnen werden, die bei den deterministischen Simulationen eingesetzt werden. Benchmarking wird in 5.1.9 genauer beschrieben. gibt den zu erwartenden Bruchteil der Zeit an, den das System zur Verfügung steht. Zum Reparieren des System braucht man eine durchschnittliche Zeit MTR, den Kehrwert davon bezeichnet man als Reparaturrate und nennt ihn µ. Wenn ein System eine konstante Ausfallrate und eine konstante Reparaturrate hat, dann gilt für die Verfügbarkeit: A= MTF µ = λ+µ MTR + MTF 5.2 Zentralprozessoren 5.2.1 Wie sieht der Maschinenbefehlszyklus aus? Validierung. Wichtig ist eine fundierte Validierung der Modelle. 1. Befehlsholphase (BH ). Nächsten Befehl ins Instruktionsregister laden. 2. Decodierungsphase (DE ). Interpretation des Maschinenbefehls. 5.1.9 Was ist Benchmarking? 3. Operandenholphase (OP ). Den ALUs die Operanden zur Verfügung stellen. 4. Ausführungsphase (AU ). Befehl ausführen. Benchmarks sind standardisierte Messprogramme zur Ermittlung der Rechnerleistung. Es wird nicht nur die Leistung der Hardware, sondern des Gesamtsystems gemessen. D. h. Compiler und Betriebssystem werden mit bewertet. Es gibt Benchmarks die im Quellcode vorliegen und sog. Paper-and-Pencil Benchmarks. Bei diesen ist nur die Aufgabe spezifiziert, die Lösung muss selbst implementiert werden. Man unterscheidet zwischen synthetischen und natürlichen Benchmarks. 5. Rückschreibephase (RS ). Ergebnis in Register oder Speicher ablegen. 6. Adressierungsphase (AD). Befehlszähler fort schalten, evtl. Springen. Der klassische Maschinenbefehlszyklus von RISC-Maschinen sieht so aus: Synthetische Benchmarks. Man benutzt Bausteine, die jeweils eine gewünschte Teilbelastung erzeugen und im Hinblick auf die Gesamtleistung zu einem Benchmark komponiert werden. Beispiele sind Whetstone und SPEC (siehe 5.1.5). 1. Instruction Fetch. Nächsten Befehl holen und Befehlszähler fort schalten. 2. Instruction decode/register fetch. Befehl dekodieren und Register lesen. Bei Verzweigungsbefehle kann bereits in dieser Phase das eventuelle Sprungziel bestimmt werden. Natürliche Benchmarks. Bei natürlichen Benchmarks benutzt man als repräsentativ angesehene echte Programme zur Leistungsmessung. Beispiele sind Benchmarks die z. B. PCs mit Windows und typischen Office-Anwendungen testen. 5.1.10 3. Execution/effective address. In Abhängigkeit vom Befehl führt die ALU eine der drei Funktionen aus. Memory reference. Die ALU berechnet Prozessadresse mit Basisregister und Offset. Register-Register ALU Instruction. Die ALU führt die entsprechende Berechnung durch, verwendet werden die aus den Register geladenen Wert. Register-Immediate ALU Instruction. Die ALU führt die entsprechende Berechnung durch. Definieren Sie die Begriffe Zuverlässigkeit und Verfügbarkeit. Unter der Zuverlässigkeit R(t) versteht man die Wahrscheinlichkeit eine Systems das Zeitintervall [0, t] zu überleben, unter der Voraussetzung, dass es zum Zeitpunkt t = 0 funktionsfähig war. Da das System zu Beginn des Zeitintervalls funktionsfähig ist, gilt R(0) = 1. Ausserdem geht man davon aus, dass das System irgendwann ausfällt. lim R(t) = 0 4. Memory Access. Falls es sich um einen Load/Store-Befehle handelt, wird hier der Speicher geschrieben, bzw. gelesen. 5. Write Back. Ergebnisse der Berechnung oder des Loads werden in die Register zurückgeschrieben. t→∞ Die Ausfallrate wird mit λ(t) bezeichnet: 5.2.2 λ(t) = − dR(t) /R(t) dt CISC-Architekturen haben folgende Eigenschaften: Umfangreiche Befehlssätze mit einigen hundert Befehle, die Teilweise komplizierte Aufgaben lösen Wenn man von einer konstanten Ausfallrate ausgeht, so gilt für die Zuverlässigkeit: viele Adressierungsarten mit Register-, Speicher- und Keller-Zugriffsarten und Adressrechnung in Maschinenbefehlen R(t) = e−λt Familienkonzept bei aufwärtskompatiblen Prozessoren mit grossen Leistungsunterschieden Die mittlere Zeit bis zu einem Fehler (MTF) berechnet sich dann so: Z ∞ 1 R(t) dt = MTF = λ t=0 Nutzung von Mikroprogrammierung für das Leitwerk Trennung von Befehlssatz, Implementierung und Realisierung Befehlssätze sind möglichst speichersparend entworfen, hauptsächlich durch uneinheitliches Befehlsformat Die Annahme, dass λ konstant ist, gilt für technische Systeme im Normalbereich, d. h. Frühausfälle hat es bereits hinter sich gelassen und Spätausfälle noch nicht erreicht. Im Gegensatz dazu zeichnen sich RISC-Architekturen durch folgende Eigenschaften aus. Bei der Zuverlässigkeit unterscheidet man nur zwischen den Zuständen läuft (1) und läuft nicht (0). Bei reparierbaren System interessiert weiterhin der Begriff der Verfügbarkeit. Die Verfügbarkeit A(t) ist Wahrscheinlichkeit, dass das System zu einem Zeitpunkt t in einem funktionierenden Zustand angetroffen wird. Die stationäre Verfügbarkeit elementare, kleine Befehlssätze, deren Operandenhol- und Ausführungsphase in je einem Takt durchführbar ist Verzicht auf Adressierungsarten und Adressrechnung in der Operandenholphase A = lim A(t) Operanden ausschliesslich in Registern (Load-Store-Architektur ) und grosse, universelle Registersätze t→∞ DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was ist der Unterschied zwischen RISC und CISC? 51 52 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.2. Zentralprozessoren Kapitel 5. Rechnerarchitektur Nutzung von Pipelining 4. Ausführungsphase. Zu Beginn der 80er ging man davon aus, dass nur solche Befehle verwendet werden sollten, die in einem Takt auszuführen waren. Aus Leistungsgründen sind aktuelle Prozessoren von diesem strengen RISC-Prinzip abgewichen. Die Rechenwerke moderner Prozessoren haben meist mehrer ALUs für bestimmte Anwendungen. Die verschiedenen ALUs dürfen, gesteuert durch das Leitwerk, mehrer Befehle gleichzeitig ausführen. Man spricht von superskalaren Rechenwerken. Das Leitwerk muss dafür sorgen, dass die Programmsemantik erhalten bleibt. fest verdrahtete Leitwerke (= keine Mikroprogrammierung) einheitliches Befehlsformat Kooperation von optimierenden Compiler und der Prozessorarchitektur zur Leistungssteigerung 5.2.3 5. Rückschreibephase. Auch die Rückschreibephase wird durch das Load/Store-Prinzip beschleunigt. Es müssen lediglich die von der ALU kommenden Daten in die Register zurückgeschrieben werden. Bei Store-Befehlen kann es passieren, dass auf den Speicher gewartet werden muss, dies kann durch den Einsatz von Caches beschleunigt werden. Zusätzlichen können noch Schreibpapier verwendet werden. Welche Arten von Interrupts gibt es? Interrupts lassen sich nach vielen Kriterien klassifizieren, z. B. Software vs. Hardware, Maskable vs Non-Maskable, Precise vs Imprecise. 5.2.4 6. Adressierungsphase. In der Adressierungsphase müssen die Befehlszähler für die in den verschiedenen Pipelinestufen steckenden Befehle hochgezählt oder bei Sprungbefehlen entsprechend angepasst werden. Wer kann welche Interrupts auslösen? Kommt auf den Interrupt an. Arithmetische Interrupts werden vom Rechenwerk ausgelöst 5.2.6 Was bringt Pipelining? Seitenfehler von der MMU Pipelining bewirkt eine dramatische Performanceverbesserung. Rein theoretisch gilt: Hardwareinterrupts z. B. von der Tastatur ... 5.2.5 Zeit pro Befehl mit Pipelining = Was ist Pipelining? Idee beim Pipelining ist es die Befehle wie am Fliessband abzuarbeiten. Parallelismus in der Ausführung und damit Leistungssteigerung entsteht beim Pipelining dadurch, dass das erste Teilwerk nach Bearbeitung des i-ten Befehls bereits mit dem Befehl i + 1 fortfahren kann. Bedingung ist, dass für alle Phasen des Maschinenzyklusses ein eigenes Werk zur Verfügung steht. Dies würde gelten, wenn die Stufen perfekt balanciert währen, alle Befehl von einander unabhängig währen und es keine Sprünge gebe. 5.2.7 Die Abbildung zeigt eine 6-Stufige Pipeline. Befehl 1 2 3 4 BH DE OP AU BH DE OP BH DE BH Zeit pro Befehl ohne Pipelining Anzahl der Pipelinestufen Wo wird Pipelining angewendet? In allen modernen Prozessoren. RS AU OP DE AD RS AD AU RS AD OP AU RS AD 5.2.8 Was ist RISC? siehe 5.2.2. t Eine Pipeline kann nur effektiv Arbeiten wenn die einzelnen Phasen des Maschinenzyklus in etwa gleich lang dauern. Bei modernen Prozessoren unterscheiden sich die Befehle speziell in der Ausführungsphase oft recht stark, deshalb werden die einzelnen Phasen des Befehlszyklus hier nochmal in mehrere Phasen zerlegt. Um jede Phase des Befehlszyklus’ möglichst in einem Takt auszuführen, werden verschiedene Techniken in den unterschiedlichen Phasen eingesetzt: 5.2.9 Für vernünftige Nutzung des Pipelining-Konzept eignen sich nur RISC-Befehle. Um die Kompatibilität zu gewährleisten werden die nach aussen durch CISC-Befehle versteckt. 5.2.10 1. Befehlsholphase. Die Befehlsholphase kann durch den Einsatz von Caches und weiteren Befehlspuffer die logisch zwischen Cache und dem Instruktionsregister liegen, beschleunigt werden. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 53 Was ist MMX? MMX ist die Intel Multimedia Extension. Das sind zusätzliche Prozessorbefehle die der schnelle Verarbeitung von Multimediadaten dienen. Es handelt sich dabei um SIMD-Befehle, wobei ein Befehl einen ganzen Satz von Daten verändern kann. Für MMX wurden keine neuen Register eingeführt, es werden 64 Bit der 80 Bit FPU-Register verwendet. Daher keine gleichzeitigen FP- und Multimediaberechnungen. Für den MMX-Nachfolger ISSE wurden neue 128 Bit Register eingeführt. 2. Decodierungsphase. Die Beschleunigung der Decodierphase erfolgt hauptsächlich durch Vereinheitlichung und Vereinfachung des Befehlssatzes. Wesentliche Voraussetzung für das einheitliche Befehlsformat ist die ausschliessliche Verwendung von Registeroperanden. Dadurch müssen bei der Dekodierung keine aufwendigen Adressberechnungen vorgenommen werden. 3. Operandenholphase. Bei RISC-Architekuren ist die Operandenholphase sehr einfach, da nur Register als Operanden verwendet werden. Weiter Vereinfachung ergibt sich dadurch, dass keine Statusregister verwendet werden. Auch die Verwendung des Dreiadressprinzips hilft, da das überschreiben von Operanden entfällt. Durch diese und andere Eigenschaften von RISC-Architekturen wird die Operandenholphase so einfach, dass sie zusammen mit der Decodierphase ausgeführt werden kann. Warum arbeiten aktuelle Intel-Prozessoren intern wie RISC stellen aber nach aussen CISC-Befehle zur Verfügung? 5.2.11 Welche Prozessorarchitekturen kennen Sie? Vorsicht: Die folgenden Daten stammen aus vielen unterschiedlichen Quelle, die sich in einigen Punkten auch klar widersprechen, sind also mit grosser Vorsicht zu behandeln. 54 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.2. Zentralprozessoren Hersteller Architektur # Befehle # Pipelines # Pipelinestufen 1st level cache [kb] 2nd level cache [kb] # Register Registerlänge [Bit] max Taktfrequenz [MHz] # Transistoren max SPECint2000 max SPECfp2000 5.2.12 MIPS 10k Alpha 21164 Pentium II Itanium SGI RISC 183 4? 5? 32D / 32I ? ? ? 250 6,8M ? ? Compaq RISC ≈ 200 4 7 / 10 8D / 8I 96 ? 64 600 9,3M 928 (21264-C) 1482 (21364) Intel CISC ≈ 390 1 14 8D / 8I offchip 8 32 2000 7,5M 1130 (Pentium 4) 1103 (Pentium 4) Intel & HP EPIC (RISC/CISC) ? ? 10 16D / 16I 96 > 256 64 1000 25M (ohne Cache) 674 (Itanium 2) 1431 (Itanium 2) 5.2.14 1. Ein Trap-Befehl wird bei der nächsten Befehlsholphase in die Pipeline eingeführt. 2. Für den Befehl, der die Unterbrechung ausgelöst hat und für alle darauf folgenden Befehle, wird Schreibzugriff generell abgeschaltet. Dies gilt nicht für Befehle, die vor dem Unterbrechung auslösenden Befehl liegen. 3. Nach die dem Unterbrechungbehandlungsroutine abgelaufen ist, wird der Befehlszähler wieder auf den unterbrechende Befehl gesetzt. Wenn dieses Vorgehen bei einer Pipeline möglich ist, so spricht man von einer Pipeline mit Precise Interrupts. Für aufwendige Fliesspunktbefehle ist es schwer dieses Verhalten sicher zustellen. Deshalb haben moderne Prozessoren zwei Pipelines (oder zwei Betriebsmodi), die eine ist schnell, hat dafür keine Precise Interrupts, die andere ist langsamer und hat Precise Interrupts. Precise Interrupts sind in der Integerpipeline relativ einfach zu realisieren und werden dort auch realisiert, weil die Integerpipeline zur Implementierung von Virtual Memory nötig ist. Wie viele Pipelinestufen haben moderne Prozessoren? 5.2.15 Warum verwendet man bei modernen Rechner mehrere Pipelines? siehe 5.2.16 und 5.2.14. Welche Probleme können beim Pipelining auftreten? Die Probleme, die beim Pipelining auftreten können, nennt man Fliessbandhemmnisse, sie lassen sich in drei Gruppen aufteilen. Modifikation des Fliessbands durch explizite Ablaufbefehle. Sprungbefehle, Prozeduraufrufe, o. Ä. stellen Fliessbandhemmnisse dar, da von der sequentielle Befehlsfolge abgewichen wird. Das für die Befehlsholphase zuständige Teilwerk kann nicht einfach den nächsten Befehl holen, sondern muss an eine bestimmte Stelle springen. Dies kann bei bedingten Sprüngen auch noch von einer Berechnung abhängig sein. Die übliche Arbeitsweise des Teilwerks muss daher unterbunden werden. Es können keinen neuen Befehle mehr in die Pipeline nachgefüllt werden, bis der neue Befehlszähler zur Verfügung steht. Es gibt mehrere Techniken zur Optimierung. Sprungzielspeicher. Der Sprungzielspeicher ist ein Puffer der die zuletzt angesprungenen Sprungziele speichert. Die Idee ist, dass ein einmal angesprungenes Ziel sehr wahrscheinlich nochmal angesprungen wird, zum Beispiel bei Schleifen. Verzögerter Sprung. Bei dieser Technik wird der auf den Verzweigungsbefehl folgende Befehl vor der Verzweigung ausgeführt. Damit gibt man dem Leitwerk einen zusätzlichen Takt Zeit auf den Sprungzielspeicher oder andere Quelle zuzugreifen. Verzweigungsbefehle die so vorgehen heissen Delay Slot Befehle. Spekulative Ausführung. Bei der spekulative Ausführung werden die Befehle auf einem der beide Pfade der Verzweigung spekulativ ausgeführt. Die erzielten Ergebnisse werden dabei in Schattenregistern gehalten und Notfalls wieder gelöscht. Bedingte Ausführung. Die bedingte Ausführung kann bei Unterscheidungen, die sich nur in einem Maschinenbefehl niederschlagen, angewandt werden. Der Befehl wird nur ausgeführt, wenn die Bedingung war ist, sonst wird er übersprungen. Hierdurch realisiert man Fallunterscheidungen ohne Verzweigungen. Verzögerung in einzelnen Phasen des Fliessbands. Speicherzugriffe können durch Caches und zusätzliche Puffer beschleunigt werden. Datenabhängigkeiten. Fliessbandhemmnisse durch Datenabhängigkeiten können auftreten, wenn der Befehl i + 1 Werte benötigt, die der Befehl i Berechnet. Es kann nur vorkommen, dass der Befehl i seine Rückschreibephase noch nicht abgeschlossen hat und die Daten damit noch nicht verfügbar sind. Dieses Probleme kann durch Bypasses gelöst werden. Die Ergebnisse, die die ALU für den Befehl i berechnet hatte werden über Abkürzungen sofort zur Berechnung des nächsten Befehls verwendet. Diese Bypasses reduzieren die Abkürzungen erheblich führen aber zu sehr komplizierten Datenpfaden. 5.2.16 55 Warum geht es spezielle Pipelines für Festpunkt- und Fliesspunktarithmetik? Wichtig für das Pipelining-Konzept ist, dass die Befehle in etwa gleiche Zeit in den einzelnen Pipelinestufen verbringen. Da Fliesspunktoperation in der Regel deutlich mehr Zeit als Festpunktoperationen benötigen, ergeben sich Probleme bei der Mischung von beiden Befehlen. Eine Möglichkeit ist, sie auf verschiedene Pipelines aufzuteilen. Die Synchronisation zwischen mehreren Pipelines kostest natürlich. Ein anderer Grund sind die Unterbrechungen, siehe 5.2.14. 5.2.17 Wie lang dauert ein RISC-Befehl in etwa? Ursprünglich war es so gedacht, dass ein RISC-Befehl in der Ausführungsphase einen Takt benötigt. Angenommen er braucht in allen Phasen des Maschinenzyklus” einen Takt, so benötigt er bei streng sequentieller Ausführung 5 Takte. Wenn Pipelining perfekt wäre würde er bei einer 5-stufigen Pipeline im Durchschnitt 1 Takt benötigen. Mit geschätztem Overhead sagt man, dass eine Operation ca. 1,2 Takte benötigt. 5.2.18 Was sind Delay-Slot-Befehle? siehe 5.2.13. 5.2.19 Was ist ein Sprungziel-Keller? siehe 5.2.13. 5.2.20 Welche Adressierungsarten gibt es? Es gibt virtuelle und physische Adressierung, für die Umsetzung ist die MMU zuständig. 5.2.21 Kennen Sie Beispiele für unkonventionelle Rechner? Feldrechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, aber k Rechenwerke in regulärer Anordnung. Vektorrechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, ein m-stufiges Rechenwerk nach Pipelineprinzip, in dem m Komponenten von Vektoren in verschiedenen Phasen der gleichen Operation sind. assoziativer Rechner: ein gewöhnlicher Programmspeicher, ein gewöhnliches Leitwerk, alle Daten und Befehle in p Zellen eines assoziativen Speichers, d. h. Auswahl der Zellen nur durch inhaltliche Kriterien, nicht durch Adressen Generell gilt bei allen Problemen, dass die Compiler sehr viel zur Optimierung beitragen können (oder müssen). So können sie z. B. durch geschickte Optimierung der Befehlsreihenfolge Datenabhängigkeit vermeiden. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie verhält sich eine Pipeline bei einer Unterbrechung? Wenn eine Unterbrechung auftritt, führt eine moderne Pipeline folgende Schritt durch. Die Intel P6 Architektur hat 14 Stufen. 5.2.13 Kapitel 5. Rechnerarchitektur 56 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.3. Hauptspeicher und Verkehrswege 5.3 Hauptspeicher und Verkehrswege 5.3.1 Page Faults werden woran erkannt und von wem behandelt? Kapitel 5. Rechnerarchitektur Wenn Hauptspeicherdaten durch DMA Zugriffe verändert werden, liegt eine Dateninkonsistenz vor. Das Problem bei virtueller Adressierung ist das Rückermitteln der virtuellen Adressen aus den physischen Adressen. Virtuelle Caches werden deshalb hauptsächlich bei prozessorinternen Befehls-Caches eingesetzt. Seitenfehler werden von der MMU erkannt, diese löst bei einem Seitenfehler eine Unterbrechung aus, die von einer Unterbrechungsroutine des Betriebssystems behandelt wird. Seiten-Ein- und Auslagerungsstrategien stecken in dieser Routine. 5.3.2 5.3.3 Speicherhierarchie mit Zugriffszeiten aufzählen. Speicher Zugriffszeit (Prozessortakt 2.5 ns) Kapazität Register Primär-Cache Sekundär-Cache Hauptspeicher Plattenspeicher Archivspeicher < 2.5 ns 2.5 - 10 ns 5 - 50 ns 50 - 500 ns 5 - 15 ms > 50 ms 256 - 1024 Bytes 1 - 128 KB 265 KB - 4MB ≤ 4 GB ≤ 200 GB mehrere TB Reale Adressierung. Caches mit physischer Adressierung sind langsamer, da die Adressübersetzung abgewartet werden muss. Dafür sind sie für Inkonsistenzen nicht so anfällig. Zum Beispiel kann die DMA-Einheit, die real adressiert, hier für die Konsistenz sorgen. 5.3.5 Die Organisationsform des Caches legt das Mapping von Hauptspeicher-Blöcken auf Cache-Blöcke und wie ein gewünschter Block im Cache aufzufinden ist (Identifikationsproblem) fest. Die folgenden Organisationsformen sind gebräuchlich. Direkte Abbildung. In einem Cache mit direkter Abbildung und N Blöcken, wird der Hauptspeicherblock B im Cache-Block B mod N gespeichert. Diese Abbildung ist die einfachste, da nur ein Vergleicher benötigt wird. Das Problem ist, dass Cache-Einträge sehr schnell wieder verdrängt werden. Voll assoziative Abbildung. In einem voll assoziativen Cache kann ein Hauptspeicherblock in jedem Cache-Block gespeichert werden. Voll assoziative Caches sind teuer, da man N Vergleicher benötigt. Die Verdrängung ist hier zwar am geringsten, aber sie sind langsam. Was ist Caching? Ein Cache ist ein schneller Pufferspeicher zwischen den Registern und dem Hauptspeicher. Darin sind sowohl Programmteile wie Daten enthalten. Diese können entweder zusammen in einem Unified Cache liegen oder es gibt zwei getrennte Caches (Split Cache). Bei jedem Speicherzugriff des Prozessors testet die Cache Steuerlogik des Caches, ob das Speicherwort im Cache vorliegt (Cache Hit) oder nicht (Cache Miss). Falls es vorliegt wird es direkt vom Cache in den Prozessor übertragen. Falls ein Cache Miss auftritt, wird aus dem Hauptspeicher ein Block von Worten in den Cache übertragen. Hauptspeicher und Cache sind in Blöcken organisiert. n-fach assoziative Abbildung. Bei n-fach assoziative Caches wird der Cache in M = N/n Sätze mit jeweils n Blöcken geteilt. Der Hauptspeicher Block B kann im einem Cache-Block des Satz B mod M gespeichert werden. Wenn n = N ist, wird der Cache voll assoziativ, wenn n = 1 entspricht er einem Cache mit direkter Abbildung. n-fach assoziative Caches bieten die Möglichkeit eine guten Kompromiss zwischen Kosten, Geschwindigkeit und Wirksamkeit zu finden. In der Praxis werden 2,4 und 8-fach assoziative Caches eingesetzt. Wegen der hohen Geschwindigkeit wird der Cache durch Hardware verwaltet, der Zugriff erfolgt transparent. Programmierer, Übersetzer und Betriebssysteme sollten den Cache aber insofern beachten, dass sie Daten und Programm für das Caching optimieren. So wird eine Programmschleife sicherlich deutlich schneller abgearbeitet, wenn sie komplett in den Cache passt. Moderne Systeme haben meistens eine Cache-Hierarchie bestehend aus dem Primary Cache und dem Secondary Cache die sich in Grössen und Geschwindigkeit unterscheiden. Da jedem Cache-Block eine grosse Anzahl an Hauptspeicherblöcken zugeordnet ist, braucht man einen Mechanismus um Hauptspeicherblöcke eindeutig zu identifizieren. Dazu wird pro Cache-Block neben ein paar Verwaltungsbits auch noch eine Kennung gespeichert, die der Hautpspeicheradresse entspricht. 5.3.6 Welche Aktualisierungsstrategien gibt es bei Caches? Wenn Daten im Cache verändert werden, stellt sich die Frage, wann diese Änderungen in den Speicher zurückgeschrieben werden um die Konsistenz zu erhalten. Es gibt zwei Strategien Primary Cache. Der Primary Caches ist auf dem Prozessor-Chip integriert und meist als Split Cache realisiert. Die Cache Blöcke sind meist nicht länger als 32 Bytes und damit in wenigen Zyklen nachladbar. Durchschreiben (Write Through). Durchschreiben bedeutet, dass jede Änderung im Cache sofort auch in den Hauptspeicher geschrieben wird. Dadurch wird die Datenkonsistenz gewährleistet, aber der Prozessor-Speicherbus stark belastet. Primary Caches arbeiten meist nach diesem Prinzip. Secondary Cache. Bis vor kurzem wurde der Secondary Cache ausserhalb des Prozessors realisiert, Prozessoren wie der Pentium III haben ihn aber bereits On Die. Der Secondary Cache ist meist ein Unfied Cache mit Blockgrössen um die 128 Byte. 5.3.4 Was für Cache-Organisationsformen gibt es? Zurückschreiben (Write Back ). Bei Write Back wird der Hauptspeicher erst aktualisiert, wenn ein veränderter Cache-Block verdrängt wird. Dazu muss ein Dirty-Bit verwaltet werden. Secondary Caches arbeiten meist so. Was für Adressierungsmöglichkeiten gibt es bei Caches? Caches können entweder mit realen oder virtuellen Adressen adressiert werden, beides hat Vor- und Nachteile. 5.3.7 Bei Caches wird meist eine LRU-Strategie eingesetzt, wobei aber in den Cache-Blöcken eine Altersinformation gespeichert werden muss. Eine sehr einfach zu implementierende Strategie ist das zufällige auswählen der zu ersetzenden Seite. Diese Strategie liefert überraschend gute Ergebnisse. Virtuelle Adressierung. Der Vorteil virtueller Caches ist, dass sie schneller sind, da Cache-Zugriff und Adressübersetzung durch die MMU können parallel stattfinden. Im Mehrprozessbetrieb werden virtuelle Caches aber einige Probleme auf. Dieselbe virtuelle Adressen von verschiedenen Prozessen kann auf unterschiedliche physische Adresse verweisen, deshalb muss beim Kontextwechsel der Cache gelöscht werden. Unterschiedliche virtuelle Adressen können auf dieselbe physische Adresse verweisen, z. B. bei gemeinsamen Variablen. Um Inkonsistenzen im Cache zu vermeiden sollten gemeinsame Daten nicht gecachet werden. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 57 Welche Ersetzungsstrategien werden bei Caches eingesetzt? 5.3.8 Was fällt Ihnen zum Thema Leistung von Caches ein? Leistungsbetrachtung von Caches orientieren sich meist an der Formel für die mittlere Speicherzugriffszeit Te für eine zweistufige Speicherhierarchie. Te = h · T h + m · T m 58 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.4. Ein-/Ausgabewerk Kapitel 5. Rechnerarchitektur Wobei h und m = 1 − h die Treffer- bzw. Fehlerraten (Hit rate, miss rate) im Cache sind. T h ist die Cache-Zugriffszeit (Hit time) und Tm die Cache-Ladezeit (miss time). Die Zugriffszeit Te kann durch die folgende drei Massnahmen verbessert werden. Optimieren einer Grösse bewirkt meist die Verschlechterung einer anderen Grössen, es gilt einen Kompromiss zu finden. Memory-Mapped I/O. Bei Memory-Mapped-IO werden die Register der Controller in Hauptspeicher eingeblendet. Nun kann auf die Register mit ganz normalen Move-Befehlen zugegriffen werden. Der Vorteil ist, dass man keine speziellen I/O-Befehle benötigt. Ausserdem kann der Zugriff auf Geräte durch die normalen Speicherschutzmechanismen realisiert werden. Auf Maschinenebene können Befehle eingespart werden, da der Wert nicht zwangsweise in ein Register geladen werden muss. Probleme ergeben sich durch das Caching, cachen von gemapten Adressen macht keinen Sinn, daher muss die Hardware dafür sorgen, dass das Caching für diese Adressen ausgeschaltet wird. Bei Memory-Mapped I/O müssen alle Gerätekontroller bei jedem Speicherzugriff aufpassen, ob nicht sie gemeint sind. Das ist kein Problem, solange I/O und Speicher am selben Bus hängen. Gibt es aber einen dedizierten Prozessor-Speicher-Bus, so muss man irgendwie zwischen echten Speicherzugriffen und Zugriffen auf Geräte unterscheiden. Dafür gibt es wiederum verschieden Ansätze. Bei Pentium gehen deshalb Speicherzugriffe durch die PCI-Bridge, die die Unterscheidung macht. Reduktion der Fehlerrate m. Entweder kann der Cache vergrössert oder die Assoziativität erhöht werden. Dadurch wird er teurer und die Cache-Zugriffszeit wird erhöht. Durch grössere Blöcke können Lokalitätseigenschaften besser genutzt werden, dafür wird die Ladezeit grösser. Weitere Möglichkeiten sind der Einsatz eines Victim Cache und Prefetching. Reduktion der Cache-Zugriffszeit Th . Die Cache-Zugriffszeiten für den Primary Cache sind entscheidend für die Prozessortaktrate, Zugriffszeiten auf den Secondary Cache bestimmen die Wartezyklen des Prozessors. Kurze Zugriffszeiten erhält man bei kleinen und einfach organisierten Caches, was den obigen Optimierungen zuwiderläuft. Reduktion der Cache-Ladezeit Tm . Cache-Ladezeiten können durch Einführung einer weiteren Ebene in der Speicherhierarchie verbessert werden. Eine andere Möglichkeit ist die Verwendung von Non-Blocking Caches die Daten an den Prozessor liefern können während sie aus dem Hauptspeicher Daten nachladen. Ausserdem ist Tm massgeblich durch die Geschwindigkeit des Prozessor-SpeicherBusses und die Hauptspeicherzugriffszeiten bestimmt. 5.3.9 Es gibt auch Systeme, z. B. Pentium, die beide Verfahren nutzen. 5.4.2 Was ist DMA? DMA steht für Direct Memory Access und wird benutzt um die CPU bei I/O-Zugriffen zu entlasten. Wenn DM eingesetzt wird, gibt es einen DMA-Controller. Will die CPU Daten von einem Geräte lesen, gibt sie dem DMA-Controller den entsprechenden Auftrag und wendet sich wieder ihrer Arbeit zu. Der DMA-Controller kopiert jetzt eigenständig Daten von dem Gerät in den Hauptspeicher. Dabei können Geräte nicht unterscheiden ob der Zugriff von der CPU oder dem DMA-Controller kommt. Wenn er damit fertig ist, schickt er eine Unterbrechung an die CPU. Damit kann die CPU vom einem Grossteil der I/O-Arbeit entlastet werden. Was beeinflusst den Zugriff auf den Hauptspeicher? Hauptspeicherzugriffszeiten Geschwindigkeiten des Prozessor-Speicher-Busses. Anzahl und Effizienz der Caches 5.3.10 Wie kann man den Zugriff auf den Hauptspeicher beschleunigen? Durch Caching, siehe 5.3.3 5.3.11 Wie verläuft die Kommunikation Prozessor-Hauptspeicher? Über den Prozessor-Speicher-Bus. Zusätzlich werden meist ein oder mehrere Caches dazwischen geschaltet. 5.3.12 Wie funktioniert Busverwaltung? Ein Busmaster muss das Recht erwerben auf dem Bus zu senden. Wenn es nur einen Busmaster gibt, ist die Vergabe einfach. Bei mehreren Mastern muss irgendwie geregelt werden, wer das Recht erhält. Es gibt Verfahren mit einer zentralen Steuereinheit und mit dezentralen Einheiten in den Busmastern. Diese können prioritätengesteuert oder fair sein. 5.3.13 Was ist Daisy-Chaining? Beim Daisy-Chaining wird der Bus sozusagen durch die Geräte hindurchgeführt. Die Daten gehen in ein Geräte hinein, werden dort eventuell verarbeitet, und dann wieder raus zum nächsten Gerät. 5.4 Ein-/Ausgabewerk 5.4.1 Welche Varianten gibt es für E/A-Operationen? Die Gerätekontrolle haben Register über die sie gesteuert und über die Daten ausgelesen werden können. Es gibt zwei Möglichkeiten, wie diese Register angesprochen werden können: I/O-Ports. Hier wird den Registern der Controller eine I/O-Port-Nummer zugeordnet, zusätzlich gibt es spezielle IN/OUT Befehle. So kann z. B. mit IN RX, port der entsprechende Wert in ein CPU-Register geladen werden. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 59 60 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 5.5. SPEC-Werte 5.5 SPEC-Werte CFP2000 Die folgenden Werten stammen von der SPEC-Website (www.spec.org) vom 16.03.2003. Die ersten 5 zeigen bei beiden Benchmarks die Top-5 von diesem Tag, die anderen sind beliebig ausgewählt. Company System Peak Base Processor Published Dell Precision WorkStation 350 (3.06 GHz P4) Intel D850EMVR motherboard (3.06 GHz, Pentium 4 processor with HT Technology) Precision WorkStation 340 (3.06 GHz P4) Precision WorkStation 350 (2.8 GHz P4) Intel D850EMVR motherboard (2.8 GHz, Pentium 4 processor) 1130 1085 Dec-2002 1107 1099 1074 1032 1061 1017 1040 1032 Intel Pentium 4 (533 MHz system bus) Intel Pentium 4 Processor with HT Technology (3.06 GHz, 533 MHz bus) Intel Pentium 4 (533 MHz system bus) Intel Pentium 4 (533 MHz system bus) Pentium 4 processor (2.8 GHz, 533 MHz bus) 905 865 Dell Dell Intel Dell Intel Dell Dell Intel AMD Fujitsu Siemens Dell Compaq HP Company System Peak Base Processor Published HP HP AlphaServer GS1280 7/1150 hp server rx5670 (1000 MHz, Itanium 2) hp server rx2600 (1000 MHz, Itanium 2) hp workstation zx6000 (1000 MHz, Itanium 2) hp AlphaServer ES45 68/1250 1482 1431 1124 1431 Alpha 21364 Intel Itanium 2 Jan-2003 Dec-2002 1427 1427 Intel Itanium 2 Dec-2002 1422 1422 Intel Itanium 2 Dec-2002 1365 1019 Alpha 21264C Nov-2002 1060 1048 Dec-2002 1048 1034 1036 1024 1024 1012 844 843 733 782 Intel Pentium 4 (533 MHz system bus) Pentium 4 processor (2.8 GHz, 533 MHz bus) Intel Pentium 4 (533 MHz system bus) Pentium 4 processor (2.67 GHz, 533 MHz bus) UltraSPARC III Cu AMD Athlon (TM) XP 2800+ Mar-2003 Oct-2002 831 772 AMD Athlon (TM) XP 2700+ Oct-2002 628 618 Aug-2001 May-2001 Oct-2001 HP CINT2000 Intel Kapitel 5. Rechnerarchitektur Precision WorkStation 340 (2.4 GHz P4) Intel D850MD motherboard (2.4 GHz, Pentium 4 processor) Precision WorkStation 340 (2.2 GHz P4) Precision WorkStation 340 (2.0A GHz P4) Intel D850EMV2 motherboard (2.0A GHz, Pentium 4 processor) Gigabyte GA-7DX Motherboard, AMD Athlon (TM) XP 1800+ PRIMEPOWER650 (810MHz) PowerEdge 1500SC (1.26 GHz PIII) AlphaServer GS160 Model 16 68/1001 hp workstation j6700 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 833 819 833 798 759 738 759 756 644 Intel Pentium 4 (533 MHz system bus) Pentium 4 processor (2.4 GHz, 400 MHz bus) Intel Pentium 4 (400 MHz system bus) Intel Pentium 4 HP HP Dec-2002 Dell Intel Dec-2002 Dell Dec-2002 Intel Oct-2002 Sun AMD Sep-2002 Apr-2002 AMD Sep-2002 Feb-2002 Intel Sep-2002 Dell 621 Pentium 4 processor (2.0A GHz, 400 MHz bus) AMD Athlon (TM) XP 1800+ Oct-2001 AMD 624 512 SPARC64 GP Jul-2002 623 621 611 561 Intel Pentium III Alpha 21264C Feb-2002 Jul-2001 603 569 PA-8700 May-2001 61 62 Precision WorkStation 350 (2.8 GHz P4) Intel D850EMVR motherboard (2.8 GHz, Pentium 4 processor) Precision WorkStation 350 (2.66 GHz P4) Intel D850EMVR motherboard (2.67 GHz, Pentium 4 processor) Sun Fire V1280 (900MHz) ASUS A7N8X (REV 1.02) Motherboard, AMD Athlon (TM) XP 2800+ ASUS A7N8X (REV 1.02) Motherboard, AMD Athlon (TM) XP 2700+ Intel D850GB motherboard(1.8 GHz, Pentium 4 processor) Precision WorkStation 330 (1.70 GHz P4) Epox 8KHA+ Motherboard, AMD Athlon (TM) XP 1700+ 607 591 Pentium 4 processor (1.8 GHz, 400 MHz bus) Intel Pentium 4 604 561 AMD Athlon (TM) XP 1700+ Oct-2002 Dec-2002 Oct-2002 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 Kapitel 6. Betriebssysteme Stack Status 6.2.2 Was ist ein Thread? Ein Thread könnte als leichtgewichtiger Prozess bezeichnet werden. Er hat Kapitel 6 Thread of Control Register Betriebssysteme Befehlszähler Stack Status Er hat aber keinen eigenen 6.1 Allgemeines 6.1.1 Was für Arten von Betriebsmitteln gibt es? globale Variablen Betriebsmittel können wie folgt klassifiziert werden. offene Dateien Adressraum Kindprozesse einmalig benutzbar. Druckerpapier, Nachricht wiederholt benutzbar. 6.2.3 parallel benutzbar. Datei mit lesendem Zugriff exklusiv benutzbar, unterbrechbar. CPU exklusiv benutzbar, nicht-unterbrechbar. Drucker Wenn mehrere Prozesse sich eine CPU teilen spricht man von Mehrprogrammbetrieb. 6.2.4 6.1.2 Was ist ein Betriebssystem? Wie kommunizieren Prozesse miteinander? Prozesse können kommunizieren über: Ein Stück Software, das die in 6.1.3 beschriebenen Aufgaben erfüllt. 6.1.3 Was bedeutet Mehrprogrammbetrieb? gemeinsamen Speicher gemeinsame Dateien Was sind die Aufgaben eine Betriebssystems? Nachrichten Veredeln der Hardware (Virtualisierung) Semaphoren Steuerung und Kontrolle der Programmausführung RPC Verwaltung der Betriebsmittel Pipes Anbieten von Diensten in Form von Schnittstellen, so dass die Betriebsmittel genutzt werden können. Mailslots (Windows) Schutz mehrerer gleichzeitig aktiver Benutzer 6.2.5 Was beinhaltet der Prozesskontext? Prozessmanagement Speichermanagement Dateimanagement 6.2 Prozesse und Threads 6.2.1 Was ist ein Prozess? Register Zeiger auf Codesegment Root-Verzeichnis Ein Prozess ist eine Abstraktion eines laufenden Programmes. Mit einem Prozess verbunden sind: Befehlszähler Zeiger auf Datensegment Arbeitsverzeichnis Prozess-Status-Wort Zeiger auf Stacksegment File Handles Thread of Control Adressraum globale Variablen Stackpointer User ID Prozessstatus Gruppen ID Priorität offene Dateien PID Kindprozesse Register Befehlszähler DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 6.2.6 63 64 Welche Zeitscheibenverfahren gibt es? http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.2. Prozesse und Threads Kapitel 6. Betriebssysteme Round-Robin Round-Robin + Prioritäten. In der Praxis wird oft eine Kombination der beiden Schedulingstrategien eingesetzt. Die Prozesse werden in mehrere Kategorien (nach Prioritäten) eingeteilt und in innerhalb dieser Kategorien wird Round-Robin Scheduling gemacht. Das heisst der Scheduler macht solange Round-Robin in der wichtigsten Kategorien bis dort keine Prozesse mehr vorhanden sind, dann nimmt er sich die nächste Kategorie vor. Auch hier sollten die Prioritäten dynamisch angepasst werden, sonst besteht die Gefahr des Verhungerns. Shortest Process Next. Shortest Process Next ist der Versuch die optimalen Verweilzeiten von Shortest Job First in interaktive Systemen zu nutzen. Dazu geht man davon aus, dass interaktive Prozesse immer nach dem Muster Warten auf Befehl, Befehl ausführen, Warten auf Befehl, Befehl ausführen ablaufen. Wenn man die Ausführung eines Befehls als Job betrachtet, kann man die Antwortzeiten minimieren in dem man die kürzesten Befehl zuerst bearbeitet. Um herauszufinden, welcher der kürzeste Befehl ist, wird eine Technik namens Aging eingesetzt. Garantiertes Scheduling. Bei diesem Verfahren werden den Benutzer Garantien wie bei N Benutzern bekommt jeder genau 1/N der Rechenleistung gegeben und diese Versucht einzuhalten. Dies ist schwierig zu implementieren. Lottery. Hier bekommt jeder Prozessor ein Los . Wenn eine Schedulingentscheidung getroffen werden muss, wird eine Losnummer ausgelost. Der Prozess mit der gezogenen Nummer erhält den Prozessor. Um Prioritäten zu realisieren kann bestimmten Prozessen mehr als ein Los gegeben werden und damit ihre Gewinnchancen erhöht werden. Lottery Scheduling bietet einige interessante Möglichkeiten, so können z. B. Prozesse ihre Lose an andere Prozesse verschenken. Ein Client, der unbedingt eine Information von einem Server braucht, könnte seine Lose an den Server verschenken, damit dieser möglichst schnell Rechenzeit bekommt. Fair-Share. Beim Fair-Share Scheduling bezieht der Scheduler zusätzlich Informationen über den Besitzer eines Prozesses in Betracht und achtet darauf, dass alle Benutzer ungefähr gleich viel Rechenzeit erhalten. Round-Robin mit Prioritäten 6.2.7 Welche Möglichkeiten gibt es zur Prozesssynchronisation? Unterbrechungssperre Verdrängungssperre Sperrvariablen algorithmische Lösungen Semaphore Monitore 6.2.8 Was ist ein Scheduler? Der Scheduler ist der Teil des Betriebssystems, der entscheidet, wann welcher Prozess Rechenzeit bekommt. Er folgt einem Scheduling Algorithmus. 6.2.9 Was ist ein Dispatcher? In Multithreadinganwendung gibt es oft einen Dispatchthread. Dieser hat die Aufgabe die Arbeit an andere Threads zu verteilen. 6.2.10 Erzählen Sie etwas zu Scheduling-Strategien. Man muss unterscheiden zwischen Scheduling-Strategien für Echtzeit-Systeme. Schedulingalgorithmen für Real-Time Systeme können entweder statisch oder dynamisch sein. Statische Algorithmen weisen jedem Prozess eine feste Priorität und verwenden dann Prioritätenscheduling. Bei dynamischen Algorithmen können sich die Prioritäten ändern. Batch-Systeme. Für Batch-Systeme gibt es folgende Algorithmen First-Come First-Served. Sehr einfach umzusetzen, wegen der Nicht-Unterbrechbarkeit aber nicht praktikabel. Shortest Job First. Beweisbar kürzeste Verweilzeit (siehe 6.2.11), aber nicht unterbrechbar und die Job-Grösse muss im voraus bekannt sein. Shortest Remaining Time Next. Hier wählt der Scheduler immer den Prozess mit der kleinsten Restlaufzeit. Auch hier müssen Berechnungszeiten im voraus bekannt sein. Rate Monotonic. RMS ist ein statischer Algorithmus der jedem Prozess eine Priorität entsprechend der Frequenz des Ereignis, das diesen Prozess triggert, zuweist. Dazu müssen die Ereignisse periodisch auftreten und die Abarbeitung eines Ereignisses muss immer gleich lang dauern. Earliest Deadline First. Ein typische dynamischer Algorithmus ist EDF. Wenn ein Prozess die CPU benötigt meldet er sich an und gibt den Termin zu dem er fertig sein muss an. Die Prozesse werden in einer Liste verwaltet und der Scheduler wählt immer den Prozess mit der knappsten Deadline. Interaktive Systeme. Round-Robin. Jedem Prozess wird ein Zeitintervall, das Quantum, zugeordnet, in dem er laufen kann, danach wird zu einem neuen Prozess gewechselt. Die Prozesse können in einer Liste verwaltet werden. Wenn ein Prozess sein Quantum aufgebraucht hat (oder abgegeben hat) wird an das an der Liste angehängt und der Prozess am Kopf der Liste gestartet. Die Wahl der Länge des Quantums ist entscheidend. Ist das Quantum zu kurz, gibt es zu viele (teure) Kontextwechsel, ist es zu lang, sind die Antwortzeiten schlecht. In der Praxis werden Quanta der Länge 20–50 ms eingesetzt. Prioritäten. Beim Prioritäten-Scheduling wird jedem Prozess eine Priorität zugeordnet. Der Scheduler wählt immer den Prozess mit der höchsten Priorität. Damit dieser nicht für immer Läuft, bricht man nach einem bestimmten Zeitquantum ab und nimmt den nächsten. Oder man verringert die Priorität des Prozesses entsprechend seiner Laufzeit. Falls seine Priorität unter dies eines anderen fällt, wird gewechselt. Generell können die Prioritäten statisch oder dynamisch vergeben werden. Bei der dynamischen Vergabe gibt es folgende Varianten. Viele Prozesse verbringen sehr viel Zeit mit I/O und belasten die CPU nur wenig. Solchen Prozessen sollte man die CPU so prompt wie möglich zur Verfügung stellen (wenn sie sie benötigen) damit sie sich weiter mit I/O befassen können und die CPU für rechenintensive Prozesse frei bleibt. Eine einfache Möglichkeit, diesen Service anzubieten, ist, den Prozessen die Priorität 1/f zuzuweisen. Wobei f der Bruchteil des Quantums ist, den der Prozess beim letzten mal benutzt hat. Prozesse die ihr Quantum fast gar nicht nutzen, bekommen eine hohe Priorität, Prozesse die ihr Quantum voll nutzen eine niedrige Priorität. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 65 Eine weitere Möglichkeit bietet die Trennung von Mechanism und Policy. Wenn Programme aus mehreren Prozessen bestehen haben sie meisten eine sehr viel bessere Vorstellung davon wie diese geschedult werden sollen als der Scheduler des Betriebssystems. Ein Möglichkeit diese Information zu nutzen ist Betriebsystemfunktionen zur Verfügung zu stellen die es einem Prozess erlauben, die Prioritäten seiner Kindprozesse zu verändern. Hier steckt der Mechanism im Kernel aber die Policy wird durch einen Userprozess bestimmt. 6.2.11 Welche Strategie führt zu kürzesten Verweilzeiten? Shortest Job First. Angenommen es gibt 4 Prozesse A, B, C, D, wobei deren Bearbeitungszeiten a, b, c, d sind. Wenn die Prozesse in alphabetischer Reihenfolge ausgeführt werden, dann sind jeweiligen Verweilzeiten für die Prozesse 66 T (A) = T (B) T (C) = a+b = a+b+c a T (D) = a+b+c+d http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.2. Prozesse und Threads Kapitel 6. Betriebssysteme Das ergibt eine durchschnittliche Verweilzeit von T (∅) = = 2. Hardware setzt Befehlszähler entsprechend des Interrupt Vectors 3. Assembler-Routine sichert die Register T (A) + T (B) + T (C) + T (D) 4 4a + 3b + 2c + d 4 4. Assembler-Routine legt neuen Stack an 5. C-Routine mit Unterbrechungscode wird gestartet 6. Scheduler wählt neuen Prozess Wie man sieht, hat die Laufzeit des ersten Prozesses den grössten Einfluss, daher führt SJF zu den kürzesten Verweilzeiten. 7. Rücksprung von der C-Routine zur Assembler-Routine 8. Zurückkopieren der Register, usw., Starten des (neuen) aktuellen Prozesses 6.2.12 Ist Shortest Job First unterbrechbar? Nein. Ist gibt aber eine unterbrechbare Version, die sich Shortest Remaining Time Next nennt. Hier wählt der Scheduler immer den Prozess mit der kleinsten Restlaufzeit. Auch hier müssen Berechnungszeiten im voraus bekannt sein. 6.2.13 Welche unterbrechbare Strategie liefert die kürzesten Verweilzeiten? 6.2.19 Interrupts lassen sich nach vielen Kriterien klassifizieren, z. B. Software vs. Hardware, Maskable vs Non-Maskable, Precise vs Imprecise. 6.2.20 Shortest Remaining Time Next. 6.2.14 Arbeitet das Prioritätenscheduling mit statischen Prioritäten? 6.2.21 Was ist der Unterschied zwischen Ports und Sockets? Ein Socket ist ein Kommunikationsendpunkt. Sockets sind für Kommunikation zwischen zwei Rechnern gedacht. Ein Socket setzt sich zusammen aus Adresse und Port. Wie funktionieren dynamische Prioritäten? 6.2.22 siehe 6.2.10. 6.2.16 Was beinhaltet der Prozesskontrollblock? Der Prozesskontrollblock ist eine Datenstruktur, die den Prozesskontext beschreibt. Siehe 6.2.5. siehe 6.2.10. 6.2.15 Was für Arten von Unterbrechungen gibt es? Wie realisiert man Semaphoren in der Praxis? Falls ein TSL-Befehl zur Verfügung steht können Semaphoren wie in 6.2.23 realisiert werden. Ansonsten werden sie meist vom Betriebssystem durch kurzzeitiges Sperren der Interrupts realisiert. Das Betriebssystem stellt den Userprozessen dann entsprechende Funktionen zur Verfügung. Wonach bewertet man Schedulingstrategien? Je nach Art des Systems verfolgen die Strategien unterschiedliche Ziele. Für alle System gilt: Fairness. 6.2.23 Wie wird wechselseitiger Ausschluss umgesetzt? Policy Enforcement. Der Scheduler muss die System-Policy durchsetzen. Es gibt verschiedene Möglichkeiten wechselseitigen Ausschluss umzusetzen. Balance. Alle Teile des Systems sollten ausgelastet sein. Interrupts sperren. Ein Prozess könnte, bevor er eine kritischen Bereich betritt einfach alle Interrupts sperren. Das hat mehrere Nachteile. Ersten sollte in Userprozess nicht das Recht haben Interrupts zu sperren, zweitens funktioniert dies in Mehrprozessorsystemen nicht. Innerhalb des Betriebssystems kann das Sperren von Interrupt manchmal eingesetzt werden, für Userprozesse sollte es aber nicht in Frage kommen. Für interaktive Systeme gilt: Response Time. Proportionality. Das Scheduling sollten den Erwartungen des Users entsprechen. Zum Beispiel macht es dem User in den meisten Fällen nichts aus, wenn das Versenden einer eMail 20s dauert, es stört in aber wenn das Eingeben eines Buchstabens 20s dauert. Throughput. Anzahl der Jobs pro Stunde maximieren. Test and Set Locks. TSL ist eine Befehl, der von der Hardware angeboten wird. Er liest ein Wort aus dem Speicher und speichert es in einem Register. Anschliessend schreibt z. B. 1 an die Stelle im Speicher. Die Hardware garantiert, dass dieser Befehl ununterbrechbar ist. Der folgende Code zeigt wie mit diesem Befehl wechselseitiger Ausschluss realisiert werden kann: Turnaround Time. Verweilzeiten minimieren. enter: Für Batch-Systeme gilt: CPU Utilization. CPU-Auslastung maximieren. 6.2.17 Wie schützt das Betriebssystem den Speicherbereich eines Prozesses vor Zugriffen von anderen Prozesses? Wie läuft eine Unterbrechung genau ab? MOV lock, 0 RET 0 in lock speichern und dadurch Sperre frei geben zurück zum Aufrufer, kritischer Bereich wurde verlassen Natürlich müssen die beiden Prozeduren beim Betreten bzw. Verlassen des kritischen Bereichs aufgerufen werden. Das Problem ist, dass diese Implementierung Busy-Waiting benutzt. 1. Hardware speichert Befehlszähler, PSW usw. auf dem aktuellen Stack DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs kopiere lock in das Register REG und setze lock auf 1 war lock = 0 ? es war nicht 0, also war die Sperre bereits gesetzt ⇒ Schleife zurück zum Aufrufer, kritischer Bereich wurde betreten exit: Das muss die Hardware erledigen, die muss vom Betriebssystem richtig konfiguriert werden. 6.2.18 TSL REG, lock CMP REG, 0 JNE enter RET 67 68 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.3. Deadlocks Kapitel 6. Betriebssysteme Mutexes. Mutexes sind nicht anderes als binäre Semaphoren. Sie sind ideal um wechselseitigen Ausschluss zu realisieren. Meist werden sie als Betriebssystemfunktionen implementiert, z. B. durch Sperren von Interrupts. Falls ein TSL-Befehl zur Verfügung steht können sie aber auch sehr einfach im Userspace implementiert werden. mutex lock: TSL REG, mutex CMP REG, 0 JZE ok CALL thread yield JMP mutex lock ok: RET mutex unlock: MOV mutex, 0 RET 6.3 Deadlocks 6.3.1 Was sind Deadlocks? Bei der Deadlock-Vermeidung versucht man zu verhindern, dass ein Prozess in einen unsicheren Zustand kommt. In der Praxis ist dies selten anzuwenden, da man dafür die zukünftigen Ressourcenbedarf der Prozesse kennen muss. Ein Beispiel ist der Bankiersalgorithmus. 6.3.5 kopiere mutex in das Register REG und setze mutex auf 1 war mutex = 0 ? es war Null, also alles klar es war nicht 0, also war die Sperre bereits gesetzt ⇒ schlafen gehen Thread ist wieder aufgewacht, nochmal probieren Man versucht eine der vier Deadlock-Bedingung generell auszuschliessen. 1. Mutual exclusion condition. Mann kann wie im Falle des Druckers einen Spooler einrichten. Dadurch hat nur noch ein einziger Prozess Zugriff auf ein Betriebsmittel. Das Problem ist, dass man nicht alle Betriebsmittel spoolen kann, z. B. die Prozesstabelle. Ausserdem können sich dadurch neue potentielle Deadlocks ergeben. Der Printspooler braucht Plattenspeicher, auch dieser kann deadlocken. zurück zum Aufrufer, kritischer Bereich wurde betreten 2. Hold and wait condition. Man könnte Prozesse zwingen alle ihre Betriebsmittel auf einen Schlag anzufordern, dies geht aber meist nicht, da die Prozesse zu Beginn noch nicht wissen, welche Betriebsmittel sie benötigen. In bestimmten Fällen funktioniert kann das sehr gut funktionieren. Datenbanken setzen Two-Phase Locking ein, was im Prinzip diesem Ansatz entspricht. 0 in mutex speichern und dadurch Sperre frei geben zurück zum Aufrufer, kritischer Bereich wurde verlassen 3. No preemption condition. Das geht mit vielen Betriebsmittel einfach nicht anders. 4. Circular wait condition. Eine Möglichkeit ist den Betriebsmittel eindeutige Nummern zuzuordnen und Prozessen das Anfordern von Betriebsmittel nur in numerischer Reihenfolge zu erlauben. Dadurch können keine Zyklen im Betriebsmittelgraphen und damit auch keine Deadlocks entstehen. Das Problem ist, dass es in einem echten System fast unmöglich ist, eine vernünftige Nummerierung aller Betriebsmittel zu finden. Eine Menge von Prozessen ist in einem Deadlock wenn jeder Prozess auf ein Ereignis wartet, das nur von einem anderen Prozess ausgelöst werden kann. 6.3.2 Welche Verfahren gibt es mit Deadlocks umzugehen? 6.3.6 1. Vogel-Strauss-Algorithmus. Mann hofft darauf, dass keine Deadlocks auftreten. Dies ist das in der Praxis am häufigsten verwendete Verfahren. 1. Mutual exclusion condition. Jedes Betriebsmittel ist entweder genau einem Prozess zugeordnet oder frei. 2. Hold and wait condition. Ein Prozess der bereits Betriebsmittel besitzt kann weitere anfordern. 3. Deadlock-Vermeidung. Man versucht Deadlocks durch vorsichtige Vergabe der Betriebsmittel zu vermeiden. 3. No preemption condition. Betriebsmittel können Prozessen nicht weggenommen werden. Die Prozesse müssen die Betriebsmittel freiwillig abgeben. 4. Deadlock-Verhinderung. Man versucht Deadlocks generell zu verhindern, in dem man eine der vier Deadlock-Bedingung ausschliesst. 4. Circular wait condition. Es gibt eine kreisförmige Kette mit zwei oder mehr Prozessen, die jeweils auf ein Betriebsmittel warten, das vom nächsten Nachbarn der Kette belegt wird. Wie funktioniert Deadlock-Erkennung? Um einen Deadlock zu finden muss man einen Kreis im Betriebsmittelgraphen finden. Falls ein Deadlock gefunden wurden, gibt es verschiedene Methoden damit umzugehen. 6.3.7 Recovery through Rollback. Man kann Prozesse zwingen hin und wieder sog. checkpoints zu speichern. In diesen wird der komplette Status eines Prozesses festgehalten. Wenn nun ein Deadlock entdeckt wird, rollt man einen der Prozessen der eines beteiligten Betriebsmittel anfordert zu seinem letzten Checkpoint zurück. Recovery through Killing. Die einfachste Methode ist es einen der am Deadlock beteiligten Prozesse zu killen. Wenn der Deadlock dadurch nicht behoben wird, killt man weitere Prozesse. Alternativ kann man auch nicht am Deadlock beteiligte Prozesse killen. In der Praxis geht das natürlich schlecht, da dadurch Daten verloren gehen. Ein Beispiel wo es funktioniert sind Transaktionen in Datenbanken. 6.3.8 Was ist der Bankiersalgorithmus? Der Bankiersalgorithmus verwendet das Prinzip der Verklemmungsvermeidung. Bei einer Anfrage eines Kunden wird der Betrag probeweise zugeteilt und dann überprüft der Algorithmus, ob in der entstehenden Situation einen Verklemmung möglich ist, wenn ja, verweigert er die Geldausgabe. Dafür ist aber nötig, dass der Algorithmus die zukünftigen Anforderungen der Prozesse (Kunden) abschätzen kann (Kreditrahmen). 6.3.9 Was ist ein Betriebsmittelgraph? Mit einem Betriebsmittelgraph lässt sich graphisch darstellen welche Prozesse welche Betriebsmittel belegen und welche Prozesse welchen Betriebsmittel anfordern. Wie funktioniert Deadlock-Vermeidung? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was sind sichere Zustände? Eine Zustand ist sicher, wenn er nicht in einem Deadlock ist und es eine Scheduling Reihenfolge gibt, so dass alle Prozesse abgearbeitet werden können, selbst dann wenn alle Prozesse plötzlich die Maximale Anzahl an Betriebsmittel fordern. Recovery through Preemption. Wenn möglich entzieht man einem der Prozesse ein Betriebsmittel. Selbst wenn dies theoretisch möglich ist, ist es schwer automatisch festzustellen welchem Prozess welches Betriebsmittel zu entziehen ist. 6.3.4 Was sind die Bedingungen für einen Deadlock? Damit ein Deadlock eintreten kann, müssen die folgende vier Bedingungen gelten. 2. Deadlock-Erkennung. Man versucht zu erkennen, dass ein Deadlock aufgetreten ist und die Situation dann zu bereinigen. 6.3.3 Wie funktioniert Deadlock-Verhinderung? 69 70 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.4. Speichermanagement 6.4 Speichermanagement 6.4.1 Was ist ein virtueller Speicher? Kapitel 6. Betriebssysteme der nach jeder Instruktion erhöht wird, ausserdem muss der Seitentabelleneintrag ein Feld haben um einen Counterwert aufzunehmen. Bei jedem Speicherzugriff wird der aktuelle Counterwert in dem entsprechenden Seitentabelleneintrag gespeichert. Falls ein Page Fault auftritt, wird die Seite mit dem niedrigsten Counterwert entfernt. Eine andere Hardwareimplementierung verwendet eine Matrix zur Speicherung derselben Information. Vor- und Nachteile. Sehr guter Algorithmus, der aber Unterstützung der Hardware erfordert. Virtueller Speicher ist Speicher der Programmen voll zur Verfügung steht, der aber grösser als der tatsächlich vorhandene, physische Speicher ist. 6.4.2 NFU. Not Frequently Used ist ein einfacher Versuch LRU mit Software zu simulieren. Algorithmus. NFU verwendet einen Software-Counter für jede Seite der beim Einlagern der Seite auf 0 gesetzt wird. Bei jedem Clocktick durchläuft das Betriebssystem alle Seiten und addiert den Wert des Reference-Bits auf den Counter. Falls ein Page Fault auftritt, wird die Seite mit dem niedrigsten Counterwert entfernt. Vor- und Nachteile. Das Hauptproblem ist, dass NFU niemals etwas vergisst. Seiten die vergangener Zeit extrem häufig benutzt wurden, haben einen hohen Counterwert und verlieren diesen nicht mehr, auch wenn sie später gar nicht mehr benutzt werden. Welche Verfahren zur Seitenersetzung kennen Sie? Optimaler Algorithmus. Der optimale Algorithmus ist ein in der Praxis nicht umsetzbarer Algorithmus der aber zur Qualitätsbeurteilung von echten Algorithmen benutzt wird. Algorithmus. Wenn eine Page Fault auftritt liegt eine bestimmte Anzahl von Seiten im Speicher. Jeder dieser Seiten kann (theoretisch) eine Zahl zugeordnet werden, die der Anzahl der Instruktionen, die vergehen, bis diese Seite benutzt wird, entspricht. Der optimale Algorithmus entfernt die Seite mit der höchsten Zahl, deren Benutzung also am weitesten in der Zukunft liegt. Vor- und Nachteile. Es liegt auf der Hand, dass dieses Verhalten optimal aber nicht realisierbar ist. Aging. Aging ist eine kleine Modifikation von NFU die den Algorithmus sehr nah an LRU bringt. Algorithmus. Wieder hat jede Seite einen eigenen Counter. Diesmal wird der Counterwert bevor das Reference-Bit addiert wird um ein Bit nach rechts verschoben. Ausserdem wird der Wert nicht auf das Bit am weitesten rechts, sondern auf das Bit am weitesten links, addiert. Wenn ein Page Fault auftritt wird die Seite mit dem kleinsten Counterwert entfernt. Eine Seite die lange nicht benutzt wurde, hat viele führende Nullen und damit einen kleinen Wert. Vor- und Nachteile. Dieser Algorithmus nähert LRU recht gut, verhält sich in zwei Punkten aber doch unterschiedlich. Da pro Intervall von Clocktick zu Clocktick nur ein Bit gespeichert wird, kann man nicht zwischen unterschiedlichen Zeitpunkten in einem Intervall speichern. Der andere Unterschied ist auf die endliche Anzahl von Bits in den Countern zurückzuführen. Falls zwei Seiten beide den Counter-Wert 0 haben, hat man keine Möglichkeit zu beurteilen, welche älter ist. In der Praxis sind 8 Bits aber meist ausreichend da damit bei einem Clocktick-Intervall von 20ms ein Zeitraum von 160ms überwacht werden kann. NRU. Der Not Recently Used Algorithmus teilt Seiten entsprechende ihrer Reference- und ModifiedBits in Klassen ein und wählt eine möglichst lange nicht benutzte Seite. Algorithmus. In den meisten Systemen gibt es Reference- und dein Modified-Bit. Falls dein Page Fault auftritt, teilt der Algorithmus die Seiten in vier Gruppen ein Class Class Class Class 0: 1: 2: 3: not referenced, not modified not referenced, modified referenced, not modified referenced, modified Nun entfernt der Algorithmus zufällig eine Seite aus der Klasse mit der niedrigsten Zahl. Vor- und Nachteile. Es werden keine Seiten, die stark benutzt werden, entfernt und die Implementierung ist einfach. Die Leistung des Algorithmus ist nicht wirklich optimal. Working Set. Alle bisher beschriebenen Algorithmen verwenden die Strategie des Demand Paging. Ein Prozess wird zuerst ohne seine Seiten gestartet, die benötigten Seiten werden dann Stück für Stück on demand eingelagert. Reale Programme haben meist bestimmte Lokalitätseigenschaften. D. h. sie greifen während einer bestimmten Phase meist nur auf wenige ihrer Seite zu. Die Menge der Seiten, die ein Prozess gerade benutzt, nennt man das Working Set. Bei den bisher aufgeführten Ersetzungsstrategien, treten sehr viele Page Faults auf, bis das Working Set eines Prozesses im Speicher ist. Beim Mehrprogrammbetrieb werden Prozesse oft komplett aus dem Speicher entfernt. Die Idee ist nun dem Prozess, bevor er wieder gestartet wird, sein Working Set zur Verfügung zu stellen. Diese Information muss vor dem Verdrängen des Prozesses gespeichert werden. Das Einlagern der Seiten bevor der Prozess anläuft, wird als Prepaging bezeichnet. Algorithmus. Wenn die Information über das Working Set eines Prozesses bekannt ist, kann man daraus auch einen effizienten Seitenersetzungsalgorithmus ableiten. Falls ein Page Fault auftritt, sollte eine Seite entfernt werde, die nicht Teil des Working Sets ist. Das Merken des Working Sets ist sehr aufwendig, daher gibt es verschiedene Näherungslösungen. Eine besteht darin sich zu merken welche Seiten der Prozess in den letzten τ Sekunden benutzt hat. Die CPU-Zeit die ein Prozess seit seinem Start tatsächlich benutzt hat, nennt man current virtual time. Der Ersetzungsalgorithmus arbeitet wie folgt. Wie immer ist in den Seitentabelleneinträgen das Reference-Bit gespeichert. Zusätzlich hat jeder Eintrag noch ein Feld in dem die Zeit gespeichert wird, wann die Seite zuletzt benutzt wurde. Bei jedem Clocktick wird das Reference-Bit gelöscht. Falls nun ein Page Fault auftritt, wird die ganze Seitentabelle durchlaufen und wie folgt vorgegangen. Ist das Reference-Bit gesetzt, wird die aktuelle Zeit im Eintrag gespeichert, dadurch wird gekennzeichnet, dass die Seite benutzt wurde, als der Page Fault auftrat. Da diese Seite benutzt wurde, gehört sie zum Working Set und sollte nicht entfernt werden. Falls das Reference-Bit 0 ist, wurde die Seite nicht benutzt und stellt eine Kandidaten für die Auslagerung dar. Jetzt wird zuerst ihr Alter berechnet, (current virtual time minus Zeit der letzten Benutzung). Falls das Alter grösser als τ ist, gehört die Seite nicht mehr zum Working Set und wird ersetzt. Falls ihr Alter kleiner als τ ist, gehört die Seite zum Working Set und wird verschont. Man merkt sich aber die Seite mit dem grössten Alter. Falls sich beim Durchlauf rausstellt, dass alle Seiten zum mit gelöschten Reference-Bit zum Working Set gehören, wird die mit dem höchsten Alter entfernt. Falls bei allen Seiten das Reference-Bit gesetzt FIFO. Einfaches FIFO-Prinzip. Algorithmus. Die Seiten werden in einer Queue verwaltet, falls ein Page Fault auftritt, wird die älteste Seite entfernt und die Neue an das Ende der Queue angehängt. Vor- und Nachteile. Die Implementierung ist sehr einfach aber das Problem ist, dass die älteste Seite nicht unbedingt auch eine Seite ist, die selten genutzt wird. Second Chance. Second Chance ist eine Erweiterung von FIFO die das Reference-Bit mit in die Entscheidung einbezieht. Algorithmus. Falls ein Page Fault auftritt geht der Algorithmus erst mal so vor wie FIFO und betrachtet den Kopf der Liste. Falls die das Reference-Bit der Seite am Kopf der Queue nicht gesetzt wird, wird sie entfernt. Falls es gesetzt ist, bekommt sie eine zweite Chance und wird an das Ende der Queue gehängt und der Algorithmus schaut sich die zweit-älteste Seite an. Vor- und Nachteile. Ein Problem von Second Chance ist, dass es, wenn bei allen Seiten das Reference-Bit gesetzt ist, zu FIFO degenerieren kann. Das andere Problem ist, dass das ständige Umhängen von Seiten in der Queue aufwendig ist. Clock. Clock ist nur eine bessere Implementierung von Second Chance. Algorithmus. Bei Clock sind die Seiten in einer kreisförmigen Liste wie bei einer Uhr angeordnet. Ein Zeiger zeigt auf die älteste Seite. Wenn nun ein Page Fault auftritt, prüft der Algorithmus ob das Reference-Bit der ältesten Seite gesetzt ist. Wenn nicht, wird die Seite ersetzt. Falls es gesetzt ist, wird es gelöscht und der Zeiger eine Position weiter gestellt. Vor- und Nachteile. Dieser Algorithmus behebt die Implementierungsprobleme von Second Chance und stellt einen realistischen Algorithmus dar. LRU. Der Least Recently Used Algorithmus entfernt immer die Seite, die am längsten nicht benutzt wurde. Algorithmus. Man nimmt an, dass Seiten in letzter Zeit stark benutzt wurden, wohl auch in Zukunft noch benutzt werden, deshalb möchte man die am längsten nicht benutzte Seite entfernen. Grundsätzlich könnte der Algorithmus mit einer Liste, die immer so organisiert wird, dass die am längsten nicht genutzte Seite am Ende steht, realisiert werden. Dies ist aber sehr aufwendig. Mit ein bisschen zusätzlicher Hardware geht es deutlich einfacher. Dazu benötigt man einen Counter DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 71 72 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.4. Speichermanagement Kapitel 6. Betriebssysteme ist, wird eine Seit ausgelost (am besten eine saubere). Vor- und Nachteile. Der Algorithmus ist sehr gut, aber aufwendig zu implementieren. Ausserdem muss immer die komplette Seitentabelle durchlaufen werden. Die meisten Betriebssysteme stellen den Userprozessen Systemaufrufe zum Anfordern und Freigeben von Speicher zur Verfügung. Bei Unix heisst der Befehl zur Veränderung der Grösse des Datensegmentes brk. Zusätzlich gibt es meist noch Befehle um Memory-Mapped Files einzurichten. WSClock. Dieser Algorithmus ist eine vereinfachte Implementierung des Working Set Algorithmus der die Idee des Clock Algorithmus’ aufgreift. Algorithmus. Wieder wird pro Seitentabelleneintrag das Reference-Bit, das Modified-Bit und die Zeit des letzten Zugriffs gespeichert. Diesmal werden die Einträge in eine kreisförmigen Liste gespeichert und es gibt einen Zeiger der auf einen der Einträge zeigt. Zuerst wird wieder das Reference-Bit getestet. Ist es gesetzt wurde diese Seite kürzlich benutzt und sollte nicht entfernt werden. Der Algorithmus löscht das Reference-Bit und geht zur nächsten Seite. Wenn er dort eine Seite, deren Reference-Bit nicht gesetzt ist, vorfindet, geht er wie folgt vor. Ist das Alter dieser Seite grösser als τ gehört sie nicht zum Working Set. Falls sie dazu auch noch sauber ist, wird sie einfach ersetzt. Falls sie nicht sauber ist, kann sie nicht einfach ersetzt werden. Um einen Prozesswechsel zu vermeiden, wird sie nicht direkt auf die Platte geschrieben, sondern der Schreib-Auftrag wird geschedult und der Zeiger auf die nächste Seite gesetzt. Es könnte ja sein, dass sich noch eine alte, saubere Seite findet. Was passiert nun, wenn der Algorithmus einmal alle Seiten durchlaufen hat ohne eine alte, saubere Seite zu finden. Jetzt müssen zwei Fälle unterschieden werden Die Verwaltung des virtuelle Speichers sollte für Prozesse und Programmierer transparent sein. Ein Ausnahme ist der Einsatz von Shared Memory. Wollen sich zwei Prozesse zum schnellen Austausch von Daten Speicher teilen, muss die Programmierschnittstelle der Speicherverwaltung Funktionen anbieten, damit Prozesse solche gemeinsamen Speicherbereiche einrichten können, z. B. Memory-Mapped Files. Windows bieten auch einige Funktionen an um das Paging zu kontrollieren, so kann man z. B. für eine bestimmten Speicherbereich das Paging ganz ausschalten. 6.4.7 Im Seitentabelleneintrag gibt es ein Reference-Bit. Diese wird gesetzt sobald auf die Seite zugegriffen wird. 6.4.8 1. mindestens ein Schreib-Auftrag wurde geschedult 2. kein Schreib-Auftrag wurde geschedult Ist die MMU ein Teil des Betriebssystems? Nein. Sie ist heute meist Teil der CPU, kann bei älteren Systemen aber auch ausserhalb der CPU sein. Im ersten Fall macht der Algorithmus einfach weiter, früher oder später findet er eine alte, saubere Seite, da der Schreib-Auftrag irgendwann ausgeführt wird. Im zweiten Fall befinden sich alle Seiten im Working Set, sonst währe ein Schreib-Auftrag abgegeben worden. Jetzt sucht sich der Algorithmus einfach eine saubere Seite und ersetzt sie (die Position einer sauberen Seite kann er sich während des Durchlaufs merken). Falls es keine saubere Seite gibt, dann hilft alles nichts, die aktuelle Seite wird geschrieben und ausgetauscht. Vor- und Nachteile. Wegen der recht einfachen Implementierung und der guten Performance, wird WSClock in der Praxis häufig eingesetzt. 6.4.9 Welche Speicher-Einlagerungsstrategien kennen Sie? On-Demand. Alle Seitenersetzungsstrategien ausser den auf Working Sets basierenden, verwenden diese Strategie. Seiten werden dann eingelagert, wenn sie das erste Mal gebraucht werden. Prepaging. Wenn die Working Set Information bekannt ist, kann das Working Set eines Prozesses eingelagert werden, bevor er gestartet wird. 6.4.10 6.4.3 Wie erkennt man, dass auf eine Seite zugegriffen wurde? Was ist Fragmentierung? Was ist ein Working Set? Die Menge der Seiten, die ein Prozess gerade benutzt, nennt man das Working Set. Man unterscheidet zwischen interner und externer Fragmentierung. Interne Fragmentierung. Im Zusammenhang mit Paging spricht man von interner Fragmentierung. Damit ist die Speichervergeudung gemeint, wenn Seiten nur halb belegt werden. Die interne Fragmentierung spricht für eine kleine Seitengrösse, es gibt aber auch Argumente für grosse Seitengrössen. Externe Fragmentierung. Im Zusammenhang mit Segmentierung spricht man von externer Fragmentierung. Hiermit ist das über die Dauer entstehende Muster aus belegtem Speicher und Löcher gemeint, das beim Ein- und Auslagern von Segmenten entsteht. Mit Compaction kann man die Löcher wieder zu einem einzigen grossen Loch zusammenfassen, was aber sehr aufwendig ist. 6.4.4 6.4.11 Was ist das Buddy Verfahren? Das Buddy-Verfahren wird von Linux zur Speicherverwaltung eingesetzt. Falls ein Stück Speicher benötigt wird, wird die Grösse des Stücks zuerst auf eine Potenz von 2 aufgerundet und dann im Speicher vorhandene Löcher solange halbiert bis es genau passt. Werden zwei nebeneinander liegende Speicherbblöcke (Buddies) frei, werden sie wieder zusammengefasst. 6.5 I/O 6.5.1 Welche Schichten hat die E/A-Verwaltung? Was ist Paging? User-level I/O Software Von Paging spricht man, wenn Prozess nicht unbedingt komplett, sondern auch teilweise im Speicher gehalten werden können. Device-independent OS software Device drivers 6.4.5 Interrupt handler Was ist Swapping? Von Swapping spricht man, wenn jeder Prozess immer komplett in den Speicher geladen wird. Beim Prozesswechsel wird der Prozess (und alle zugehörigen) Daten auf die Platte ausgelagert und der neue Prozess eingelagert. 6.4.6 Welche Programmierschnittstelle bietet die Speicherverwaltung an? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 73 Hardware 6.6 Betriebssystem-Design 6.6.1 Was ist ein Microkernel? 74 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.6. Betriebssystem-Design Die Idee eines Microkernels ist es nur minimale Funktionalität in den Kernel einzubauen um die Effizienz und Zuverlässigkeit zu steigern. Zum Beispiel werden das Dateisystem und das Speichermanagement in Userprozesse ausgelagert. Durch die Modulare Struktur sind Microkernel-Systeme deutlich übersichtlicher und daher besser wartbar. Die viele Funktionen in Userprozesse ausgelagert sind, sind sie stabiler. Das abstürzen eine Userprozesses reisst den Kernel normalerweise nicht mit. Durch die mit der Modularisierung verbundenen häufigen Wechsel zwischen User- und Kernelprozessen ist die Performance von Microkernelsystemen etwas schwächer. Mach und Minix sind Microkernelsysteme. 6.6.2 Was bedeutet monolithisch? Eine monolithische Struktur ist das genau Gegenteil eines Microkernels. Bei monolithischen Systemen steckt alle betriebssystemrelevante Funktionalität im Kernel. 6.6.3 Welche Funktionen beinhaltet ein Microkernel? Kapitel 6. Betriebssysteme 6.7 Beispiele 6.7.1 Erklären Sie doch mal die Unterschiede zwischen Unix und Windows 2000. Unix/Linux Windows Grösse (LOC) Struktur Linux 2.2: 1 M, Solaris 5.8: 2 M Die Struktur hängt von der jeweiligen Unix-Version ab. So hat MINIX z. B. eine Microkernel, Linux dagegen ist monolithisch. Schnittstelle Unter Unix rufen Prozessen direkt die System Calls auf. Diese werden über Bibliotheken zur Verfügung gestellt. Prozesse können bei Linux generell nur durch forken eines Prozesses erzeugt werden. Dadurch entsteht eine Prozesshierarchie. Die Unixprozesse entsprechen fast genau den Prozessbegriff wie er z. B. im Tanenbaum verwendet wird. Ein Prozess hat einen Thread of Control und ihm sind Ressourcen aller Art zugeordnet. 29 M Ab Version 4.0 ist NT absolut monolithisch, vorher war es zwar auch kein Microkernel, aber es waren doch einige Betriebssystemfunktionen in Userprozesse ausgelagert. Windows versteckt die eigentlichen System Calls hinter einer schwergewichtigen API mit enormen Funktionsumfang. Eine Prozesshierarchie gibt es Windows nicht. Windows führt einige Begriffe ein. Ein Job ist eine Sammlung von Prozessen, zu jedem Prozess gehören einer oder mehr Threads. Prozesse stellen eher eine Verwaltungseinheit dar, ihnen fehlt eigentlich der Thread of Control. Auf Userebene kann ein Thread mehrere Fibers, leichtgewichtige Threads enthalten. Auch Windows verwendet Round-Robin Scheduling mit dynamischen Prioritäten wobei Prozesse die Prioritäten ihrer Threads beeinflussen können. Das Windows Scheduling basiert auch nur auf Threads. Fibers können nur von Prozessen selbst geschedult werden. Jedem Prozess stehen 4GB Speicher zur Verfügung wobei in die oberen zwei GB bei jedem Prozesse das Betriebssystem eingeblendet ist, das aber geschützt ist. Das liegt daran, dass bei Windows bei einem Wechsel vom User- zum Kernelmodus der selbe Prozess (Thread) weiter läuft. Ein Pagingdaemon versucht kontinuierlich den Speicher möglichst frei zu halten. Der verwendete Ersetzungsalgorithmus basiert auf einem Working Set. Windows verwendet aber kein Prepaging. Windows bietet diverse Möglichkeiten zur Kommunikation, darunter Pipes, Named Pipes, Mailslots, Sockets, RPC und Shared Files. Prozesse Scheduling 6.6.4 Was gehört zum einem Betriebssystemkern? Das kommt auf die Struktur des Systems an, Microkernel oder monolithisch. Was immer drin ist, ist der Scheduler. Scheduling Unix und Linux verwenden Round-Robin Scheduling mit dynamischen Prioritäten. Das Linux Scheduling basiert auf Threads. Speicher Das Paging wird bei Unix von einem PagingDaemon durchgeführt der eine modifizierte Variante des Clock-Algorithmus’ einsetzt. Linux verwendet den Buddy-Algorithmus und ebenfalls einen Clock-ähnlichen Ersetzungsalgorithmus. Es gibt keine Working Set Verwaltung und kein Prepaging. IPC Prozesskommunikation läuft bei Unix vorwiegend über Pipes, die eine Form des Nachrichtenaustausches darstellen. Zusätzlich können Prozesse über Signale kommunizieren (siehe 6.7.3). Unix ordnet jedem Benutzter eine UID dar und organisiert die Benutzter in Gruppen. Dateien werden die bekannten Rechte entsprechend der Userund Gruppen-ID zugeordnet. Durch das Everything is a File-Konzept lässt sich dieses Prinzip z. B. auch auf Ein- und Ausgabe anwenden. Unix folgt dem Everything is a File-Konzept. Sicherheit Misc DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 75 76 Windows wird jeder Benutzter und jede Gruppe durch eine eindeutige Security ID (SID) identifiziert. Jeden Objekt kann eine ACL (siehe 3.5.4) zugeordnet werden, die dem User entsprechende Operation auf einem Objekt gestattet. Bei Windows ist alles ein Objekt. http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 6.7. Beispiele 6.7.2 Hat Windows 2000 einen Microkernel? In den ersten Versionen hatte NT zwar einen rechten schlanken Kernel, da er aber Speichermanagement, Dateisystem u. Ä enthielt, konnte man nicht von einem Microkernel sprechen. Seit der Version 4.0 steckt ein Grossteil der Funktionalität im Kernel, also erst recht kein Microkernel. 6.7.3 Was für Möglichkeiten bietet Unix zur Prozesskommunikation? Pipes. Pipes stellen eine Form von Kommunikation über Nachrichten da. Zwischen zwei Prozessen kann ein Kanal angelegt werden. Jeder der Prozesse kann einen Datenstrom in diesen Kanal schicken. Diese Kanäle heissen Pipes. Software Interrupts. Prozesse können Signale an andere Prozesse verschicken. Die Prozesse können dem System mitteilen wie es mit eingehenden Signalen umgehen soll. Dazu muss ein Prozess ein Signalbehandlungsroutine angeben. Falls ein Signal eingeht, wird diese Routine sofort gestartet. Signale können nur an Prozesse aus der eigenen Prozessgruppe (die Verwandten) geschickt werden. Signal werden auch für andere Zwecke benutzt, so bekommt ein Prozess der durch 0 teilt ein SIGFPE Signal geschickt. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 77 Kapitel 7. Rechnernetze 7.2 ISO–OSI–Referenzmodell 7.2.1 i Gegen Sie eine Kurzeinführung in das ISO–OSI–Schichtenmodell. 1. Physical Layer (Physische Schicht). Die physische Schicht ist dafür zuständig rohe Bits über den Kommunikationskanal zu schicken. Hier geht es um mechanische und elektrische Fragen, ausserdem spielt das Timing eine wichtige Rolle. Die Implementierung ist meist stark von dem darunter liegenden Leiter abhängig. Dienste. SendFrame und RecieveFrame Protokolle. Stichworte. Twisted Pair, Glasfaser, Funk, Satellit, Manchester-Codierung Kapitel 7 Rechnernetze 7.1 Allgemeines 7.1.1 Wozu verwendet man Codierungen? 2. Data Link Layer (Sicherungsschicht). Die Sicherungsschicht berücksichtigt, dass die von der physischen Schicht gelieferten Bitströme mit Fehler behaftet sein können. Sie ist für Fehlerkontrolle und Korrektur zuständig. Ausserdem teilt die Sicherungsschicht die zu übertragenden Daten in sog. Frames auf. Desweiteren findet hier die Flusssteuerung statt. Bei Netzen mit Vielfachzugriffsmedien gibt es noch eine Teilschicht, die MAC-Layer, die für die Medienzugriffskontrolle sorgt. Dienste. SendPacket, RecievePacket Protokolle. HDLC, SLIP, PPP Stichworte. Sliding Window, Bit-Stuffing Codierung dient dazu, den Inhalt einer Nachricht in einer speicherbaren, verarbeitbaren und übermittelbaren Form darzustellen. 7.1.2 3. Network Layer (Netzwerkschicht). Die Netzwerkschicht muss Pakete von der Quelle zum Ziel versenden können. Der Weg verläuft normalerweise über mehrere Router, deshalb findet das Routing auf der Netzwerkschicht statt. Die Netzwerkschicht stellt somit die erste Ende-zu-Ende Übertragungschicht dar, die Sicherungsschicht überträgt die Daten nur von einem Ende des Leiters zum anderen. Ausserdem werden Stauprobleme in Netzwerken in der Netzwerkschicht gelöst (und in der Transportschicht). Dienste. SendTPDU, RecieveTPDU Protokolle. IP, ARP, DHCP Stichworte. Staukontrolle, Routing, IP Welche Fehler treten in Netzwerken auf? Daten können kaputt gehen Daten können verloren gehen Daten können in der falschen Reihenfolge ankommen Leitungen können ganz zusammenbrechen 7.1.3 4. Transport Layer (Transportschicht). Die Aufgabe der Transportschicht ist es einen zuverlässigen, kostengünstigen Transport von der Quelle vom Ziel anzubieten. Dieser Transport muss unabhängig von der physischen Struktur der Netzwerke die dazu dienen, sein. Manchmal werden die Schichten in zwei Teile zerlegt, die unteren vier Schichten betrachtet man als den Transport Service Provider und die oberen Schichten als den Transport Service User. Die Transportschicht stellt somit die Schnittstelle zwischen Anbieter und Nutzer da, deshalb spielt sei eine besondere Rolle. Dienste. Connect, SendData, RecieveData, Disconnect Protokolle. TCP, UDP Stichworte. Sliding Window, Three-Way Handshake Wie kann man Fehler erkennen? Das hängt von der Art der Fehler ab. Störungen innerhalb eines Frames können durch Prüfsummen erkannt werden. Verloren gegangene Frames können durch Bestätigungen erkannt werden. Flusskontrolle stellt die richtige Reihenfolge sicher. 7.1.4 Unterschiede zwischen verbindungsorientierter und verbindungsloser Kommunikation? Bei verbindungsorientierter Kommunikation muss der Sender zum Empfänger eine (virtuelle) Verbindung aufbauen, erst dann kann der Daten senden. Danach wird die Verbindung wieder abgebaut. Eine Verbindung wird als eine sichere Kommunikation betrachtet. Normalerweise geht man davon aus, dass die Daten bei Empfänger in der selben Reihenfolge ankommen, wie sie vom Sender verschickt wurden. Dies ist bei verbindungsloser Kommunikation nicht sicher gestellt. Bei verbindungsloser Kommunikation sendet der Sender einfach darauf los. Die Daten kommen beim Empfänger an oder auch nicht. 7.1.5 5. Session Layer (Sitzungsschicht). Die Sitzungsschicht erlaubt es Benutzern an verschiedenen Maschinen Sitzungen zwischen ihnen aufzubauen. Eine Sitzung ermöglicht gewöhnlichen Datentransport, wie die Transportschicht auch, bietet aber zusätzliche Dienste, die für bestimmte Anwendungen wichtig sind. Die Sitzungsschicht existiert im TCP/IP-Modell nicht und ist logisch schlecht von der Anwendungsschicht trennbar. Was ist ein Multicast? 6. Presentation Layer (Darstellungsschicht). Die Darstellungsschicht führt bestimmte Funktionen aus, deren häufige Verwendung eine allgemeine Lösung rechtfertigen. Die Darstellungsschicht kümmert sich auch um Syntax und Semantik der übertragenen Information. Die Darstellungsschicht existiert im TCP/IP-Modell nicht und ist logisch schlecht von der Anwendungsschicht trennbar. Protokolle. MIME Bei einem Multicast kann eine Station an eine Gruppe von Empfänger eine Nachricht verschicken. Dies muss unterschieden werden vom Broadcast, wo eine Station an alle anderen Stationen eine Nachricht schickt. 7.1.6 Was sind LAN, MAN und WAN? Name Distanzen Beispiel Technologien LAN MAN WAN Local Area Network < 1km Büro Ethernet, WLAN Metropolitan Area Network 1 km – 10 km Stadt Cable, FDDI Wide Area Network > 10 km Land ATM DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 7. Application Layer (Anwendungsschicht). In der Anwendungsschicht sind viele bekannte Protokolle wie HTTP angesiedelt. Protokolle. HTTP, FTP, SNMP, SMTP 79 80 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.2. ISO–OSI–Referenzmodell Host A 7 Application Presentation protocol 6 Presentation 5 Host B Application protocol Application OSI APDU 7 Application 6 Presentation 5 Session 4 Transport 3 Network 2 Data link Physical 1 Presentation PPDU Session protocol Session Kapitel 7. Rechnernetze Session SPDU Transport TPDU Transport protocol 4 Transport Router Router 3 Network Network Network Network Paket 2 Data link Data link Data link Data link Frame 1 Physical Physical Physical Physical Medium Medium Bit 7.2.8 Medium 7.2.9 Dienstprimitive. Die Dienstprimitive sind die Operation (Methoden), die eine Schicht der Schicht über ihr anbietet. Es herrscht einige Verwirrung darüber welche Schicht nun welche Primitive hat. Zum Beispiel wird manchmal behauptet, die Schicht 1 hätte die Primitiven SendBit und RecieveBit. Das stimmt so nicht. Das sind nämlich genau die Primitiven des Leiters und nicht der Schicht 1. Protokoll. Protokolle definieren Regel für die Nachrichten die zwischen Instanzen der selben Schicht ausgetauscht werden. Zwei Instanzen auf der selben Schicht können, wenn Sie wollen sich für ein neues Protokoll entscheiden. Solange sie ihre Dienste nicht ändern, wird das Netz davon nicht beeinflusst. Was sind die Anforderungen an die einzelnen Schichten? 7.3.1 Auf welcher Schicht ist ein Hub angesiedelt? Physische Schicht. 7.3.2 7.3.3 Auf welcher Schicht ist eine Bridge angesiedelt? Sicherungsschicht. Nennen Sie für jede Schicht ein Beispielprotokoll. 7.3.4 Auf welcher Schicht ist ein Router angesiedelt? Netzwerkschicht. Wer hat das OSI-Schichtenmodell entworfen? 7.3.5 Beschreiben Sie Ethernet. Ethernet ist eine LAN-Technologie, die durch IEEE 802.3 standardisiert ist und eine Übertragungsrate von 10 MBit/s bietet. Ethernet kann mit Coax, Twisted-Pair und Glasfaser eingesetzt werden. Es handelt sich um ein Broadcastnetz, dass CSMA/CD als Zugriffsverfahren einsetzt und die ManchesterCodierung verwendet. Als Adressen verwendet Ethernet die weltweit eindeutigen 48 Bit MAC Adressen. Ethernet selbst bietet nur verbindungslose Kommunikation ohne Bestätigung. Es kann aber durch die Logical Link Control (LLC)-Schicht erweitert werden, die auch verbindungsorientierte Kommunikation erlaubt. Dann ist die Sicherungsschicht in zwei Schichten, die MAC-Schicht und die LLC-Schicht zerlegt. Die Medium Access Control (MAC)-Schicht beinhaltet das Vielfachzugriffsverfahren. Die Logical Link Control (LLC)-Schicht bietet die verbindungsorientierte Kommunikation, die LLC ist durch IEEE 802.2 definiert. Ethernet ist sehr einfach und günstig und daher sehr weit verbreitet. Dies gilt insbesondere, da auch schnellere Varianten von Ethernet, Fast Ethernet und Gigabit Ethernet mit 100 bzw. 1000 MBit/s existieren. Warum vertikale und nicht horizontale Einteilung? Mit vertikaler Einteilung wird ein Schichtenmodell impliziert, siehe 7.2.8. Horizontale Einteilung entspricht einer Partitionierung mit komplizierteren Abhängigkeiten. Was bedeutet das Open ins OSI? Unter Open Systems versteht man Systeme die für die Kommunikation mit anderen Systemen offen sind. 7.2.7 Auf welcher Schicht ist ein Switch angesiedelt? Sicherungsschicht. Das OSI-Modell basiert auf einem Vorschlag der von der ISO ausgearbeitet wurde. 7.2.6 Was ist ein SAP? Schichtübergreifend. siehe 7.2.1. 7.2.5 Was für einen Sinn hat das Schichtenmodell? 7.3 siehe 7.2.1. 7.2.4 Host-tonetwork Ein SAP ist ein Service Access Point oder ein Dienstzugriffspunkt. Dies ist der Punkt in dem die Schicht n der Schicht n + 1 ihre Dienste zur Verfügung stellt. Dienst (Service). Ein Dienst ist eine Menge von Operationen die eine Schicht der Schicht über ihr anbietet. Es wird nichts über die Implementierung dieser Operationen ausgesagt. 7.2.3 Transport Network Reduzierung der Komplexität und Austauschbarkeit. Die Darstellung zeigt das ISO-OSI-Schichtenmodell. Wichtig sind die folgenden Begriffe 7.2.2 TCP/IP Application Unterschied zwischen ISO–OSI–Referenzmodell und Schichtenmodell des Internet? Das TCP/IP-Modell spezifiziert weder Schicht 1 noch Schicht 2. Ausserdem nimmt es oberhalb der Schicht 4 keine Trennung mehr vor. Die Darstellung zeigt die beiden Modelle. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 81 7.3.6 Was wissen Sie über TCP/IP siehe 7.7.12 und 7.8.3. 82 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.4. Schicht 1 7.4 Schicht 1 7.4.1 Was gibt es für Medien? Kapitel 7. Rechnernetze pure ALOHA. Bei pure ALOHA kann jede Station senden, wann sie will, sie macht kein Carrier Sensing. Während des Sendens hört die Station weiter mit und kann dadurch erkennen, ob ihre Daten korrekt gesendet wurden oder nicht. Wenn es einen Fehler gab, sendet sie einfach nochmal. Die maximale Ausnutzung der Bandbreite liegt bei 18%. Kabel slotted ALOHA. Bei slotted ALOHA wird die Zeit in sog. Slots unterteilt. Um die Slots zu synchronisieren, kann z. B. eine Station als Taktgeber fungieren. Bei slotted ALOHA dürfen die Station nicht zu jeder Senden, sondern immer nur zu Beginn eines Slots. Durch slotted ALOHA kann die Leistung in etwa verdoppelt werden. Coax Twisted Pair Lichtwellenleiter Multimode Fiber Monomode Fiber 7.5.4 Drahtlos DQDB ist in der IEEE Norm 802.6 definiert und beschreibt ein MAN. DQDB wird in der 4. Auflage des Tanenbaums nicht mal erwähnt, scheint also nicht mehr relevant zu sein. Funk Mikrowellenfunk Infrarot Laser 7.4.2 7.5.5 Wie funktionieren Lichtwellenleiter? 7.5.6 siehe 7.4.1. Schicht 2a 7.5.1 Welche Medienzugriffsverfahren kennen Sie? Wie funktioniert die Manchester-Codierung? Codierungsverfahren, bei dem die binären Informationen durch Spannungswechsel innerhalb der Bitzeit dargestellt werden. Dadurch können Sender und Empfänger wesentlich leichter synchronisiert werden, denn der Übergang in der Mitte der Bitzeit gibt einen zuverlässigen Takt. Eine binäre 1 wird durch ein High-Signal gefolgt von einem Low-Signal dargestellt, ein 0 genau umgekehrt. Die ManchesterCodierung ist self-clocking , d.h. es muss kein extra Taktsignal gesendet werden. Der Empfänger kann den Takt selbst erkennen. Deshalb hat bei Ethernet jeder Frame eine 7 Byte lange, aus der Folge 10 bestehende, Präambel. Nachteil der Manchester-Codierung ist, dass die doppelte Bandbreite benötigt wird. Welche Arten von Lichtwellenleitern gibt es? 7.5 Wie funktioniert FDDI? Fiber Distributed Data Interface ist ein Lichtwellenleiter basiertes Token-Ring-LAN, das 100 Mbps über Entfernungen von 200km unterstützt. FDDI wird in der 4. Auflage des Tanenbaums nur noch am Rande erwähnt. Ein Lichtwellenleiter besteht aus einer sehr dünnen Glasfaser, die von einer Glasshülle umschlossen wird. Das ganze wird dann noch durch eine Kunsstoffhülle geschützt. Am einen Ende der Leitung sitzt eine Lichtquelle, zum Beispiel eine Laserdiode, am anderen Ende sitzt ein Detektor. Vereinbarungsgemäss steht Licht an für 1 und Licht aus für 0. Aufgrund der Brechungs- und Beugungsgesetze verlässt das Licht den Leiter nicht, sondern ist praktisch in ihm gefangen und kann wegen der minimalen Dämpfung über sehr weite Entfernungen übertragen werden. 7.4.3 Was ist DQDB? 7.5.7 Geben Sie eine Einteilung der Vielfachzugriffsverfahren an. Vielfachszugriffsverfahren siehe 7.5.7. ohne Reservierung 7.5.2 mit Reserverierung Erklären Sie CSMA-CD. ohne Carrier Sense In der 1-persistenten Variante läuft CMSA/CD so ab: mit Carrier Sense statisch dynamisch – sendewillige Station überwacht den Kanal (Carrier Sense) pure Aloha – ist der Kanal frei, wird gesendet slotted Aloha p-persistent nonpersistent TDM FDM Token – ist der Kanal belegt, wird er weiter überwacht bis er frei ist, dann wird sofort übertragen – während der Übertragung wird der Kanal weiter abgehört 7.5.8 – bei Erkennung einer Kollision wird die Übertragung abgebrochen und ein JAM-Signal gesendet Nach i Kollision wird eine Zufallszahl zwischen 0 und 2i − 1 gewählt. Entsprechend dieser Zufallszahl wird gewartet. Nach 10 Kollisionen wird die Wartezeit nicht mehr erhöht. Nach 16 Kollisionen meldet der Controller einen Fehler. – danach wird entsprechend des Binary-Backoff-Algorithmus’ gewartet – jetzt geht es von Vorne wieder los 7.5.3 7.5.9 Wie funktioniert ALOHA? ALOHA ist ein Vielfachzugriffsverfahren ohne Reservierung und ohne Carrier Sense. Es gibt zwei verschiedene Arten von ALOHA. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie funktioniert der Binary-Back-Off-Algorithm? 83 Was ist der Konfliktparameter? Eine Nachricht darf bei CSMA/CD nicht komplett in den Kanal passen, sonst kann eine Kollision auftreten, ohne dass die sendende Station das bemerkt. Betrachten wir den Worst-Case. 84 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.5. Schicht 2a Wir haben zwei Stationen A und B, die genau an den beiden Enden des Mediums liegen. Jetzt sendet A einen Frame FA . Kurz bevor der Frame am anderen Ende des Kabels ist, sendet die dortige Station einen Frame FB . B erkennt den Frame FA von A und sendet wegen der Kollision sofort ein JAM-Signal J. Dieses muss jetzt aber wieder über das ganze Kabel bis zu A. Wichtig ist das A zu den Zeitpunkt, in dem das JAM-Signal bei ihm eintrifft noch nicht mit dem Senden des Frames F A fertig ist, sonst würde sie nichts von der Kollision mit bekommen. Kapitel 7. Rechnernetze 7.6 Schicht 2b 7.6.1 Was ist Sliding Window ? Sliding Window beschreibt ein Verfahren zur Flusskontrolle das flexibler als Stop-And-Wait ist. Die Idee ist folgende. Bei Stop-And-Wait muss der Sender immer auf die Bestätigung für einen Frame warten, bevor er den nächsten senden darf. Bei langen Signallaufzeiten wird dadurch sehr viel Kapazität verschwendet. Besser wäre es, wenn der Sender mehrere Frames verschicken kann und dann nach und nach die Bestätigungen bekommt. Grundvoraussetzung für Sliding Window ist, dass jeder Frame eine eindeutige Sequenznummer hat. Damit können Duplikate unterschieden werden. Sowohl der Sender wie auch der Empfänger haben ein Fenster von Sequenznummern, die bei beiden unterschiedliche Funktionen erfüllen. Diese Fenster heissen entsprechen Sendefenster und Empfangsfenster. Beide Fenster sind jeweils durch eine unter und obere Grenze begrenzt. Diese Grenzen sind Sequenznummern. Um das zu gewährleisten gibt man den Frames eine Mindestlänge, so dass eine sendende Station mindestens so lang mit senden beschäftigt ist, wie das Signal zum Ende des Leiters und das JAM-Signal zurück benötigt. Die maximale Kabellänge muss natürlich auch spezifiziert sein. Nehmen wir an die Signallaufzeit von einem Ende des Mediums zum anderen beträgt t Zeiteinheiten, dann muss eine Station zum Senden eines Frames mindestens 2 · t Zeiteinheiten benötigen, damit nichts schief geht. Der Konfliktparameter K beschreibt genau diesen Zusammenhang: Die Sequenznummer im Sendefenster sind die Frames die verschickt wurden oder verschickt werden dürfen, für die aber noch keine Bestätigung eingegangen ist. Wenn ein Paket von der Netzwerkschicht kommt wird ein Frame mit der nächsten höchsten Sequenznummer erstellt und die obere Grenze des Sendefensters wird um eins erhöht. Dadurch verwaltet das Sendefenster immer eine List von noch nicht bestätigten Frames. Da theoretisch all diese Frames verloren gehen könnten, muss der Sender von jedem eine Kopie speichern. Dafür braucht er Speicherplatz und daher ist Grösse des Fensters begrenzt. Falls die Grösse des Fensters erschöpft ist und die Netzwerkschicht weiterhin versucht neue Pakte zu verschicken, muss die Sicherungsschicht der Netzwerkschicht signalisieren, sich zu gedulden und keine neuen Pakete mehr anzuliefern, bis wieder Platz im Sendefenster entstanden ist. Der Sender muss ausserdem aufhören zu Senden, wenn ihm die Sequenznummern ausgehen. Wenn z. B. 3 Bits für die Sequenznummer verwendet werden, kann er 8 Frames verschicken ohne eine Bestätigung zu bekommen, dann muss er auf eine Bestätigung warten. 2·t K= ∆t Wobei ∆t die Nachrichtenübertragungszeit ist. Um das vorhergesagte zu formalisieren, fordern wir dass K= 2·t <1 ∆t immer gelten muss. Wenn wir für ∆t den Quotienten aus Framelänge l und Kanalübertragungsrate λ einsetzen, können wir die minimale Framelänge lmin berechnen. K lmin 7.5.10 = ⇓ > 2·t 2tλ = <1 ∆t l Das Empfangsfenster entspricht den Frames die der Empfänger bereits ist anzunehmen. Alle ankommenden Frames, die ausserhalb des Fensters liegen, werden sofort verworfen. Wenn ein Frame ankommt, dessen Sequenznummer der unteren Grenze des Empfangsfensters entspricht, wird dieser an die Netzwerkschicht weitergegeben, eine Bestätigung verschickt und das ganze Empfangsfensters (ober und untere Grenze) um eins nach oben geschoben (rotiert). In der Bestätigung, die an den Sender geschickt wird, steht die Sequenznummer des letzten korrekt erhaltenen Frames, so weiss der Sender, ob alles klar gegangen ist und kann das nächsten Frame verschicken. Falls der Empfänger einen Frame empfängt, der nicht die aktuell erwartete Sequenznummer hat, kann er nach zwei Strategien vorgehen. Die einfachere wird go back n genannt. Der Empfänger akzeptiert die Frames einfach nicht und sendet keine Bestätigungen (dieses Verfahren ergibt sich automatisch, wenn die Grösse des Empfangsfensters 1 ist). Die aufwendigere Methode nennt sich selective repeat. Wenn der Empfänger einen Fehler entdeckt, schickt er dem Sender eine negative Bestätigung (NAK) und sagt ihm genau, welcher Frame fehlt, der Sender kann diesen dann nochmal schicken. Erst wenn der Empfänger eine vollständige Sequenz von Frames hat, gibt er diese an die Netzwerkschicht weiter. 2tλ Wie funktioniert Token Ring? Token Ring verwendet ein dynamisches Vielfachzugriffsverfahren mit Reservierung. Ein Token kreist in dem (physischen) Ring. Wenn eine Station senden will, muss sich den Token vom Ring nehmen. Nur wer einen Token hat darf senden. 7.5.11 Vergleiche Sie CSMA/CD und Token Ring/Bus? Da ein Token verloren oder kaputt gehen kann oder eine Station eine Token nicht mehr her geben kann, ist das Tokenmanagement von Token Ring/Bus ist deutlich aufwendiger als CSMA/CD. Siehe dazu auch 7.5.12. Wichtig ist, dass die Reihenfolge der Frames beim Senden zwar durcheinander kommen kann, aber der Netzwerkschicht die Pakete immer in der richtigen Reihenfolge übergeben werden. 7.6.2 7.5.12 Was passiert bei Token Ring, wenn eine Station ausfällt? Zur Flusskontrolle gibt es feedback-basierte Mechanismen und rate-basierte Mechanismen, in der Sicherungsschicht werden aber nur feedback-basierte Mechanismen eingesetzt. Zwei Protokolle sind StopAnd-Wait und Sliding Window. Sliding Window wird in 7.6.1 beschrieben. Stop-And-Wait ist sehr einfach. Der Sender sendet einen Frame, dann wartet er solange, bis er eine Bestätigung vom Empfänger bekommen hat. Erst dann sendet er den nächsten Frame. Ein wirkliches Problem ergibt sich beim Ring, wenn das Kabel reisst. Falls eine Station ausfällt (oder abgeschaltet) wird entfällt auch die Verzögerung die sie normalerweise auf das Token hat, das Token muss dann eventuell an anderer Stelle stärker verzögert werden. Ein anderes Problem ist, dass es bei Token Ring immer eine Überwachungsstation gibt, die dafür u. a. dafür zuständig verloren gegangene Tokens zu ersetzen. Fällt diese aus, muss eine andere einspringen, was oft zu Problemen führt. 7.6.3 7.5.13 Welche Verfahren zur Flusssteuerung kennen Sie? Wie teilt der Empfänger bei dem Sender Sliding Window mit, dass er mit dem Senden aufhören soll? Was ist der Vorteil von Switched Ethernet? Wenn der Empfänger überfordert ist, sendet er keine Bestätigungen mehr. Dadurch muss der Sender früher oder später aufhören zu Senden, da sein Sendefenster erschöpft ist. Die Kollisiondomänen sind kleiner, dadurch gibt es weniger Kollisionen. Die Sicherheit wird erhöht, da nicht jede Station den ganzen Datenverkehr mit bekommt. Bei HDLC (7.6.7) kann der Empfänger einen Supervisory-Frame vom Typ Recieve Not Ready an den Sender schicken. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 85 86 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.6. Schicht 2b Bei TCP schickt der Empfänger dem Sender immer die Grösse seines Empfangsfensters mit, wenn er überfordert ist, schickt er eine 0. 7.6.4 Kapitel 7. Rechnernetze 7.7 Schicht 3 7.7.1 Erklären Sie, was Schicht 3 macht. Wie funktioniert CRC? siehe 7.2.1. Die Grundidee von CRC ist, dass man eine Folge von n Bits als ein Polynom vom Grad n − 1 dessen Koeffizienten nur 0 oder 1 sind, betrachten kann. Polynomielle Arithmetik wird modulo 2 durchgeführt, daher entspricht Addition und Subtraktion einem einfach XOR. Das Prüfsummenverfahren läuft nun wie folgt ab. Sender und Empfänger einigen sich auf eine Generatorpolynom G(x), wobei das höchste und das niedrigste Bit 1 sein muss. Um einen Frame mit m Bits, die dem Polynom M (x) entspricht zu verschlüsseln, muss der Frame länger sein als das Generatorpolynom. Nun hängt man an den eigentlichen Frame eine Checksumme an, so dass das gechecksummte Frame durch G(x) teilbar ist. Wenn der Empfänger eine Frame erhält versucht er ihn durch G(x) zu teilen. Gibt es einen Rest, liegt ein Übertragungsfehler vor. Dadurch ergibt sich folgender Algorithmus zur Berechnung der Checksumme: 7.7.2 Bei statischen Routing-Verfahren werden die Wegewahlentscheidungen im Vorhinein ohne bestimmt. Adaptive Routing-Verfahren passen die Entscheidungen mit Messungen an die aktuellen Gegebenheiten an. 7.7.3 7.7.4 Es stellt sich die Frage, warum T (x) durch G(x) teilbar ist. Das ist eine fundamentale Eigenschaft der Division, es gilt immer: Divisor | Dividend − Rest 7.7.5 7.7.6 Welche Fehler werden durch CRC erkannt? Wie sichert man Nachrichteninhalt? Mit Checksummen, z. B. CRC (siehe 7.6.4). Was ist HDLC? High-Level Data Link Control ist ein älteres bitorientiertes Sicherungsprotokoll das vor allem in öffentlichen Paketvermittlungsnetzen eingesetzt wird. Das Protokoll nutzt ein Flag und bit-stuffing um die Frames voneinander zu trennen. Zur Flusskontrolle wird ein Sliding Window verfahren mit einer 3 Bit Sequenznummer verwendet. Es gibt drei verschiedene Arten von Frames: Information, Supervisory und Unnumbered. Wobei Information-Frames für normale Datenübertragung, Supervisory-Frames für Signalisierung und die Unnumbered-Frames für verschieden Zwecke verwendet werden. Unnumbered-Frames können für verbindungslose Kommunikation benutzt werden. Die Supervisory-Frames können verschiedene Typen haben. Wichtige Typen sind Recieve Ready für normale Bestätigung und Reject für negative Bestätigung. Zusätzlich gibt es Recieve Not Ready um den Sender mitzuteilen, dass der Empfänger nicht mehr mitkommt und Selective Reject um einen Fehler für einen bestimmten Frame anzuzeigen. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Erklären Sie Distance-Vector-Routing. Distance-Vector-Routing ist ein dynamischer Algorithmus, der wie folgt funktioniert. Jeder Router verwaltet einen Vektor mit den besten bekannten Entfernungen zu jedem Ziel und der entsprechenden Leitung. Diese Tabelle werden immer wieder geupdatet in dem mit den Nachbarn Informationen ausgetauscht werden. Für jeden Zielrouter enthält der Vektor einen Eintrag mit der zu wählenden Ausgangsleitung und einen Eintrag für die geschätzte Entfernung zum Ziel. Mögliche Metriken hier sind Hops, Übertragungszeit oder Queueingzeiten. Jeder Router kennt die Entfernung zu seinen Nachbarn, falls die Metrik nicht Hops ist, kann der Router die Entfernung anhand einer Analyse seiner Queue oder durch Messung von Signallaufzeiten bestimmen. In einem bestimmten Zeitintervall verschickt jeder Router die von ihm geschätzten Zeiten an seine Nachbarn. Mit den neu erhaltenen Tabellen der Nachbarn kann jeder Router entscheiden, ob es bessere Wege zu manchen Zielen gibt, als in seinem Vektor gespeichert ist. siehe 7.6.4. 7.6.7 Erklären Sie Shortest-Path-First-Routing. Beim Shortest-Path-Routing werden die kürzesten Pfade im Netzwerk mit einem typischen Algorithmus wie Dijkstra bestimmt. Das Kantengewicht kann auf verschiedene Arten gewählt werden. Es kann einfach immer 1 betragen, den zählt man nur die Hops oder man wählt andere Faktoren wie die physische Distanz, Übertragungszeit oder die durchschnittlichen Queueingzeiten. Auch eine Kombination der Faktoren ist möglich. Die Routingentscheidungen werden dann entsprechend der kürzesten Wege bestimmt. Die Berechnung der CRC kann in Hardware sehr effizient gelöst werden. 7.6.6 Wie funktioniert Routing im Internet? In autonomen Subnetzen (AS) wird heute hauptsächlich OSPF eingesetzt. Zwischen den AS meisten BGP. Zum Beispiel gilt für 9/4 mit Rest 1: 4 | 9 − 1. Die Güte der Checksumme ist bei CRC abhängig vom Grad des Generatorpolynoms. Allgemein gilt mit einem Generatorpolynom vom Grad k findet man alle Bit-Fehler der Länge ≤ k. Wenn man das Polynom geschickt wählt kann man ausserdem noch alle Bitfehler die eine ungerade Anzahl an Bits betreffen finden. Das liegt daran, dass kein Polynom mit einer ungeraden Anzahl an Termen das Polynom x2 + 1 als Faktor hat. Wenn x2 + 1 ein Faktor des Generatorpolynoms ist, dann findet man die ungeradlängigen Bitfehler. Es gibt einige international standardisierte Polynome. Ethernet verwendet das folgende Polynom vom Grad 3 7.6.5 Ist auf Schicht 3 eine zuverlässige Übertragung möglich? Schicht 3 kann sowohl verbindungsorientiert als auch verbindungslos sein. IP ist eine Beispiel für eine verbindungslose Technik, ATM für eine verbindungsorientiert. 1. r sei der Grad von G(x). An den Frame werden auf der niederwertigen Seiten r 0-Bits angehängt. Er hat jetzt m + r Bits und entspricht dem Polynom xr M (x). 2. Diese Polynom xr M (x) wird nun entsprechen der Modulo-2-Division durch G(x) geteilt. 3. Dabei ergibt sich ein Rest von r oder weniger Bits. Dieser wird nun von Bitstring der x r M (x) entspricht entsprechend der Modulo-2-Subtraktion abgezogen. Das ist nun der gechecksummte Frame, der T (x) genannt wird. x32 + x26 + x23 + x22 + x16 + x12 + x11 + x10 + x8 + x7 + x5 + x4 + x2 + x1 + 1 Was sind statische und adaptive Routing-Verfahren? 87 Distance-Vector-Routing hat ein grosses Problem, es findet zwar eine gute Konfiguration, aber sehr langsam. Das Problem ist vor allem, dass sich gute Nachrichten sehr schnell, schlechte aber sehr langsam verbreiten. Das ist als Count-to-Infinity-Problem bekannt. Der Kern des Problems liegt daran, dass wenn X Y mitteilt, dass er irgendwohin einen Pfad hat, Y nicht weiss, ob er selber auf dem Pfad liegt oder nicht. 7.7.7 Erklären Sie Link-State-Routing. Link-State-Routing ist adaptiver Routing-Algorithmus bei dem Informationen über die Netztopologie und alle Verzögerungszeiten gesammelt und an jeden Router verteilt wird. Dann können mit dem Dijkstra-Algorithmus die kürzesten Pfade bestimmt werden. Jeder einzelne Router geht nach folgenden Schritten vor: 88 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.7. Schicht 3 Kapitel 7. Rechnernetze 1. Nachbarn entdecken und deren Adressen merken. Als erstes Sendet der Router über jede seiner Leitungen ein Hello-Paket. Als Antwort erhält er vom Router auf der anderen Seite dessen Adresse. Diese Adressen müssen eindeutig sein. Die wichtigsten Unterschiede zwischen IPv4 und IPv6 sind IPv6 benutzt 16 Byte Adresse, das entspricht ca. 3, 4 · 1038 Adressen. Das Adressproblem ist damit behoben. 2. Die Verbindungskosten zu jedem Nachbarn messen. Jetzt sendet er an jeden Nachbarn ein Echo-Paket um die Verzögerung zu messen. Er kann dies mehrmals durchführen und einen Durchschnittswert wählen. Ob hierbei die Auslastung der Leitung mit in die Kalkulation aufgenommen wird, ist ein Diskussionspunkt. 3. Ein Paket zusammenstellen, dass die gerade gelernten Informationen enthält. Jetzt baut der Router ein Paket mit den gewonnen Informationen zusammen. Diese Paket enthält die Adresse des Router, eine Sequenznummer, ein Alter und eine Liste der Nachbarn. Für jeden Nachbarn enthält es die gemessene Verzögerungszeit. Die Frage ist nur, wann die Pakete verschickt werden. Dies kann entweder periodisch erfolgen oder wenn ein besonderes Ereignis, zum Beispiel ein nicht erreichbarer Router, auftritt. 4. Dieses Paket an alle anderen Router schicken. Das verschicken des Pakets ist er komplizierteste Teil, das sich Inkonsistenzen ergeben können, wenn manchen Router schon die neuen Information erhalten haben und andere nicht. Grundsätzlich basiert das Verfahren bei der Verteilung auf Flooding. Um das Flooding kontrollieren zu können, versieht der Router jedes Paket, das er versendet mit einer neuen Sequenznummer. Jeder Router speichert eine List von Paaren (Router, Sequenznummer), die er gesehen hat. Wenn ein neuen Paket ankommt, prüft er ob dieses neu ist, wenn ja verschickt er es an alle Router ausser dem Quellrouter. Wenn es ein Duplikat ist, verwirft er es. Wenn er ein Paket mit einer niedrigeren Sequenznummer als die höchste, die der Router bisher gesehen hat, ankommt, lehnt er das Paket ab, weil es alt ist. Es ergeben sich ein Paar Probleme, die aber in den Griff zu bekommen sind. Als erstes müssen die Sequenznummern am besten 32-bitig sein, damit sie nicht überlaufen. Wenn ein Router ausfällt und seine Sequenznummer vergisst, daher wieder bei 0 anfängt, werden seine Pakte nirgendwo mehr angenommen. Falls eine Paket kaputt geht und z. B. statt der Sequenznummer 4 eine 65.540 enthält, was auf einen 1-Bitfehler zurückzuführen ist, werden alle Pakete zwischen Sequenznummer 5 und 65.540 nicht mehr angenommen. Alle Probleme können mit dem Age-Feld der Pakete behoben werden. Das Alter eines bereits empfangenen Paketes wird jede Sekunde um 1 herunter gezählt. Paket mit Alter 0 sterben. Das Alter wird am Anfang so gesetzt, das normalerweise immer ein neues Paket vom entsprechenden Router ankommt, bevor es stirbt. Ausserdem wird beim Flooding am Anfang das Alter bei jedem Hop herunter gezählt, damit Paket nicht verloren gehen können. 5. Kürzeste Pfade zu allen Router berechnen. Wenn ein Router die komplette Menge an Link-State-Paketen bekommen hat, kann er daraus die Topologie des kompletten Netzes erschliessen und mit Hilfe von Dijkstra die kürzesten Pfade berechnen. Der Algorithmus funktioniert sehr gut und wird zum Beispiel bei OSPF eingesetzt. Defekte Hardoder Software kann den Algorithmus aber empfindlich stören. Wenn z. B. ein Router behauptet eine bestimmte Verbindung zu haben, wird der Graph auf dem die Berechnung basiert, inkorrekt. 7.7.8 Die Unterstützung für Optionen wurde verbessert. Zum einen dadurch, dass das Optionsfeld im IP-Header grösser ist, zum anderen werden die Information jetzt so gespeichert, das Router über Informationen, die nicht für sie bestimmt sind, einfach hinweg springen können. IPv6 hat verbesserte Unterstützung für Quality of Service. IPv6 hat Unterstützung für diverse Sicherheitsmechanismen wie Authentifizierung. 7.7.12 Das IP-Protokoll ist ein verbindungsloses Schicht 3 Protokoll. Zur Adressierung werden die bekannten IP-Adressen verwendet. Jedes IP-Paket besteht aus einem Header- und einem Datenteil. IP Pakete können bis 65.535 Bytes lang sein, sind aber in der Praxis meist 1500 Byte lang. 7.7.13 7.7.14 7.7.15 7.7.16 Was ist Staukontrolle? Im Gegensatz zur Flusskontrolle die dafür da ist, das ein Sender einen Empfänger, die beide an einer Punkt zu Punkt Verbindung hängen, nicht mit Daten überflutet, wird beim Thema Staukontrolle das komplette Netz betrachtet. Ein Stau existiert immer dann, wenn die Belastung des Netzes grösser ist als seine Ressourcen. Im Falle eines Staus können entweder die Ressourcen erhöht werden, oder, wenn das nicht geht, die Belastung gedrosselt werden. Generell unterscheidet man bei Staukontrolle zwischen Open Loop- und Closed Loop-Methoden. Erklären Sie OSPF. Open Loop Methoden. Open Loop Methoden versuchen das Problem durch gutes Design zu lösen, das heisst durch gute Planung im Vorhinein, während des Betriebs wird nicht mehr eingegriffen. Möglichkeiten den Stau im voraus zu vermeiden bestehen an mehreren Stellen. Nennen Sie ein nicht-adaptives, isoliertes Routing-Verfahren. Data Link Layer. In der Sicherungsschicht sollte die Flusskontrolle unnötige Frames verhindern, also z. B. selective repeat und piggybacking einsetzen. Network Layer. In der Netzwerkschicht ist vor allem die Entscheidung zwischen verbindungsorientierten und verbindungslosen Diensten ausschlaggebend, da viele Staukontrolle-Algorithmen nur mit Verbindungen arbeiten. Ausserdem ist Wahl eines Routing-Algorithmus’, der die Last gut verteilt, wichtig. Was ist RIP? Unterschied zwischen IPv4 und IPv6 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was ist hot potatoe? Beim Hot-Potatoe-Routing können Pakete nicht gespeichert werden, sondern werden wie eine heisse Kartoffel weitergegeben. Kommt z. B. in Backbone-Netzen vor wenn ein Carrier Daten von anderen Carriern möglichst schnell wieder los werden will. Wird auch bei optischem Routing verwendet, wo Lichtsignale nicht zwischengespeichert werden können. RIP ist ein älteres Internet Routing Protocol, es verwendet Distance-Vector-Routing, siehe dazu 7.7.6. 7.7.11 Was ist Flooding? Flooding ist ein sehr einfaches statisches Routingverfahren bei dem jedes ankommende Pakete über alle Leitung aus der Quellleitung weitergeleitet wird. Damit Flooding nicht ausartet, muss es irgendwie eingedämmt werden, entweder durch Hopcounter oder es werden Sequenznummern vergeben, so dass ein Router ein bereits einmal gefloodetes Paket nicht nochmal floodet. Flooding ist meist nicht praktikabel findet aber doch seine Anwendung. Zum einem ist wahnsinnig robust, selbst wenn fast alle Netzknoten ausfallen und nichts mehr funktioniert, tut Flooding noch seinen Dienst. Ausserdem ist Flooding der Prüfstein für alle anderen Routingalgorithmen, da Flooding dadurch, dass es alle Wege wählt, immer den kürzesten Weg wählt. Ich denke, hier ist Broadcasting gemeint. 7.7.10 Wozu braucht man das TTL-Feld im IP-Header? Das Time to Live-Feld im IP-Header wird bei jedem Hop runtergezählt, damit z. B. zyklisch geroutete Paket nicht ewig Kreisen (bei TTL=0 stirbt das Paket). OSPF ist ein Internet Routing Protokoll für autonome Subnetze, es wird ein Link-State-RoutingAlgorithmus verwendet, siehe dazu 7.7.7. 7.7.9 Erzählen Sie etwas zum IP-Protokoll. 89 90 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.8. Schicht 4 Transport Layer. Auch in der Transportschicht muss die Flusskontrolle unnötig versandte Daten vermeiden. Kapitel 7. Rechnernetze 7.8.3 Closed Loop Methoden. Closed Loop Methoden reagieren auf den aktuellen Zustand des Netzes, dieser Ansatz besteht immer aus drei Teilen: TCP ist das verbindungsorientiert Schicht 4 Protokoll der Internetprotkollfamilie. Eine TCP-Verbindung wird immer von einem Socket zu einem anderen aufgebaut. Ein Socket ist eine IP-Adresse plus Port. Eine TCP-Verbindung ist Byte basiert, nicht Nachrichten basiert. Der Verbindungsaufbau läuft bei TCP über den Three-Way Handshake (7.8.4). Zur Flusskontrolle verwendet TCP ein Sliding Window Verfahren. Bei dem von TCP verwendeten Verfahren teilt der Empfängen dem Sender immer die Grösse seines Empfangsfensters mit. Wenn er es auf 0 setzt, kann er damit den Sender drosseln. Die ursprüngliche Version unterstützt kein Selective Repeat sondern nur go back n. Interessant ist, dass die TCP-Checksumme ausser dem Header und den Daten noch einen Pseudoheader mit ein berechnet. Dieser Pseudoheader enthält Ziel- und Quelladresse. Diese Verwendung von IP-Adressen auf Schicht 4 verletzt die Protkollhierarchie. Bei der Trennung der Verbindung werden Timer benutzt um das Two Army-Problem zu umgehen. Die Staukontrollemechanismen von TCP beruhen auf der Annahme das Pakete hauptsächlich wegen Pufferüberläufen und nicht wegen schlechter Leitungsqualität verloren gehen. Dies führt bei unsicheren Funkverbindungen zu Problemen. Zur Staukontrolle verwendet verwaltet der Sender neben dem Sendefenster zusätzlich ein Congestion Window. Dieses Fenster kann an die aktuelle Belastung des Netzes angepasst werden. 1. Überwachung des Netzes. Wo und wann treten Verstopfungen auf? 2. Verteilung der Stauinformation an relevante Stellen. 3. Behebung des Problems Die folgenden Verfahren lassen sich nur bei verbindungsorientierter Kommunikation einsetzen. Wenn ein Stau entdeckt wurde, werden keine neuen Verbindungen mehr aufgebaut (Admission Control ). Verbindungen können vorsichtig um heikle Stelle herumgeführt werden. Es können bereits beim Verbindungsaufbau Verträge abgeschlossen werden. So fordert ein Kunde zum Beispiel eine gewisse Bandbreite, die Verbindung wird nur aufgebaut, wenn diese Bandbreite auch zur Verfügung steht. Im verbindungslosen Netzen muss anders vorgegangen werden. Ein Router kann die Auslastung seiner Ports messen, dieser Auslastung kann er eine Zahl zwischen 0 und 1 zuordnen. Jetzt wird eine Auslastungsobergrenze festgelegt. Wann immer ein Router ein Paket auf einem Port rausschicken soll, dessen Auslastung die Obergrenze übersteigt, muss er irgendwie reagieren. Dafür gibt es mehrere Möglichkeiten: 7.8.4 Schicht 4 7.8.1 Was ist das Transportsystem? Angenommen man hat Host A, der eine Verbindung mit Host B, aufnehmen möchte, passiert folgendes: 1. Im ersten Paket von A nach B: ACK-Flag SYN-Flag Sequenznummernfeld Acknowledgementfeld ACK-Flag SYN-Flag Sequenznummernfeld Acknowledgementfeld 0 1 initiale Sequenznummer nicht benutzt = = = = 1 1 initiale Sequenznummer Sequenznummer von A inkrementiert 3. Handschlag von A nach B ACK-Flag SYN-Flag Sequenznummernfeld Acknowledgementfeld = = = = 1 0 initiale Sequenznummer inkrementiert Sequenznummer von B inkrementiert Nach diesen drei Schritten ist die Verbindung aufgebaut. Möchte man den Aufbau einer TCP-Verbindung unterbinden muss man das erste Paket heraus filtern. So wird der weitere Aufbau einer Verbindung unmöglich. Das ACK-Flag spielt hier die entscheidende Rolle, da dieses Flag nur im ersten Paket nicht gesetzt ist. So werden bestehende TCP-Verbindungen nicht beeinträchtigt, da hier in allen Paketen das ACK-Flag gesetzt ist. Ist Schicht 4 immer verbindungsorientiert? Die Abbildung zeigt den Three-Way Handshake in seiner üblichen Darstellung. A, S sind das ACK bzw. SYN -Flag, SEQ und ACK sind das Sequenznummernfeld und Acknowledgementfeld. Nein. UDP z. B. ist nicht verbindungsorientiert. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs = = = = 2. Möchte B die Verbindung aufnehmen schickt er ein Paket nach A Unter dem versteht man die Schichten 1-4. 7.8.2 Was ist der Three-Way Handshake? Beim Aufbau einer TCP-Verbindung muss – bevor eine Verbindung zustande kommt – zunächst eine Verständigung zwischen Sender und Empfänger stattfinden. Dazu verwendet TCP die Methode des Three-Way Handshake. Das heißt es müssen zunächst drei TCP-Pakete gesendet werden bevor die Verbindung aufgebaut ist. Erst mit einem erfolgreichen letzten und drittem Segment erfolgt der Handschlag und die Verbindung besteht. Warning Bit. Der Router kann in ausgehenden Pakete ein Warning Bit auf 1 setzen, die Zielstation setzt dann ihrerseits ein Warning Bit in dem zu sendenden Bestätigunspaket, dass wieder zum Sender zurück läuft. Dieser drosselt daraufhin das Senden. Das dauert zwar relativ lang, hat aber den Vorteil, dass nicht in der schon bestehenden Stausituation noch extra Pakete versandt werden müssen. Choke Packets. Wenn der Router eine Überlastung feststellt sendet er ein Choke Packet an den Sender, der daraufhin drosselt. Hop-by-Hop Choke Packets. Es kann u. U. recht lange dauern, bis das Choke Packet beim Sender angekommen ist. Mit einem Hop-by-Hop Choke Packet kann der Router den Router vor ihm bitten, den Datenverkehr durch Pufferung zu drosseln. Dieser bittet wieder seinen Vorgänger usw. Load Shedding. Wenn die vorangegangen Methoden alle nichts Helfen, kann der Router zu brutaleren Methoden greifen, er verwirft einfach einen Teil der Pakete. Wenn der Router eine Ahnung von der Art der Daten hat (z. B. Multimedia) kann er erst einmal möglichst unwichtige Pakete verwerfen. Random Early Detection. Bei einigen Transportprotokollen (z. B. TCP) reagiert der Sender bei verloren Pakete mit einer Drosselung der Sendegeschwindigkeit. Das liegt daran, dass in kabelbasierten Netzen, für die z. B. TCP hauptsächlich entworfen wurde, fehlende Bestätigung meist auf Pufferüberläufe zurückzuführen sind. Wenn dem so ist, kann der Router, wenn er merkt, dass ein Stau kurz bevor steht manche Pakete der Quelle die die hohe Auslastung erzeugt, einfach verwerfen. Die Quelle reagiert dann mit der Drosselung der Sendeleistung. Das verfahren heisst early weil der Router das tut, bevor alles verstopft ist und random weil er aus der Queue in der er die Überlastung feststellt, zufällig ein Paket wählt und dieses verwirft. Dadurch wählt er den zu drosselnden Sender zufällig. 7.8 Erzählen sie etwas zu TCP. 91 92 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 7.8. Schicht 4 Host 1 Host 2 ASS 0 1 EQ ACK x Time CK EQ A A S S y x+1 11 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs ASS 1 0 x EQ ACK +1 y +1 93 Kapitel 8. Rechnernetze II Ebenenmanagement Schichtenmanagement Steuerebene Kapitel 8 Obere Schichten Rechnernetze II CS SAR Benutzerebene Obere Schichten ATM-Anpassungsschicht ATM-Schicht TC 8.1 Allgemeines 8.2 Hochleistungsnetze 8.2.1 Gibt es bei ATM MAC-Adressen? PMD Die Physische Schicht und die Anpassungsschicht bestehen aus zwei Teilschichten, wobei jeweils die untere die Arbeit tut und die oberen für die Schnittstelle nach oben zuständig ist. Die ATM-Anpassungsschicht (ATM Adaption Layer, AAL) hat die Aufgabe die Datenströme der höheren Schichten auf 48-Byte Lange Zellen zu segmentieren, bzw. aus den ATM-Zellen wieder die ursprünglichen Datenpakete zu erstellen (Reassembly). Es gibt verschiedene Typen der ALL-Schichte, derzeit sind AAL 1–5 spezifiziert. Je nach Anwendung (z. B. Clip) wird eine andere Schicht gewählt. ATM verwendet sein eigenes Adressformat. Genauer gesagt gibt es drei verschiedene Adressformate, die alle 20 Byte lang sind. Die Abbildung zeigt das DCC-Format. 1 AFI 2 3 4 5 6 7 8 DCC 9 10 HO-DSP 11 12 13 14 15 16 17 ESI 18 19 20 Die Hauptaufgabe der ATM-Sicht besteht darin, die von der AAL-Schicht empfangenen Daten an ihren Bestimmungsort zu transportieren. Die Informationseinheit der ATM-Schicht sind die 53-Byte Zellen. Die ATM-Schicht ist vollkommen unabhängig von der unter ihr liegenden physischen Schicht. SEL Im ersten Byte, dem Authority Format Identifier (AFI) wird das Adressformat angegeben, der Wert 39 steht für das DCC-Format. In den folgenden zwei Bytes steht der Data Country Code (DCC). Er bestimmt das Land, 276F steht für die BRD. Byte 4 bis 13 werden vom High Order Domain Specific Part (HO-DSP) belegt. Hier sind die Routing Domain und der Area Identifier abgelegt. Den Rest der 20 Byte teilen sich der End System Identifier (ESI) und das Selector Field (SEL). Wobei dem ESI die Rolle einer MAC-Adresse bei einem Ethernet-Gerät zukommt. Das SEL spielt eine ähnliche Rolle wie Ports bei IP. Wenn auf einer Maschine mehrere Dienste (z. B. BUS und LECS) laufen, so werden sie durch das SEL unterschieden. 8.2.2 Die physische Schicht ist für die Generierung der ATM-Zellen, Checksummen-Berechnung und das tatsächliche Versenden zuständig. Für eine genauer Beschreibung der Funktion der Schichten siehe auch 8.2.4. 8.2.4 Vergleichen Sie das ATM-Schichtenmodell mit dem ISO–OSI–Schichtenmodell. Physische und AAL-Schicht (AAL = ATM Adaption Layer) sind jeweils zweigeteilt. Wobei die eigentliche Arbeit in der unteren Schicht stattfindet und die Konvergenzschicht darüber die Schnittstelle nach oben bietet. Die Tabelle gibt einen Überblick über die Schichten des ATM-Modells und zeigt auch die korrespondierenden Schichten im OSI-Modell. Der Versuch die Schichten von ATM in das OSI-Schichtenmodell einzuordnen ist nicht unproblematisch. Wie funktioniert bei ATM die Vermittlung? Ein Vermittler liest die VPI/VCI-Information der ankommende Zelle aus dem Header und routet die Zelle anhand von Tabellen. In internen Vermittler (Vermittler, die keine Verbindung zum einem Host haben) kann das Routing nur in Abhängigkeit von der VPI-Information gemacht werden. Das hat mehrere Vorteile. Der Vermittler muss verhältnismässig kleine Tabellen speichern. Dass Routing ist schneller und Routen lassen sich sehr schnell für viele VCs umleiten. 8.2.3 Physische Schicht OSI ATM Teilschicht Funktionalität 3/4 AAL CS (Convergence Sublayer) SAR (Segmentation and Reassembly Sublayer) ATM (Asynchronous Transfer Mode) ist eine verbindungsorientierte Netzwerktechnologie, die Datenraten bis 622 MBit/s bietet. Die Verbindungen heissen Virtual Circuits (VC) und können entweder permanent oder switched sein. Mehrere VCs können zu einem Virtual Path (VP) zusammengefasst werden. Das bietet die Möglichkeit, eine ganze Sammlung von VCs zu routen. Ausserdem können QoS-Parameter einem ganzen Pfad zugeordnet werden. ATM setzt statt Pakete Zellen von 53 Byte Länge, die einen 5 Byte Header haben ein. Welche Vorteile der Einsatz von Zellen hat, beschreibt 8.2.6. ATM-Verbindungen bieten keine garantierte Zellzustellung, aber alle Zellen werden in der richtigen Reihenfolge zugestellt. 2/3 ATM 2 Physisch Das ATM-Modell lässt sich im Gegensatz zum OSI-Schichtenmodell besser dreidimensional darstellen. Die Benutzerebene betrifft Datentransport, Flusssteuerung, Fehlerkorrektur und andere Benutzerfunktionen. Die Steuerebene beschäftigt sich mit dem Verbindungsmanagement. Ebenen- und Schichtenmanagement sind für Ressourcenmanagement und Schicht übergreifende Koordination zuständig. 1 Bereitstellung der Standardschnittstelle (Konvergenz) Segmentierung und erneute Zusammensetzung Flusssteuerung Erzeugung/Extraktion des Zellheaders Management des virtuellen Pfades Multiplexen/Demultiplexen der Zellen Entkoppelung der Zellrate Erzeugung der Header-Prüfsummen Erzeugung der Zellen Ein-/Auspacken der Zellen Erzeugung von Rahmen Bitzeitgabe Physischer Netzzugriff Geben Sie einen kurzen Überblick über ATM. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 95 8.2.5 96 TC (Transmission Convergence Sublayer) PM (Physical Medium Dependent Sublayer) i Wie sieht die Sicherungsschicht bei ATM aus? http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 8.3. Dienstgüte Kapitel 8. Rechnernetze II Die Sicherungsschicht des OSI-Modells entspricht einer Mischung der Transmission Convergence Layer und der ATM-Schicht. Siehe 8.2.4. 8.2.6 Buffering. Ein Datenstrom kann gepuffert werden. Diese beeinflusst Zuverlässigkeit und Bandbreite nicht. Es erhöht die Verzögerung bietet aber die Möglichkeit Jitter zu vermindern. Da Pakete (im Verhältnis zu Zellen) sehr gross werden können, müssen neu ankommende Pakete, die übertragen werden sollen, im Mittel sicherlich länger warten. Traffic Shaping. Traffic Shaping kann als rate basierte Flusskontrolle betrachtet werden. Bei Verfahren wie Sliding Window wird Menge an Daten die verschickt wird kontrolliert. Beim Traffic Shaping kontrolliert man die Datenübertragungsrate. Die Idee beim Traffic Shaping ist, dass der Sender beim Verbindungsaufbau einen Vertrag eingeht, der ihm eine gewisse Datenrate zusichert, wenn er eine gewissen Senderate nicht überschreitet. Zur Realisierung von Traffic Shaping werden Leaky Bucket- oder Token-Bucket-Algorithmen eingesetzt. Wichtig ist, das beim Buffering auf Empfängerseite gepuffert wird, beim Traffic Shaping auf Senderseite. Bei Übertragungsfehlern muss immer ein ganzes Paket neu übertragen werden. Wenn nur an einer Stelle eines Pakets ein Fehler aufgetreten ist, müssen u. U. 64k übertragen werden. Das ist ungefähr 1200 mal so viel wie bei einer ATM-Zelle. Resource Reservation. Das Abschliessen eines Traffic Contracts erlaubt es den an der Verbindungen teilnehmenden Router entsprechend Ressourcen zu reservieren. Ressourcen sind Bandbreite, Puffer und Rechenzeit. Durch die feste Zellengrösse die lassen sich genauer Werte über z. B. die Belegungsdauer genauer bestimmen und vorhersagen. Admission Control. Wenn ein Router erkennt, dass es die im Vertrag geforderten Anforderungen nicht erfüllen kann, darf er die Verbindung nicht annehmen. Bei ATM-Zellen hat man einen relativen hohen Protokoll-Overhead, warum macht man das? Der wichtigste Grund ist, dass sich durch die kleine Zellengrösse die Zellen schneller (eventuell parallel) verarbeiten lassen. Zellrouting wird in Hardware realisiert. 8.2.7 Würden Sie ATM lokal einsetzen? 8.3.3 Im Vergleich zu Ethernet kann ATM hauptsächlich noch durch QoS punkten. Wenn QoS tatsächlich die zentrale Anforderung an das Netz ist (z. B. Video-Übertragung), dann könnte ATM eine Überlegung wert sein. Zu Berücksichtigen ist, dass ATM sehr teuer und sehr aufwendig zu konfigurieren ist. Ausserdem lässt es sich sehr schlecht in eine IP-Umgebung einbauen, wenn man nicht auf QoS verzichten will, oder man muss eine noch aufwendigere manuelle Konfiguration vor nehmen. Mit derzeitigen LAN-Technologien bekommt man eventuell für das selbe Geld ein so dermassen überdimensioniertes Gigabit-Ethernet, dass sich QoS von alleine erledigt. 8.3 Dienstgüte 8.3.1 Was ist QoS? Um eine niedrige Auslastung garantieren zu können, dürfen die Anforderung in den angenommenen Traffic Contracts die Ressourcen nicht überschreiten. 8.3.4 8.3.6 Jitter. Jitter ist die Standardabweichung der Verzögerung. Zuverlässigkeit (Reliability). Hier interessiert sowohl die Zerstörung als auch der Verlust von Daten. Realtime Variable Bit Rate (RT-VBR). Bei den meisten Komprimierungsverfahren für Audio und Video (z.B. MPEG) entsteht eine Datenstrom mit unterschiedlichen Bitraten. Um Echzeitanwendungen zu ermöglichen wird in dieser Klasse garantiert, dass kein Jitter auftritt. Der gelegentliche Bit- oder Zellverlust ist im Gegensatz zum Jitter zu verschmerzen. Unterschiedliche Anwendungen haben unterschiedliche Anforderungen an die Merkmalsklassen, die Tabelle gibt einen Überblick. 8.3.2 Verzögerung niedrig niedrig mittel mittel niedrig niedrig hoch hoch Jitter niedrig niedrig niedrig mittel hoch hoch hoch hoch Bandbreite niedrig mittel mittel niedrig mittel hoch niedrig hoch Non Realtime Variable Bit Rate (nRT-VBR). Diese Klasse eignet sich ebenfalls für Anwendungen mit variierender Bitrate, gibt aber keine Jitter-Garantie. Unspecified Bit Rate (UBR). Die UBR-Klasse mach keinerlei Garantien über die Bitrate und warnt auch nicht vor Überlastungen. Dieses Verfahren ähnelt dem von IP und eignet sich daher auch gut für die Übertragung von IP-Paketen. Available Bit Rate (ABR). Die ABR-Klasse bietet die Möglichkeit eine Verbindung zwischen A und B zu beantragen, die immer mindestens 5 MBit/s leistet, aber nach Möglichkeit des Netzes auch mehr zur Verfügung stellt. So kann man z.B. angeben, dass Spitzen von 10 MBit/s auftreten können. Die 5 MBit/s sind dann garantiert und die 10 MBit/s werden nach Möglichkeit zur Verfügung gestellt. Diese Klasse würde sich z.B. für Web-Surfen eignen. Welche Strategien gibt es für QoS? Overprovisioning. Man stellt einfach so viele Ressourcen zur Verfügung, dass alle QoS-Bedürfnis von selbst erfüllt werden. Das Problem bei dieser Lösung ist der Kostenfaktor. Das normale Telefonnetz ist ein Beispiel für diese Lösung. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Welche Dienstklassen bietet ATM? Constant Bit Rate (CBR). Durch die konstante Bitrate eignet sich die CBR-Klasse um eine Kupferoder Glasfaserleitung zu emulieren. Damit kann z.B. ein Sprachkanal realisiert werden, der sich wie ein herkömmlicher ISDN B-Kanal verhält. Ausserdem kann die CBR-Klasse zur EchtzeitÜbertragung unkomprimierter Video/Audio-Daten verwendet werden. Verzögerung (Delay). gemessen in ms. Zuverlässigkeit hoch hoch hoch hoch niedrig niedrig niedrig niedrig Was ist ein isochroner Dienst? Bei isochronen Diensten sollten Sender und Empfänger möglichst gleich laufen (also kein Jitter). Bandbreite (Bandwidth). gemessen in Bit/s. Anwendung eMail Dateitransfer WWW Remote Login Audio niedrig Video niedrig Telephonie niedrig Videokonferenz niedrig Was ist Jitter? Jitter ist die Standardabweichung der Verzögerung, also die durchschnittliche Abweichung von der durchschnittlichen Verzögerung. Video und speziell Audio ist sehr anfällig für Audio. Da das menschliche Ohr Schwankungen sofort raus hört. 8.3.5 Dienstgüte (Quality of Service) bezeichnet quantifizierbare Eigenschaften eines Dienstes. Die einzelnen Eigenschaften werden als Dienstgüteparameter oder Merkmale bezeichnet. Die wichtigsten Merkmalsklassen sind: Wie garantiert man eine niedrige Auslastung? 97 8.3.7 Welche Möglichkeiten gibt es QoS über IP zu realisieren? Für QoS in IP-Netzwerken gibt es zwei verschieden Ansätze 98 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 8.3. Dienstgüte Integrated Services. Hier ist die Idee ähnlich wie bei ATM eine Verbindung mit zugesicherten Eigenschaften aufzubauen. Dazu müssen auf jedem einzelnen Router die Ressourcen reserviert werden. Das dabei verwendete Protokoll heisst Resource Reservation Setup Protocol (RSVP). Das Problem ist genau, dass jeder Router dieses Protokoll unterstützen muss. Ausserdem ist die Skalierbarkeit eher begrenzt, weil für jede Verbindung ein RVSP-Tunnel aufgebaut werden muss. Differentiated Services. Bei diesem Ansatz werden keine Verbindungen aufgebaut, sondern die Pakete in verschiedene Prioritätsklassen eingeteilt und dann entsprechend ihrer Priorität geroutet. Dies ist insofern einfach zu realisieren, da auch der IPv4 Header ein Type Of Service Feld enthält. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 99 Literaturverzeichnis [Duden Informatik, 1993] Duden Informatik. 2. Aufl. Dudenverlag, 1993 [Hennesy & Patterson, 2003] Hennesy, John L.; Patterson, David A. Computer Architecture: A Quantitative. Approach. 3. Aufl. Morgan Kaufman, 2003 [Jessen, 2001] Jessen E. Skript zur Vorlesung Rechnerarchitektur WS 00/01. [Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl. Hanser, 1999 [Tanenbaum, 1997] Tanenbaum, Andrew S. Computernetzwerke. 3. Aufl. Prentice Hall, 1997 [Tanenbaum, 2001] Tanenbaum, Andrew S. Modern Operating Systems. 2. Aufl. Prentice Hall, 2001 [Tanenbaum, 2003] Tanenbaum, Andrew S. Computer Networks. 4. Aufl. Prentice Hall, 2003 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 101 Teil III Theoretische Informatik DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 103 Kapitel 9. Effiziente Algorithmen und Datenstrukturen Teleskopsumme) n X ĉi = i=1 = Kapitel 9 n X i=1 n X i=1 (ci + Φ(Di ) − Φ(Di−1 )) ci + Φ(Dn ) − Φ(D0 ) Wichtig ist, dass gelten muss Φ(Dn ) − Φ(D0 ) ≥ 0, sonst sind die amortisierten Kosten keine obere Schranke der tatsächlichen Kosten. Da man in vielen Fällen die Anzahl n der Operationen zu Beginn nicht weiss, muss man dafür sorgen, dass für alle i Φ(Di ) ≥ Φ(D0 ) gilt. Oft ist es praktisch, Φ(D0 ) = 0 zu setzen und für jedes i > 0 zu zeigen, dass Φ(Di ) ≥ 0 gilt. Effiziente Algorithmen und Datenstrukturen 9.1.5 Was ist Divide&Conquer? Bei Divide&Conquer wird ein Problem in Subprobleme zerlegt, diese werden (rekursiv) gelöst und die Gesamtlösung aus den Teillösungen zusammengesetzt. 9.1 Allgemeines 9.1.1 Was ist dynamisches Programmieren? Wenn man die Rekursionsgleichung für einen Divide&Conquer-Algorithmus kennt, kann in vielen Fällen mit Hilfe des Master Theorems die Laufzeit bestimmt werden. Wie Divide&Conquer wird beim dynamischen Programmieren ein Problem in Subproblem aufgeteilt, diese gelöst und die Gesamtlösung aus den Teillösungen zusammengesetzt. Dynamisches Programmieren verwendet man, wenn die Subproblem (im Gegensatz zu Divide&Conquer) nicht unabhängig sind. Zwischenergebnisse werden in Tabellen gespeichert. Dynamisches Programmieren kommt meist bei Optimierungsproblemen zum Einsatz. Master Theorem: Seien α ≥ 1 und β ≥ 1 zwei Konstanten und sei f (n) eine nicht negative Funktion und sei T (n) definiert durch die Rekursionsgleichung n + f (n) T (n) = αT β l m j k wobei nβ sowohl als nβ als auch als nβ gelesen werden kann, dann ist 9.1.2 9.1.6 Ein Beispiel für dynamische Programmierung? Θ nlogβ α , wenn f (n) = O nlogβ α− für ein konstantes > 0, Θ nlogβ α log n , wenn f (n) = Θ nlogβ α , logβ α+ T (n) = für ein konstantes > 0 und Θ (f (n)) , wenn f(n) = Ω n αf nβ ≤ cf (n) für ein konstantes 0 < c < 1. Knapsack, Floyd-Warshall, CYK, LCS 9.1.3 Wie können Graphen repräsentiert werden? Mit Adjazenzenlisten oder Adjazenzenmatrizen. 9.1.4 Welche Aussagen können Sie über die Laufzeit von Divide&Conquer-Algorithmen machen? Man erkennt das die Laufzeit von Divide&Conquer-Verfahren hauptsächlich von der Funktion f , die für das Zusammensetzen der Gesamtlösung aus den Teillösungen zuständig ist, abhängt. i Was versteht man unter amortisierter Kostenrechnung? 9.1.7 Erklären Sie den Unterschied zwischen Worst-Case-, Average-Case- und amortisierten Kosten. Mit der amortisierten Kostenrechnung gibt man die durchschnittlichen Kosten von Operationen in Folgen an. Angegeben wird der Worst-Case aller Folgen. Worst-Case-Kosten. Die Worst-Case-Kosten geben eine obere Schranke für die Laufzeit an, gelten also unabhängig von der Art der Eingabedaten. Eine Möglichkeit die amortisierten Kosten zu bestimmen ist die Potentialmethode, die wie folgt funktioniert. Man startet mit einer Datenstruktur D0 , auf der n Operationen ausgeführt werden. Für jedes i = 1, 2, . . . , n gibt ci die tatsächlichen Kosten der i-ten Operation an. Di ist die Datenstruktur, die durch Anwendung der i-ten Operation auf die Datenstruktur Di−1 entsteht. Eine Potentialfunktion Φ ordnet jeder Datenstruktur Di ein reelle Zahl Φ(Di ) zu. Diese Zahl ist das Potential der Datenstruktur Di . Die amortisierten Kosten ĉi der i-ten Operation unter Berücksichtigung der Potentialfunktion Φ ist definiert durch Average-Case-Kosten. Die Average-Case-Kosten geben die Kosten für einen durchschnittlichen Ablauf eines Algorithmus an. Dies macht aber noch eine Aussage über das Worst-CaseVerhalten. Ein Beispiel ist Quicksort, dass Average-Case-Kosten von O(n log n) hat, im schlechtesten Fall aber quadratische Kosten hat. Amortisierte Kosten. Bei bestimmten Datenstrukturen wie Fibonacci-Heaps macht es keinen Sinn alle Operationen getrennt zu betrachten, da die Operationen dort sehr unterschiedlich viel Arbeit verrichten. Deshalb werden dort Folgen von Operationen auf eine Datenmenge betrachtet. Angegeben werden dann die durchschnittlichen Kosten pro Operation für den Worst-Case aller Folgen. ĉi = ci + Φ(Di ) − Φ(Di−1 ). Die amortisierten Kosten einer Operation sind also die tatsächlichen Kosten plus die Potentialzunahme. Wenn die Potentialzunahme bei Operation i positiv ist, wird sozusagen überbezahlt, das Potential der Datenstruktur erhöht sich. Ist sie negativ, wird angespartes Potential aufgebraucht. 9.1.8 Ein Graph ist ein Tupel (V, E), wobei V eine endliche Menge von Knoten ist und E ⊆ von Kanten ist. Für die amortisierten Kosten von n Operationen gilt somit (der zweite Schritt ergibt sich wegen der DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 105 Was sind Graphen? 106 V 2 eine Menge http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.2. Mathematische Grundlagen 9.1.9 Kapitel 9. Effiziente Algorithmen und Datenstrukturen 9.3 Was ist die transitive Hülle? ∗ ∗ Die transitive Hülle eines gerichteten Graphen G = (V, E) ist der Graph G = (V, E ) wobei Hinweis: Wenn nicht anders angegeben gilt im Folgenden n = |V | und m = |E|. E ∗ = {(i, j) | es gibt einen Pfad von Knoten j nach i in G} 9.3.1 ist. 9.1.10 Was ist das uniforme und was das logarithmische Kostenmaß? Insert (O(1)): Es wird ein neuer Baum mit einem einzigen Knoten erzeugt, dieser wird an die Wurzelliste angehängt. Fall nötig wird min[H] umgesetzt. Minimum (O(1)): Der Zeiger min[H] zeigt immer auf das kleinste Element. Merge (O(1)): Die Wurzellisten der beiden Heaps H1 und H2 werden konkateniert. der Zeiger min[H] wird auf min(min[H1 ], min[H2 ]) gesetzt. Extract-Min (O(log n)): Bei dieser Operation wird die Neuordnung des Heaps durchgeführt und zwar so, dass danach alle Wurzel der Wurzelliste unterschiedlichen Grad haben (der Grad gibt die Anzahl der Söhne eines Knotens an). Es lässt sich zeigen, dass die amortisierten Kosten für das Löschen des Minimums O(D(n)) betragen, wobei D(n) der maximale Grad eines Knotens einem Heap mit n Knoten ist. Es gilt folgendes Lemma (size(x) bezeichnet die Anzahl der Knoten im Unterbaum von x, x mitgezählt): Beispiel: Der Algorithmus, der testet ob eine Zahl n eine Primzahl √ ist hat im uniformen Kostenmaß √ die Komplexität O( n), da er einfach für alle Zahlen {2, 3, . . . , n} testet ob sie die Zahl n teilen. Nun das logarithmische Kostenmaß. Wenn die Zahl n binär√kodiert wird, beträgt die Eingabelänge l = log2 n. Als Laufzeit erhält man für den Algorithmus O( 2l ) was aber leider O(2l/2 ) entspricht. Dieser Algorithmus hat also exponentielle Laufzeit und ist daher für grosse n unbrauchbar. Was ist das allgemeine Prinzip das im CYK-Algorithmus verwendet wird? Dynamische Programmierung. 9.1.12 Welche algorithmische Prinzipien kennen Sie (mit Beispielen)? Lemma Für jeden Knoten x vom Grad k eines Fibonacci-Heaps gilt size(x) ≥ Fk+2 (daher der Name Fibonacci-Heaps). Greedy: Kruskal, Prim Divide&Conquer: Mergesort, Quicksort Mit diesem Lemma lässt sich nun Zeigen, dass D(n) = O(log n): Sei x einen Knoten mit Grad k in einem n-Knoten Fibonacci-Heap. Laut Lemma gilt n ≥ √ size(x) ≥ Fk+2 . Weiterhin gilt, dass Fk+2 ≥ φk , wobei φ der goldene Schnitt ist, φ = (1 + 5)/2. Somit gilt n ≥ size(x) ≥ φk . Logarithmieren ergibt k ≤ logφ n. Also ist D(n) = O(log n). Dynamische Programmierung: Knapsack, Floyd-Warshall, CYK, LCS 9.2 Mathematische Grundlagen 9.2.1 i Sie haben in der Vorlesung Rekursionsgleichungen kennen gelernt. Erzählen Sie etwas dazu. Was sind Fibonacci-Heaps und wieso heissen sie so? Der Fibonacci-Heap ist eine Heap-Implementierung bei der alle Operationen bis auf Extract-Min in O(1) ablaufen, Extract-Min benötigt O(log n). Die Grundidee der Fibonacci-Heaps ist, jegliche Neuordnung des Heaps solange wie möglich hinauszuzögern. Nur bei Extract-Min wird der Heap neu geordnet. Genau wie der Binomial-Heap besteht der Fibonacci-Heap aus mehreren Bäumen, die an den Wurzel verbunden sind. Ausserdem gibt es einen Zeiger min[H] der auf das kleinste Element der Wurzelliste und somit auf das kleinste Element überhaupt zeigt. Beim uniformen Kostenmaß wird die Länge (in Bits) der einzelnen Operatoren nicht beachtet, beim logarithmischen Kostenmaß schon. Das logarithmische Kostenmaßmuss verwendet werden, wenn die Operator sehr gross sind (im Vergleich zur normalen Registergrösse). 9.1.11 Datenstrukturen Trotz der guten Laufzeiten werden Fibonacci-Heaps wegen der aufwendigen Implementierung in der Praxis nicht sehr häufig eingesetzt. Da die Laufzeit von vielen Algorithmen mit einer Rekursionsgleichung beschrieben werden kann, interessiert man sich für die geschlossene Form solcher Rekursionsgleichungen. Zur Bestimmung dieser Form existieren verschiedene Verfahren. 9.3.2 Was ist ein Binary Heap? Ein Binary Heap ist ein Binärbaum in dem für jeden Knoten gilt, dass sein Schlüssel grösser ist als die Schlüssel aller Kinder. Formeln. Für einfache Rekursionsgleichung, d. h. homogene und inhomogene Rekursionsgleichung ersten Grades sowie homogene Rekursionsgleichung zweiten Grades existieren Lösungsformeln. Siehe dazu [DS-Faq, 2001]. 1 16 Substitutionsmethode. Die Idee bei der Substitutionsmethode ist, eine obere Grenze für die Rekursionsgleichung zu raten und diese durch Nachrechnen zu beweisen. Dies wird z. B. beim der Laufzeitanalyse von BFPRT gemacht (9.4.14). 8 Master-Theorem. Die Laufzeit von Divide&Conquer-Algorithmen lässt sich oft mit dem MasterTheorem bestimmen, siehe dazu 9.1.6. 2 Erzeugendenfunktionen. Ein sehr mächtiges (aber auch recht komplexes) mittel zum Lösen von Rekursionsgleichungen sind Erzeugendenfunktionen, siehe dazu [DS-Faq, 2001] und [Graham et. al., 1989]. 4 5 6 7 8 7 9 3 9 4 3 4 5 6 7 8 9 10 10 1 Parent(i) Left(i) Das ist in [DS-Faq, 2001] und [Graham et. al., 1989] ausführlich beschrieben. Right(i) 107 2 16 14 10 8 7 9 3 2 4 1 Wie die Abbildung zeigt, werden Binary Heaps eigentlich immer als Arrays implementiert. Damit kann sehr einfach auf den Vater sowie die rechten und linken Kinder zugegriffen werden: i Wie kann man eine Rekursionsgleichung mit Hilfe einer Erzeugendenfunktion lösen? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 3 10 1 Iterationsmethode. Die Idee bei der Iterationsmethode ist, die Rekursion immer wieder zu expandieren und somit eine Form zu erreichen, die nur von n und den Startbedingungen abhängt. Der Vorteil ist, dass man keine obere Grenze erraten muss, dafür erfordert sie einiges an Rechenarbeit. Manchmal kann man ohne die Iterationsmethode zu Ende zu führen das Ergebnis erraten und dann die Substitutionsmethode anwenden. 9.2.2 2 14 108 : bi/2c : 2i : 2i + 1 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen Mit Heaps kann sowohl der Heapsort Algorithmus als auch eine Priority Queue realisiert werden. Laufzeiten: Insert Extract-Max Build-Heap Heapify Heapsort 9.3.3 O(log n) O(log n) O(n) O(log n) O(n log n) Delete Suchbäume können für Dictionaries und Priority Queues eingesetzt werden. 9.3.6 1. Alle Blätter hängen an schwarzen Kanten. 2. Alle Blätter haben die gleiche Schwarztiefe. Was ist ein Binomial-Baum 3. Kein Pfad von der Wurzel zu einem Blatt enthält aufeinander folgende rote Kanten. Der Binomial-Baum Bk ist ein geordneter Baum, der rekursiv definiert ist. Die Schwarztiefe eine Knotens ist die Anzahl der schwarzen Kanten auf dem Pfad von der Wurzel zum Knoten. Ein Rot-Schwarz-Baum hat die Tiefe O(log n), das führt zu den folgende Laufzeiten der Dictionary-Operationen. der B0 hat nur einen einzigen Knoten. der Bk besteht aus den beiden Binomial-Bäumen Bk−1 die wie folgt miteinander verbunden sind: die Wurzel des einen Baumes ist das linkeste Kind der Wurzel des anderen Baumes Search. Die Suche funktioniert wie immer in einem Suchbaum. Laufzeit ist O(log n). Der Baum Bk hat folgenden Eigenschaften: Insert. Wie bei den (a, b)-Bäumen wird zuerst Search durchgeführt um das Blatt w zu finden, wo der einzufügende Schlüssel noch nicht hängt. Das Blatt w wird dann durch einen Knoten w 0 mit Kinder w und v ersetzt. Wobei v den neuen Schlüssel hat. Wenn danach zwei aufeinander folgende rote Kanten an w 0 liegen, wird durch Rotation oder Doppelrotation wieder die Ordnung hergestellt. Laufzeit ist O(log n). 1. es gibt 2k Knoten 2. die Höhe des Baumes ist k k i Knoten, daher der Name 3. auf der Tiefe i gibt es Delete. Beim Löschen eines Schlüssels muss der Vater des Blattes durch den Bruder des Blattes ersetzt werden um die Binärbaumstruktur aufrecht zu halten. Danach steht u. U. eine Reorganisation des ganzen Baumes verändert werden. Trotzdem ist die Laufzeit O(log n). 4. die Wurzel hat Grad k, das ist der höchste vorkommende Grad im Baum 9.3.4 Was sind Rot-Schwarz-Bäume? Rot-Schwarz-Bäume sind externe Binärbäume mit roten und schwarzen Kanten, sodass gilt stellt Heap-Bedingung wieder her Was sind Binomial-Heaps und wieso heissen sie so? Rot-Schwarz-Bäume können zur Implementierung von (2, 4)-Bäumen dienen. Ein Binomial-Heap H ist eine Menge von Binomial-Bäumen die folgenden Bedingungen erfüllt. 1. jeder Binomial-Baum in H erfüllt die Heap-Bedingung so dass für jeden Knoten gilt, dass sein Schlüssel mindestens so gross wie der seines Vater ist 9.3.7 Was ist eine Priority Queue? Priority Queue ist eine Datenstruktur, die folgende Operationen unterstützt: 2. jeder Bi kommt nur einmal in H vor Insert Diese Binomial-Bäume werden an den Wurzel durch eine Liste verbunden. Die zweite Bedingung besagt, dass der Binomial-Heap H mit n Knoten höchstens blog nc + 1 viele Binomial-Bäume und damit auch höchstens blog nc + 1 Wurzel in der Kette hat. Damit dauert die Suche nach dem kleinsten Element O(log n). Minimum Extract-Min (Decrease-Key) Laufzeiten: Make-Heap Insert Minimum Extract-Min Union Decrease-Key Delete 9.3.5 9.3.8 O(1) O(log n) O(log n) O(log n) O(log n) O(log n) O(log n) Wo werden PQs verwendet? Bei den Algorithmen von Prim und Dijkstra. Kruskal kann auch mit PQs implementiert werden. 9.3.9 i Wie kann man PQs implementieren? Es gibt verschiedene Möglichkeiten zur Implementierung von PQs, die sich in den Laufzeiten und des Aufwands unterscheiden. Binary-Heaps Was sind Suchbäume? Binomial-Heaps Suchbäume sind Datenstrukturen, die folgende Operationen unterstützen: Fibonacci-Heaps Search 1-Level und 2-Level Buckets Minimum Radix Heaps Maximum 9.3.10 Predecessor Successor Eine Union-Find-Struktur erlaubt es Mengenoperationen effizient zu implementieren, sie stellt folgende Operationen zur Verfügung. Insert DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was sind Union-Find-Strukturen? 109 110 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen Make-Set Splay-Trees stellen eine selbst-organisierende Datenstruktur dar. Es handelt sich um binäre Suchbäume, die aber im Gegensatz zu balancierten Bäumen keinen weiteren Bedingung unterliegen. Beim Zugriff auf ein Element x wird eine Variante der Move-To-Root-Heuristik angewandt, die das Element an die Wurzel des Baumes verschiebt und den Baum verbreitert. Die Länge aller Suchpfade zu Elementen auf dem Suchpfad von x halbiert sich in etwa. Die Operation Splay(t, x) führt die Reorganisation für Baum t und Element x durch. Die Wörterbuch-Operationen laufen wie folgt ab: Union Find-Set Die beste bekannte Implementierung von Union-Find-Strukturen funktioniert mit Bäumen, wobei die Wurzel jeweils eines Baumes jeweils den Repräsentanten darstellt. Wenn noch die Heuristiken Union by Rank und Path Compression angewandt werden, kann für m Operation auf n Element die Laufzeit (mα(m, n)) erreichen. Wobei α die inverse Ackermannfunktion ist. 9.3.11 9.3.12 Search: Zuerst wird Splay(t, x) durchgeführt. Ist x enthalten steht es danach an der Wurzel, ansonsten ist es nicht enthalten. Erklären Sie die Union-Operation. Insert: Um Element x in Baum t einzufügen, wird zuerst Splay(t, x) durchgeführt. Dadurch können sich drei Fälle ergeben: Wenn die Union-Find-Struktur als Wald implementiert ist, wird die Wurzel des kleineren Teilbaums an die Wurzel des grösseren Teilbaums gehängt. Man nennt dieses Vorgehen Union by Rank und verwaltet den Rang in einem Array rank []. 1. x steht an der Wurzel. In diesem Fall gibt es nichts zu tun, da das Element bereits vorhanden ist. Was ist Pfadkompression? 3. x steht nicht an der Wurzel und x ist kleiner als alle Elemente in t. Auch in diesem Fall macht man x zur Wurzel, allerdings ist danach der linke Unterbaum von x leer. 2. x steht nicht an der Wurzel und x ist nicht kleiner als alle Elemente in t. In diesem Fall macht man x zur Wurzel und hängt die Teilbäume der alten Wurzel entsprechend um. Bei Find-Set werden alle Knoten direkt an die Wurzel gehängt, dadurch laufen folgende Find-SetOperationen schneller ab. 9.3.13 Delete: Um Element x aus t zu löschen wird zuerst Splay(t, x) durchgeführt. Falls x danach nicht an der Wurzel steht, ist nichts zu tun, da x nicht im Baum enthalten ist. Andernfalls steht x an der Wurzel und hatte den linken Unterbaum tl und den rechten Unterbaum tr . Jetzt wird x gelöscht, danach führt man Splay(tl , ∞) aus, wobei ∞ eine Element ist, dass grösser ist als alle Elemente in tl . Dadurch erhält man einem Baum t0l , der den grössten Schlüssel y von tl an der Wurzel und eine leeren rechten Teilbaum hat. Diesen Teilbaum ersetzt man jetzt durch t r und hat wieder eine gültigen Baum. Welche Komplexität hat die Find -Operation bei Union-Find-Strukturen mit Path-Compression? Wenn bereits vorher einmal nach einem Element der Menge gesucht wurde, ist die Komplexität O(1), da alle Knoten direkt an der Wurzel hängen. Im schlimmsten Fall kann sie O(n) wobei n die Anzahl der Knoten in diesem Teilbaum ist. 9.3.14 Mit einer amortisierten Kostenanalyse kann man Zeigen, dass m Splay-Tree-Operation auf n Elementen O(m log n) Zeit brauchen, daher ergeben sich im Durchschnitt Kosten von O(log n) pro Operation. Was bedeutet log∗ n? Dazu muss zuerst die Funktion log(i) n definiert werden. wenn i = 0 n (i) log(log(i−1) n) wenn i > 0 und log(i−1) n > 0 log n = undefiniert wenn i > 0 und log(i−1) n ≤ 0 oder log(i−1) n undefiniert 9.3.17 Die Aufgabe der Splay(t, x)-Operation ist es, dass Element x an die Wurzel des Baumes zu verschieben und den Baum breiter zu machen. Im Folgenden sei v der Knoten bei dem das Element gefunden wurde. Falls x nicht gefunden wird, sei v der Vater des Blattes bei dem die Suche erfolglos endet. Der Vater von v heisst p[v], der Grossvater von v ist g[v] = p[p[v]]. Die Splay(t, x)-Operation läuft nun in zwei Schritten ab: log∗ n ist dann wie folgt definiert. log∗ n = min{i ≥ 0 | log(i) n ≤ 1} 1. Zuerst wird der Knoten v gesucht. Damit ist log∗ n genau die Umkehrfunktion zur wiederholten Potenzierung. 9.3.15 2. Jetzt werden die Operationen Zig, Zig-Zig und Zig-Zag durchgeführt bis sie nicht mehr ausgeführt werden können, weil v Wurzel des Baumes ist. Was ist eine Rotation in einem Suchbaum? Die Operationen funktionieren so: Durch eine Rotation in einem Suchbaum kann ein Knoten um ein Niveau angehoben oder abgesenkt werden ohne das die Suchbaumeigenschaft verletzt wird. Der Begriff Rotation ist eigentlich irreführend. Falls man sich wirklich eine Rotation vorstellen will, liegt das Rotationszentrum anschaulich eher auf der Kante als am Knoten. Sonst würde ja nur der eine Knoten verändert. Die Abbildung zeigt Linksund Rechtsrotation. γ x α 9.3.16 β p[v] α RR(p[v]) α β p[v] β γ y β Zig-Zig: Diese Operation wird durchgeführt falls v einen Vater p[v] und einen Grossvater g[v] hat und sowohl v als auch p[v] rechte (linke) Söhne ihres jeweiligen Vaters sind. Es werden zwei aufeinander folgende Rotationen in die gleiche Richtung durchgeführt. Zuerst bei g[v] und dann bei p[v], dadurch wird v um zwei Niveaus angehoben. γ i Was sind Splay-Trees? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs v γ x α LEFT-ROTATE(x) Zig: Diese Operation wird durchgeführt falls p[v] die Wurzel des Baumes ist. Es wird eine Rotation nach links oder rechts durchgeführt, so dass v neue Wurzel des Baumes wird. v RIGHT-ROTATE(y) y Wie funktioniert die Splay-Operation? 111 112 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen deterministische Weise eine alternative Adresse berechnet. Für jeden Schlüssel wird also eine Sondierungsfolge festgelegt. Das heisst die Hashfunktion bekommt einen zweiten Eingabeparameter (die probe number ) der beim Insert inkrementiert wird, bis ein freier Slot gefunden wurde. Bei Search wird ebenfalls inkrementiert bis der Schlüssel gefunden wurde oder ein leerer Slot entdeckt wurde, dann endet die Suche erfolglos. Ein Problem ergibt sich beim Delete. Wenn man den Schlüssel einfach löschen würde, zerbräche man die Sondierungsreihenfolge und könnte die dahinter liegenden Elemente nie mehr finden. Deshalb löscht man nicht, sonder markiert den Slot als gelöscht . Dadurch sind die Laufzeiten aber nicht mehr von α abhängig. Aus diesem Grund wird normalerweise Chaining verwendet, wenn auch gelöscht werden soll. Für das Sondieren gibt es mehrere Vorgehensweisen. Generell gelten im folgenden diese Definitionen. h(k) ist ursprüngliche Hashfunktion, s(i, k) ist eine Sondierungsfunktion, die die Probe number und einen Schlüssel nimmt und h(i, k) = (h(k) − s(i, k)) mod m. Man startet dann immer mit h(k) und versucht, falls diese belegt ist, als nächstes h(1, k) = h(k) − s(1, k). v g[v] p[v] δ p[v] RR(g[v]) α RR(p[v]) v γ v α p[v] g[v] β α β βγ δ g[v] γ δ Zig-Zag: Diese Operation wird durchgeführt falls v einen Vater p[v] und einen Grossvater g[v] hat und einer der beiden Knoten v und p[v] linker und der andere rechter Sohn seines jeweiligen Vater ist (oder umgekehrt). Jetzt werden zwei Rotationen in gegengesetzter Richtung durchgeführt. Die erste bei p[v], die zweite bei g[v], dadurch wird v um zwei Niveaus angehoben. g[v] g[v] v α p[v] v δ RR(p[v]) α LR(g[v]) v β γ a) Linear Probing Beim linearen Sondieren ist die Sondierungsfunktion wie folgt definiert: p[v] g[v] β p[v] γ α βγ δ δ s(i, k) = j Der einzige Unterschied zur normalen Move-to-Root-Heuristik liegt in der Operation Zig-Zig. Hier wird nicht wie bei Move-To-Root streng von unten nach oben vorgegangen, die Rotation wird zuerst für den Grossvater und dann für den Vater durchgeführt. 9.3.18 ⇒ h(i, k) = (h(k) − j) D. h. man probiert zuerst T [h(k)], dann T [h(k)−1], dann T [h(k)−2], usw. Lineares sondieren ist sehr einfach zu implementieren hat aber das Problem des Primary Clustering. Um die Elemente herum, die Kollisionen verursachen, bilden sich Häufungen. Für die durchschnittliche Anzahl der Sondierungsschritte gilt: 1 1+ 1 erfolgreich 2 1−α E [# probes] = 1 1+ 1 2 erfolglos 2 (1−α) i Was ist Hashing? Hashing ist eine Methode mit der man die Wörterbuchoperation Insert, Delete und Search in einigen Fällen mit der durchschnittlichen Laufzeit O(1) realisieren kann. Es wird eine Hashfunktion definiert, die jedem Element k des Universums U einen Slot h(k) zuweist. Im folgenden gilt folgendes: b) Quadratic Probing Beim quadratischen Sondieren ist die Sondierungsfunktion wie folgt definiert: U ist das Universum, N = |U | K ⊂ U ist die Schlüsselmenge, n = |K| Array T [0 . . . m − 1] ist die Hashtabelle s(i, k) = (−1)j Hashfunktion h : U → [0 . . . m − 1] h(ki ) sind Slots Welche Probleme gibt es beim Hashing und wie werden die gelöst? Probleme die beim Hashing auftreten können sind Kollisionen. Es kann passieren, das zwei (oder mehrere) Elemente k1 und k2 auf den selben Slot h(k) gehasht werden. Zur Behandlung solcher Kollisionen gibt es mehrere Methoden: c) Double Hashing Beim doppelten Hashing ist die Sondierungsfunktion wie folgt definiert: 1. Chaining Alle Elementen die auf den selben Slot h(k) gehasht werden, werden in eine verkettete Liste gehängt, deren Kopf in h(k) liegt. Beim Chaining ergeben sich folgende Laufzeiten: s(i, k) = jh0 (k) Insert: O(1) Delete: O(1) wenn die Listen doppelt verkettet sind, wenn nicht entspricht sie der von Search Search: die Worst-Case-Laufzeit ist O(n), wenn alle Elemente im selben Slot landen. Wenn man annimmt, dass die Hasfunktion die Element auf alle Slots mit gleicher Wahrscheinlichkeit verteilt ist die Average-Case-Laufzeit von Search O(1 + α), wobei α der load factor, das Verhältnis der Elemente in der Tabelle zur Anzahl der Slots, ist. Dies gilt für erfolgreiche und erfolglose Suche. Wenn die Anzahl der Slots proportional zur Anzahl der Elemente ist, führt das zur Laufzeit O(1). 2. Open addressing Beim Hashing mit offener Adressierung werden alle Element in der Tabelle selbst abgelegt. Wird beim Insert oder Search des Schlüssels k ein Element 6= k im Slot h(k) gefunden, so wird auf DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 113 2 j 2 D. h. man probiert T [h(k)], T [h(k) + 1], T [h(k) − 1], T [h(k) + 4], T [h(k) − 4], . . . Man muss hier aufpassen, dass das auch tatsächlich eine Permutation über alle Slots ergibt. Es lässt sich zeigen, dass dies für bestimmte prime m so ist. Das Clustering tritt hier viel weniger stark auf und heisst Secondary Clustering. Für die durchschnittliche Anzahl der Sondierungsschritte gilt: 1 + ln 1 − α2 erfolgreich 1−α E [# probes] = 1 1 erfolglos − α + ln 1−α 1−α ki sind Schlüssel 9.3.19 mod m wobei h0 eine zweite Hashfunktion ist. Damit h(i, k) = (h(k) − s(i, k)) mod m eine Permutation aller Hashadressen ergibt, muss h0 (k) für alle Schlüssel relativ prim zu m sein. Das kann man z. B. erreichen indem man als m eine Zweierpotenz wählt und h0 so definiert, dass sie nur ungerade Zahlen erzeugt. Für die durchschnittliche Anzahl der Sondierungsschritte gilt: E [# probes] = 9.3.20 114 1 1 α m 1−α 1 1−α erfolgreich erfolglos i Was ist universelles Hashing? http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen Beim normalen Hashing kann es immer passieren, dass die Hashfunktion alle Schlüssel einer bestimmten Eingabe in den selben Slot hasht und damit Worst-Case-Laufzeit produziert. Dies kann vermieden werden, in dem die Hashfunktion zufällig aus einer Menge von Hashfunktionen gewählt wird. Sei H eine solche Menge von Hashfunktionen. Die Menge h heisst universell wenn für jedes Paar unterschiedlicher Schlüssel x, y ∈ U , die Anzahl der Hashfunktionen für die h(x) = h(y) gilt, genau |H|/m ist. Das bedeutet, wenn man eine Hashfunktion h zufällig aus H auswählt ist die Wahrscheinlichkeit einer Kollision zwischen zwei Schlüsseln x, y gleich 1/m. Dies entspricht genau der Wahrscheinlichkeit eine Kollision zu erzeugen, wenn man die beiden Slots vollkommen zufällig bestimmen würde, also den Annahmen des uniformen Hashings. 9.3.21 4 5 6 7 Die Laufzeit ist O(Höhe(T )). Insert (k). Beim Insert wird zuerst einmal wie beim Search ein Blatt gesucht, da an dessen Vater der neue Schlüssel angehängt werden muss. Jetzt muss überprüft werden, ob der Knoten dadurch nicht zu viele Kinder erhält. Wenn ja, muss er und eventuell seine Vorfahren aufgetrennt werden. Im folgenden Algorithmus steht p(v) für den Vater von v. i Was ist perfektes Hashing? Insert(k) 01 bestimme Blatt v wie in Search 02 w ← p(v) 03 füge k als zusätzliches Blatt von w ein 04 while (#Kinder(w) > b) { 05 if (w 6= Wurzel) y ← p(w) 06 else y ← neue Wurzel mit einzigem Kind w 07 zerteile w in zwei Knoten w 1 und w2 , kleinsten und 09 wobei w1 die b+1 2 10 w2 die b+1 grössten Kinder von w erhält. 2 11 füge den b+1 -ten Schlüssel von w zu y 2 12 und zwar zwischen die Zeiger auf w1 und w2 13 w ← y //rekursiv weiter machen mit dem Vater 14 } Das folgende gilt nur für das statische Dictionary-Problem, wobei nur Search-Operation zugelassen ist. Eine Hashfunktion ist perfekt, wenn Sie alle Schlüssel auf unterschiedliche Slots abbildet. Eine minimale perfekt Hashfunktion braucht nur den Platz m = |K| = n. Für m ≥ 3n kann man in Zeit O(nN ) eine perfekte Hashfunktion für K ⊂ U finden, die in O(1) auszuwerten ist (durch ein Programm der Grösse O(n log N ) Bits). 9.3.22 Welche Bäume setzt man in einer Datenbank ein? B-Bäume. 9.3.23 9.3.24 Geben Sie eine grobe Klassifizierung von Datenstrukturen an. Klasse Operationen Implementierung Dictionary Priority Queue Mergeable Heaps Concatenable Queues Search, Insert, Delete Minimum, Insert, Extract-Min, (Search) Minimum, Insert, Delete, Merge Minimum, Insert, Delete, Merge Hashtabelle, balancierte Bäume Heaps 2-3-Bäume, Binomial-Wälder 2-3-Bäume v ← i-tes Kind von v } if (k = key(v)) return True else return False Die Abbildung zeigt einen 2, 3-Baum in der Schlüssel 22 eingefügt werden soll. Der Baum 0 ist der Ausgangsbaum. Wenn nun 22 eingefügt wird, ergibt sich Baum 1 in dem das Blatt, an das 22 angehängt wurde, die Bedingung a ≤ #Kinder ≤ b verletzt. Deshalb wird dieser Knoten aufgespalten (2). Dadurch hat die Wurzel ein Kind zu viel und es wird eine neue Wurzel eingefügt (3). Der Knoten unter der Wurzel wird nun aufgespalten und alles ist in Ordnung. 0 Was sind (a, b)-Bäume? 1 4,13 1 7 17,21 4,13 1 7 17,21,22 (a, b)-Bäume sind Suchbäume mit den folgenden Eigenschaften. 1 Alle Blätter haben die gleiche Tiefe. 4 7 13 17 21 24 1 4 7 13 17 21 22 24 Die Schlüssel sind nur in den Blättern gespeichert (externer Suchbaum). Für alle Knoten v ausser der Wurzel gilt: a ≤ #Kinder ≤ b. 2 3 Für die Wurzel gilt: 2 ≤ #Kinder ≤ b. 4,13,21 4,13,21 Es gilt b ≥ 2a − 1 Für alle inneren Knoten v gilt: Hat v l Kindern, so sind in v l − 1 Werte k1 . . . kl−1 gespeichert und es gilt: 1 ki−1 < key(w) ≤ ki für alle Knoten w im i-ten Unterbaum von v, wobei k0 = −∞, kl = +∞ 1 7 4 7 17 13 Die Wörterbuchoperationen funktionieren wie folgt. 4 Search(k) 1 v ← Wurzel 2 while (v ist kein Blatt) { 3 i ← min{1 ≤ j ≤ #Kinder(v) | k ≤ kj } 115 116 24 1 4 7 17 13 17 22 21 22 24 21 1 1 22 7 13 4 Search (k). Der Algorithmus zum finden eines Elementes startet an der Wurzel und läuft entsprechend der Informationen, die in den Knoten gespeichert sind, nach unten bis zu einem Blatt. Dort findet er entweder den gesuchten Schlüssel oder nicht. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 21 17 1 22 7 4 7 17 13 17 22 21 22 24 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen Die Laufzeit ist O(Höhe(T )). AVL-Bäume sind balancierte Binäre Suchbäume bei denen für jeden Knoten v gelten muss, dass die Höhe seines linken Unterbaums von der des rechten höchstens um 1 unterscheidet. Für die Laufzeiten der einzelnen Operation gilt: Delete (k). Zuerst wird der Schlüssel gesucht, wenn er nicht gefunden wird, wird abgebrochen. Wenn er gefunden wurde, wird das Blatt entfernt, das kann dazu führen, dass dem Vater zu wenige Kinder übrig bleiben. 01 02 03 04 05 06 07 08 09 10 11 Search Insert Delete bestimme Blatt v wie in Search if (key(v) 6= k) return //Schlüssel nicht gefunden w ← p(v) entferne v von w while ((#Kinder(w) < a) ∧ (w 6= Wurzel)) { y ← linker oder rechter Nachbar von w if (#Kinder(y) = a) verschmelze w und y else adoptiere rechtestes bzw. linkestes Kind von y w ← p(w) //rekursiv weiter machen mit dem Vater } if ((w =Wurzel) ∧ (Wurzel hat nur ein Kind)) lösche Wurzel Die Komplexität für Search ergibt sich auf folgenden Lemma: AVL-Bäume mit der Höhe h haben mindestens Fib(h + 2) Blätter, also Fib(h + 2) − 1 interne Knoten. Es gilt √ !n 1 1± 5 Fib(n) ≈ √ 2 5 Die Abbildung zeigt einen 2, 3-Baum aus dem das Blatt mit dem Schlüssel 7 gelöscht wird. Der Baum 0 ist der Ausgangsbaum. In Baum 1 wurde das Blatt bereits entfernt, dadurch hat der Knoten 7 ein Kind zu wenig. Jetzt gibt es zwei Möglichkeiten den Knoten y zu wählen. Wird der linke Nachbar gewählt, kommt man zu dem Fall, dass dieser genau a Kinder hat, dann wird verschmolzen (2a). Wird der rechte Nachbarn gewählt, gilt dies nicht, deshalb adoptiert man das linkeste Kind (2b). 0 1 4,13 1 1 7 4 7 2a 13 21 4 24 1 4 17 21 24 1 9.3.26 17 21 4 13 24 21 17 21 9.3.28 Binomial Heap O(1) O(log n) O(log n) O(log n) O(log n) O(log n) O(log n) Fibonacci Heap O(1) O(1) O(1) O(log n) O(1) O(1) O(log n) Was zeichnet eine sich selbst organisierende Liste aus? 1. Move-To-Front Rule (MFR): Bei jedem Zugriff auf ein Element wird dieses an den Anfang der Liste verschoben. Für die MFR gilt, dass die amortisierten Kosten höchstens um den Faktor 2 schlechter sind als ein optimaler Listenalgorithmus. Die Laufzeiten der Wörterbuchfunktionen sind von der Höhe des Baumes abhängig. Um die Höhe eines (a − b)-Baumes in Abhängigkeit von n zu bestimmen, muss man sich erstmal überlegen wie viele Schlüssel der Baum der Höhe h speichert. Dieser Wert wird maximal, wenn jeder Knoten genau b Kinder hat. Dann speichert der Baum bh Schlüssel. Minimal wird er, wenn die Wurzel zwei Kinder und alle anderen Knoten a Kinder haben, dann speichert er 2ah−1 Schlüssel. Also gilt: 2ah−1 ≤ n ≤ bh 2. Transposition Rule (TR): Bei jedem Zugriff auf ein Element wird dieses um eine Position nach vorne verschoben. Die TR kann verglichen mit der MFR oder einem optimalen Algorithmus beliebig schlecht werden. 9.3.29 Das nun nach h aufgelöst ergibt n logb n ≤ h ≤ 1 + loga 2 Da die Wörterbuchoperationen alle von der Höhe des Baumes abhängen gilt also für alle die Laufzeit O(log n). Die Wahl der Parameter hängt von dem Speicherort der Daten ab. Wenn die Daten im Hauptspeicher liegen, sollte man a klein, also z. B. 2 oder 3 wählen. Liegen die Daten auf der Festplatte, wählt man a gross, z. B. a = 100. 117 Was ist ein Leftist-Baum? Ein Leftist-Baum ist ein binärer Suchbaum, so dass für jeden Knoten gilt, dass ein kürzester Weg zu einem Blatt über ein rechtes Kind führt. 9.3.30 Nennen Sie ein Beispiel für sich selbst organisierende Datenstrukturen? Selbst-Organisierende-Listen und Splay-Trees. 9.3.31 Was sind AVL-Bäume? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Binary Heap O(1) O(log n) O(1) O(log n) O(n) O(log n) O(log n) Selbstorganisierende Listen verändern die Position der Element entsprechend ihrer Zugriffshäufigkeit um die Zugriffszeiten für häufig benutzte Elemente zu verbessern. Es kommen zwei verschiedene Heuristiken zum Einsatz: 24 Die Laufzeit ist O(Höhe(T )). 9.3.25 Vergleichen Sie die verschiedenen Heap-Implementierungen hinsichtlich der Laufzeiten. Make-Heap Insert Minimum Extract-Min Merge Decrease-Key Delete 4,17 13 Wovon hängt die Zahl der speicherbaren Element im AVL-Baum ab? Von seiner Höhe. 17,21 13 1 17,21 13 13 2b 4,13 1,4 1 17 1 Daher gilt, dass AVL-Bäume mit n Knoten die Höhe O(log n) haben, womit dies auch für Search gilt. Bei Insert und Delete müssen u. U. bestimmte Rebalancierungen durchgeführt werden, deren Worst-Case-Laufzeit aber immer O(log n) ist. 9.3.27 4,13 17,21 O(log n) O(log n) O(log n) 118 Ist ein Splay-Tree für eine Englischlexikon geeignet? http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.3. Datenstrukturen Kapitel 9. Effiziente Algorithmen und Datenstrukturen Nur wenn man aus irgendwelchen Gründen andauernd die gleichen Wörter nach schaut. 9.3.32 Der Zeitbedarf für Extract-Min nähert sich der Worst-Case-Komplexität von O(C), da der nächste nicht-leere Bucket ziemlich weit entfernt sein kann. Gibt es Datenstrukturen die Mengenoperationen effizient unterstützen? 2-Level Buckets versuchen dieses Problem zu beheben, in dem sie eine Bucket-Hierarchie einführen. √ Es gibt ein Top-Bucket (btop) bestehend aus | C + 1|√Buckets und zu jedem Bucket in btop gibt es ein weiteres Bottom-Bucket (bbot), das auch aus B = | C + 1| Buckets besteht. Das i-te bbot nimmt Elemente auf deren Schlüssel im Intervall [iB, (i+1)B] liegen. Um ein Element in ein Bucket einzufügen wird zuerst das passende Bucket in btop gesucht. Dann wird in dem dazugehörigen bbot das Element eingefügt. Ja, Union-Find-Strukturen. 9.3.33 Wie funktionieren Radix-Heaps? Radix-Heaps greifen die Idee von 1-Level Buckets auf, wieder muss die maximale Differenz der Schlüssel C bekannt sein. Im Gegensatz zu den 1-Level Buckets werden bei Radix-Heaps keine festen Bucketgrössen sondern Bucket mit exponentiell zunehmender Grösse verwendet. Dadurch werden nur noch O(log c) Buckets benötigt. Da auch bei den Radix-Heaps die Laufzeit für die teure Extract-Min Operation √ von der Anzahl der Buckets abhängt, verbessern sich die amortisierten Kosten von O(C) bzw. O( C) auf O(log C). 9.3.34 Was sind balancierte Bäume? Suchbäume ohne Balancierung können aus der Form geraten bzw. entarten wobei sich die Laufzeiten für die Zugriffe drastisch verschlechtern können. Balancierte Bäume haben Mechanismen, die dafür sorgen, dass die Bäume nicht oder nur wenig entarten. Um sowohl Zeit als auch Platz zu sparen, kann man durch leichte Modifikation √ nur ein einziges BottomBucket einsetzen. Dann benötigt man nur zwei Arrays der Länge B = | C + 1| + 1. Dabei enthält das Top-Bucket die meisten Elemente in grob vorsortierter Form, nur die Elemente mit den kleinsten Schlüsseln werden im Bottom-Bucket gehalten. Mit√dieser Implementierung erreicht man Laufzeiten von O(1) für Insert sowie Decrease-Key und O( C) für Extract-Min. 9.4 Selektieren und Sortieren 9.4.1 Stellen Sie sich vor, Sie haben ein Feld und wollen das 15. grösste finden. Wie können Sie effektiver als mit Sortieren vorgehen. Mit einem Selektionsalgorithmus. 9.3.35 Was sind 1-Level Buckets? Buckets bieten eine Möglichkeit Priority Queues zu implementieren. Die Voraussetzung für die Bucket basierten Implementierungen sind: 9.4.2 Man braucht auf jeden Fall n − 1 Vergleiche. Beweis: Man Betrachte den Algorithmus als Folge von Spielen, die immer das grössere Element gewinnt. Jeder Spieler ausser dem Gewinner muss mindestens einmal verlieren, daher n − 1 Vergleiche. Die Schlüssel sind ganzzahlig. Zu jedem Zeitpunkt gilt, dass die Differenz des grössten und kleinsten Schlüssels ≤ c ist. Dies ist z. B. beim Algorithmus von Dijkstra erfüllt. c ist hier die maximale Kantenlänge. Wie viele Vergleiche braucht man um von n-Element das Grösste zu finden? 9.4.3 1-Level Buckets bestehen aus Welche Komplexität hatte eine naive Bestimmung des Medians? Man verwendet eine normalen Sortieralgorithmus und wählt das mittlere Element. Laufzeit: O(n log n) einem Array b[0 . . . C + 1] zur Aufnahme der Buckets. Jedes bi enthält einen Pointer auf die Liste der Elemente im Bucket, einer Zahl minvalue, die gleich dem kleinsten gespeicherten Schlüssel ist, 9.4.4 i Nennen Sie einen Algorithmus zur effizienten Bestimmung des Median. BFPRT. eine Zahl 0 ≤ minpos ≤ c, die den Index des Buckets mit dem kleinsten Schlüssel enthält und einer Zahl n, die die Anzahl der gespeicherten Elemente hält. Die Priority Queue Operationen sind dann wie folgt implementiert. Insert (x). Das Element x wird in b[key(x) mod (C + 1)] eingefügt. Falls key(x) kleiner als der bisher kleinste Wert ist, müssen minvalue und minpos angepasst werden. Ausserdem wird n inkrementiert. Die Laufzeit für diese Operation ist O(1). 9.4.5 Wie ist die untere Schranke für die Median-Bestimmung (mit Beweis)? − 2 Vergleiche. Der Beweis läuft über das Gegenspielerargument. Die untere Schranke is 3n 2 9.4.6 Erklären Sie Radix-Sort. Extract-Min. n wird decrementiert. Falls noch Elemente übrig bleiben, muss das neue kleinste Element gesucht werden und alle Variablen angepasst werden. Dazu müssen alle Buckets durchlaufen werden. Die Laufzeit ist O(C) Die Idee bei Radix-Sort ist die Eingabewerte einzeln nach ihren Dezimalstellen zu sortieren und zwar zuerst nach der niedrigsten. Das müssen natürlich nicht Dezimalstellen sein, es können auch Buchstaben oder Binärzahlen verwendet werden. Das Beispiel zeigt wie 3-stellige Dezimalzahlen zuerst nach den Einern , dann nach Zehnern und zuletzt nach den Hundertern sortiert werden. Decrease-Key. Zuerst wird der Schlüssel verkleinert. Ergibt sich dadurch ein neuer minvalue, müssen die Variablen angepasst werden. Laufzeit ist O(1). 9.3.36 329 720 720 329 457 355 329 355 657 436 436 436 839 457 839 457 ⇒ ⇒ ⇒ 436 657 355 657 720 329 457 720 355 839 657 839 ↑ ↑ ↑ Was sind 2-Level Buckets? Wenn der Wertebereich sehr gross im Verhältnis zu der Anzahl der abgelegten Werte ist, sind 1-Level Bucket aus zwei Gründen ungünstig. Das Array b belegt statischen Speicherplatz der Grösse O(C) obwohl nur ein kleiner Teil davon gebraucht wird. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 119 120 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.4. Selektieren und Sortieren Die Laufzeit von Radix-Sort hängt natürlich von dem Algorithmus ab, der zum Sortieren nach den einzelnen Stellen verwendet wird. Um n Zahlen nach einer Stelle zu sortieren benötigt man z. B. mit Mergesort O(n log n) Zeit. Falls die Zahlen d Stellen haben, benötigt man insgesamt O(d · n log n), also keine Vorteile zu normalen Sortieralgorithmen. Wenn allerdings ein nicht-vergleichsbasierter Algorithmus wie Counting Sort mit linearer Laufzeit verwendet wird, ergibt sich auch eine lineare Gesamtlaufzeit von Radix-Sort. Kapitel 9. Effiziente Algorithmen und Datenstrukturen Das Suchen eines n kleinsten Elements in einer Menge. 9.4.9 Sortieren hat grösseren Aufwand als Selektieren. 9.4.10 9.4.7 Warum sortiert man nicht einfach? Erklären Sie Bucket-Sort. Wie funktioniert Quicksort? Quicksort ist ein Divide&Conquer Algorithmus mit einer durchschnittliche Laufzeit von O(n log n). Die Worst-Case-Laufzeit ist allerdings O(n2 ). Der grundlegende Algorithmus ist sehr einfach und funktioniert wie folgt. Dieser Algorithmus sortiert das Array A[p . . . r]. Wenn für alle zu sortierenden Zahlen x, gilt, dass 0 ≤ x < 1 und die Zahlen zufällig verteilt sind, kann Bucket-Sort ein Array mit n Zahlen in Zeit O(n) sortieren. Benötigt werden n Buckets, die jeweils eine Liste von Werte aufnehmen können. Der Algorithmus läuft dann wie folgt ab. Quicksort(A, p, r) 1 if p < r 2 then q ← Partition(A, p, r) 3 Quicksort(A, p, q) 4 Quicksort(A, q + 1, r) 1. Initialisiere Buckets b0 , b1 , . . . , bn−1 . 2. Lege ai in Bucket dn · ai e. 3. Sortiere die Elemente innerhalb der Buckets. 4. Konkateniere die Buckets. Das Eingabearray wird in zwei Teile zerlegt und diese rekursiv mit Quicksort sortiert. Entscheidend ist die Partitionierung des Arrays. Eine einfache Implementierung von Partition funktioniert so. Bis auf den Schritt 3 ist alles in O(n) zu erledigen. In Schritt 3 kommt es darauf an, wie wie viele Elemente durchschnittlich in einem Bucket sind. Falls in jedem Bucket nur 1 Elemente ist, ist es einfach. Sei ni die Zufallsvariable die die Anzahl der Element in Bucket i beschreibt. Wenn man in Schritt 3 einen Sortieralgorithmus mit quadratischer Laufzeit verwendet, ist die erwartete Zeit, die Element im Bucket i zu sortieren E O(n2i ) = O(E n2i ). Für alle Bucket ergibt sich daher die Summe: ! n−1 n−1 X X O E n2i = O E n2i (9.1) i=0 Partition(A, p, r) 1 x ← A[p] 2 i←p−1 3 j ←r+1 4 while (True) { 5 do j ← j − 1 until (A[j] ≤ x) 6 do i ← i + 1 until (A[i] ≥ x) 7 if (i < j) swap A[i] ↔ A[j] 8 else return j 9 } i=0 Die Wahrscheinlichkeit, dass ein Element x in Bucket i landet ist 1/n. Das Verteilen von n Elementen auf n Buckets kann mit dem Bällen-Urnen-Modell erfasst werden und ist binomialverteilt. Das heisst die Wahrscheinlichkeit, dass ni = k ist, folgt der Binomialverteilung b(k; n, p). Somit gilt für den Erwartungswert und die Varianz 1 =1 n E [ni ] = np = n · Var [ni ] = np(1 − p) = n · 1 1 1 · 1− =1− n n n Für jede Zufallsvariable gilt folgende Gleichung 2 E n2i = Var [ni ] + E [ni ] 9.4.11 Daraus ergibt sich E n2i Die Funktion Partition wählt eine Pivot-Element x und vertausche die Array-Elemente so, dass alle Element links von x kleiner und alle rechts davon grösser sind als x. Dafür werden zwei Zeiger i und j verwendet, die gegeneinander laufen. Der entscheidende Punkt ist die Wahl des Pivot-Elements. In dieser Implementierung wird einfach das erste Element des Arrays gewählt. Diese Methode ist nicht optimal. Wenn das Array z. B. bereits sortiert ist ergeben sich bei dieser Wahl immer 1:(n − 1)– Partitionen. Deshalb konzentrieren sich die Verbesserungen von Quicksort darauf das Pivot-Element möglichst geschickt zu wählen. Mann kann es zufällig wählen oder noch besser den Median von drei Zufallswerten wählen. Zur Analyse von Quicksort, siehe 9.4.16. Mergesort ist ein Divide&Conquer Algorithmus. Eine Feld wird sortiert in dem es in zwei (fast) gleich grosse Teilfelder zerlegt wird, die dann wieder rekursiv mit Mergesort sortiert werden. Die Teilfelder werden dann geMerget um die Gesamtlösung zusammen zu setzen. 1 + 12 n 1 = 2− n = O(1) = 1− Divide: Teile das n-elementige, zu sortierende Feld in zwei Teilfelder der Länge n/2. Conquer: Sortiere die zwei Teilfelder rekursiv mit Mergesort. Wenn man dieses Ergebnis nun in (9.1) einsetzt ergibt sich n−1 X i=0 O E n2i = O n−1 X i=0 Combine: Verschmelze die zwei sortierten Teilfelder zu einem. O(1) ! Das Verschmelzen der Teilfelder erledigt die Funktion Merge. Anschaulich funktioniert sie wie ein der Algorithmus, den ein Mensch benutzen würde um zwei sortierte Kartenstapel zu verschmelzen. Beide Stapel liegen mit der kleinsten Karte oben auf dem Tisch. Man wählt nur immer die kleinste Karte die oben aufliegt und legt sie nacheinander auf einen dritten Stapel. Der dritte Stapel ist dann eine korrekte Verschmelzung der beiden Stapel. Dieser Algorithmus lässt sich in O(n) implementieren, wobei n die Summe der Längen der beiden Teilfelder ist. Mit der Merge-Funktion sieht der Mergesort-Algorithmus so aus: und damit eine Gesamtlaufzeit von O(n). 9.4.8 Was versteht man unter Selektion? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs i Wie funktioniert Mergesort? 121 122 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.4. Selektieren und Sortieren Kapitel 9. Effiziente Algorithmen und Datenstrukturen Merge-Sort(A, p, r) 1 if p < r 2 then q ← b(p + r)/2c 3 Merge-Sort(A, p, q) 4 Merge-Sort(A, q + 1, r) 5 Merge(A, p, q, r) Diese Funktion sortiert das Teilfeld A[p . . . r]. Falls p > r gibt es nicht mehr zu sortieren und die Funktion bricht ab. Merge (A, p, q, r) verschmelzt die Felder A[p . . . q] und A[q + 1 . . . r]. 9.4.12 4. Jetzt werden die Element des Eingabearrays bzgl. des Medians der Mediane s partitioniert. Dadurch ergeben sich zwei Mengen S1 = {x ∈ S | x < s} und S2 = {x ∈ S | x > s} 5. Jetzt gibt es drei Fälle: Falls i ≤ |S1 |, bestimme rekursiv das i-kleinste Element in S1 Falls i = |S1 | + 1, gib s als Lösung zurück. Sonst, bestimme rekursiv das (i − |S1 | − 1)-kleinste Elemente in S2 . 9.4.15 Wie ist die Laufzeit von BFPRT? Um die Laufzeit zu bestimmen, muss man zuerst eine untere Grenze für die Elemente, die grösser als das Partitionierungselement s sind, bestimmen. Mindestens die Hälfte der Mediane, die in Schritt 2 gefunden werden, ist grösser oder gleich dem Median der Mediane s. Also sind aus der Hälfte der dn/5e Gruppen jeweils drei Element grösser als s. Ausnahmen sind die Gruppe, die s enthält und die letzte Gruppe, falls n nicht durch 5 teilbar ist. Wenn man diese beiden Gruppen weg lässt, ergibt sich für die Anzahl der Elemente, die grösser als s ist l m 1 n 3n 3 −2 ≥ − 6. 2 5 10 i Komplexität von Mergesort herleiten. Mergesort ist ein typischer Divide&Conquer-Algorithmus. Die Laufzeit T (n) von Divide&ConquerAlgorithmen kann rekursiv ausgedrückt werden: O(1) wenn n ≤ c , T (n) = αT (n/β) + D(n) + C(n) sonst. Wobei c eine konstante ist, für die die Berechnung trivial wird. Das Problem wird in α Teilproblem geteilt und des Teilproblem hat die Grösse n/β, d. h. das die Teilprobleme sich auch überlappen können. D(n) ist die Zeit, die man braucht um das Problem in Teilprobleme zu zerlegen, C(n) die Zeit um die Lösung aus den Teillösungen zusammenzusetzen. Ebenso gilt, dass die Anzahl der Elemente, die kleiner als s sind, mindestens 3n/10 − 6 ist. Daher wird im Worst-Case Select 7n/10 + 6 mal rekursiv aufgerufen (Schritt 5). Die in der Abbildung grau unterlegten Elemente sind die, die grösser als s sind. Die Rekursion für Mergesort ergibt sich wie folgt: Divide: Dieser Schritt muss die Mitte des Subarrays finden, daher D(n) = O(1). Conquer: Das Problem wird rekursiv in 2 Teilprobleme zerlegt, die beide die Grösse n/2 haben, also 2T (n/2). s Combine: Merge benötigt für n Elemente O(n), also C(n) = O(n). Daraus ergibt sich: T (n) = O(1) 2T (n/2) + O(n) wenn n = 1 , sonst. Der erste Fall ergibt sich, weil ein Feld der Länge 1 bereits sortiert ist. Das O(1) für Divide trägt zur Summe nichts bei, also fällt es unter den Tisch. Für diese Rekursionsgleichung kann nun mit dem Mastertheorem (9.1.6) die Laufzeit bestimmt werden. α = 2, β = 2 und f (n) = O(n), daher trifft der zweite Fall des Mastertheorems zu und die Laufzeit von Mergesort ist Θ nlogβ α log n = Θ(n log n) . 9.4.13 Damit lässt sich nun eine Rekursionsgleichung erstellen. Schritt 1, 2 und 4 benötigen O(n). Schritt 3 benötigt T (dn/5e) und Schritt 5 benötigt höchstens T (7n/10 + 6). Für n > 20 gilt 7n/10 + 6 < n und für n ≤ 80 ist die Laufzeit O(1). Daher ergibt sich die Rekursionsgleichung: O(1), wenn n ≤ 80, T (n) ≤ T (dn/5e) + T (7n/10 + 6) + O(n) wenn n > 80. Die lineare Laufzeit wird nun durch die Substitutionsmethode gezeigt. Man nimmt an, dass T (n) ≤ cn ist und Substitute entsprechend. Wie funktioniert Heapsort? Die n zu sortierenden Element werden nacheinander auf den Heap gelegt. Danach werden alle n Element wieder mit Extract-Min herunter geholt. Dies kann auch in-situ geschehen. Laufzeit ergibt sich aus den Laufzeiten der Heapoperationen und ist O(n log n). 9.4.14 T (n) ≤ Wie funktioniert BFPRT? 1. Teile die n Elemente in bn/5c Gruppen zu je 5 Elementen plus eine Gruppe mit n mod 5 Elementen. 9.4.16 Rekursionsformel für Quicksort? Die Rekursionsformel hängt von der Güte der Partitionierung ab. 2. Jetzt wird der Median jeder der dn/5e Gruppen bestimmt in dem die Elemente der Gruppen per Insertion Sort sortiert werde und der mittlere Wert gewählt wird. Falls die Gruppe ein ungerade Anzahl an Elementen hat, wird der grössere der beiden Medianwerten gewählt. Im schlechtesten Fall teil Quicksort immer in eine Partition der Grösse 1 und eine Partition der Grösse n − 1. Dann ergibt sich T (n) = T (n − 1) + O(n) 3. Jetzt wird Select rekursiv aufgerufen um den Median der in Schritt 2 berechneten Median zu bestimmen. 123 cn Der letzte Schritt gilt, da man c so gross wählen kann, dass es grösser als O(n) für alle n > 80 ist. Der Algorithmus Select zur Bestimmung des i-kleinsten Elements einer Menge S, läuft in folgenden Schritten ab. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs ≤ cdn/5e + c(7n/10 + 6) + O(n) ≤ cn/5 + c + 7cn/10 + 6c + O(n) ≤ 9cn/10 + 7c + O(n) und dafür gilt T (n) = O(n2 ). 124 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.4. Selektieren und Sortieren Im besten Fall teil Quicksort immer in zwei Partitionen der Grösse n/2 auf, dann gilt T (n) = 2T (n/2) + O(n) Kapitel 9. Effiziente Algorithmen und Datenstrukturen 9.5 Minimale Spannbäume 9.5.1 Wie funktioniert der Algorithmus von Kruskal? Der Algorithmus von Kruskal ist ein Greedy-Algorithmus zur Bestimmung eines minimalen Spannbaumes. Der Algorithmus sortiert die Kanten nach ihrem Gewicht und fängt dann mit der kleinsten Kante an diese in den Spannbaum einzufügen. Bei jedem Einfügen überprüft er, ob durch das Einfügen ein Kreis entsteht, falls ja, wird die Kante ignoriert, falls nein, wird die Kante eingefügt. was laut Master Theorem O(n log n) ist. Falls Quicksort in jedem Schritt zwei Partitionen, deren Grössen konstant proportional zueinander sind (z. B. immer 9:1), erzeugt, so ergibt sich die Rekursionsgleichung T (n) = T (9n/10) + T (n/10) + O(n) Meist wird der Algorithmus nicht mit einer Kantenvorsortierung sondern einer Priority-Queue implementiert. Dies kann Vorteile haben, wenn die grössten Kanten des Graphen nicht Teil des minimalen Spannbaums sind. Bei der Implementierung mit Priority-Queue kann der Algorithmus in diesem Fall frühzeitig abbrechen. (für das Beispiel) Egal wie diese Verhältnis aussieht, also z. B. auch 99:1, ergibt sich die Laufzeit O(log n), weil der Rekursionsbaum immer Tiefe O(log n) hat und jede Ebene O(n) kostet. Daher ergibt sich auch für die durchschnittliche Laufzeit von Quicksort O(n log n). Mann muss nur dafür sorgen, dass die Partitionierung möglichst zufällig abläuft. 9.4.17 Zur Kreisüberprüfung wird eine Union-Find-Struktur verwendet. Zu Beginn ist jeder Knoten in einer eigenen Menge. Wenn eine Kante eingefügt werden soll, wird überprüft, ob die beiden Endknoten in unterschiedlichen Menge liegen, wenn nicht, wird die Kante ignoriert. Falls dem so ist, wird die Kante eingefügt und die beiden Mengen verschmolzen. Gibt es Sortierverfahren mit einer besseren Laufzeit als O(n log n). Implementierung mit PQ: O(n log n) ist die untere Schranke für vergleichsbasiertes Sortieren. Wenn ohne Vergleiche sortiert wird, können bessere Laufzeiten erreicht werden. Beispiele sind Radix- und Bucket-Sort die aber bestimmte Annahmen über die Daten machen. Kruskal 01 A ← ∅ 02 Q ← E[G] 03 for each (vertex v ∈ V [G]) { 04 Make-Set(v) 05 } 06 while (Q 6= ∅) { 07 (u, v) ← Extract-Min(Q) 08 if (Find-Set(u) 6= Find-Set(v)) { 09 A ← A ∪ {(u, v)} 10 Union(u, v) 11 } 12 } 13 return A Die untere Schranke für vergleichsbasiertes Sortieren kann über den Entscheidungsbaum hergeleitet werden. Wenn n Element sortiert werden müssen, gibt es n! verschieden Permutationen, also hat der Entscheidungsbaum n! Blätter. Die Länge des längsten Pfades von der Wurzel zu einem Blatt entspricht der Worst-Case-Laufzeit beim Sortieren. Deshalb muss man nur die Höhe h des Baumes bestimmen um die untere Schranke für Sortieren zu finden. Da ein Binär (Entscheidungsbaum ist binär) nicht mehr als 2h Blätter hat gilt n! ≤ 2h . Daraus ergibt sich durch Logarithmieren h ≥ log n! . Mit der Stirling-Approximation für die Fakultät kommt man zu h ≥ = = = log Dieser Algorithmus hat gegenüber dem mit Kantenvorsortierung keinen Vorteil, da er nicht frühzeitig abbricht. Theoretisch kann man abbrechen, wenn nur noch eine einzige Menge übrig ist, dann kann sowieso keine weitere Kante mehr hinzugefügt werden. Für die Priority-Queue Operationen ergibt sich die Laufzeit O(m log m), die Union-Find-Operationen haben eine sehr kleine (amortisierte) Komplexität und tragen damit unerheblich zu der Gesamtlaufzeit bei, also hat der Algorithmus von Kruskal die Laufzeit O(m log m). n n e n log n − e log e n log n − O(1) O(n log n) 9.5.2 9.4.18 Braucht Quicksort zusätzlichen Speicher? Es handelt sich praktisch um den gleichen Algorithmus. Bei Dijkstra müssen zusätzlich die Pfadlängen von Startpunkt addiert werden. Ausser ein paar wenigen Zeigern, nein. 9.4.19 9.5.3 Wie kann man bei Quicksort die Worst-Case-Laufzeit vermeiden? 9.5.4 Mergesort sortiert Elemente, die bereits richtig sind, nicht. 125 Erklären Sie den Algorithmus von Prim. Der Algorithmus von Prim zur Bestimmung es minimalen Spannbaums geht wie folgt vor. Alle Knoten des Baumes werden in einer Priority Queue verwaltet. Zu Beginn erhalten alle Knoten den Wert ∞, nur der Startknoten erhält 0. Nun nimmt man sich den Knoten u mit dem kleinsten Wert aus der Queue (beim ersten mal der Startknoten) und durchläuft man alle Nachbarknoten v des Knotens u, die noch in der Queue sind. Ist das Kantengewicht von (u, v) kleiner als der beim Knoten gespeicherte Wert key[v], wird der Knotenwert aktualisiert. Warum verwendet man in der Praxis Mergesort häufiger? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Welche Algorithmen gibt es zur Berechnung minimaler Spannbäume? Es gibt die Algorithmen von Kruskal und Prim. Mann muss dafür sorgen, dass die Partitionierung möglichst gut ist und nicht in zwei Partitionen teilt, bei der eine Partition nur die Grösse 1 hat. Dazu kann man eine randomisierte Version benutzten, die das Pivot-Element immer zufällig auswählt. Das kann noch weiterhin verbessert werden, wenn man 3 Element zufällig wählt und den Median dieser als Pivot-Element verwendet (Median-of-Three). 9.4.20 Wie ist der Dijkstra-Algorithmus mit dem von Prim vergleichbar? 126 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.6. Kürzeste Pfade Kapitel 9. Effiziente Algorithmen und Datenstrukturen Prim (G, w, r) 01 Q ← V [G] 02 for each (u ∈ Q) { 03 key[u] ← ∞ 04 } 05 key[r] ← 0 06 π[r] ←NIL 07 while (Q 6= ∅) { 08 u ← Extract-Min(Q) 09 for each (v ∈ Adj[u]) { 10 if (v ∈ Q ∧ w(u, v) < key[v]) { 11 π[v] ← u 12 key[v] ← w(u, v) 13 } 14 } 15 } 08 09 10 11 12 13 14 15 Der Algorithmus speichert zusätzlich für jeden Knoten seinen Vorgänger im Feld π[]. Laufzeit: Auch hier zeigt sich die Verwandtschaft zum Algorithmus von Prim. Die Schleife in den Zeilen 7–15 wird n mal durchlaufen, darin wird jedes mal ein Extract-Min ausgeführt, also n log n. Die Schleife in den Zeilen 9–13 wird O(m) mal durchlaufen. Also ergibt sich insgesamt O(m + n log n). Dies gilt nur, wenn die Priority Queue mit Fibonacci Heaps implementiert wird, da bei diesen die Zuweisung in Zeile 11 in O(1) durchgeführt werden kann. Der Algorithmus speichert zusätzlich für jeden Knoten seinen Vorgänger im Feld π[]. Laufzeit: Die Schleife in den Zeilen 7–15 wird n mal durchlaufen, darin wird jedes mal ein ExtractMin ausgeführt, also n log n. Die Schleife in den Zeilen 9–13 wird O(m) mal durchlaufen. Also ergibt sich insgesamt O(m+n log n). Dies gilt nur, wenn die Priority Queue mit Fibonacci Heaps implementiert wird, da bei diesen die Zuweisung in Zeile 12 in O(1) durchgeführt werden kann. 9.5.5 9.6.2 Was ist das Single-Source-Shortest-Path-Problem? Man möchte die Entfernung von einem Startknoten zu allen anderen Knoten wissen. 9.6.3 Komplexität von Dijkstra? Es werden n−1 Schritte gemacht in denen jeweils eine Extract-Min- und für alle Nachbarn des Knoten evtl. eine Insert- oder Decrease-Key-Operation durchgeführt. Wenn die PQ mit Fibonacci-Heaps implementiert ist, beträgt die Laufzeit O(n log n + m). Was ist ein Spannbaum? Für einen Graphen G(V, E) ist G0 (V, E 0 ) mit E 0 ⊆ E ein Spannbaum, wenn G0 ein Baum ist. 9.5.6 } u ← Extract-Min(Q) for each (v ∈ Adj[u]) { if (d[v] > d[u] + w(u, v)) { d[v] ← d[u] + w(u, v) π[v] ← u } } 9.6.4 Was ist eine minimaler Spannbaum, was hat er für einen praktischen Nutzen? Ein minimaler Spannbaum ist ein Spannbaum des Kantengewicht (Summe der Gewichte aller Baumkanten) minimal ist. In der Praxis kann man so z. B. die billigste Leitungskonfiguration zwischen Rechnern finden, so dass diese gerade noch verbunden sind. Welche Verfahren zur Bestimmung der transitiven Hülle kennen Sie? Man kann alle Kantengewichte auf 1 setzen und den Floyd-Warshall-Algorithmus laufen lassen. Gibt es einen Pfad zwischen zwei Knoten steht in der Matrix eine Zahl n ansonsten ∞. 9.6.5 Nennen Sie mir einen Algorithmus zur effizienten Matrizen-Multiplikation. Der Strassen-Algorithmus. 9.5.7 Was sind die blaue und die rote Regel? 9.6.6 Diese Regeln werden bei den Korrektheitsbeweisen für minimale Spannbaum Algorithmen benutzt. Welche Algorithmen gibt es ausser Dijkstra für SSSP? Bellman-Ford. 9.6 Kürzeste Pfade 9.6.1 i Wie funktioniert Algorithmus von Dijkstra? 9.6.7 Floyd-Warshall. Dijkstras Algorithmus zur Bestimmung der kürzesten Pfade ähnelt dem von Prim zur Bestimmung des minimalen Spannbaumes sehr stark. Wieder werden alle Knoten in einer Priority Queue verwaltet und ihr Entfernungswert zu Beginn auf ∞ gesetzt. Der Startknoten erhält den Wert 0. Nun wird der kleinsten Knoten u aus der Queue entnommen und alle seine Nachbarn v durchlaufen. Gibt es von u nach v einen kürzeren Weg als in v gespeichert, wird der Wert bei v aktualisiert. 9.6.8 Wie kann man den Floyd-Warshall-Algorithmus so modifizieren, dass man auch die Pfade ablesen kann? Man kann in einer Vorgängermatrix für jeden Knoten den Vorgänger speichern. 9.6.9 Dijkstra (G, w, s) 01 for each (v ∈ V [G]) { 02 d[v] ← ∞ 03 π[v] ←NIL 04 } 05 d[s] ← 0 06 Q ← V [G] 07 while (Q 6= ∅) { DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Welche Algorithmen gibt es für das All-Pairs-Shortest-Path-Problem? Welche Komplexität hat der Floyd-Warshall-Algorithmus? Er Algorithmus besteht aus 3 ineinander geschachtelten For-Schleifen und daher Laufzeit O(n 3 ). Der Algorithmus ist dem CYK-Algorithmus sehr ähnlich, der dieselbe Laufzeit hat. 9.6.10 Wie kann man Zyklen in Graphen bestimmen? Ein Graph enthält genau dann Zyklen, wenn während der Tiefensuche Rüeckwärtskanten gefunden werden. 127 128 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 9.7. Matchings 9.6.11 i Erklären Sie den Strassen-Algorithmus zur Matrizen-Multiplikation. Kapitel 9. Effiziente Algorithmen und Datenstrukturen 9.7.4 Normalerweise wird die Multiplikation zweier n × n Matrizen wie folgt berechnet. a11 a12 b11 b12 c11 c12 = · c21 c22 a21 a22 b21 b22 a11 b11 + a12 b21 a11 b12 + a12 b22 = a21 b11 + a22 b21 a21 b12 + a22 b22 Was ist ein augmentierender Pfad? Wie findet man ihn? Ein augmentierender Pfad ist ein Pfad dessen Kanten abwechselnd gemacht und ungematcht sind. Die erste und die letzte Kante müssen ungematcht sein. Im bipartiten Graphen können augmentierende Pfade mit einer modifizierten Breitensuche gefunden werden. Das Kostet 8 Multiplikation (O(n3 )) und 4 (O(n2 )) Additionen. Wenn man einen Divide&ConquerAlgorithmus angibt, der die n × n Matrizen immer wieder in n/2 × n/2 Matrizen zerlegt und dabei die klassische Form der Berechnung anwendet, erhält man die Rekursionsformel T (n) = 8T (n/2) + O(n2 ) Laut Mastertheorem gilt für T (n) = O(n3 ). Also wurde durch Divide&Conquer nichts gewonnen, im Vergleich zur normalen Matrizen-Multiplikation. Bei Strassens Methode wird die Anzahl der Multiplikationen auf 7 gedrückt. Man geht wie folgt vor. Zuerst werden sieben Produkte gebildet. m1 m2 m3 := := := m4 m5 := := m6 m7 := := c1 = c2 c3 c4 = = = (a12 − a22 )(b21 + b22 ) (a11 + a22 )(b11 + b22 ) (a12 − a21 )(b11 + b12 ) (a11 + a12 )b22 a11 (b12 − b22 ) a22 (b21 − b11 ) (a21 + a22 )b11 Mit diesen Produkten ergibt sich: m 1 + m2 − m4 − m6 m 4 + m5 m 6 + m7 m 2 − m3 Wenn der Divide&Conquer-Algorithmus Strassens Methode verwendet, ergibt sich T (n) = 7T (n/2) + O(n2 ) und für das gilt laut Mastertheorem T (n) = O(nlog 7 ) = O(n2,81 ). Der Algorithmus von Strassen ist also tatsächlich schneller. 9.7 Matchings 9.7.1 Was ist ein Matching? Eine Matching ist eine Kantenmenge, wobei kein Knoten Endpunkt von mehr als einer Kante ist. 9.7.2 Welche Matchings sind interessant? Interessant sind Matchings mit maximaler Kardinalität. Gibt es mehrere solche Matchings interessiert man sich für Matchings maximaler Kardinalität mit minimalen bzw. maximalen Gewicht. 9.7.3 Wie findet man Matchings? Man sucht nach augmentierenden Pfaden. Solange es noch einen augmentierenden Pfad gibt, kann man diesen Invertieren und erhöht damit die Kardinalität des Matchings. Wenn es keine augmentierenden Pfade mehr gibt, ist die Kardinalität des Matchings maximal. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 129 130 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit Jede Äquivalenzrelation R teilt eine Menge in mehrere disjunkte Mengen. Die Anzahl dieser Mengen heisst der Index von R. Man kann jeder Sprache die Äquivalenz Relation RL auf Σ∗ zuweisen. Es gilt xRL y genau dann, wenn für alle Wörter z ∈ Σ∗ gilt xz ∈ L ⇔ yz ∈ L Kapitel 10 Der Satz von Myhill, Nerode besagt, dass eine Sprache genau dann regulär ist, wenn der Index der von RL endlich ist. Auf diesem Satz beruht auch die Existenz des Minimalautomaten, der ja auch Äquivalenzklassenautomat heisst. Automaten, Formale Sprachen und Berechenbarkeit 10.2 10.2.1 Chomsky 3 Beschreiben die regulären Ausdrücke (a∗ a∗ ) und (a∗ |a∗ )∗ die selbe Sprache? Beide Ausrücke beschreiben die Sprache, die durch den Ausdruck a∗ beschrieben wird. 10.1 10.1.1 10.2.2 Allgemeines Geben Sie einen endlichen Automaten für (a∗ |a∗ )∗ an. Der Automat, der a∗ akzeptiert, sieht so aus: i Was ist die Chomsky-Hierarchie? a Eine hierarchische Einteilung formaler Sprachen. 10.1.2 z0 Möglichkeiten Sprachen zu Erzeugen? Der Automat A = (Q, Σ, δ, I, F ) ist definiert mit Grammatiken und Turing-Generator-Maschinen. 10.1.3 Q Was ist Abzählbarkeit? Eine unendliche Menge M ist abzählbar wenn es eine bijektive Abbildung von N nach M gibt: δ F M = {f (1), f (2), f (3), . . .} Diese Funktion muss nicht zwangsweise berechenbar sein. 10.1.4 10.1.5 = {z0 } Σ = {a} I = {z0 } 10.2.3 = {(z0 , a, z0 )} = {z0 } Was sind reguläre Ausdrücke? Reguläre Ausdrücke sind Formeln zur Beschreibung regulärer Sprachen. Sind sind induktiv definiert: Kann man aus einer Grammatik schliessen, was für ein Sprachtyp beschrieben wird? Ja. Die Produktion der verschiedenen Sprachtypen unterliegen bestimmten Regeln. ∅ ist ein regulärer Ausdruck Was ist der Homomorphismus bei formalen Sprachen? jedes a ∈ Σ ist ein regulärer Ausdruck ist ein regulärer Ausdruck sind α und β reguläre Ausdrücke, so ist auch αβ ein regulärer Ausdruck Wie Schnitt, Vereinigung, usw. ist auch ein Homomorphismus eine Operation auf formalen Sprachen. Sei h : Σ → ∆∗ eine Abbildung, also Zeichen → Zeichenkette. Man kann die Abbildung zu einem Homomorphismus h : Σ∗ → ∆∗ erweitern, also Zeichenkette → Zeichenkette. Die folgenden Schritte Zeigen die zeichenweise Anwendung der Abbildung. h() h(a) h(aw) sind α und β reguläre Ausdrücke, so ist auch α|β ein regulärer Ausdruck ist α ein regulärer Ausdruck, so ist auch α∗ ein regulärer Ausdruck 10.2.4 = = h(a) = h(a)h(w) Mit Hilfe der folgenden zwei Aussagen und des Gesetzes von De Morgan lässt sich die Abgeschlossenheit unter Schnitt beweisen. 1. Reguläre Sprachen sind unter der Vereinigung abgeschlossen. Dies gilt, weil die regulären Ausrücke genau die regulären Sprachen beschreiben und die Vereinigung eine der Operation bei regulären Ausdrücken ist. Für eine Sprache L ⊆ Σ∗ heisst h = {h(w) | w ∈ L} ⊆ ∆∗ homomorphes Bild von L. Entsprechend ist (−1) h = {x ∈ Σ∗ | h(x) = w, w ∈ L} das Urbild einer Sprache L ⊆ ∆∗ . Man nennt h Homomorphismus. 10.1.6 (−1) den inversen 2. Reguläre Sprachen sind unter Komplementbildung abgeschlossen. Dies kann durch einen komplementären Automaten gezeigt werden. Vertauscht man bei einem Automaten A Endzustände mit Nicht-Endzuständen, so erhält man einen Automaten A0 , der die Komplementärsprache erkennt. Was sind Äquivalenzklassen? Was haben Sie mit formalen Sprachen zu tun? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie zeigt man, dass der Schnitt zweier regulärer Sprachen wieder eine reguläre Sprache ist? 131 132 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.2. Chomsky 3 Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit Sei L eine reguläre Sprache. Dann gibt es eine Zahl n, so dass sich alle Wörter x ∈ L mit |x| ≥ n zerlegen lassen in x = uvw, so dass folgende Eigenschaften erfüllt sind: Mit dem Gesetz von De Morgan ergibt sich für zwei Sprachen L1 und L2 : L1 ∪ L 2 = L 1 ∩ L 2 10.2.5 1. |v| ≥ 1, 2. |uv| ≤ n, Zeigen Sie, dass das Komplement bei regulären Sprachen abgeschlossen ist. 3. für alle i = 0, 1, 2, . . . gilt: uv i w ∈ L siehe 10.2.4 10.2.6 Mit Hilfe des Pumping Lemmas lässt sich zeigen, dass eine Sprache nicht regulär ist. Der Beweis läuft über die Konstruktion eines Automaten: Welchen Typ hat die Sprache a 3j+2 i+1 b , j, i ≥ 0? Geben Sie einen Automaten dazu an. Da L regulär ist, gibt es einen Automaten A, der L erkennt. Für die Zahl der Zustände Q wählt man |Q| = n. Ein beliebiges Wort x hat die Länge ≥ n, daher durchläuft der Automat beim Abarbeiten des Wortes |x| + 1 Zustände (wenn man den Startzustand mit zählt). Mit dem Schubfachprinzip kann man schliessen, dass diese Zustände nicht alle verschieden sein können (|x| ≥ n), d. h. irgendwann muss der Automat eine Schleife durchlaufen. Jetzt wählt man die Zerlegung x = uvw so, dass Zustand nach dem Lesen von u und uv derselbe ist. Diese Zerlegung kann so gewählt werden, dass Bedingung 1 und 2 erfüllt werden. Da die Zustände die selben sind, erreicht der Automat beim Lesen des Wortes uw denselben Endzustand wie beim Lesen von x = uvw. Das heisst uw = uv 0 w ∈ L. Dasselbe gilt für uvvw = uv 2 w, uvvvw = uv 3 w, usw. Damit ist auch Bedingung 3 erfüllt. Da i und j nicht voneinander abhängig sind, handelt es sich um eine reguläre Sprache, ein entsprechender Automat für i = j = 0 sieht so aus: z0 10.2.7 a z1 a z2 b z3 Was für Varianten von endlichen Automaten gibt es? Ein endlicher Automat A = (Q, Σ, δ, I, F ) heißt: 10.2.11 Pumping-Lemma auf Sprache der Palindrome anwenden. 1. Automat mit einem Startzustand wenn gilt |I| = 1. Man nimmt an, dass die Sprache der Palindrome regulär ist und führt das mit dem Pumping Lemma zum Widerspruch. Man wählt ein Wort x wie folgt: 2. alphabetisch, wenn gilt δ ⊆ Q × (Σ ∪ {}) × Q, d. h. jeder Übergang ist mein genau einem Zeichen oder markiert n Nun sei x = uvw die den Bedingungen 1 und 2 des Pumping Lemmas entspricht 4. deterministisch (DEA), wenn er buchstabierend ist, genau einen Startzustand hat und für alle p, q, r ∈ Q und alle a ∈ Σ mit (p, a, q) ∈ δ und (p, a, r) ∈ δ gilt q = r, d. h. von jedem Zustand gibt es jeweils nur einen Übergang mit der Markierung a. . . aa} |abaa{z . . . aa} x = aa . . aa} |aa .{z | .{z u 5. vollständig, wenn für jedes p ∈ Q und jedes a ∈ Σ ein q ∈ Q mit (p, a, q) ∈ δ existiert, d. h. von jedem Zustand gibt es für jeden Buchstaben des Alphabets einen Übergang. 10.2.8 n z }| { z }| { x = aa . . . aa b aa . . . aa 3. buchstabierend, wenn gilt δ ⊆ Q×Σ×Q, d. h. jeder Übergang ist mit genau einem Zeichen markiert, ist nicht erlaubt Wegen |v| ≥ 1 müsste dann auch Sind reguläre Sprachen unter Homomorphismen abgeschlossen? v w ≤n n z }| { z }| { uw = aa . . . aa b aa . . . aa ein Wort der Sprache sein. Dies ist jedoch kein Palindrom, da das Wort mehr a’s als b’s enthält. Also kann die Sprache der Palindrome nicht regulär sein. Ja. Der Beweis ergibt sich aus dem Beweis für die Substitution. Dieser Beweis läuft induktiv über reguläre Ausdrücke und Arbeitet auf der syntaktischen Repräsentation der Sprache. 10.2.12 Pumping-Lemma auf ai bi anwenden. 10.2.9 Man nimmt an, dass L = {ai bi | i ≥ 0} regulär ist und führt das mit dem Pumping Lemma zum Widerspruch. Nun wählt man das Pumping Lemma n und betrachtet genau das Wort an bn mit der Länge 2n. Für die Zerlegung uvw ergibt sich: i Wie wandelt man einen endlichen Automaten in einen regulären Ausdruck um? Man verwandelt den Automaten schrittweise in einen verallgemeinerten Automaten an dessen Kanten reguläre Ausrücke stehen. Das mach man solang bis nur noch zwei Zustände, ein Startzustand und ein Endzustand übrig bleiben. Auf der einzigen verbleibenden Transition steht der gesuchte reguläre Ausdruck. Beispiel, Elimination des Zustandes qi : 1. v ist nicht leer (Bedingung 1) 2. uv und v können nur aus a’s bestehen (Bedingung 2) 3. wegen Bedingung 3 müsste dann aber auch das Wort uv 0 w = uw = an−|v| bn in der Sprache sein. ac*d a b Diese widerspricht der Definition von L, daher ist L nicht regulär. c qi d bc*d 10.2.13 Was ist der Unterschied zwischen einem NEA und DEA? ac*e e siehe 10.2.7 f 10.2.14 Welche Form haben die Produktionen bei regulären Sprachen? bc*e|f Für jede Produktion l → r muss gelten |l| ≤ |r|, l muss eine einzige Variable sein, r ist ein Terminal oder ein Terminal gefolgt von einer Variablen. 10.2.10 Pumping-Lemma erklären und beweisen. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 133 134 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.2. Chomsky 3 10.2.15 Wie funktioniert die Umwandlung von einem nicht-deterministischen Automaten zu einem deterministischen Automaten? Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit 10.2.18 Algorithmus zur Minimalisierung von DEAs. Zuerst kann man Zustände, die vom Startzustand aus nicht erreichbar sind, streichen. Dann bestimmt man Paare von äquivalenten Zuständen. Dazu bestimmt man iterativ alle nicht-äquivalenten Zustände, in dem man die folgenden Regeln anwendet, bis sich keine Änderungen mehr ergeben. Die Umwandlung von einem NFA zu einem DFA läuft in 4 Schritten ab 1. endlicher Automat −→ Automat mit einem Startzustand Man fügt einen neuen Startzustand q0 hinzu. Von diesem Zustand gibt es einen -Übergang zu allen alten Startzuständen. Wenn von zwei Zuständen einer ein Endzustand ist und der andere nicht, so sind die Zustände nicht äquivalent p∈F ∧q ∈ /F ⇒ p 6≡ q 2. Automat mit einem Startzustand −→ alphabetischer Automat mit einem Startzustand Ein Übergang mit einem Wort w = a1 a2 . . . an wird in mehrere Übergänge, die jeweils nur mit einem Zeichen markiert sind, aufgeteilt. Dazu müssen n − 1 Zwischenzustände eingeführt werden. Wenn von zwei Zuständen ein a-Übergang zu zwei nicht-äquivalenten Zuständen existiert, dann sind auch die beiden Zustände nicht äquivalent. 3. alphabetischer Automat mit einem Startzustand −→ buchstabierender Automat mit einem Startzustand (-Elimination) Beim Entfernen der -Übergänge muss sicher gestellt werden, dass die akzeptierte Sprache sich nicht ändert. Die -Elimination gliedert sich in drei Teilschritte. (p, a, r) ∈ δ ∧ (q, a, r 0 ) ∈ δ ∧ r 6≡ r 0 1. Stelle eine Tabelle aller Zustandspaare {q, q 0 } mit q 6= q 0 von A auf. / F (oder umgekehrt). 2. Markiere alle Paare {q, q 0 } mit q ∈ F und q 0 ∈ 3. Für jedes noch unmarkierte Paar {q, q 0 } und jedes a ∈ Σ teste, ob {δ(q, a), δ(q 0 , a)} bereits markiert ist. Falls ja, wird auch {q, q 0 } markiert. 4. Der letzte Schritt wird so lange wiederholt, bis sich keine Änderungen mehr ergeben. 5. Alle jetzt noch unmarkierten Paar sind äquivalent und können daher verschmolzen werden. 10.3 10.3.1 10.3.2 oder oder 10.3.3 Welche Automaten erkennen kontextfreie Sprachen? Kellerautomaten. A→w haben. 10.3.4 Eine Sprache L ist genau dann regulär, wenn es eine rechtslineare oder linkslineare Grammatik G mit L = L(G) gibt. Um dies zu Beweisen, kann man zeigen, dass es für jede lineare Grammatik einen endlichen Automaten gibt, der diese Sprache erkennt. In der anderen Richtung muss man zeigen, dass für jede reguläre Sprache einen lineare Grammatik gibt. Erkennt ein deterministischer Kellerautomat kontextfreie Sprachen? Ein deterministischer Kellerautomat erkennt nur deterministisch-kontextfreie Sprachen. 10.3.5 Welche Normalformen für kontextfreie Sprachen gibt es und für was sind sie gut? Es gibt die Chomsky Normalform. Hier haben alle Produktionen die Form A → BC oder A → a. Die Chomsky Normalform wird für die Anwendung des CYK-Algorithmus’ gebraucht. 10.2.17 Wie zeigen Sie die Äquivalenz zweier regulärer Sprachen? Greibach Normalform. Alle Produktionen haben die Form A → aB1 B2 . . . Bn . Sie wird zur Konstruktion von Kellerautomaten benötigt. Von beiden Sprachen den Minimalautomaten bauen. Diese beiden Automaten müssen bis auf Isomorphie gleich sein, wenn die Sprachen äquivalent sind. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Was ist eine kontextfreie Sprache? A→w haben. Sie heisst linkslinear wenn alle Produktionen die Form A → Bw Welchen Typ hat die Sprache ai+1 b3i , i ≥ 0? Geben Sie einen Automaten dazu an. Eine kontextfreie Sprache ist vom Chomsky Typ 2, wird von einem Kellerautomaten akzeptiert und von einer kontextfreien Grammatik erzeugt. Eine Grammatik heisst rechtslinear wenn alle Produktionen die Form A → wB Chomsky 2 Diese Sprache ist kontextfrei, da die Anzahl der b’s von der der a’s abhängt. Der Kellerautomat liest erstmal ein a ohne den Keller zu verändern, dann pusht er für jedes gelesene a drei Zeichen. Beim Lesen eines b’s wird jeweils eins dieser Zeichen vom Keller geholt. Akzeptanz durch leeren Keller. Der entstandene Automat A0 ist meist nicht minimal, er kann aber mit dem Myhill-Verfahren minimalisiert werden (10.2.18). 10.2.16 Sind reguläre Sprachen gleich den linearen Sprachen? p 6≡ q Etwas detaillierter lässt sich der Algorithmus so beschreiben: a) Für jede Kette von -Übergängen von p nach r gefolgt von einem a-Übergang von r nach q fügt man einen a-Übergang von p nach r hinzu. b) Falls von p eine Kette von -Übergängen zu einem Endzustand führt, wird p auch zum Endzustand. c) Jetzt kann man die -Übergängen löschen. 4. buchstabierender Automat mit einem Startzustand −→ deterministischer endlicher Automat (Potenzautomatenkonstruktion) Die Idee ist, alle Wege im buchstabierenden Automaten gleichzeitig zu Verfolgen und sich die Zustände zu merken, in denen sich der Automat befinden könnte. Dazu verwendet man die Potenzautomatenkonstruktion. Für einen buchstabierenden Automaten A = (Q, Σ, δ, q0 , F ) definiert man einen Automaten A0 = (P(Q), Σ, δ 0 , {q0 }, F 0 ), wobei P(Q) die Potenzmenge von Q ist. Die Übergangsrelation δ 0 definiert man so: (P, a, R) ∈ δ 0 gdw. R = {r ∈ Q | ∃p ∈ P : (p, a, r) ∈ δ} wobei P und R Teilmengen von Q also Element von P(Q) bzw. Zustände des Potenzautomaten sind. Die Menge der Endzustände ist definiert durch F 0 = {P ⊆ Q | P ∩ F 6= ∅}, d. h. diejenigen Teilmengen von Q, die mindestens einen Endzustand enthalten. ⇒ 135 136 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.3. Chomsky 2 10.3.6 Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit Erklären und beweisen Sie das Pumping-Lemma für kontextfreie Sprachen. Der Kellerautomat für Palindrome muss die Mitte des Wortes erraten. Der Kellerautomat könnte so aussehen. Sei L eine kontextfreie Sprache. Dann gibt es eine Zahl n ∈ N, so dass sich alle Wörter z ∈ L mit |z| ≥ n zerlegen lassen in z = uvwxy mit folgenden Eigenschaften: Q = {q0 , q1 } Γ = Σ ∪ {c} 1. |vx| ≥ 1 Z0 = c F =∅ 2. |vwx| ≤ n δ = {((q0 , x, y), (q0 , xy)) | x ∈ Σ, y ∈ Γ} ∪ {((q0 , , y), (q1 , y) | y ∈ Γ} ∪ 3. für alle i ≥ 0 gilt: uv i wxi y ∈ L Beweisidee: Wenn eine Grammatik eine Sprache L mit unendlich vielen Wörtern erzeugt, dann muss es Wörter geben in deren Ableitungsbaum auf einem Pfad dieselbe Variable mehrfach vorkommt (Schubfachprinzip). {((q0 , x, y), (q1 , y)) | x ∈ Σ, y ∈ Γ} ∪ {((q1 , x, x), (q1 , )) | x ∈ Σ} ∪ {((q1 , , c), (q1 , ))} S A A 10.3.11 Was sind nutzlose Variablen? A (1) Eine Variable heisst nützlich wenn sie in mindestens einer Ableitung eines Wortes vorkommt. Wenn eine Variable nicht nützlich ist, ist sie nutzlos. Eine nützliche Variable ist produktiv und erreichbar (aber nicht umgekehrt). A (2) Entscheidung Mitte (ungerade länge) (3) Keller mit Eingabe vergleichen (4) Startsymbol vom Keller löschen (5) Die Menge der Endzustände F ist leer, da der Automat durch den leeren Keller akzeptiert. (1) S nächstes Eingabezeichen pushen (1) Entscheidung Mitte (gerade länge) (2) (2) Eine Variable A heisst produktiv, wenn aus ihr mindestens ein Wort abgeleitet werden kann. A Eine Variable A heisst erreichbar, wenn sie in mindestens einer Satzform vorkommt. 10.3.12 Was ist eine nullierbare Variable? u v w x y u v v w x x y Eine Variable A einer Grammatik G heisst nullierbar, wenn gilt A ⇒∗G . Die Abbildung zeigt einen solchen Ableitungsbaum für das Wort uvwxy und uvvwxxy. Man kann den bei Knoten (1) beginnenden Teilbaum so wählen, dass auf keinem Pfad dieses Teilbaums zwei gleiche Variablen vorkommen. Jetzt kann man das Teilstück des Baumes zwischen (1) und (2) beliebig oft wiederholen und erhält damit Ableitungsbäume für die Wörter uv i wxi y. Da in jedem bei (1) beginnenden Teilbaum auf keinem Pfad Variablen doppelt vorkommen gilt |vwx| ≤ n für ein geeignetes n. Man kann davon ausgehen, dass es in der Grammatik keine -Produktionen gibt, daher gilt auch |vx| ≥ 1. 10.3.7 10.3.13 Wie erstellt man eine Grammatik, die keine -Produktion, keine Kettenproduktion und keine nutzlosen Variablen enthält? 1. Elimination von -Produktion Wenn die Grammatik eine Produktion enthält mit der Form A → A1 . . . An bei der für ein i ∈ {1, . . . n} die Variable Ai nullierbar ist, dann wird die Produktion durch A → A1 . . . Ai−1 Ai+1 ersetzt (Ai bleibt also weg). Die wird solange angewandt, bis es keine solchen Produktionen mehr gibt. Produktionen der Form A → werden gelöscht. Diese Grammatik kann keine Sprachen erzeugen, die enthalten. Zeigen Sie, dass L = {am bm cm } nicht kontextfrei ist. 2. Elimination von Kettenproduktionen Jede Sequenz von Kettenproduktionen A ⇒∗G B gefolgt von eine Nicht-Kettenproduktion B → α wird ersetzt durch eine Produktion A → α. Man nimmt an, dass L kontextfrei ist und für das mit dem Pumping Lemma zum Widerspruch. Man wählt das Wort z = an bn cn . Dann hat z die Länge 3n ≥ n. Wegen Bedingung 2 können v und x entweder nur aus a’s und b’s oder aus b’s und c’s bestehen. vx muss wegen Bedingung 1 mindestens ein Zeichen enthalten. Dann kann aber uv 2 wx2 y nicht in L sein, da es entweder mehr a’s als c’s oder mehr c’s als a’s enthält. 10.3.8 3. Entfernen von nutzlosen Variablen (dieser Schritt ist bei manchen Definitionen der Chomsky Normalform nicht gefordert) Bei den beiden folgenden Schritten kommt es auf die Reihenfolge an. a) Alle nicht-produktiven Variablen und die Produktionen in denen sie vorkommen können entfernt werden, ohne dass die Sprache sich ändert. b) Alle nicht-erreichbaren Variablen und die Produktionen in denen sie vorkommen können entfernt werden, ohne dass die Sprache sich ändert. Was sind kontextfreie Grammatiken? Bei kontextfreie Grammatiken gilt für jede Produktion l → r, |l| ≤ |r und das l eine einzige Variable sein muss. 10.3.14 Erklären Sie die Chomsky-Normalform und wie man sie erstellt. 10.3.9 In welcher Klasse liegt die Sprache der Palindrome? Eine Grammatik ist in Chomsky-Normalform, wenn alle Produktionen die Form A → BC Palindrom sind vom Chomsky-Typ 2. Sie sind nicht deterministisch-kontextfrei. A→a haben. Um eine Grammatik vom Typ 2, die keine -Produktion, keine Kettenproduktion und keine nutzlosen Variablen enthält, in Chomsky-Normalform zu überführen sind folgende Schritte notwendig. 10.3.10 Wie funktioniert der Kellerautomat für Palindrome? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs oder 137 138 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.3. Chomsky 2 Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit 1. Für jedes Terminal a wir eine neue Variable Ba und eine Produktion Ba → a eingefügt. Ausserdem ersetzt man in jeder Produktion der Form A → α mit |α| ≥ 2 jedes Zeichen a in α durch die Variable Ba 5. Wenn die Berechnung mit leerem eigentlich beendet wäre, liegt auf dem Keller noch das Symbol X0 . Deshalb werden Übergänge hinzugefügt, so dass der Automat X0 aus dem Keller löscht und in den Endzustand Qf übergeht. 2. Jetzt ersetzt man jede Produktion der Form A → A1 . . . An mit n > 2 durch diese n−1 Produktionen Ein Automat A der durch Endzustände akzeptiert, kann wie folgt in einen Automaten A0 , der durch leeren Keller akzeptiert umgewandelt werden. A → A 1 C1 C1 → A 2 C2 C2 → 1. Automat A0 simuliert Automat A A 3 C3 .. 2. Wenn A0 einen Endzustand erreicht, kann er sich nicht-deterministisch dafür entscheiden, den Keller komplett zu löschen und damit Akzeptanz über leeren Keller zu erreichen. . Cn−2 → An−1 An Problem: Wenn A0 den leeren Keller erreicht, A sich aber nicht in einem Endzustand befindet, wird A 0 das Wort akzeptieren, obwohl A es nicht tut. wobei C1 , . . . , Cn−2 neue Variablen sind. Bei einer Grammatik in Chomsky Normalform hat die Ableitung eines Wortes der Länge n genau 2n − 1 Schritte. Lösung: Im ersten Schritt erzeugt A0 aus dem Startsymbol Z0 den Kellerinhalt Z0 X0 mit einem Kellersymbol X0 ∈ / Γ. Damit kann der Keller garantiert nie leer werden. Der Keller wird nur leer, wenn sich der Automat in einem Endzustand nicht-deterministisch für das komplette löschen des Kellers entscheidet. 10.3.15 Sind kontextfreie Sprachen unter Schnitt abgeschlossen? Nein. Beweis durch Gegenbeispiel. Die Sprachen L1 = {ai bj cj | i, j ≥ 0} und L2 = {ai bi cj | i, j ≥ 0} sind beide Kontextfrei. Der Schnitt der Sprachen L = L1 ∪ L2 = {ai bi ci | i ≥ 0} 10.3.20 Geben Sie die Grammatik für Palindrome an. Für das Alphabet Σ = {0, 1}. ist aber nicht kontextfrei. S S 10.3.16 Wenn ich Ihnen einen Automaten auf den Tisch stelle, können Sie dann sagen, welchen Typ von Sprachen er erkennt? S S Es muss sich um einen EA handeln, da der unendliche Keller des Kellerautomaten nicht auf den Tisch passen würde. S S 10.3.17 Wie sind Kellerautomaten definiert? Ein Kellerautomat über einem Alphabet Σ besteht aus → 0S0 → 1S1 → 0 → 1 → 00 → 11 10.3.21 Was ist eine linksrekursive Grammatik? einer endlichen Menge von Zuständen Q Eine linksrekursive Grammatik enthält Produktionen bei denen die erste Variabel auf der rechten Seiten gleich der Variablen auf der linken Seite ist. Zum Beispiel einem Startzustand z0 ∈ Q einem Kelleralphabet Γ A → AB einem Anfangssymbol Z0 ∈ Γ einem Menge von Endzuständen F Linksrekursive Grammatiken sind ungeeignet für die Verarbeitung mit Top-Down-Parsern, da diese dabei in Endlosschleifen geraten können. Für die Elimination von Linksrekursionen, siehe 2.3.6. einer Übergangsrelation δ ⊆ (Q × (Σ ∪ {}) × Γ) × (Q × Γ∗ ) 10.3.22 Was ist eine mehrdeutige Grammatik? 10.3.18 Wie definiert man einen Zustandsübergang? Zustandsübergang kann als Funktion oder Relation definiert werden. Definition mit Relation siehe 10.3.17. Bei einer mehrdeutigen Grammatik gibt es für mindestens ein Wort verschiedene Ableitungsbäume. 10.3.23 Erklären Sie die Begriffe LL(k) und LR(k). 10.3.19 Welchen Arten von Akzeptanz gibt es bei Kellerautomaten. Zeigen Sie die Äquivalenz dieser Arten. siehe 2.3.3. Es gibt Akzeptanz über Endzustände und Akzeptanz mit leerem Keller. Ein Automat A der durch leeren Keller akzeptiert, kann wie folgt in einen Automaten A 0 , der durch Endzustand akzeptiert umgewandelt werden. i Welche Komplexität hat das Wortproblem? 10.3.24 Das Wortproblem kann mit dem CYK-Algorithmus in O(n3 ) gelöst werden. /Γ 1. Hinzufügen eines neuen Kellersymbols X0 ∈ 2. Hinzufügen eines Endzustandes Qf ∈ /Q 10.3.25 Wie kann man eine Grammatik -frei machen? 3. Automaten so modifizieren, dass er im ersten Schritt das Kellersymbol Z 0 durch Z0 X0 ersetzt 0 4. Automat A simuliert dann den Automaten A DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs siehe 10.3.13 139 140 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.4. Chomsky 1 10.4 10.4.1 Chomsky 1 Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit 10.4.6 Was ist das für eine Sprache {ww|w ∈ {0, 1}∗ }? Es handelt sich um eine kontextsensitive Sprache. Diese Sprache beschreibt das aus dem Compilerbau bekannte Problem, das eine Variable zuerst deklariert werden muss, bevor sie benutzt wird. i Ist das Wortproblem für kontextsensitive Sprachen entscheidbar? Ja, aber N P -hart. 10.4.2 10.4.7 i Geben Sie einen Algorithmus für das Wortproblem an. Welchen Typ hat die Sprache ak bm ak bm , k ∈ N, m ≥ 0? Die Sprache ist kontextsensitiv. Sie entspricht dem Problem bei der Übersetzung eines Programmes festzustellen, ob die Anzahl der Parameter beim Methodenaufruf gleich der Anzahl der Parameter bei der Methodendeklaration ist. Man startet mit dem Startsymbol und leitet so oft ab, bis man das Wort gefunden hat oder nicht mehr ableiten kann. n Formell: Für m, n ∈ N werden die Mengen Tm wie folgt definiert. 10.5 n = {w ∈ (V ∪ Σ)∗ | |w| ≤ n und w lässt sich aus S in höchstens m Schritten ableiten} Tm n Die Mengen Tm , n ≥ 1 lassen sich induktiv über m definieren. T0n n Tm+1 Abln (X) = 10.5.1 Berechenbarkeit Warum ist die Ackermannfunktion nicht primitiv rekursiv? Informell: Man kann zeigen, dass man zur Berechnung von a(n+1, n+1) n verschachtelte For-Schleifen braucht. Da dies für beliebige n gilt, gibt es keine Obergrenze für die Anzahl der For-Schleifen. {S} n = Abln (Tm ), wobei = X ∪ {w ∈ (V ∪ Σ)∗ | |w| ≤ n und w 0 ⇒ w für ein w0 ∈ X} 10.5.2 Abln (X) bildet also aus einer Menge von Wörtern (Satzformen) eine neue Menge, in dem sie X um alle Wörter, die in einem Schritt aus allen Wörter aus X herleitbar sind, erweitert. Aufgenommen werden nur Wörter, deren Länge ≤ n ist. Jede nicht-triviale Eigenschaft P ist unentscheidbar, d. h. die Sprache LP = {hM i | M ist eine Turing-Maschine mit P (L(M ))} Da es nur endlich viele Wörter der Länge n gibt, ist [ n Tm ist nicht entscheidbar. Eine Eigenschaft von Sprachen ist eine Teilmenge P von aufzählbaren Sprachen. Man schreibt P (L) wenn L die Eigenschaft erfüllt, d.ḣ. L ∈ P . Man schreibt ¬P (L) wenn L sie nicht erfüllt. Eine Eigenschaft heisst nicht-trivial wenn es wenigstens eine aufzählbare Sprache mit L mit P (L) und wenigstens eine aufzählbare Sprache L0 mit ¬P (L0 ) gibt. m≥0 für jedes n eine endliche Menge. Deshalb kann man folgenden Algorithmus angeben, der das Wortproblem für Typ 3, 2 und 1 Sprachen löst, da diese die Wortlängenmonotonie erfüllen. Als Eingabe erhält der Algorithmus ein Wort und eine Grammatik. Wortproblem(G, x) 1 n ← |x| 2 T ← {S} 3 do{ 4 T1 ← T 5 T ← Abln (T1 ) 6 } until (x ∈ T ) or (T = T1 ) 7 if (x ∈ T ) return Ja 8 else return Nein i Was ist der Satz von Rice und was bedeutet er? Beispiel : Es ist nicht entscheidbar, ob eine Turing-Maschine nur endlich viele Wörter akzeptiert (d. h. ob die Sprache endlich ist). Die Eigenschaft P ist definiert durch P (L) = {L | |L| < ω}. Die Eigenschaft ist nicht trivial, da ¬P (Σ ∗ ) und P (∅). Es ist nicht entscheidbar, ob die akzeptierte Sprache regulär ist. P (L) = {L | L ist regulär}. Eigenschaft ist nicht-trivial: ¬P (an bn ) und P (∅) 10.5.3 i Erklären Sie den Begriff Aufzählbarkeit. Der Begriff Aufzählbarkeit ist mit dem der Abzählbarkeit eng verwandt: Eine unendliche Menge M ist aufzählbar wenn es eine surjektive, berechenbare Abbildung von N nach M gibt: M = {f (1), f (2), f (3), . . .} Dieser Algorithmus terminiert immer, hat aber exponentielle Laufzeit. 10.4.3 Die Abbildung muss auf jeden Fall berechenbar sein, hier liegt der Unterschied zur Abzählbarkeit. Wenn diese Abbildung berechenbar ist, so kann auch jedes Element der Menge M tatsächlich erzeugt werden. i Welche Komplexität hat dieser Algorithmus? Ist N P -hart und daher Komplexität O(2n ) 10.4.4 10.5.4 Was heisst rekursiv aufzählbar ? Die Begriffe aufzählbar und rekursiv aufzählbar bedeuten im deutschen dasselbe. Was ist Wortlängenmonotonie? Auch bei kontextsensitiven Sprachen können Worte in jedem Ableitungsschritt nur länger werden oder gleich lang bleiben. Das ist eine grundlegende Voraussetzung für die Entscheidbarkeit des Wortproblems. 10.5.5 Zeigen sie, dass eine rekursive aufzählbare Sprache semi-entscheidbar ist. Satz: Eine Sprache ist rekursiv aufzählbar genau dann, wenn sie semi-entscheidbar ist. 10.4.5 Beweis: Von links nach rechts: Wenn die Sprache L mit der Funktion f rekursiv aufzählbar ist, dann muss man nur der Reihe nach i = 0, 1, 2 . . . in f einsetzen und testen ob f (n) = x ist. Welche Automaten erkennen kontextsensitive Sprachen? Linear beschränkte Turingmaschinen. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 141 142 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.5. Berechenbarkeit Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit Von rechts nach links: Die Annahme ist, das die Sprache L semi-entscheidbar ist. Man sucht nach einer Funktion f deren Wertebereich L ist, die also alle Elemente von A aufzählt. 5. Jede Funktion, die durch sog. primitive Rekursion aus primitiv rekursiven Funktionen entsteht, ist primitiv rekursiv. Primitive Rekursion bedeutet, dass die Definition von f (n + 1, . . .) zurückgeführt wird auf f (n, . . .). Formal muss f ein Gleichungssystem der folgenden Form erfüllen: Wenn L semi-entscheidbar ist, dann gibt es auch einen Algorithmus M , der diese Semi-Entscheidung berechnet. Der Algorithmus bekommt ein Wort x der Sprache L als Eingabe und antwortet nach einer endlichen Anzahl an Schritt mit ja oder er antwortet gar nicht. Mit Hilfe dieses Algorithmus kann der in der Abbildung dargestellte Automat die Sprache aufzählen, in dem er mit natürlichen Zahlen gefüttert wird (Automat nicht im Sinne von endlicher Automat). n C1 (x',y') M' x' C2 x f (0, . . .) = g(. . .) f (n + 1, . . .) = h(f (n, . . .), . . .) wobei g, h selbst primitiv rekursive Funktionen sind. 10.5.8 M ja x y' K a Durch Anwendung des µ-Operators wird aus einer n + 1-stelligen Funktion g eine n-stellige Funktion µg. min{k ∈ N | g(x, k) = 0 ∧ (g(x, j) ist definiert für alle j ≤ k)} (µg)(x) = undefiniert, falls min nicht existiert {...} M ist der bereits beschriebene Semi-Entscheidungs-Algorithmus. Er ist der zentrale Bestandteil des Automaten M 0 . M 0 erweitert M um eine Kontrolleinheit K, die M nach einer bestimmten Anzahl von Schritten abbrechen kann. Des weiteren wählt man a als ein Wort, das in der Sprache L liegt. Jetzt erhält der Automat ein 2-Tupel (x0 , y 0 ) wobei x0 ∈ N und y 0 ∈ N als Eingabe. y 0 wird der Kontrolleinheit K zugeführt, diese kann M nach y 0 Schritten abbrechen. Der andere Teil des Tupels x0 ist ebenfalls eine natürliche Zahl, die aber ein Wort codiert. Entscheidend dabei ist, dass jedes Wort als natürliche Zahl codiert werden kann. Dieses codierte Wort x0 wird von Codierer C2 in das Wort x übersetzt. Der Algorithmus wird nun auf das Wort x angesetzt und gibt, falls x ein Wort der Sprache ist, ja aus. Falls M ja ausgibt, gibt M 0 das Wort x aus. Da nicht entscheidbar ist, ob der Algorithmus jemals anhält, bricht ihn die Kontrolleinheit nach y 0 Schritten ab. In diesem Falle gibt M 0 das Wort a aus. µg(x) bezeichnet also den kleinsten Index k, für den g(x, k) = 0 gilt und für den für alle j ≤ k der Wert g(x, j) definiert ist. 10.5.9 10.5.10 Wie geht die Umwandlung einer nicht-deterministischen Turingmaschine in eine Deterministische? Dazu muss erstmal die Idee der beschränkten Simulation beschrieben werden. Ein beschränkter Simulator Sim(M ) einer TM M erweitert M um einen Zähler der mit n initialisiert wird. Sim(M ) erhält als Eingabewort w#n wobei w das Eingabewort und n ein Wort aus n Strichen ist. Bei jedem Abarbeitungsschritt wird der Zähler um 1 decrementiert (ein Strich gelöscht). Ist der Zähler bei 0 bevor das Wort w erkannt wurde, akzeptiert die Maschine nicht. Diese Idee kann nun erweitert werden um eine DTM zu bauen. Gegeben sei folgende nicht-deterministische Turing-Maschine M = (Q, Σ, Γ, δ, q0 , B, F ). Für einen Zustand q ∈ Q und ein gelesenes Zeichen a definiert man A(q,a) = {(p, b, m) | ((q, a), (p, b, m) ∈ δ} als die Menge der möglichen Übergänge nach q bei gelesenem Eingabezeichen a. Man nennt A(q,a) die Menge der Alternative. Die maximale Anzahl k von Alternativen der Turingmaschine ist k = max{|A(q,a) | | q ∈ Q, a ∈ Γ} Nun kann man jeder Alternative aus A(q,a) eindeutig eine Nummer aus {1, 2, . . . , k} zuordnen. Jetzt sei π = k1 k2 . . . kn mit ki = {1, 2, . . . , k}. Sei Sim(M ) eine Turingmaschine, die die Eingabe w#π erhält, wobei w ∈ Σ∗ . Sim(M ) simuliert die Turingmaschine M auf der Eingabe w für |π| Schritte; ki gibt in jedem Simulationsschritt an, welche Alternative der TM M die TM Sim(M ) wählen soll. Wenn die Wahl einer alternative nicht möglich ist, wird die Simulation erfolglos abgebrochen. Genau dafür ist der Codierer C1 zuständig. Dieser erhält als Eingabe eine natürliche Zahl und erzeugt als Ausgabe ein 2-Tupel mit natürlichen Zahlen. Es gibt berechenbare Funktionen, die solche Tupel erzeugen ([Schöning, 1997, S. 111]), da (N × N) aufzählbar ist. Der ganze Automat erzeugt nun alle Wörter der Sprache L, wenn er alle natürlichen Zahlen als Eingabe enthält. Er berechnet also eine Funktion mit Definitionsbereich N und Wertebereich L. Erklären Sie den Begriff Berechenbarkeit. Laut der Churchschen These stimmt die durch die formale Definition der Turing-Berechenbarkeit erfasste Klasse von Funktionen genau mit der Klasse der im intuitiven Sinne berechenbaren Funktionen überein. Diese Maschine ist deterministisch, da jede Alternativenwahl vorgeben ist und stoppt nach |π| Schritten. Nun kann man aus Sim(M ) eine Maschine M 0 bauen, die für die Eingabe w systematisch alle Paare w#π erzeugt und dann Sim(M ) mit Eingabe w#π startet. Wenn Sim(M ) für ein π die Eingabe w#π akzeptiert, dann akzeptiert M 0 die Eingabe w. Es gilt L(M ) = L(M 0 ). Denn es gilt w ∈ L(M 0 ) gdw. ein π ∈ {1, 2, . . . , k}∗ mit w#π von Sim(M ) akzeptiert wird gdw w ∈ L(M ) gilt. Informell: Berechenbar ist, was man z. B. in Java programmieren kann. 10.5.7 Wie sind die primitiv rekursiven Funktionen definiert? 10.5.11 Zeigen Sie die Unentscheidbarkeit des Wortproblems? Die primitiv rekursiven Funktionen sind induktiv definiert: Definition des Wortproblems: 1. Alle konstanten Funktionen sind primitiv rekursiv. LW = {hM i#hwi | M ist eine Turing-Maschine und w ∈ L(M )} 2. Alle identischen Abbildungen (Projektionen) sind primitiv rekursiv. 3. Die Nachfolgerfunktion s(n) = n + 1 auf den natürlichen Zahlen ist primitiv rekursiv. wobei hM i und hwi geeignete Repräsentationen der Turing-Maschine bzw. eines Wortes sind. Die Frage ist nun, ist diese Sprache entscheidbar, das heisst, gibt es eine Turing-Maschine, die genau diese Sprache erkennt, also für jede Kombination Turing-Maschine–Sprache mit ja oder nein antworten kann. 4. Jede Funktion die durch Einsetzung (Komposition) von primitiv rekursiven Funktionen entsteht, ist selbst primitiv rekursiv. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie unterscheiden sich die primitiv rekursiven von den µ-rekursiven Funktionen? Die Berechbarkeitsmächtigkeit der primitiv rekursiven Funktion entspricht der Loop-Berechenbarkeit. Die Berechbarkeitsmächtigkeit der µ-rekursiven Funktionen entspricht der While- bzw. Turing-Berechenbarkeit. Man sieht, dass M 0 auf jeden Fall stoppt und immer ein Wort der Sprache ausgibt. M 0 erzeugt alle Wörter der Sprach, wenn die Eingabe-Tupel alle Wörter enthalten und für jedes Wort, die Anzahl der Schritte y 0 gross genug ist. Um dies sicher zustellen muss man den Algorithmus einfach mit allen Wörter, die es gibt füttern und für jedes Wort alle möglichen Anzahlen an Schritten zulassen. Da heisst, M 0 erzeugt alle Wörter, wenn er als Eingabe alle Tupel (N × N) erhält. 10.5.6 Wie ist der µ-Operator definiert? 143 144 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.5. Berechenbarkeit Kapitel 10. Automaten, Formale Sprachen und Berechenbarkeit Die Unentscheidbarkeit wird durch einen Widerspruchsbeweis gezeigt. Man nimmt an, dass es eine deterministische Turing-Maschine W mit L(W ) = LW gibt, die für alle Eingaben hält, also das Wortproblem löst. ja 〈M〉#〈w〉 U D x#x W ja nein nein Wie man sieht, würde dies Maschine das Wortproblem lösen. Da das Wortproblem aber bewiesenermassen unentscheidbar ist, kann die Maschine H nicht existieren und somit das Halteproblem auch nicht entscheidbar. nein Ein Wort x, das in die Turing-Maschine M gegeben wird, wird zuerst vom Duplizierer D verdoppelt zum dem Wort x#x. Diese Wort wird nun in die Turing-Maschine W gegeben, die auf jedem Wort hält. Zum Schluss wird das Ergebnis noch negiert. Nun gibt man der Turing-Maschine ihre eigene Repräsentation als Eingabe, also x = hM i. M verhält sich dann wie folgt. H Sie wird mit einer Instanz des Wortproblems gefüttert. Die Umbauer-Maschine U baut die Maschine M f um. Diese Maschine akzeptiert w wenn sie auf ihm hält. Jetzt wird eine Beschreiin eine Maschine M bung der umgebauten Maschine und das Wort in die Maschine H eingeführt. H ist die hypothetische f auf w hält und antwortet immer. Maschine, die das Halteproblem löst. Sie testet nun ob, M ja M ja nein Aus dieser angenommenen Turing-Maschine W wird jetzt eine Turing-Maschine M , wie in der Abbildung gezeigt, konstruiert. x 〈M〉#〈w〉 i Beweisen Sie die das Halteproblem. (2. Variante) 10.5.13 Der Beweis läuft in zwei Schritten, zuerst beweist man das spezielle Halteproblem und reduziert es dann auf das Halteproblem. Auf jeden Fall hält M , da der Duplizierer D immer hält und die Maschine W laut der Widerspruchsannahme auch immer hält. Spezielles Halteproblem: Unter dem speziellen Halteproblem versteht man die Sprache K = {w ∈ {0, 1}∗ | Mw angesetzt auf w hält} Wenn M mit ja antwortet, dann muss W auf der Eingabe hM i#hM i mit nein gehalten haben. Gemäss der Widerspruchsannahme gilt dann hM i#hM i ∈ / LW . Die Turing-Maschine W löst ja das Wortproblem, das sie mit nein Antwortet ist also hM i kein Wort der Sprache L(M ), die durch die Turing-Maschine M erkannt wird. Es gilt also hM i ∈ / L(M ). Das heisst aber wiederum, dass die Maschine M auf der Eingabe hM i nicht mit der Antwort ja hält. Dieser Widerspruch zeigt, dass die Turing-Maschine M für die Eingabe hM i nicht mit der Antwort ja halten kann. Diese Sprache ist nicht entscheidbar. Beweis: Man nimmt an, dass K entscheidbar ist und führt diese Annahme zum Widerspruch. Falls K entscheidbar ist, dann lässt sich χK mit einer Turingmaschine M berechnen. Nun baut man diese Turing-Maschine M um in eine Turingmaschine um in eine Turingmaschine M 0 , die wie folgt definiert ist. Wenn M auf der Eingabe hM i mit der Antwort nein hält, dann muss W auf der Eingabe hM i#hM i mit ja halten. Dann gilt laut der Widerspruchsannahme, dass hM i#hM i ∈ LW . Aufgrund der Definition von LW gilt dann aber auch hM i ∈ L(M ). Was aber bedeutet, dass M mit der Antwort ja hält. Dieser Widerspruch zeigt, dass die Turing-Maschine M für die Eingabe hM i nicht mit der Antwort nein halten kann. M' start M =0? Die Turing-Maschine M hält also für die Eingabe hM i weder mit ja noch mit nein . Da die Maschine aber per Konstruktion immer hält, liegt ein Widerspruch vor. Die einzige Annahme die getroffen wurde, war, dass es eine Maschine W gibt, die das Wortproblem löst. Aufgrund des Widerspruchs kann W nicht existieren und somit ist das Wortproblem nicht entscheidbar. nein M 0 angesetzt auf w 0 hält Definition des Halteproblems: LH = {hM i#hwi | M ist eine Turing-Maschine und hält bei der Eingabe w} M 0 angesetzt auf w 0 hält wobei hM i und hwi geeignete Repräsentationen der Turing-Maschine bzw. eines Wortes sind. Die Frage ist nun, ist diese Sprache entscheidbar, das heisst, gibt es eine Turing-Maschine, die genau diese Sprache erkennt, also für jede Kombination Turing-Maschine–Sprache mit ja oder nein antworten kann. ⇔ ⇔ ⇔ ⇔ ⇔ M angesetzt auf w 0 gibt 0 aus χK (w0 ) = 0 w0 ∈ /K Mw0 angesetzt auf w 0 hält nicht M 0 angesetzt auf w 0 hält nicht Der Widerspruch zeigt, dass die Annahme falsch war, K ist nicht entscheidbar. Allgemeines Halteproblem: Unter dem allgemeinen Halteproblem versteht man die Sprache Man zeigt die Unentscheidbarkeit des Halteproblems indem man das Wortproblem auf das Halteproblem reduziert. Man zeigt, also, dass man aus einer Maschine die das Halteproblem entscheidet, eine Maschine bauen könnte, die das Wortproblem entscheidet. Da das Wortproblem nicht entscheidbar ist, kann es ein solche Maschine nicht geben. H = {w#x| Mw angesetzt auf x hält} Diese Sprache ist nicht entscheidbar. Beweis: Wir wissen bereits, dass das spezielle Halteproblem nicht entscheidbar ist, dieses reduzieren wir jetzt auf das allgemeine Halteproblem. D. h. wir zeigen, dass das spezielle Halteproblem eine Spezialfall des allgemeinen Halteproblems ist, dann kann das allgemeine Halteproblem nicht entscheidbar sein. Formal: Man zeigt, das K ≤ H. Dazu wählt man als Reduzierungsfunktion f (w) = w#w. Dann gilt: w ∈ K ⇔ f (w) ∈ H. Eine deterministische Turing-Maschine M kann man so umbauen, dass sei ein Wort genau dann akzepf bezeichnet. tiert, wenn sie auf dem Wort hält. Die umgebaute Maschine wird mit M Die folgende Maschine entscheidet das Wortproblem. 145 stop Die Maschine M 0 stoppt wenn M 0 ausgibt, ansonsten gerät M 0 in eine Endlosschleife. Jetzt betrachtet man ein Codewort w 0 der Maschine M 0 und kommt zu folgenden Schlussfolgerungen: 10.5.12 Beweisen Sie die Unentscheidbarkeit des Halteproblems. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs ja 146 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 10.5. Berechenbarkeit i Was ist die Kleen’sche Normalform? 10.5.14 Ein Programm, dass nur aus einer einzigen While-Schleife besteht, ist in Kleen’scher Normalform. 10.5.15 Gibt es Funktionen, die Turing aber nicht Loop-berechenbar sind? Ja. Z. B. die Ackermannfunktion. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 147 Kapitel 11. Logik Desweiteren ist Res0 (F ) = F und Ausserdem ist Res∗ (F ) = Resn+1 (F ) = Res(Resn (F )) [ Resn (F ) n≥0 Kapitel 11 Auf Unerfüllbarkeit wird mit dem Resolutionssatz getestet: Resolutionssatz: Eine Klauselmenge F ist unerfüllbar genau dann, wenn 2 ∈ Res∗ (F ). Logik 11.2.4 Was ist das Resolutionslemma? Sei F eine Formel in KNF, dargestellt als Klauselmenge. Ferner sei R ein Resolvent zweier Klauseln K1 und K2 . Dann sind F und F ∪ {R} äquivalent. 11.1 11.1.1 Beweis: Sei A eine zu F und damit auch zu F ∪ {R} passende Belegung. Wenn A |= F ∪ {R}, dann gilt natürlich auch A |= F . Allgemeines Umgekehrt wird angenommen, dass A |= F , dann gilt für alle Klauseln K ∈ F : A |= K. Der Resolvent R hat die Form R = (K1 − {L}) ∪ (K2 − {L}) mit K1 , K2 ∈ F und L ∈ K1 , L ∈ K2 . Jetzt muss man zwei Fälle unterscheiden. Was bedeuteten Korrektheit und Vollständigkeit? Die Aufgabe eines Kalküls ist es die Unerfüllbarkeit einer Formelmenge zu beweisen. Das Kalkül muss vollständig und korrekt sein. Korrektheit bedeutet, dass keine erfüllbare Formel vermeintlich als unerfüllbar erkannt wird. Vollständigkeit bedeutet, dass jede unerfüllbare Formel nachgewiesen werden muss. 11.2 11.2.1 Aussagenlogik 2. Fall : A 6|= L Da A |= k1 , gilt auch A |= (K1 − {L}) und somit A |= R. Erklären Sie was gültige, erfüllbare und unerfüllbare Formeln sind. Eine Formel F ist erfüllbar falls sie mindestens ein Modell A hat. Man schreibt A |= F . Eine Formel F heisst gültig falls für jede zu F passende Belegung A gilt A |= F . Man nennt F eine Tautologie und schreibt |= F . Eine Formel F heisst unerfüllbar falls es keine passende Belegung, die ein Modell ist, gibt. 11.2.2 1. Fall : A |= L Da A |= L gilt sicherlich A 6|= L. Weiterhin gilt A |= K2 . Wenn A Modell für K2 ist, dann gilt auch A |= (K2 −{L}, da das Literal, das aus der Klausel entfernt wird, ja eh nicht erfüllbar ist. Innerhalb der Klausel sind alle Literale mit ∨ verbunden, deshalb ändert das entfernen einer 0 nichts. Der Resolvent wird durch Vereinigung von (K1 − {L}) und (K2 − {L}) gebildet. Die einzelnen Literale in R sind also wieder alle durch ∨ verbunden, da A |= K2 gilt, muss auch A |= R gelten. Es gibt nur diesen beiden Fälle und für beide gilt, A |= R, also muss auch A |= F ∪ {R} gelten. 11.2.5 Resolutionssatz: Eine Klauselmenge F ist unerfüllbar genau dann, wenn 2 ∈ Res∗ (F ). Wenn Sie einen Entscheidungsalgorithmus für die Erfüllbarkeit haben, wie können Sie zeigen, dass zwei Formeln äquivalent sind? Korrektheit: Angenommen 2 ∈ Res∗ (F ). Die leere Klausel 2 kann nur durch Resolution zweier Klauseln K1 und K2 mit K1 = {L} und K2 = {L} entstanden sein. Aus dem Resolutionslemma folgt: Zeigen, dass A ↔ B eine Tautologie ist. 11.2.3 F ≡ Res1 (F ) ≡ Res2 (F ) ≡ . . . ≡ Resn (F ) ≡ . . . i Wie funktioniert die aussagenlogische Resolution? Da 2 in Res∗ (F ) enthalten ist (Annahme), ist für ein n ≥ 0, 2 ∈ Resn (F ), und damit auch K1 , K2 ∈ Resn (F ). Das es kein Modell gibt, das sowohl K1 als auch K2 erfüllt, ist Resn (F ) unerfüllbar. Da Resn (F ) ≡ F , ist F unerfüllbar. Die Resolution ist ein aussagenlogisches Kalkül. Um Resolution anzuwenden muss die Formel in KNF dargestellt werden. Vorteilhaft ist es dann die KNF-Formel als Mengen sog. Klauseln darzustellen. Aus F = (L1,1 ∨ . . . ∨ L1,n1 ) ∧ . . . ∧ (Lk,1 ∨ . . . ∨ Lk,nk ) Vollständigkeit: Die Annahme ist nun, dass F unerfüllbar ist und man will zeigen, dass in diesem Falle auch tatsächlich 2 ∈ Res∗ (F ) gilt. Der Beweis ist ein Induktionsbeweis über die Anzahl n der atomaren Formeln in F . Aufgrund des Endlichkeitssatzes kann man sich auch wenn F eine unendliche Formelmenge ist, auf eine endliche unerfüllbare Teilmenge von F beschränken. wird F = {{L1,1 , . . . , L1,n1 }, . . . , {Lk,1 , . . . , Lk,nk }} Induktionsanfang: Falls n = 0, so kann F nur F = {2} sein und somit ist 2 ∈ Res ∗ (F ). wobei L Literale sind. Induktionsschritt: Man wählt ein beliebiges aber festes n. Es wird angenommen, dass für jede unerfüllbare Klauselmenge G, die nur die atomaren Formeln A1 , A2 , . . . An enthält, gilt 2 ∈ Res∗ (F ). Jetzt sei F eine Klauselmenge mit den atomaren Formeln A1 , A2 , . . . An+1 . Jetzt werden aus F zwei neue Klauselmengen F1 und F0 wie folgt konstruiert. Wenn K1 , K2 und R Klauseln sind, dann heisst R Resolvent von K1 und K2 , falls ein Literal L gibt mit L ∈ K1 und L ∈ K2 und R diese Form hat R = (K1 − {L}) ∪ (L2 − {L}) F0 : Das Atom An+1 wird auf den Wert 0 fixiert. Dann entsteht F0 aus F indem jedes Vorkommen von An+1 aus den Klausel gestrichen wird. Das geht da, A ∨ 0 = A. Ausserdem wird jede Klausel, die ¬An+1 enthält komplett gestrichen. Eine Klausel, die den Wert 1 enthält, hat insgesamt den Wert 1 und kann damit gestrichen werden. Wenn F eine Klauselmenge ist, dann ist Res(F ) definiert als Res(F ) = F ∪ {R | R ist Resolvent zweier Klauseln aus F } DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs i Beweis für Korrektheit und Vollständigkeit der Resolution. 149 150 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.2. Aussagenlogik F1 : Das Atom An+1 wird auf den Wert 1 fixiert. Dann entsteht F1 aus F indem jedes Vorkommen von ¬An+1 aus den Klausel gestrichen wird. Das geht da, A ∨ 0 = A. Ausserdem wird jede Klausel, die An+1 enthält komplett gestrichen. Eine Klausel, die den Wert 1 enthält, hat insgesamt den Wert 1 und kann damit gestrichen werden. Kapitel 11. Logik 4. Â((¬F )) = 11.2.7 Zu beachten ist, dass weder F0 noch F1 das Atom An+1 oder ¬An+1 enthalten. Im nächsten Schritt will man zeigen, dass sowohl F0 wie F1 unerfüllbar sind. Dies wird mit einem Widerspruchsbeweis erreicht (nur für F0 ausgeführt): Angenommen es gibt eine Belegung A : {A1 , . . . , An } → {0, 1}, die F0 erfüllt, dann ist A0 ein Modell für F , wobei A0 wie folgt definiert ist: A(B) falls B ∈ {A1 , . . . , An } A0 (B) = 0 falls B = An+1 1, 0, falls Â(F ) = 0 sonst Was sind die minimalen Junktoren? Sowohl mit NAND als auch NOR können ∧, ∨, ¬ dargestellt werden. 11.2.8 Was ist eine Basis? Eine Menge O von Operatoren ist eine Basis (vollständig) falls es zu jeder Funktion f : W n → W, n ≥ 1 eine Formel F gibt, sodass F enthält nur Operatoren aus O und atomare Aussagen A1 , . . . An Die Existenz des Modells A0 steht aber im Widerspruch zur angenommenen Unerfüllbarkeit von F . Deshalb kann F0 nicht erfüllbar sein, aus dem selben Grund ist auch F1 unerfüllbar. Man weiss nun, dass F0 und F1 unerfüllbar sind, daher kann auf sie die Induktionsvoraussetzung angewandt werden und es gilt 2 ∈ Res∗ (F0 ) und 2 ∈ Res∗ (F1 ). Das heisst auch, dass es Klauseln K1 , . . . , Km geben muss mit: für alle zu F passenden Belegungen A gilt f (A(A1 ), . . . , A(An )) = A(F ). 11.2.9 Erklären Sie die Konjunktive Normalform. Eine Formel ist in konjunktiver Normalform, wenn sie folgende Form hat: Km = 2 und für i = 1, . . . , m gilt: Ki ∈ F0 oder Ki ist Resolvent zweier Klauseln Ka , Kb mit a, b < i. D. h. es gibt für F0 eine Folge von Klausel K1 , . . . , Km , die zur leeren Klausel führt. Für F1 gibt es ebenfalls eine Folge K10 , . . . , Kt0 . F = (L1,1 ∨ . . . ∨ L1,n1 ) ∧ . . . ∧ (Lk,1 ∨ . . . ∨ Lk,nk ) Beweis dafür, dass es für jede Formel eine konjunktive Normalform gibt, ist ein Induktionsbeweis über den Formelaufbau. Einige der Klauseln Ki entstanden aus F wobei das Vorkommen des Literals An+1 gestrichen wurde. Jetzt wird die ursprüngliche Klausel Ki ∪{An+1 } wieder hergestellt und An+1 bei den Resolutionsschritten mitgeführt. Es kann nur passieren, dass im Laufe der Resolutionsschritte die leere Klausel auftaucht, dann ist alles gezeigt. Wenn dies nicht passiert, ist am Ende auf jeden Fall {A n+1 } ∈ Res∗ (F ). Algorithmus zum Erzeugen der KNF: 1. Ersetze in F jedes Vorkommen einer Teilformel der Bauart Durch das Wiedereinfügen der von ¬An+1 in die Folge K10 , . . . , Kt0 , ergibt sich am Ende auf jeden Fall {¬An+1 } ∈ Res∗ (F ). ¬¬G durch G ¬(G ∧ H) durch (¬G ∨ ¬H) Jetzt braucht nur noch ein Resolutionsschritt durchgeführte werden {An+1 } ¬(G ∨ H) {¬An+1 } durch (¬G ∧ ¬H) bis keine derartige Teilformel mehr vorkommt. 2. Ersetze in F jedes Vorkommen einer Teilformel der Bauart (F ∨ (G ∧ H)) ((F ∧ G) ∨ H) 2 ∗ und es gilt 2 ∈ Res (F ). 11.2.6 Die Formel ist nun in KNF. Es kann allerdings sein, dass noch überflüssige Disjunktion vorkommen. Diese jedoch zulässig, da es sich um Tautologien handelt. Syntax. Eine atomare Formel hat die Form Ai , wobei i = 1, 2 . . .. Formeln werden induktiv definiert. 1. Alle atomaren Formeln sind Formeln. 2. Für alle Formeln F und G sind (F ∧ G) und (F ∨ G) Formeln. 3. Für jede Formel F ist ¬F eine Formel. Beispiel: Semantik. Es gibt eine Funktion A, die die atomaren Formeln auf die Menge der Wahrheitswerte {0, 1} abbildet. Desweiteren gibt es eine Funktion  die Menge der Formeln auf die Wahrheitswerte abbildet. Die Unterscheidung zwischen A und  hat formale Gründe, da  einen grösseren Definitionsbereich als A hat. In einigen Bücher wird diese Unterscheidung nicht gemacht und in allen wird sie früher oder später weggelassen. Die Semantik ist wie folgt definiert. = = = Eine Formel ist in disjunktiver Normalform, wenn sie folgende Form hat: F = (L1,1 ∧ . . . ∧ L1,n1 ) ∨ . . . ∨ (Lk,1 ∧ . . . ∧ Lk,nk ) Beweis dafür, dass es für jede Formel eine disjunktive Normalform gibt, ist ein Induktionsbeweis über den Formelaufbau. falls Â(F ) = 1 oder Â(G) = 1 sonst DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs (¬A → B) ∧ ((A ∧ ¬C) → B) (A ∨ B) ∧ (¬(A ∧ ¬C) ∨ B) (A ∨ B) ∧ ((¬A ∨ C) ∨ B) (A ∨ B) ∧ (¬A ∨ C ∨ B) 11.2.10 Erklären Sie die Disjunktive Normalform. Formel A ist Â(A) = A(A). 1, falls Â(F ) = 1 und Â(G) = 1 0, sonst 1, 0, ((F ∨ G) ∧ (F ∨ H)) ((F ∨ h) ∧ (G ∨ H)) bis keine derartige Teilformel mehr vorkommt. i Woraus besteht die Aussagenlogik (Syntax/Semantik)? 1. für jede atomare 2. Â((F ∧ G)) = 3. Â((F ∨ G)) = durch durch 151 152 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.2. Aussagenlogik Kapitel 11. Logik i Was ist der Endlichkeitssatz? 11.2.11 08 09 10 11 12 13 Eine Menge M von Formel ist erfüllbar genau dann, wenn jede der endlichen Teilmengen von M erfüllbar ist. i Beweis des Endlichkeitssatzes? 11.2.12 Die Richtung von links nach rechts ist einfach. Jedes Modell für M ist ein Modell für jede Teilmenge von M und damit auch für jede endliche Teilmenge. In die andere Richtung wird es kompliziert, daher zerlegt man den Beweis am Besten in mehrere Schritte. A ← A ∪ {(An , 1)} I ← I − {i | Ai (An ) 6= 1} } else { A ← A ∪ {(An , 0)} I ← I − {i | Ai (An ) 6= 0} } Was macht der Algorithmus jetzt in der Stufe 1? Zuerst kommt die IF-Abfrage in Zeile 7. Diese Abfrage ist so nicht programmierbar (auf jeden Fall nicht in endlicher Zeit), trotzdem wird jetzt angenommen, das diese Anfrage immer ein Ergebnis liefert und sich der Algorithmus somit immer für einen der beiden Zweige entscheidet. Man kann sich die Abfrage so vorstellen: Das Atom A n (in der ersten Stufe A1 ) wird in alle Modelle Ai eingesetzt und überprüft, ob unendlich oft 1 herauskommt. 1. Erst nochmal die Aufgabe verdeutlichen: Man nimmt an, jede endliche Teilmenge von M ist erfüllbar, dass heisst sie hat ein Modell. Die Aufgabe ist nun aus diesen unendlich vielen Modellen ein Modell für M zu konstruieren. Wenn das gelingt, ist auch die Richtung von rechts nach links bewiesen. Zur Erinnerung: Die Ai sind die Modelle für die Formelmengen Mn , die in Schritt 2 definiert wurden. 2. Für jedes n ≥ 1 sei Mn die Menge der Formel in M, die nur die atomaren Formeln A1 , . . . An enthalten. Jede dieser Mengen Mn ist wieder unendlich, da es unendlich viele Möglichkeiten gibt n n atomare Formeln zu einer Formel zusammen zubauen. Aber es gibt höchstens k ≤ 22 verschiedene Formeln in M, die nicht äquivalent zueinander sind. Auch wenn diese Abfrage nicht programmierbar ist, liefert sie immer eine Antwort, entweder es gibt unendliche viele Modelle Ai für die A( A1 ) = 1 oder nicht. Angenommen es gibt unendlich viele, was passiert dann? Das Modell A (das bis jetzt aus der leeren Menge besteht) wird um (A 1 , 1) erweitert. Es weist also fortan dem Atom A1 den Wert 1 zu. n Wieso? Für eine Formel mit n atomaren Formeln kann man höchstens 22 verschiedene Wahrheitstafeln aufstellen. Für jede atomare Formel zwei Möglichkeiten, daher 2n und dann noch pro n Belegung wahr oder ’falsch, macht 22 verschiedene Wahrheitstafeln. Was in Zeile 9 mit der Indexmenge I passiert, wird gleich erklärt. Jetzt erst mal zu dem ELSEZweig. Falls nicht unendlich viele Modelle Ai gibt, die A1 1 zuweisen, dann wird der ELSE-Zweig ausgeführt. Dieser mach genau dasselbe nur erweitert er A um (A1 , 0). Das Modell weist A1 also fortan den Wert 0 zu. Man nennt diese nicht äquivalenten Formeln in Mn jetzt F1 . . . Fk , da es ja nicht mehr als k gibt. Jetzt kann man für jede Formel F aus Mn eine zu ihr äquivalente Formel Fi mit i ≤ k finden. Formell: Für jedes F ∈ Mn gibt es ein i ≤ k mit Fi ≡ F . Also, was soll die Veränderung der Indexmenge I? Der Grund für die Veränderung der Indexmenge liegt genau in dem Wort fortan im letzten Absatz. Wenn das Modell dem Atom A1 den Wert 1 zuweist, dann soll das im nächsten Schritt auch noch so bleiben. Im nächsten Schritt n = 2 sucht man nach unendlich vielen Modellen Ai für die Ai (A2 ) = 1 ist. Diese Modellen sollen aber natürlich nicht dem widersprechen, was in Schritt 1 bereits fix gemacht wurde. Ein Modell der Form Ai = {(A1 , 0), (A2 , 1), . . .} ist also unbrauchbar, da es A1 nicht den Wert 1 sondern 0 zuordnet. Deswegen geht man brutal vor und verwirft im Schritt 1 gleich alle Modelle, die so aussehen. Das wird erreicht, indem einfach die Indizes der untauglichen Modelle gestrichen werden. Genau das passiert in Zeile 9. Interessant ist, dass dies einfach so geht, aber die unendliche Anzahl an Modellen Ai macht’s möglich. Jedes Modell was Modell für die Formelmenge {F1 , . . . , Fk } ist, muss daher auch Modell für Mn sein. Das ist schon mal nicht schlecht, das Modell für die endliche Formelmenge {F1 , . . . , Fk } ist auch Modell für die unendliche Formelmenge Mn (damit ist leider noch nichts bewiesen). Das Modell für die Formelmenge Mn heisst ab jetzt An . Dieses Modell hat eine wichtige Eigenschaft. Da M1 ⊆ M2 ⊆ . . . ⊆ Mn , ist An nicht nur Modell für Mn , sondern auch für M1 , M2 , . . . , Mn−1 . 3. Eigentlich sucht man ja nach dem Modell A für die Menge M. Diese Modell muss nun aus den Modellen Ai zusammengesetzt (konstruiert) werden. 5. Das Modell A für die Formelmenge M wurde nun konstruiert. Es muss nur noch gezeigt werden, dass es sich auch tatsächlich um ein Modell handelt. Zur Schreibweise: Das gesuchte Modell A ist eine Funktion die von den atomaren Formeln A n auf die Wahrheitswerte {0, 1} abbildet. Diese Funktion kann auch in Relationenschreibweise geschrieben werden, wobei A(An ) = 1 durch (An , 1) und A(An ) = 0 durch (An , 0) ausgedrückt wird. Das hat den Vorteil das man die Mengenoperation ∪ zum Erweitern des Definitionsbereichs verwenden kann. Die Belegung B = {(A1 , 1)} ∪ {(A2 , 0)} z. B. weist dem Atom A1 1 und dem Atom A2 0 zu. Man nimmt sich eine beliebige Formel F aus M. In F können nur endlich viele atomare Formel vorkommen, z. B. l Stück. Das heisst F setzt sich zusammen aus den atomaren Formeln A1 , . . . , Al . Das heisst, F ist Element von Ml und damit auch von Ml+1 ⊆ Ml+2 ⊆ . . .. Daraus folgt, dass Al und Al+1 , Al+2 , . . . Modelle für F sind. Wichtig ist nun, dass die Indexmenge I in jedem Schritt zwar ausgedünnt wird, da I aber zu Beginn unendlich ist, bleibt sie immer unendlich. Das heisst aber auch, das in der Stufe l des Algorithmus immer noch unendliche viele Indizes i ∈ I vorhanden sind. Wenn es noch unendlich viele Indizes gibt, dann gibt es aber sicher auch eins mit i ≥ l. Für diese i gilt: Ai (A1 ) = A(A1 ), . . . , Ai (Al ) = A(Al ) und deshalb ist A ein Modell für F . Da wir das F vollkommenen beliebig aus M gewählt haben, gilt diese Schlussfolgerung für alle F und damit ist A Modell für M. Man gibt nun einen Algorithmus an, der das gesuchte Modell A konstruiert. Im letzten Schritt wird dann gezeigt, dass dieses Modell auch tatsächlich ein Modell für M ist. 4. Dieser Algorithmus baut das Modell A in mehreren Stufen auf. In der ersten Stufe wird A einfach auf die leere Menge gesetzt, enthält also für kein einziges Atom eine Belegung. Zusätzlich gibt es eine unendliche Indexmenge I, die zu Beginn auf I = {1, 2, . . .} gesetzt wird. 01 02 04 05 06 07 Stufe 0: A←∅ I ← {1, 2, 3, . . .} i Obere Schranke für Komplexität der Resolution mit Beweis. 11.2.13 Sei F eine Klauselmenge mit den Atomformeln A1 , . . . , An . Jede der Atomformeln kann in einer Klausel positive vorkommen, negativ vorkommen, positive und negativ vorkommen oder gar nicht vorkommen. Diese vier Möglichkeiten führen zu höchstens 4n verschiedenen Klauseln in Res∗ (F ). In jedem Schritt Stufe n > 0: if (es gibt unendlich viele Indizes i ∈ I mit Ai (An ) = 1) { DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 153 154 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.2. Aussagenlogik Kapitel 11. Logik von Resi (F ) nach Resi+1 (F ) kann nur eine Klausel hinzukommen. Daher ist 4n eine grobe obere Schranke für die Komplexität. Ja, NAND und NOR. Für NAND gilt: ¬F 11.2.14 Berechenbarkeit der Aussagenlogik im Vergleich zur Prädikatenlogik? F ∧G Die Aussagenlogik ist im Gegensatz zur Prädikatenlogik entscheidbar. i Ist die Aussagenlogik entscheidbar? 11.2.15 Die Aussagenlogik ist entscheidbar, da mit Hilfe der Wahrheitstabelle jede Formel entscheidbar ist. F ∨G 11.2.16 Was können sie über Aussagenkalküle sagen? = NAND(F, F ) = ¬(F ∧ F ) = ¬F = NAND(NAND(F, G), NAND(F, G)) = ¬(¬(F ∧ G)) = F ∧G = NAND(NAND(F, F ), NAND(G, G) direkt kaum benutzbar ¬F Natürliches Schliessen. technisch Aufwendiger, es gibt lokale Annahmen korrespondiert zum F ∧G natürlichen/mathematischen Beweisen direkt mit Hilbert-Kalkül verwandt aber jede Tautologie hat einen Beweis mit Teilformeleigenschaft F ∨F Sequenzen-Kalkül. technisch aufwendiger = NOR(NOR(F, F ), NOR(G, G)) = NOR(¬F, ¬G) ¬(¬F ∨ ¬G) F ∧G = NOR(NOR(F, G), NOR(F, G)) = NOR(¬(F ∨ G), ¬(F ∨ G)) = ¬(¬(F ∨ G) ∨ ¬(F ∨ G)) = ¬(¬(F ∨ G)) = F ∨G Ideal zur Beweissuche liefert Gegenmodell Für Genaueres siehe (11.2.3), (11.2.23), (11.2.24) und (11.2.25). 11.2.21 Erfüllbarkeitstest für Hornformeln? Eine Hornformel F kann mit folgendem Algorithmus auf Erfüllbarkeit getestet werden. 11.2.17 Wozu dient ein Kalkül? 1. Für jede Teilformel der Form (1 → A), markiere A. Ein Kalkül ist eine Kollektion rein mechanisch anzuwendender syntaktischer Umformungsregeln. Die Aufgabenstellung ist der Nachweis der Unerfüllbarkeit einer Formel. ein Kalkül muss korrekt und vollständig sein. 2. solange es in F eine Teilformel G der Form (A1 ∧ . . . ∧ An → B) oder (A1 ∧ . . . ∧ An → 0) wobei alle A1 , . . . An bereits markiert sind, B jedoch nicht, tue folgendes: Falls G die erste Form hat, markiere jedes Vorkommen von B, andernfalls unerfüllbar ausgeben und anhalten. 11.2.18 Nennen Sie das Deduktionstheorem der Aussagenlogik. 3. Wenn der Algorithmus bis hier läuft, gibt erfüllbar aus und stoppe. Die erfüllende Belegung wird durch die Markierung angezeigt. A(Ai ) = 1 falls Ai markiert ist. Seien F und G aussagenlogische Formeln und M eine Menge von Formeln, dann gilt: M ∪ {F } |= G = NOR(F, F ) = ¬(F ∨ F ) = ¬F = = Problem: Beweissuche (→ E hat nicht die Teilformeleigenschaft) nicht und F ∨G Für NOR gilt: technisch sehr einfach NAND(¬F, ¬G) ¬(¬F ∧ ¬G) = = = Hilbert-Kalkül. 11.2.19 Bilden NAND(¬(F ∧ G), ¬(F ∧ G)) ¬((¬(F ∧ G)) ∧ (¬(F ∧ G))) = = =⇒ Dieser Algorithmus ist korrekt und hat Laufzeit O(n), wobei n die Anzahl der Atome ist. M |= (F → G) 11.2.22 Was ist der Modus Ponens? Eine Regel des natürlichen Schliessens: und eine Basis? φ Ja. A ∨ B kann dargestellt werden durch ¬(¬A ∧ ¬B). i Erzählen Sie etwas zum natürlichen Schliessen. 11.2.23 11.2.20 Gibt es eine Basis mit nur einem Operator? DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs φ→ψ (→−e) ψ 155 156 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.2. Aussagenlogik Kapitel 11. Logik Im Gegensatz zum Hilbert-Kalkül erlaubt natürliches Schliessen das Schliessen unter lokalen Annahmen. Beim natürlichen Schliessen werden Herleitungsbäume konstruiert. Diese werden mit ihrer Wurzel unten und den Blätter oben geschrieben. Formeln an den Blättern heissen Annahmen, die Formeln an der Wurzel heisst Konklusion. Annahmen können entweder gestrichen oder offen sein. Die Menge der korrekten Herleitungsbäume ist induktiv definiert: Reductio ad absurdum. Der Widerspruchsbeweis [¬A] .. . ⊥ A 1. F ist ein Beweisbaum mit der offenen Annahme F . 2. Durch die Regeln können induktiv neue Beweisbäume gebildet werden. Beispiel. Die Folgerungsbeziehung ¬A |= A → B ist richtig, das Beispiel zeigt einen Herleitungsbaum. Die Regeln. ¬A Konjunktion. Eine Konjunktion kann eingeführt A→B B (→−i) A→B Zur Elimination einer Implikation dient der Modus Ponens. 11.2.24 Erzählen Sie etwas zu Hilbert-Kalkülen. Hilbert-Kalküle sind sehr einfach, eignen sich aber schlecht zur Beweissuche. Ein Hilbert-Kalkül besteht aus einer Menge von Formeln (Axiomen) und einer Menge von Schlussregeln der Form F1 . . . F n Prämissen = . F Konklusion Wenn n = 0 dann ist die Regel ein Axiom. Disjunktion. Eine Disjunktion kann durch eine der beiden folgenden Regeln eingeführt werden. B (∨−i) A∨B Eine Herleitung einer Formel F aus einer Formelmenge M ist eine Sequenz F1 , . . . , Fk mit Fk = F und für i ≤ k gilt Um aus einer Disjunktion A ∨ B etwas schliessen zu können, muss man es sowohl aus A wie aus B schliessen können. [A] [B] .. .. . . Fi ist ein Axiom oder n es gibt eine Regel G1 ...G so dass {G1 , . . . Gn } ⊆ {F1 , . . . Fi−1 }, d. h. Fi wurde auch aus F G hergeleitet. A∨B C C (∨−e) C Negation. Die Verneinung einer Annahme ist gerechtfertigt, wenn ihre Annahme zu einem Widerspruch geführt hat. [A] .. . Man schreibt M `H F . Die Herleitung ist ein Beweis von F . Es gibt zwei Grundaxiome. A1 F → (G → F ) für beliebige Formeln F, G A2 (F → G → H) → (F → G) → F → H Kettenschluss Eine Schlussregel, den Modus Ponens. F →G G ⊥ (¬−i) ¬A Eine Aussage und ihre Verneinung können nicht gleichzeitig gelten. A F Beispiel. Die Herleitung von `H A → A. ¬A (¬−e) ⊥ 1. 2. 3. 4. 5. Verum. Die wahre Aussage darf immer behauptet werden. A (>−i) > (A → (A → A) → A) → (A → (A → A)) → A → A A → ((A → A) → A) (A → A → A) → A → A A→A→A A→A (A2) (A1) (MP 1,2) (A1) (MP 3,4) Deduktionstheorem. In jedem Hilbert-Kalkül, das mindestens die Axiome A1 und A2 enthält und nur den Modus Ponens als Regel besitzt gilt Falsum. Aus der falschen Aussage darf alles gefolgert werden. ⊥ (⊥−e) A DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs (→−i) Korrektheit und Vollständigkeit. Natürliches Schliessen und der Hilbert-Kalkül sind äquivalent. Da der Hilbert-Kalkül korrekt ist, ist auch natürliches Schliessen korrekt. Natürliches Schliessen ist vollständig, da es die Resolution simulieren kann und die Resolution vollständig ist. A→B (→−e) B A (∨−i) A∨B (¬−e) (⊥−e) Hier wurde mit der Annahme ¬A begonnen und die temporäre Annahme A hinzugenommen. Daraus kann ⊥ geschlossen werden. Aus ⊥ kann wiederum alles geschlossen werden, in diesem Falle B. Im letzten Schritt wird → eingeführt, dafür darf die temporäre Annahme A gestrichen werden. A∧B A∧B (∧−e) (∧−e). A B Implikation. Wenn B eine Herleitung von A ist, kann man A → B schreiben und die Annahme A streichen. [A] .. . A [A] ⊥ B A B (∧−i) A∧B oder eliminiert werden (raa) M ∪ {F } `H G genau dann, wenn M `H F → G 157 158 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.2. Aussagenlogik Kapitel 11. Logik Vollständiges Axiomensystem. A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 Da bei jeder Regel die Formeln der Konklusion auch in der Prämisse stehen, ist die Rückwärtsanwendung einer deterministisch, Dies nennt man Teilformeleigenschaft. F → (G → F ) (F → G → H) → (F → G) → F → H F ∧G→F F ∧G→G F →G→F ∧G F →F ∨G G→F ∨G F ∨ G → (F → H) → (G → H) → H (¬F → ⊥) → F ¬F → F → ⊥ (F → ⊥) → ¬F Für jede Regel S1 Sn S und jede passende Belegung A gilt A |= |S| genau dann, wenn A |= |S1 | und . . . und A |= |Sn | Die Korrektheit des Sequenzen-Kalküls, also dass `G S folgt, dass |= |S| gilt, wird mit einem Induktionsbeweis über die Grösse der Herleitung von S gezeigt. Das Sequenzen-Kalküls hat eine weitere interessante Eigenschaft: Jeder fehlgeschlagene Beweisversuch für S liefert ein Gegenmodell für |S|, das heisst ein Modell für ¬|S|. Dadurch ist auch gleich die Vollständigkeit beweisen, da jeder Beweisversuch immer zu einem Modell für |S| oder ¬|S| führt. Beispiel. Aufgabe ist es zu zeigen, dass ⇒ A ∨ ¬A gilt. Axiom Korrektheit. Es gilt ⇒ `H F |= F Der Beweis geht mit Induktion über die Länge der Herleitung `H F 11.2.27 Ist die Formel ((A → B) → C) ↔ (A → (B → C)) eine Tautologie? 1. Hilbert-Kalkül ist äquivalent zum Natürlichen Schliessen. 2. Natürliches Schliessen kann Resolution simulieren. 3. Resolution ist vollständig, siehe 11.2.5. Nein, das würde bedeuten, dass das Assoziativgesetz für die Implikation gilt und das tut es nicht. 11.3 11.2.25 Erzählen Sie etwas zum Sequenzen-Kalkül. 11.3.1 Das Ziel des Sequenzen-Kalküls ist die Beweissuche. Es werden immer Sequenzen der Form Γ ⇒ ∆ bewiesen wobei Γ, ∆ Multimengen von Formel sind. Intuitiv gilt, F1 , . . . Fn ⇒ G1 , . . . , Gn ist herleitbar falls |= F1 ∧ . . . ∧ Fn → G1 ∨ . . . ∨ Gn Γ→ _ ∆ vorgeführt. a) Bereinigung. F wird durch gebundenes Umbenennen der Variablen in eine äquivalente , bereinigte Form F1 überführt. Eine Formel ist in bereinigter Form wenn es keine Variablen mehr gibt die sowohl frei und gebunden vorkommen und hinter allen Quantoren verschiedene Variablen stehen. Das y im zweiten Disjunktionsglied wird in w umbenannt und es ergibt sich: F1 = ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀wP g(z, w), z Konjunktion. Γ ⇒ ∆, F Γ ⇒ ∆, G (∧−R). Γ ⇒ ∆, F ∧ G Disjunktion. Γ, F ⇒ ∆ Γ, G ⇒ ∆ (∨−L) Γ, F ∨ G ⇒ ∆ Γ ⇒ ∆, F, G (∨−R). Γ ⇒ ∆, F ∨ G Diese Formel ist äquivalent zu F . b) Freie Variablen beseitigen. Falls in der Formel F1 noch freie Variable y1 , . . . , yn vorkommen, ersetzt man F1 durch F2 = ∃y1 . . . ∃yn F1 . F2 ist erfüllbarkeitsäquivalent zu F1 und F2 . Im Beispiel ist z eine ungebundene Variable deshalb führt man ∃z ein: F2 = ∃z ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀wP g(z, w), z Implikation. Γ ⇒ F, ∆ Γ, G ⇒ ∆ (→−L) Γ, F → G ⇒ ∆ Γ, F ⇒ ∆, G (→−R). Γ ⇒ ∆, F → G Negation. Γ ⇒ F, ∆ (¬−L) Γ, ¬F ⇒ ∆ DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs Wie gehen Sie vor, wenn Sie die Unerfüllbarkeit einer prädikatenlogischen Formel F zeigen möchten 1. Skolemnormalform. Um mit der Formel F überhaupt etwas Anfangen zu können muss zuerst die Skolemform der Formel erstellt werden. Den Weg dorthin kann man wieder in mehrere Schritte zerlegen und wird an der Formel F = ¬∃x P (x, z) ∨ ∀yQ x, f (y) ∨ ∀yP g(z, y), z Es gibt für jeden Junktor eine rechte und eine linke Regel: Γ, F, G ⇒ ∆ (∧−L) Γ, F ∧ G ⇒ ∆ Prädikatenlogik Um die prädikatenlogische Resolution auf eine Formel F anzuwenden, müssen folgende Schritte durchlaufen werden. gilt. Dieser Zusammenhang wird wie folgt notiert: ^ (∨−R) Eine Wahrheitstafel zeigt alles passenden Belegungen einer Formel. `H F Beweis. |Γ ⇒ ∆| = ⇒ A, ¬A 11.2.26 Was ist eine Wahrheitstafel? Vollständigkeit. Es gilt ⇒ (¬−R) ⇒ A ∨ ¬A 1. Alle Axiome sind Tautologien. 2. Der Modus Ponens überführt Tautologien in Tautologien. |= F A⇒A Γ, F ⇒ ∆ (¬−R). Γ ⇒ ∆, ¬F 159 160 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.3. Prädikatenlogik Kapitel 11. Logik c) Pränexform. Jetzt wird eine zu F2 äquivalent und damit zu F erfüllbarkeitsäquivalente Formel F3 in Pränexform hergestellt. Eine Formel ist in Pränexform, wenn alle ihre Quantoren am Anfang der Formel stehen. Das ergibt F3 = ∃z∀x∃y∀w ¬P (x, z) ∧ ¬Q x, f (y) ∨ P g(z, w), z ergeben sich P (a, f (a), g(a, a)) P (f (a), f (a), g(a, f (a))) P (a, f (f (a)), g(a, a)) d) Skolemform. Jetzt werden die Existenzquantoren durch den Übergang zur Skolemform eliminiert. Die neue Formel F4 ist weiterhin erfüllbarkeitsäquivalent zu F . In diesem Falle wird der z durch a und y durch h(x) substituiert. F4 = ∀x∀w ¬P (x, a) ∧ ¬Q x, f (h(x)) ∨ P g(a, w), a durch .. . [x/a][y/f (a)][x/a] Nach dem Satz von Herbrand (11.3.17) ist eine Aussage F in Skolemform genau dann unerfüllbar, wenn eine endliche Teilmenge von E(F ) im aussagenlogischen Sinne unerfüllbar ist. D. h. man muss jetzt nur per Aussagenlogik zeigen, dass E(F ) unerfüllbar ist und ist fertig. Da kommt nun die Resolution ins Spiel. Im Folgenden seien F1 , F2 . . . eine Aufzählung aller Formeln in E(F ). 4a. Grundresolution. Die Aufgabe ist nun zu zeigen, das E(F ) im aussagenlogischen Sinne unerfüllbar ist. Dies kann sehr einfach mit dem Grundresolutionsalgorithmus durchgeführt werden (11.3.11). Die Grundresolution arbeitet auf den Element von E(F ) und damit auf Grundinstanzen der Klausel von F ∗ . Sie heissen Grundinstanzen, da alle Variablen durch variablenfreie Terme ersetzt wurden. e) KNF. Die Matrix von F4 wird in KNF umgeformt: F5 = ∀x∀y((P (g(a, w), a) ∨ ¬P (x, a)) ∧ (P (g(a, w), a) ∨ ¬Q(x, f (h(x))))) Beispiel. Gegeben ist die unerfüllbare Formel, ihre Matrix in Klauselform, D(F ) und E(F ) Als Klauselmenge dargestellt: F F∗ F5∗ = {{P (g(a, w), a), ¬P (x, a)}, {P (g(a, w), a), ¬Q(x, f (h(x)))}} = ∀x(P (x) ∧ ¬P (f (x))) = (P (x) ∧ ¬P (f (x))) = {{P (x)}, {¬P (f (x))}} D(F ) = {a, f (a), f (f (a)), . . .} E(F ) = {(P (a) ∧ ¬P (f (a))), (P (f (a)) ∧ ¬P (f (a)))), . . .} Bis jetzt ist noch nicht wirklich etwas passiert. Diese Schritte galten nur der Erstellung der Skolemform, die im weiteren Verlauf benötigt wird. Wichtig ist, dass die entstandene Formel F5 trotz aller Umformungen erfüllbarkeitsäquivalent zu F ist. → Motivation der nächsten Schritte. Die nächsten Schritte hängen jetzt erst mal ein bisschen in der Luft. Wichtig ist, nicht aus den Augen zu verlieren, das es im Endeffekt um das Zeigen der Unerfüllbarkeit geht. Um die Unerfüllbarkeit zu zeigen benötigt man eine Menge E(F ) namens Herbrand-Expansion. Die nächsten Schritte beschäftigen sich mit dem Finden dieser Menge. Das kann man sich am besten vorstellen, wenn man vom Satz von Herbrand (11.3.17) zurück denkt. Dieser Satz besagt, dass eine Aussage in Skolemform F genau dann unerfüllbar ist, wenn es eine endliche Teilmenge von E(F ) (der Herbrand-Expansion) gibt, die im aussagenlogischen Sinne unerfüllbar ist. Der Beweis dieses Satzes hängt aber davon ab, ob eine erfüllbare Formel ein Modell mit abzählbarer Grundmenge besitzt. Das dem so ist, besagt der Satz von Löwenheim-Skolem (11.3.21). Er besagt, dass jede erfüllbare prädikatenlogische Formel ein Modell mit abzählbarer Grundmenge besitzt und zwar ein Herbrand-Modell, das eine Herbrand-Struktur ist. Schon die ersten beiden Substitutionen [x/a] und [x/f (a)] liefern eine unerfüllbare Klauselmenge. {P (a)} {¬P (f (a))} {P (f (A))} {¬P (f (f (a)))} 2 Die Grundresolution ist sehr ineffizient, da alle Grundsubstitutionen durch probiert werden müssen. Eine Alternative bietet die prädikatenlogische Resolution. 4b. Prädikatenlogische Resolution. Wie gesagt ist die ausschliessliche Resolution von Grundinstanzen sehr ineffizient, besser wäre es nur die Substitutionen durchzuführen, die auf dem Weg zum Ziel liegen. Die Grundidee dabei ist, prädikatenlogische Resolventen aus prädikatenlogischen Klausel zu erzeugen. Dabei ist mit jedem Resolutionsschritt ein Substitutionsschritt verbunden. Ziel ist es wie bei der aussagenlogischen Resolution, bestimmte Literale in zwei Ausgangsklauseln zueinander komplementär zu machen. Ziel hierbei ist es Substitutionen zu finden, die zwei Literale unifizieren. 2. Herbrand-Struktur. Zum Beispiel ist die Herbrand-Struktur (11.3.10) für die Formel F F = ∀x∀y∀zP (x, f (y), g(z, x)) wie folgt definiert. Beispiel. Gegeben sind zwei prädikatenlogische Klauseln UA = D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .} und es gilt: f A (a) f A (f (a)) A f (g(a, a)) = K1 = K2 = {P (f (x)), ¬Q(z), P (z)} {¬P (x), R(g(x), a)} R ist ein prädikatenlogischer Resolvent von K1 , K2 wenn die drei Bedingungen von (11.3.16) gelten. Ein prädikatenlogischer Resolvent von K1 , K2 ist f (a) = f (f (a)) = f (g(a, a)) .. . R = {¬Q(f (x)), R(g(f x)), a)} R erfüllt die drei Bedingungen: 1. Es gibt zwei Substitutionen s1 und s2 , so dass K1 und K2 keine gemeinsamen Variablen enthalten. Man wählt z. B. s1 = [ ] und s2 = [x/u]. Das ergibt 3. Herbrand-Expansion. Jetzt wird die Herbrand-Expansion bestimmt. Die Herbrand-Expansion entsteht in dem die Variablen in F ∗ in jeder möglichen weise durch die Terme in D(F ) substituiert werden. Für die Formel F = ∀x∀y∀zP (x, f (y), g(z, x)) DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs durch [x/a][y/a][z/a] durch [x/f (a)][y/a][x/a] 161 162 K1 s 1 = K2 s 2 = K1 [ ] = {P (f (x)), ¬Q(z), P (z)} K2 [x/u] = {¬P (u), R(g(u), a)} http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.3. Prädikatenlogik 2. Jetzt muss sich eine Literalmenge aus K1 s1 , K2 s2 finden lassen, die unfizierbar ist. Eine Wahl ist L Kapitel 11. Logik 11.3.7 Eine Struktur is ein Paar A = (UA , IA ) wobei UA eine beliebige aber nicht leere Menge ist. IA ist eine Abbildung, die {P (f (x)), P (z), ¬P (u) } | {z } | {z } aus K1 s1 aus K2 s2 = {¬P (f (x)), ¬P (z), ¬P (u)} = jedem k-stelligen Prädikatensymbol P ein k-stelliges Prädikat über UA zuordnet, jedem k-stelligen Funktionssymbol f eine k-stellige Funktion auf UA zuordnet, Mit dem Unifikationsalgorithmus kann nun der allgemeinste Unifikator sub bestimmt werden. Dieser liefert in zwei Schritten sub = [z/f (x)][u/f (x)] 3. Wenn jetzt noch die dritte Bedingung gilt, handelt es sich bei R um einen Resolventen. Ein Resolvent ist nur dann ein Resolvent, wenn er folgende Form hat. jeder Variablen x eine Element der Grundmenge UA zuordnet. 11.3.8 Einsetzen der obigen Klausel und Substitutionen ergibt = 1. Skolemform. Um mit der Formel F überhaupt etwas Anfangen zu können muss zuerst die Skolemform der Formel erstellt werden. Zur Übersicht wird erstmal die Implikation ersetzt. (({P (f (x)), ¬Q(z), P (z)} − {P (f (x)), P (z)}) ∪ ({¬P (u), R(g(u), a)} − {¬P (u)}))[z/f (x)][u/f (x)] F = ∃x(P (x) → ∀xP (x)) = ∃x(¬P (x) ∨ ∀xP (x)) = ({¬Q(z)} ∪ {R(g(u), a)})[z/f (x)][u/f (x)] = ({¬Q(z), R(g(u), a)})[z/f (x)][u/f (x)] = = a) Bereinigung. F wird durch gebundenes Umbenennen der Variablen in eine äquivalente , bereinigte Form F1 überführt. Hier wurde die Variable beim Allquantor in y umbenannt. Es ergibt sich: F1 = ∃x(¬P (x) ∨ ∀yP (y)) ({¬Q(f (x)), R(g(u), a)})[u/f (x)] {¬Q(f (x)), R(g(f (x)), a)} Diese Formel ist äquivalent zu F . b) Freie Variablen beseitigen. Die Formel enthält keine freien Variablen, der Schritt entfällt daher und es gilt: F2 = F1 = ∃x(¬P (x) ∨ ∀yP (y)) Die Abbildung zeigt den Resolutions-/Substitutionsschritt noch einmal graphisch. {P (f (x)), ¬Q(z), P (x)} {¬P (x), R(g(x), a)} s1 s2 sub = [] = [x/u] = [z/f (x)][u/f (x)] c) Pränexform. Jetzt wird eine zu F2 äquivalente und damit zu F erfüllbarkeitsäquivalente Formel F3 in Pränexform hergestellt. Eine Formel ist in Pränexform, wenn alle ihre Quantoren am Anfang der Formel stehen. Das ergibt {¬Q(f (x)), R(g(f (x)), a)} F3 = ∃x∀y(¬P (x) ∨ P (y)) Auf diese Weise können nun nur die Substitutionsschritte durchgeführt werden, die zum Finden der leeren Klausel benötigt werden. 11.3.2 Prädikatenlogische Resolution mit Unifikation am Beispiel ∃x(P (x) → ∀xP (x)). Dieses Beispiel ist so einfach, dass man wirklich Schritt für Schritt vor gehen kann, da das HerbrandUniversum endlich ist, kann man ganz in Ruhe die Herbrand-Expansion bestimmen und dann erst resolvieren. R = ((K1 s1 − {L1 , . . . , Lm }) ∪ (K2 s2 − {L01 , . . . , L0n }))sub. R Was ist eine Struktur? d) Skolemform. Jetzt werden die Existenzquantoren durch den Übergang zur Skolemform eliminiert. Die neue Formel F4 ist weiterhin erfüllbarkeitsäquivalent zu F . In diesem Falle wird der einzige Existenzquantor gestrichen und durch das nullstellige Funktionssymbol a ersetzt. Um was erweitert die Prädikatenlogik die Aussagenlogik? Die Prädikatenlogik erweitert die Aussagenlogik um Quantoren, Funktions- und Prädikatensymbole. 11.3.3 F4 = ∀y(¬P (a) ∨ P (y)) e) KNF. Die Matrix von F4 wird in KNF umgeformt und als Klauselmenge dargestellt. Da die Matrix von F4 bereits in KNF ist, ergibt sich Normalformen der Prädikatenlogik? siehe 11.3.22, 11.3.23 und 11.3.26 11.3.4 F5 = F4 = ∀y(¬P (a) ∨ P (y)) Als Klauselmenge dargestellt: i Ist die Herbrand-Expansion abzählbar? F5∗ = {{¬P (a), P (y)}} ∗ Die Herbrand-Expansion entsteht in dem die Variablen in F in jeder möglichen weise durch die Terme in D(F ) substituiert werden. Das D(F ) abzählbar ist, ist auch E(F ) abzählbar. 11.3.5 2. Herbrand-Struktur. In diesem Fall ist es sehr einfach das Herbrand-Universum zu bestimmen, da F keine Funktionssymbol mit einer Stelligkeit grösser 0 enthält. Es gibt eine Konstante a. Sie ist das einzige Element des Herbrand-Universums und es gilt: Ist die Prädikatenlogik entscheidbar? D(F5 ) = {a} Das Erfüllbarkeitsproblem der Prädikatenlogik ist nicht entscheidbar. Beweis durch Reduktion auf das Postsche Korrespondenzproblem. 11.3.6 3. Herbrand-Expansion. Jetzt wird die Herbrand-Expansion E(F5 ) bestimmt. Dies ist beim Beispiel sehr einfach da D(F5 ) nur das einzige Element a hat und F5 nur eine Variable nämlich y hat. Also ersetzt man y durch a und erhält Nennen Sie mir ein Kalkül für die Prädikatenlogik? E(F5 ) = {F5∗ [y/a]} = {{¬P (a), P (a)}} Resolution. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 163 164 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.3. Prädikatenlogik 4. Resolution. Hier gibt es leider nichts zu resolvieren. Unerfüllbarkeit kann nicht gezeigt werden. Diese geht aber nur wegen dem endlichen Herbrand-Universum. 11.3.9 Kapitel 11. Logik 11.3.11 Geben Sie den Grundresolutionsalgorithmus an. Der Grundresolutionsalgorithmus ist ein Resolutionsalgorithmus, der wie der Gilmore-Algorithmus funktioniert. Wenn F eine prädikatenlogische Formel ist, bezeichnen F1 , F2 . . . alle Formel ihrer HerbrandExpansion E(F ). Der Algorithmus erhält als Eingabe die Mengen Fi . Was ist das Herbrand-Universum? Das Herbrand-Universum D(F ) einer Formel F in Skolemform ist die Menge aller variablenfreien Terme, die aus allen Bestandteilen von F gebildet werden können. Es ist induktiv definiert: Grundresolution(Fi ) 1 i←0 2 M ←∅ 3 do { 4 i←i+1 5 M ← M ∪ Fi 6 M ← Res∗ (M ) 7 } until (2 ∈ M ) 8 return unerfüllbar 1. Alle in F vorkommenden Konstanten sind in D(F ). Falls F keine Konstante enthält, so ist a in D(F ). 2. Für jedes in F vorkommende n-stellige Funktionssymbol f und Terme t1 , . . . tn in D(F ) ist der Term f (t1 , . . . tn ) in D(F ). Beispiel. Gegeben seien die Formeln F G = ∀x∀y∀zP (x, f (y), g(z, x)) = ∀x∀yQ(c, f (x), h(y, b)) Wenn die Formel F unerfüllbar ist, hält der Algorithmus nach endlich vielen Schritten. 11.3.12 Was ist eine Grundsubstitution? Bei F liegt der Spezial fall vor, da F keine Konstante enthält wird a in das Herbrand-Universum aufgenommen: Bei einer Grundsubstitution werden alle freien Variablen durch variablenfreie Terme ersetzt. Die Substitutionen zur Definition der Herbrand-Expansion sind Grundsubstitutionen. D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .} Bei G sind Konstanten c und b vorhanden, daher: 11.3.13 Was ist ein Unifikator und was ist ein allgemeinster Unifikator? D(G) = {c, b, f (c), f (b), h(c, c), h(c, b), h(b, c), h(b, b), f (f (c)), f (f (b)), . . .} Eine Substitution sub ist ein Unifikator einer endlichen Menge von Literalen L = {L 1 , . . . Lk }, falls L1 sub = L2 sub = . . . = Lk sub. D. h. durch Anwendung der Substitution sub auf jedes Literal in L entsteht ein und dasselbe Literal. Man schreibt für diesen Sachverhalt auch |Lsub| = 1 sagt L ist unifizierbar. Ein Unifikator sub einer Literalmenge L heisst allgemeinster Unifikator von L, falls für jeden Unifikator sub0 von L gilt, dass es eine Substitution s gibt mit sub0 = subs. Wobei subs die Hintereinanderausführung der Substitution subs und s beschreibt. Man sieht, das Herbrand-Universum ist unendlich, sobald die Formel ein Funktionssymbol mit einer Stelligkeit > 0 enthält. Man sieht auch, dass es rekursiv aufzählbar ist. 11.3.10 Was ist eine Herbrand-Struktur? Wenn F eine Aussage in Skolemform ist, dann heisst jede zu F passende Struktur A = (U A , IA ) eine Herbrand-Struktur, falls folgendes gilt: 11.3.14 Wie funktioniert der Unifikationsalgorithmus? 1. UA = D(F ) (das Herbrand-Universum) Der Unifikationsalgorithmus überprüft ob eine Literalmenge L unifizierbar ist und gibt in diesem Fall den allgemeinsten Unifikator aus. Als Eingabe erhält er eine nicht-leere Literalmenge L. In jedem Schritt versucht er einen Unifikator zu finden, falls dies nicht möglich ist, bricht er ab, ansonsten wird der neue Unifikator an den im vorherigen Schritt bestimmten, angehängt. 2. für jedes in F vorkommende n-stellige Funktionssymbol f und t1 , . . . tn ∈ D(F ) ist f A (t1 , . . . tn ) = f (t1 , . . . tn ). Beispiel. Für die Formel Unifikation(L) 01 sub ← [ ] //die leere Substitution 02 while (|Lsub| > 1) { 03 durchsuche die Literale in Lsub paarweise von links nach rechts bis erste 04 Position gefunden, wo sich zwei Literale L1 und L2 unterscheiden. 05 if (keines der beiden Zeichen ist Variable) 06 return nicht unifizierbar 07 else { 09 sei x die Variable und t der im anderen Literal beginnenden Term 10 if (x kommt in t vor) 11 return nicht unifizierbar 12 else 13 sub ← sub[x/t] //Hintereinanderausführung von sub und [x/t] 14 } 15 } 16 return allgemeinster Unifikator: ∪ sub F = ∀x∀y∀zP (x, f (y), g(z, x)) ist UA = D(F ) = {a, f (a), g(a, a), f (g(a, a)), f (f (a)), g(a, f (a), g(f (a), a, . . .} und es gilt: f A (a) f A (f (a)) f A (g(a, a)) = f (a) = f (f (a)) = f (g(a, a)) .. . Die Wahl von P A bleibt an dieser Stelle noch offen. Wichtig ist, dass durch Punkt 2 der Definition Syntax und Semantik gleichgeschaltet werden. Die Interpretation eines Terms liefert den Term, es gilt also A(t) = t. DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 165 166 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.3. Prädikatenlogik 11.3.15 Was ist der Gödelsche Unvollständigkeitssatz? Kapitel 11. Logik 11.3.23 Was ist die Pränexform? Eine Formel F ist in Pränexform falls sie folgende Bauart hat Jedes Beweissystem für die Menge der wahren arithmetischen Formeln ist notwendigerweise unvollständig, d. h. es bleiben immer wahre arithmetische Formeln übrig, die nicht beweisbar sind. Q1 y 1 Q 2 y 2 . . . Q n y n F wobei Qi ∈ {∃, ∀}. In F darf kein Quantor mehr vorkommen. 11.3.16 Wie ist die Resolution der Prädikatenlogik definiert? Seien K1, K2 und R prädikatenlogische Klauseln. Dann ist R ein prädikatenlogischer Resolvent von K1 und K2 , falls folgendes gilt: 11.3.24 Was versteht man unter gebundenen Umbenennen? Sei F = QxG mit Qi ∈ {∃, ∀}. Wenn y eine Variable ist, die in G nicht vorkommt, dann gilt 1. Es gibt Substitutionen s1 und s2 , die Variablenumbennungen sind, so dass K1 s1 und K2 s2 keine gemeinsamen Variablen enthalten. 2. Es gibt eine Menge von Literalen L1 , . . . , Lm ∈ K1 s1 (m ≥ 1) und L01 , . . . , L0n ∈ K2 s2 (n ≥ 1), so dass L = {L1 , . . . , Lm , L01 , . . . , L0n } unifizierbar ist. sub ist der allgemeinste Unifikator von L. 3. R hat die Form F ≡ QyG[x/y] 11.3.25 Was ist eine Matrix? Die Matrix einer Formel F in Skolemform ist diejenige Formel, die man erhält, wenn man alle Quantoren in F samt der dahinter stehenden Variablen streicht. Sie wird mit F ∗ bezeichnet. R = ((K1 s1 − {L1 , . . . , Lm }) ∪ (K2 s2 − {L01 , . . . , L0n }))sub. 11.3.17 Wie lautet der Satz von Herbrand? 11.3.26 Was ist die Skolemform? Eine Formel ist in Skolemform, wenn sie bereinigt ist, in Pränexform ist und nur Allquantoren enthält. Eine Aussage F in Skolemform ist unerfüllbar genau dann, wenn es eine endliche Teilmenge von E(F ) gibt, die im aussagenlogischen Sinne unerfüllbar ist. 11.3.27 Was ist eine Theorie? 11.3.18 Was ist das Lifting-Lemma? Eine Theorie ist eine Menge von Formel T, die gegenüber Folgerbarkeit abgeschlossen ist. D.h. T ist eine Theorie wenn für alle F1 , F2 , . . . Fn ∈ T und alle Formeln G gilt: wenn G eine Folgerung von {F1 , F2 , . . . , Fn } ist, dann ist auch G ∈ T. Die Formel, die Element einer Theorie sind, heissen auch Sätze. Seien K1 , K2 zwei prädikatenlogische Klauseln und K10 , K20 seien beliebige Grundinstanzen hiervon, die im aussagenlogischen Sinne resolvierbar sind, so dass R 0 ein Resolvent von K10 und K20 ist. Dann gibt es einen prädikatenlogischen Resolventen R von K1 und K2 , so dass R0 eine Grundinstanz von R ist. Das Lifting-Lemma wird zum Beweis der Vollständigkeit der prädikatenlogischen Resolution benötigt. 11.3.28 Was ist ein Axiom? 11.3.19 Wie lautet der Resolutionssatz der Prädikatenlogik? Theorien können auf zwei Arten definiert werden: Sei F eine Aussage in Skolemform mit der Matrix F ∗ in KNF. Dann gilt: F ist unerfüllbar genau dann, wenn 2 ∈ Res∗ (F ∗ ). 1. Bei der modelltheoretischen Methode gibt man eine Struktur A vor und nimmt als Theorie alle Formel die unter A gelten: T h(A) = {F | A |= F } 11.3.20 Was sind Terme? 2. Bei der axiomatischen Methode gibt man ein Axiomensystem, also eine Menge von Formeln M vor. Diese Theorie besteht dann aus allen Formel die aus den Formel der Menge M folgerbar sind. Die Element der Menge M heissen Axiome. Es gilt: Term sind induktive definiert: 1. Jede Variable ist ein Term. Cons(M) = {G | G folgt aus {F1 , . . . Fn } ∈ M} 2. Falls f eine k-stellige Funktion und t1 , . . . tk Terme sind so ist auch f (t1 , . . . , tk ) ein Term. 11.4 i Satz von Löwenheim/Skolem mit Beweis? 11.3.21 11.4.1 Jede erfüllbare prädikatenlogische Formel besitzt ein Modell mit abzählbarer Grundmenge. Beweis. Jede prädikatenlogische Formel F kann in eine erfüllbarkeitsäquivalente Aussage G in Skolemform umgewandelt werden. Diese Umformungen sind so, dass jedes Modell für G auch Modell für F ist. Falls F erfüllbar ist, dann ist auch G erfüllbar und besitzt ein Herbrand-Modell, dass auch Modell für F ist. Das Herbrand-Modell besitzt die abzählbare Grundmenge D(F ). Beweisideen Unentscheidbarkeit der Prädikatenlogik. Der Beweis erfolgt per Reduktion. Wir suchen einen Algorithmus der jedes beliebige Postsche Korrespondenzproblem (PCP) K in eine prädikatenlogische Formel F = FK überführt, so das K eine Lösung besitzt, genau dann wenn F gültig ist. Das heisst man führt das Gültigkeitsproblem der Prädikatenlogik auf PCP zurück. Falls das Gültigkeitsproblem entscheidbar wäre, müsste auch das PCP entscheidbar sein. Die widerspricht den Kenntnissen der Berechenbarkeitstheorie. 11.3.22 Welche Eigenschaften hat eine bereinigte Formel? Eine Formel heisst bereinigt, wenn es keine Variable gibt, die sowohl gebunden als auch ungebunden vorkommt. Ausserdem müssen hinter allen Quantoren unterschiedliche Variablen stehen. Diese Form erreicht man durch gebundenes Umbenennen (11.3.24). DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 167 11.4.2 Erfüllbarkeitsäquivalenz der Skolemform. Beweis zeigt, dass jeder Durchlauf der Konstruktions-While-Schleife eine erfüllbarkeitsäquivalente Formel erzeugt. Dazu wird das Überführungslemma verwendet. 168 http://www.deissenboeck.de/faqs | DHP-FAQ v1.0 11.4. Beweisideen 11.4.3 Äquivalenz der Pränexform. Bei der Umwandlung einer Formel F in eine Formel G in Pränexform gilt F ≡ G. Beweis. Der Beweis ist ein Induktionsbeweis über den Formelaufbau. Hier ist alles sehr vereinfacht dargestellt. Induktionsanfang. Wenn F eine atomare Formel ist, dann ist F = G bereits in Pränexform und es gilt F ≡ G. Induktionsschritt. Es gibt 3 Fälle. 1. F hat die Form ¬F1 und G1 = Q1 y1 . . . Qn yn G0 ist die laut Induktionsvoraussetzung existierende zu F1 äquivalent Formel. Dann gilt F ≡ Q1 y1 . . . Qn yn ¬G0 Diese Formel ist in Pränexform. 2. F hat die Form (F1 ◦ F2 ). Es gibt zu F1 und F2 äquivalente Formeln G1 und G2 in Pränexform. Die Formel Q1 y1 . . . Qk yk Q01 z1 . . . Q0l zl (G01 ◦ G02 ) ist äquivalent zu F und in Pränexform. 3. F hat die Form QxF1 . Die gesucht Formel hat die Form QxQ1 y1 . . . Qn yn F10 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 169 Literaturverzeichnis [Cormen et al., 2000] Cormen, Thomas H. et al. Introduction to Algorithms. MIT-Press, 2000 [DS-Faq, 2001] DS-Faq. http://www.deissenboeck.de/faqs [Duden Mathematik, 2000] Duden Rechnen und Mathematik. Dudenverlag, 2000 [Duden Informatik, 1993] Duden Informatik. 2. Aufl. Dudenverlag, 1993 [Graham et. al., 1989] Graham, R.L., D.E. Knuth; Patashnik O. Concrete Mathematics. Addison Wesley, 1989 [Kindler & Manthey, 2001] Kinderl Ekkart; Manthey Steffen Skript zur Vorlesung Automaten, Formale Sprachen und Berechenbarkeit WS 01/02. [Ottmann & Widmayer, 2002] Ottman, Thomas; Widmayer, Peter. Algorithmen und Datenstrukturen. 4. Aufl. Spektrum, Akad. Verl., 2002 [Rechenberg & Pomberger, 1999] Rechenberg, Peter; Pomberger, Gustav (hrsg.) Informatik-Handbuch. 2. Aufl. Hanser, 1999 [Schöning, 1997] Schöning, Uwe. Theoretische Informatik – kurzgefaßt. 3. Aufl. Spektrum, Akad. Verl., 1997 [Schöning, 2000] Schöning, Uwe. Logik für Informatiker. 5. Aufl. Spektrum, Akad. Verl., 2000 DHP-FAQ v1.0 | http://www.deissenboeck.de/faqs 171